Unicode-Unterstützung

Aus Asprova Hilfe
(Weitergeleitet von Unicode Support)
Wechseln zu: Navigation, Suche
Hilfe Nummer: 8993000

Asprova unterstützt Unicode, so dass in einem Projekt Strings in verschiedenen Sprachen verwendet werden können.

Speichern & Exportieren

Sowohl beim Speichern des Projekts, als auch beim Export von Daten wird Unicode unterstützt. Nachfolgend wird auf die verschiedenen Möglichkeiten eingegangen. Allen ist gemein, dass es bei der Nutzung mehrere Sprachen ohne die Nutzung von Unicode es zu fehlerhaften Darstellung von Text und verstümmeltem Text kommen kann.

Projektdatei

Asprovas ARU-Standarddateityp unterstützt Unicode, so dass dies der Dateityp ist, der für Projekte mit mehreren Texten genutzt werden sollte.

Unicode01.jpg

Export (in Textdatei)

Beim Export von Daten in Textdateien können sie als [Datenquelle] "Textdatei (Unicode)" setzen.

Unicode02.jpg

Die Daten werden dann in UTF-8 codiert in die Datei geschrieben. Um die exportierte Datei anzuzeigen, muss ein Unicode-fähiges Programm verwendet werden. (Seit Windows 2000 unterstützt der Editor in Windows Unicode.) Werden Textdateien mit dieser Einstellung importiert, so werde diese ebenfalls in UTF-8 erwartet.

XML-Export

Beim Export von XML-Dateien kann die Codierung in UTF-8 vorgegeben werden.

Unicode03.jpg

Ist "UTF-8" aktiviert, so wird die exportierte XML-Datei in UTF-8 codiert gespeichert.

Auslastungs-/ Bestandsgraphen exportieren (RDB/Spreadsheet)

Beim Export von Rohdaten für Graphen kann die Codierung in UTF-8 vorgegeben werden.

Unicode04.jpg

Ist "UTF-8" aktiviert, so wird die exportierte Datei in UTF-8 codiert gespeichert.

Über Unicode

Computer verwenden zur Verarbeitung von Textdateien ein System, in dem jedem Zeichen eine Nummer zugeordnet ist. Um Textdateien zwischen Computern auszutauschen, muss dafür auf den beteiligten Computern das gleiche System genutzt werden. Welche Nummer einem Zeichen zugeordnet ist, ist durch den Standard zur Codierung definiert. Ex existieren diverse Zeichencodierung-Standards, die meist der Zuweisung von Nummern zu Zeichen von nur einer bestimmten Sprache dienen.

Zum Beispiel wird in Japan üblicherweise die Codierung "Shift_JIS" verwendet. Sie wurde entwickelt, um Zeichen in der japanischen Sprache Nummern zuzuordnen, nicht aber Zeichen anderer Sprachen. "Shift_JIS kann dementsprechend keine Nummern von arabischen Schriftzeichen erkennen. Denn wenn ein Text-Dokument mit arabischen Schriftzeichen mit der Zeichencodierung "Shift_JIS" gespeichert wird, werden die arabischen Zeichen anders interpretiert, da sie die gleichen Nummern nutzen können, und das gespeicherte Dokument erscheint verstümmelt. Auf die gleiche Art erscheinen japanische Texte unter Verwendung einer Codierung für arabische Schriftzeichen verstümmelt.

Unicode ist eine Codierung zur Verarbeitung von Sprachen aus aller Welt. Es wurde nicht zur Verarbeitung einer bestimmten Sprache entwickelt, so dass mehrsprachige Textdokumente verarbeitet werden können.

Informationen zur Codierung ohne Unicode finden Sie hier.

Schriftarten

Die oben erläuterte "Codierung" ist der etablierte Standard zum Informationsaustausch zwischen Computern. Das System jedoch, mit dem Computer die Nummern in darstellbare Zeichen umwandelt, nennt sich "Schriftart" (Font). Wie bei der Codierung ordnen Schriftarten Zeichen Zahlen zu. Und wie Codierungen existieren Schriftarten zur Abbildung verschiedener Sprachen. Eine beliebte Schriftart zur Anzeige von japanischen Zeichen ist "MS PGothic". Sie enthält Informationen zur Anzeige von japanischen Schriftzeichen. Im Grunde genommen enthält sie "Bilder" für jedes Zeichen. Dementsprechend enthält sie keine Informationen zur Anzeige von Zeichen anderer Sprachen, wie beispielsweise Koreanisch.

Je nach enthaltenen Informationen können Schriftarten durchaus Zeichen aus anderen Sprachen abbilden. Beispielsweise "MS PGothic" englische Zeichen darstellen, da die in der japanischen Codierung den englischen Zeichen zugeordneten Nummern, denen der englischen Codierung entsprechen und die Schriftart Informationen zur Anzeige englischer Zeichen beinhaltet.

Die meisten chinesischen Schriftarten enthalten japanische Zeichen, aber die den Zeichen zugeordneten Nummern sind unterschiedlich. Obwohl die Information zur Anzeige der Zeichen in der Schriftartendatei vorhanden ist, haben sie in der Regel eine andere Nummer. Bei der Anzeige des Zeichens wird dessen Nummer benutzt, um das passende Bild des Zeichens zu finden. Als Resultat kommt dabei fehlerhaft angezeigter Text heraus.

Um Texte unterschiedlicher Sprachen in der selben Schriftart ordnungsgemäß anzuzeigen, muss der Text im Unicode-Format vorliegen und eine Unicode-fähige Schriftart genutzt werden. Obwohl der Unicode-Standard für jedes Zeichen eine Nummer definiert, ist der Mechanismus zur korrekten Darstellung der "Bilder" die Schriftart.

Viele Schriftarten unterstützen den Unicode. Schriftarten, die Unicode unterstützen, beinhalten aber nicht unbedingt Informationen zur Anzeige jedes einzelnen Zeichens. Es gibt etwa Unicode-Schriftarten, die nur thailändische Zeichen unterstützen oder Unicode-Schriftarten, die nur koreanische Zeichen unterstützen. Einen Schriftart zu erstellen, der jedes Zeichen aus jeder Sprache enthält würde enormen Aufwand erfordern. Daher existiert eine solche bisher nicht. Meist kann aber eine Schriftart gefunden werden, der den Anforderungen bestimmter Situationen gerecht wird.


Hilfe Nummer: 8993000