Unicode-Unterstützung

Aus Asprova Hilfe
Wechseln zu: Navigation, Suche
Hilfe Nummer: 8993000

Asprova unterstützt Unicode, so dass in einem Projekt Strings in verschiedenen Sprachen verwendet werden können.

Speichern & Exportieren

Sowohl beim Speichern des Projekts, als auch beim Export von Daten wird Unicode unterstützt. Nachfolgend wird auf die verschiedenen Möglichkeiten eingegangen. Allen ist gemein, dass es bei der Nutzung mehrere Sprachen ohne die Nutzung von Unicode es zu fehlerhaften Darstellung von Text und verstümmeltem Text kommen kann.

Projektdatei

Asprovas ARU-Standarddateityp unterstützt Unicode, so dass dies der Dateityp ist, der für Projekte mit mehreren Texten genutzt werden sollte.

Unicode01.jpg

Export (in Textdatei)

Beim Export von Daten in Textdateien können sie als [Datenquelle] "Textdatei (Unicode)" setzen.

Unicode02.jpg

Die Daten werden dann in UTF-8 codiert in die Datei geschrieben. Um die exportierte Datei anzuzeigen, muss ein Unicode-fähiges Programm verwendet werden. (Seit Windows 2000 unterstützt der Editor in Windows Unicode.) Werden Textdateien mit dieser Einstellung importiert, so werde diese ebenfalls in UTF-8 erwartet.

XML-Export

Beim Export von XML-Dateien kann die Codierung in UTF-8 vorgegeben werden.

Unicode03.jpg

Ist "UTF-8" aktiviert, so wird die exportierte XML-Datei in UTF-8 codiert gespeichert.

Auslastungs-/ Bestandsgraphen exportieren (RDB/Spreadsheet)

Beim Export von Rohdaten für Graphen kann die Codierung in UTF-8 vorgegeben werden.

Unicode04.jpg

Ist "UTF-8" aktiviert, so wird die exportierte Datei in UTF-8 codiert gespeichert.

Über Unicode

Rechner verwenden zur Verarbeitung von Textdateien ein System, in dem jedem Zeichen eine Nummer zugeteilt ist. Zur Kommunikation von Textdateien zwischen Rechnern ist das Verständnis des Systemes auf beiden Rechnern vorausgesetzt.

Welche Nummer einem Zeichen zugeordnet ist, ist durch den Zeichencodierung-Standard definiert. Dabei existieren diverse Zeichencodierung-Standards, von welchen die meisten Zwecks Zuweisung von Nummern zu Zeichen einer bestimmten Sprache unterliegen.

Zum Beispiel wird in Japan üblicherweise die Shift_JIS Zeichencodierung verwendet. Diese Codierung wurde entwickelt, um eine Nummer einem Zeichen in der japanischen Sprache zuzuweisen, nicht aber an Zeichen anderer Sprachen. Die Shift_JIS-Codierung kann dementsprechend keine Nummern von arabischen Schriftzeichen erkennen. Denn wenn ein Text-Dokument mit arabischen Schriftzeichen mit der Zeichencodierung Shift_JIS gespeichert wird, werden die arabischen Zeichen anders interpretiert und das gespeicherte Dokument erscheint ungeordnet. Auf die gleiche Art erscheinen japanische Texte unter Verwendung einer Codierung für arabische Schriftzeichen ungeordnet.

Unicode ist eine Zeichenkodierung zur Verarbeitung von Sprachen aus aller Welt. Es wurde nicht zur Verarbeitung einer bestimmten Sprache entwickelt, wodurch mehrsprachige Textdokumente verarbeitet werden können.

Schriftarten

Informationen zur Zeichencodierung finden Sie hier.

Die oben erläuterte "Codierung" ist der etablierte Standard zum Informationsaustausch zwischen Computern und trägt den Namen Schrifttyp (Font). Das System entscheidet anhand der Nummer, welches Zeichen angezeigt wird. Wie bei der Codierung bilden Schrifttypen Zeichen anhand von Zahlen ab. Und wie Codierungen existieren Schrifttypen zur Abbildung von Sprachen. Ein Schrifttyp zur Anzeige von japanischen Zeichen heißt "MS P Gothic". Er enthält Informationen zur genauen Anzeige von japanischen Schriftzeichen. Im Grunde genommen enthält er "Bilder" für jedes Zeichen. Dementsprechend enthält er keine Informationen zur Anzeige von Zeichen aus anderen Sprachen, wie beispielsweise Koreanisch.

Abhängig der darin enthaltenen, spezifischen Informationen können Schrifttypen eventuell Zeichen aus anderen Sprachen abbilden. Beispielsweise kann der oben genannte Schrifttyp "MS P Gothic" Zeichen aus dem Englischen darstellen. Der Grund dafür ist, dass englischen Zeichen zugewiesene Nummern in der japanischen Codierung vorkommen, den Englischen gleich sind und der Schrifttyp Informationen zur Anzeige von englischen Zeichen beinhaltet.

Die meisten Schrifttypen der chinesischen Sprache enthalten auf ähnliche Weise japanische Zeichen, wobei die den Zeichen zugeordnete Nummern unterschiedlich sind. Obwohl die Information zur Anzeige von benötigten Zeichen auf dem Bildschirm in der Schrifttypdatei vorhanden ist, hat sie eine andere Nummer. Zur Anzeige des Zeichens auf dem Bildschirm wird dessen Nummer benutzt, um das Bild des Zeichens aufzusuchen. Als Resultat kommt dabei fehlerhaft angezeigter Text heraus.

Um Texte aus unterschiedlichen Sprachen im selben Schrifttyp ordnungsgemäß anzuzeigen, muss der Text Unicode sein und ein Unicode-fähiger Schrifttyp genutzt werden. Obwohl der Unicode-Standard für jedes Zeichen eine Nummer definiert, ist der Mechanismus zur korrekten Darstellung der Schrifttyp.

Viele Schrifttypen unterstützen den Unicode. Schrifttypen, die Unicode unterstützen, beinhalten nicht unbedingt Informationen zur Anzeige jedes einzelnen Zeichens. Zum Beispiel: Unicode-Schrifttypen, die nur thailändische Zeichen unterstützen oder Unicode-Schrifttypen, die nur koreanische Zeichen unterstützen. Einen Schrifttyp zu kreieren, der jedes Zeichen aus jeder Sprache enthält würde enormen Aufwand abverlangen. Aus diesem Grund existiert ein solcher nicht. Meist kann ein Schrifttyp gefunden werden, der die Anforderungen bestimmter Situationen erfüllt.


Hilfe Nummer: 8993000