Unicode-Unterstützung: Unterschied zwischen den Versionen

Aus Asprova Hilfe
Wechseln zu: Navigation, Suche
(Über Unicode)
 
Zeile 35: Zeile 35:
  
 
== Über Unicode ==
 
== Über Unicode ==
Rechner verwenden zur Verarbeitung von Textdateien ein System, in dem jedem Zeichen eine Nummer zugeteilt ist. Zur Kommunikation von Textdateien zwischen Rechnern ist das Verständnis des Systemes auf beiden Rechnern vorausgesetzt.
+
Computer verwenden zur Verarbeitung von Textdateien ein System, in dem jedem Zeichen eine Nummer zugeordnet ist. Um Textdateien zwischen Computern auszutauschen, muss dafür auf den beteiligten Computern das gleiche System genutzt werden. Welche Nummer einem Zeichen zugeordnet ist, ist durch den Standard zur Codierung definiert. Ex existieren diverse Zeichencodierung-Standards, die meist der Zuweisung von Nummern zu Zeichen von nur einer bestimmten Sprache dienen.
  
Welche Nummer einem Zeichen zugeordnet ist, ist durch den Zeichencodierung-Standard definiert. Dabei existieren diverse Zeichencodierung-Standards, von welchen die meisten Zwecks Zuweisung von Nummern zu Zeichen einer bestimmten Sprache unterliegen.
+
Zum Beispiel wird in Japan üblicherweise die Codierung "Shift_JIS" verwendet. Sie wurde entwickelt, um Zeichen in der japanischen Sprache Nummern zuzuordnen, nicht aber Zeichen anderer Sprachen. "Shift_JIS kann dementsprechend keine Nummern von arabischen Schriftzeichen erkennen. Denn wenn ein Text-Dokument mit arabischen Schriftzeichen mit der Zeichencodierung "Shift_JIS" gespeichert wird, werden die arabischen Zeichen anders interpretiert, da sie die gleichen Nummern nutzen können, und das gespeicherte Dokument erscheint verstümmelt. Auf die gleiche Art erscheinen japanische Texte unter Verwendung einer Codierung für arabische Schriftzeichen verstümmelt.
  
Zum Beispiel wird in Japan üblicherweise die Shift_JIS Zeichencodierung verwendet. Diese Codierung wurde entwickelt, um eine Nummer einem Zeichen in der japanischen Sprache zuzuweisen, nicht aber an Zeichen anderer Sprachen. Die Shift_JIS-Codierung kann dementsprechend keine Nummern von arabischen Schriftzeichen erkennen. Denn wenn ein Text-Dokument mit arabischen Schriftzeichen mit der Zeichencodierung Shift_JIS gespeichert wird, werden die arabischen Zeichen anders interpretiert und das gespeicherte Dokument erscheint ungeordnet. Auf die gleiche Art erscheinen japanische Texte unter Verwendung einer Codierung für arabische Schriftzeichen ungeordnet.
+
Unicode ist eine Codierung zur Verarbeitung von Sprachen aus aller Welt. Es wurde nicht zur Verarbeitung einer bestimmten Sprache entwickelt, so dass mehrsprachige Textdokumente verarbeitet werden können.
  
Unicode ist eine Zeichenkodierung zur Verarbeitung von Sprachen aus aller Welt. Es wurde nicht zur Verarbeitung einer bestimmten Sprache entwickelt, wodurch mehrsprachige Textdokumente verarbeitet werden können.
+
Informationen zur Codierung ohne Unicode finden Sie [[Codierung|hier]].
  
 
=== Schriftarten ===
 
=== Schriftarten ===
Informationen zur Zeichencodierung finden Sie [[Codierung|hier]].
+
Die oben erläuterte "Codierung" ist der etablierte Standard zum Informationsaustausch zwischen Computern. Das System jedoch, mit dem Computer die Nummern in darstellbare Zeichen umwandelt, nennt sich "Schriftart" (Font). Wie bei der Codierung ordnen Schriftarten Zeichen Zahlen zu. Und wie Codierungen existieren Schriftarten zur Abbildung verschiedener Sprachen. Eine beliebte Schriftart zur Anzeige von japanischen Zeichen ist "MS PGothic". Sie enthält Informationen zur Anzeige von japanischen Schriftzeichen. Im Grunde genommen enthält sie "Bilder" für jedes Zeichen. Dementsprechend enthält sie keine Informationen zur Anzeige von Zeichen anderer Sprachen, wie beispielsweise Koreanisch.
  
Die oben erläuterte "Codierung" ist der etablierte Standard zum Informationsaustausch zwischen Computern und trägt den Namen Schrifttyp (Font). Das System entscheidet anhand der Nummer, welches Zeichen angezeigt wird. Wie bei der Codierung bilden Schrifttypen Zeichen anhand von Zahlen ab. Und wie Codierungen existieren Schrifttypen zur Abbildung von Sprachen. Ein Schrifttyp zur Anzeige von japanischen Zeichen heißt "MS P Gothic". Er enthält Informationen zur genauen Anzeige von japanischen Schriftzeichen. Im Grunde genommen enthält er "Bilder" für jedes Zeichen. Dementsprechend enthält er keine Informationen zur Anzeige von Zeichen aus anderen Sprachen, wie beispielsweise Koreanisch.
+
Je nach enthaltenen Informationen können Schriftarten durchaus Zeichen aus anderen Sprachen abbilden. Beispielsweise "MS PGothic" englische Zeichen darstellen, da die in der japanischen Codierung den englischen Zeichen zugeordneten Nummern, denen der englischen Codierung entsprechen und die Schriftart Informationen zur Anzeige englischer Zeichen beinhaltet.
  
Abhängig der darin enthaltenen, spezifischen Informationen können Schrifttypen eventuell Zeichen aus anderen Sprachen abbilden. Beispielsweise kann der oben genannte Schrifttyp "MS P Gothic" Zeichen aus dem Englischen darstellen. Der Grund dafür ist, dass englischen Zeichen zugewiesene Nummern in der japanischen Codierung vorkommen, den Englischen gleich sind und der Schrifttyp Informationen zur Anzeige von englischen Zeichen beinhaltet.
+
Die meisten chinesischen Schriftarten enthalten japanische Zeichen, aber die den Zeichen zugeordneten Nummern sind unterschiedlich. Obwohl die Information zur Anzeige der Zeichen in der Schriftartendatei vorhanden ist, haben sie in der Regel eine andere Nummer. Bei der Anzeige des Zeichens wird dessen Nummer benutzt, um das passende Bild des Zeichens zu finden. Als Resultat kommt dabei fehlerhaft angezeigter Text heraus.
  
Die meisten Schrifttypen der chinesischen Sprache enthalten auf ähnliche Weise japanische Zeichen, wobei die den Zeichen zugeordnete Nummern unterschiedlich sind. Obwohl die Information zur Anzeige von benötigten Zeichen auf dem Bildschirm in der Schrifttypdatei vorhanden ist, hat sie eine andere Nummer. Zur Anzeige des Zeichens auf dem Bildschirm wird dessen Nummer benutzt, um das Bild des Zeichens aufzusuchen. Als Resultat kommt dabei fehlerhaft angezeigter Text heraus.
+
Um Texte unterschiedlicher Sprachen in der selben Schriftart ordnungsgemäß anzuzeigen, muss der Text im Unicode-Format vorliegen und eine Unicode-fähige Schriftart genutzt werden. Obwohl der Unicode-Standard für jedes Zeichen eine Nummer definiert, ist der Mechanismus zur korrekten Darstellung der "Bilder" die Schriftart.
  
Um Texte aus unterschiedlichen Sprachen im selben Schrifttyp ordnungsgemäß anzuzeigen, muss der Text Unicode sein und ein Unicode-fähiger Schrifttyp genutzt werden. Obwohl der Unicode-Standard für jedes Zeichen eine Nummer definiert, ist der Mechanismus zur korrekten Darstellung der Schrifttyp.
+
Viele Schriftarten unterstützen den Unicode. Schriftarten, die Unicode unterstützen, beinhalten aber nicht unbedingt Informationen zur Anzeige jedes einzelnen Zeichens. Es gibt etwa  Unicode-Schriftarten, die nur thailändische Zeichen unterstützen oder Unicode-Schriftarten, die nur koreanische Zeichen unterstützen. Einen Schriftart zu erstellen, der jedes Zeichen aus jeder Sprache enthält würde enormen Aufwand erfordern. Daher existiert eine solche bisher nicht. Meist kann aber eine Schriftart gefunden werden, der den Anforderungen bestimmter Situationen gerecht wird.
 
 
Viele Schrifttypen unterstützen den Unicode. Schrifttypen, die Unicode unterstützen, beinhalten nicht unbedingt Informationen zur Anzeige jedes einzelnen Zeichens. Zum Beispiel: Unicode-Schrifttypen, die nur thailändische Zeichen unterstützen oder Unicode-Schrifttypen, die nur koreanische Zeichen unterstützen. Einen Schrifttyp zu kreieren, der jedes Zeichen aus jeder Sprache enthält würde enormen Aufwand abverlangen. Aus diesem Grund existiert ein solcher nicht. Meist kann ein Schrifttyp gefunden werden, der die Anforderungen bestimmter Situationen erfüllt.
 
  
 
<hr>
 
<hr>
 
<div align="right">Hilfe Nummer: 8993000</div>
 
<div align="right">Hilfe Nummer: 8993000</div>

Aktuelle Version vom 14. Dezember 2018, 14:20 Uhr

Hilfe Nummer: 8993000

Asprova unterstützt Unicode, so dass in einem Projekt Strings in verschiedenen Sprachen verwendet werden können.

Speichern & Exportieren

Sowohl beim Speichern des Projekts, als auch beim Export von Daten wird Unicode unterstützt. Nachfolgend wird auf die verschiedenen Möglichkeiten eingegangen. Allen ist gemein, dass es bei der Nutzung mehrere Sprachen ohne die Nutzung von Unicode es zu fehlerhaften Darstellung von Text und verstümmeltem Text kommen kann.

Projektdatei

Asprovas ARU-Standarddateityp unterstützt Unicode, so dass dies der Dateityp ist, der für Projekte mit mehreren Texten genutzt werden sollte.

Unicode01.jpg

Export (in Textdatei)

Beim Export von Daten in Textdateien können sie als [Datenquelle] "Textdatei (Unicode)" setzen.

Unicode02.jpg

Die Daten werden dann in UTF-8 codiert in die Datei geschrieben. Um die exportierte Datei anzuzeigen, muss ein Unicode-fähiges Programm verwendet werden. (Seit Windows 2000 unterstützt der Editor in Windows Unicode.) Werden Textdateien mit dieser Einstellung importiert, so werde diese ebenfalls in UTF-8 erwartet.

XML-Export

Beim Export von XML-Dateien kann die Codierung in UTF-8 vorgegeben werden.

Unicode03.jpg

Ist "UTF-8" aktiviert, so wird die exportierte XML-Datei in UTF-8 codiert gespeichert.

Auslastungs-/ Bestandsgraphen exportieren (RDB/Spreadsheet)

Beim Export von Rohdaten für Graphen kann die Codierung in UTF-8 vorgegeben werden.

Unicode04.jpg

Ist "UTF-8" aktiviert, so wird die exportierte Datei in UTF-8 codiert gespeichert.

Über Unicode

Computer verwenden zur Verarbeitung von Textdateien ein System, in dem jedem Zeichen eine Nummer zugeordnet ist. Um Textdateien zwischen Computern auszutauschen, muss dafür auf den beteiligten Computern das gleiche System genutzt werden. Welche Nummer einem Zeichen zugeordnet ist, ist durch den Standard zur Codierung definiert. Ex existieren diverse Zeichencodierung-Standards, die meist der Zuweisung von Nummern zu Zeichen von nur einer bestimmten Sprache dienen.

Zum Beispiel wird in Japan üblicherweise die Codierung "Shift_JIS" verwendet. Sie wurde entwickelt, um Zeichen in der japanischen Sprache Nummern zuzuordnen, nicht aber Zeichen anderer Sprachen. "Shift_JIS kann dementsprechend keine Nummern von arabischen Schriftzeichen erkennen. Denn wenn ein Text-Dokument mit arabischen Schriftzeichen mit der Zeichencodierung "Shift_JIS" gespeichert wird, werden die arabischen Zeichen anders interpretiert, da sie die gleichen Nummern nutzen können, und das gespeicherte Dokument erscheint verstümmelt. Auf die gleiche Art erscheinen japanische Texte unter Verwendung einer Codierung für arabische Schriftzeichen verstümmelt.

Unicode ist eine Codierung zur Verarbeitung von Sprachen aus aller Welt. Es wurde nicht zur Verarbeitung einer bestimmten Sprache entwickelt, so dass mehrsprachige Textdokumente verarbeitet werden können.

Informationen zur Codierung ohne Unicode finden Sie hier.

Schriftarten

Die oben erläuterte "Codierung" ist der etablierte Standard zum Informationsaustausch zwischen Computern. Das System jedoch, mit dem Computer die Nummern in darstellbare Zeichen umwandelt, nennt sich "Schriftart" (Font). Wie bei der Codierung ordnen Schriftarten Zeichen Zahlen zu. Und wie Codierungen existieren Schriftarten zur Abbildung verschiedener Sprachen. Eine beliebte Schriftart zur Anzeige von japanischen Zeichen ist "MS PGothic". Sie enthält Informationen zur Anzeige von japanischen Schriftzeichen. Im Grunde genommen enthält sie "Bilder" für jedes Zeichen. Dementsprechend enthält sie keine Informationen zur Anzeige von Zeichen anderer Sprachen, wie beispielsweise Koreanisch.

Je nach enthaltenen Informationen können Schriftarten durchaus Zeichen aus anderen Sprachen abbilden. Beispielsweise "MS PGothic" englische Zeichen darstellen, da die in der japanischen Codierung den englischen Zeichen zugeordneten Nummern, denen der englischen Codierung entsprechen und die Schriftart Informationen zur Anzeige englischer Zeichen beinhaltet.

Die meisten chinesischen Schriftarten enthalten japanische Zeichen, aber die den Zeichen zugeordneten Nummern sind unterschiedlich. Obwohl die Information zur Anzeige der Zeichen in der Schriftartendatei vorhanden ist, haben sie in der Regel eine andere Nummer. Bei der Anzeige des Zeichens wird dessen Nummer benutzt, um das passende Bild des Zeichens zu finden. Als Resultat kommt dabei fehlerhaft angezeigter Text heraus.

Um Texte unterschiedlicher Sprachen in der selben Schriftart ordnungsgemäß anzuzeigen, muss der Text im Unicode-Format vorliegen und eine Unicode-fähige Schriftart genutzt werden. Obwohl der Unicode-Standard für jedes Zeichen eine Nummer definiert, ist der Mechanismus zur korrekten Darstellung der "Bilder" die Schriftart.

Viele Schriftarten unterstützen den Unicode. Schriftarten, die Unicode unterstützen, beinhalten aber nicht unbedingt Informationen zur Anzeige jedes einzelnen Zeichens. Es gibt etwa Unicode-Schriftarten, die nur thailändische Zeichen unterstützen oder Unicode-Schriftarten, die nur koreanische Zeichen unterstützen. Einen Schriftart zu erstellen, der jedes Zeichen aus jeder Sprache enthält würde enormen Aufwand erfordern. Daher existiert eine solche bisher nicht. Meist kann aber eine Schriftart gefunden werden, der den Anforderungen bestimmter Situationen gerecht wird.


Hilfe Nummer: 8993000