Unicode-Unterstützung: Unterschied zwischen den Versionen

Aus Asprova Hilfe
Wechseln zu: Navigation, Suche
K (GK verschob die Seite Unicode Support nach Unicode-Unterstützung)
(Über Unicode)
 
(Eine dazwischenliegende Version desselben Benutzers wird nicht angezeigt)
Zeile 1: Zeile 1:
{{DISPLAYTITLE:Unicode Support}}
+
{{DISPLAYTITLE:Unicode-Unterstützung}}
 
<div align="right">Hilfe Nummer: 8993000</div>
 
<div align="right">Hilfe Nummer: 8993000</div>
 
 
<hr>
 
<hr>
Unicode-Unterstützung
 
  
Asprova unterstützt Unicodes ab Version 4.2.0. Texte in verschiedenen Sprachen in einem Projekt können ohne Störungen angezeigt werden (vorausgesetzt die Einstellungen der Schriftart sind geeignet). Um Unicode-Daten in Ihren Projekten zu verwenden, müssen die unten aufgelisteten und erläuterten Funktionen beachtet werden. (Um weiterhin mit Projektdaten wie bisher zu verfahren, müssen keine Einstellungen geändert werden).
+
Asprova unterstützt Unicode, so dass in einem Projekt Strings in verschiedenen Sprachen verwendet werden können.  
  
Die Unicode-Unterstützung garantiert nicht, dass Texte auf dem Bildschirm korrekt angezeigt werden. Beachten Sie das folgende Thema zu Schriftarten.
+
== Speichern & Exportieren ==
 +
Sowohl beim Speichern des Projekts, als auch beim Export von Daten wird Unicode unterstützt. Nachfolgend wird auf die verschiedenen Möglichkeiten eingegangen. Allen ist gemein, dass es bei der Nutzung mehrere Sprachen ohne die Nutzung von Unicode es zu fehlerhaften Darstellung von Text und verstümmeltem Text kommen kann.
  
 
+
=== Projektdatei ===
aru-Dateien
+
Asprovas ARU-Standarddateityp unterstützt Unicode, so dass dies der Dateityp ist, der für Projekte mit mehreren Texten genutzt werden sollte.
 
 
Beim Speichern eines Projektes kann der Dateityp als Unicode festgelegt werden.
 
  
 
[[Image:unicode01.jpg]]
 
[[Image:unicode01.jpg]]
  
 
+
=== Export (in Textdatei) ===
Wir empfehlen für Projekte mit mehrsprachigen Texten, das Projekt als aru-Datei zu speichern.
+
Beim Export von Daten in Textdateien können sie als [Datenquelle] "Textdatei (Unicode)" setzen.
 
 
<nowiki>*</nowiki> Wenn der aru-Dateityp nicht verwendet wird, können Projekte mit mehrsprachigen Texten beim nächsten Öffnen verzerrt erscheinen.
 
 
 
 
 
Datenexport (Text)
 
 
 
Bei Datenexport in eine Textdatei kann der Datenquellentyp als "Text Datei (Unicode)" angegeben werden.
 
  
 
[[Image:unicode02.jpg]]
 
[[Image:unicode02.jpg]]
  
 +
Die Daten werden dann in UTF-8 codiert in die Datei geschrieben. Um die exportierte Datei anzuzeigen, muss ein Unicode-fähiges Programm verwendet werden. (Seit Windows 2000 unterstützt der Editor in Windows Unicode.) Werden Textdateien mit dieser Einstellung importiert, so werde diese ebenfalls in UTF-8 erwartet.
  
Bei Verwendung von "Text Datei (Unicode)", wird die exportierte Datei als UTF-8 Text geschrieben. Um die exportierte Datei anzuzeigen, muss ein unicode-fähiger Text-Viewer verwendet werden. (Von Windows 2000 an sind die Standard-Editor-Programme unicode-fähig.) Textdateien mit dieser Einstellung werden auf die gleiche Art exportiert. Die importierte Textdatei sollte im UTF-8-Format vorliegen.
+
=== XML-Export ===
 
+
Beim Export von XML-Dateien kann die Codierung in UTF-8 vorgegeben werden.
<nowiki>*</nowiki>Wenn die Option (Unicode) nicht verwendet wird, erscheinen exportierte Projektdaten mit mehrsprachigen Texten eventell ungeordnet.
 
 
 
 
 
XML Export
 
 
 
Bei Verwendung der XML-Exportfunktion kann das Exportformat als Unicode festgelegt werden.
 
  
 
[[Image:unicode03.jpg]]
 
[[Image:unicode03.jpg]]
  
 +
Ist "UTF-8" aktiviert, so wird die exportierte XML-Datei in UTF-8 codiert gespeichert.
  
Wenn das "UTF-8" Kontrollkästchen aktiviert ist, wird die exportierte XML-Datei im UTF-8-Format gespeichert.
+
=== Auslastungs-/ Bestandsgraphen exportieren (RDB/Spreadsheet) ===
 
+
Beim Export von Rohdaten für Graphen kann die Codierung in UTF-8 vorgegeben werden.
<nowiki>*</nowiki>Wenn die Option (Unicode) nicht verwendet wird, erscheinen exportierte Projektdaten mit mehrsprachigen Texten eventell ungeordnet.
 
 
 
 
 
Auslastungsgraphen / Bestandsgraphen exportieren (RDB/Spreadsheet)
 
 
 
Beim Export von Diagrammdaten kann das Exportformat als Unicode festgelegt werden.
 
  
 
[[Image:unicode04.jpg]]
 
[[Image:unicode04.jpg]]
  
 +
Ist "UTF-8" aktiviert, so wird die exportierte Datei in UTF-8 codiert gespeichert.
  
Wenn das "UTF-8" Kontrollkästchen aktiviert ist, wird die exportierte Grafik-Datei im UTF-8-Format gespeichert.
+
== Über Unicode ==
 
+
Computer verwenden zur Verarbeitung von Textdateien ein System, in dem jedem Zeichen eine Nummer zugeordnet ist. Um Textdateien zwischen Computern auszutauschen, muss dafür auf den beteiligten Computern das gleiche System genutzt werden. Welche Nummer einem Zeichen zugeordnet ist, ist durch den Standard zur Codierung definiert. Ex existieren diverse Zeichencodierung-Standards, die meist der Zuweisung von Nummern zu Zeichen von nur einer bestimmten Sprache dienen.
<nowiki>*</nowiki>Wenn die Option (Unicode) nicht verwendet wird, erscheinen exportierte Projektdaten mit mehrsprachigen Texten eventuell ungeordnet.
 
 
 
 
 
Über Unicodes
 
 
 
Rechner verwenden zur Verarbeitung von Textdateien ein System, in dem jedem Zeichen eine Nummer zugeteilt ist. Zur Kommunikation von Textdateien zwischen Rechnern ist das Verständnis des Systemes auf beiden Rechnern vorausgesetzt.
 
 
 
Welche Nummer einem Zeichen zugeordnet ist, ist durch den Zeichencodierung-Standard definiert. Dabei existieren diverse Zeichencodierung-Standards, von welchen die meisten Zwecks Zuweisung von Nummern zu Zeichen einer bestimmten Sprache unterliegen.
 
 
 
Zum Beispiel wird in Japan üblicherweise die Shift_JIS Zeichencodierung verwendet. Diese Codierung wurde entwickelt, um eine Nummer einem Zeichen in der japanischen Sprache zuzuweisen, nicht aber an Zeichen anderer Sprachen. Die Shift_JIS-Codierung kann dementsprechend keine Nummern von arabischen Schriftzeichen erkennen. Denn wenn ein Text-Dokument mit arabischen Schriftzeichen mit der Zeichencodierung Shift_JIS gespeichert wird, werden die arabischen Zeichen anders interpretiert und das gespeicherte Dokument erscheint ungeordnet. Auf die gleiche Art erscheinen japanische Texte unter Verwendung einer Codierung für arabische Schriftzeichen ungeordnet.
 
 
 
Unicode ist eine Zeichenkodierung zur Verarbeitung von Sprachen aus aller Welt. Es wurde nicht zur Verarbeitung einer bestimmten Sprache entwickelt, wodurch mehrsprachige Textdokumente verarbeitet werden können.
 
 
 
  
Unicode und Schrifttyp
+
Zum Beispiel wird in Japan üblicherweise die Codierung "Shift_JIS" verwendet. Sie wurde entwickelt, um Zeichen in der japanischen Sprache Nummern zuzuordnen, nicht aber Zeichen anderer Sprachen. "Shift_JIS kann dementsprechend keine Nummern von arabischen Schriftzeichen erkennen. Denn wenn ein Text-Dokument mit arabischen Schriftzeichen mit der Zeichencodierung "Shift_JIS" gespeichert wird, werden die arabischen Zeichen anders interpretiert, da sie die gleichen Nummern nutzen können, und das gespeicherte Dokument erscheint verstümmelt. Auf die gleiche Art erscheinen japanische Texte unter Verwendung einer Codierung für arabische Schriftzeichen verstümmelt.
  
Informationen zur Zeichencodierung finden Sie [[Über Ecodings…| hier]].
+
Unicode ist eine Codierung zur Verarbeitung von Sprachen aus aller Welt. Es wurde nicht zur Verarbeitung einer bestimmten Sprache entwickelt, so dass mehrsprachige Textdokumente verarbeitet werden können.
  
Die oben erläuterte "Codierung" ist der etablierte Standard zum Informationsaustausch zwischen Computern und trägt den Namen Schrifttyp (Font). Das System entscheidet anhand der Nummer, welches Zeichen angezeigt wird. Wie bei der Codierung bilden Schrifttypen Zeichen anhand von Zahlen ab. Und wie Codierungen existieren Schrifttypen zur Abbildung von Sprachen. Ein Schrifttyp zur Anzeige von japanischen Zeichen heißt "MS P Gothic". Er enthält Informationen zur genauen Anzeige von japanischen Schriftzeichen. Im Grunde genommen enthält er "Bilder" für jedes Zeichen. Dementsprechend enthält er keine Informationen zur Anzeige von Zeichen aus anderen Sprachen, wie beispielsweise Koreanisch.
+
Informationen zur Codierung ohne Unicode finden Sie [[Codierung|hier]].
  
Abhängig der darin enthaltenen, spezifischen Informationen können Schrifttypen eventuell Zeichen aus anderen Sprachen abbilden. Beispielsweise kann der oben genannte Schrifttyp "MS P Gothic" Zeichen aus dem Englischen darstellen. Der Grund dafür ist, dass englischen Zeichen zugewiesene Nummern in der japanischen Codierung vorkommen, den Englischen gleich sind und der Schrifttyp Informationen zur Anzeige von englischen Zeichen beinhaltet.
+
=== Schriftarten ===
 +
Die oben erläuterte "Codierung" ist der etablierte Standard zum Informationsaustausch zwischen Computern. Das System jedoch, mit dem Computer die Nummern in darstellbare Zeichen umwandelt, nennt sich "Schriftart" (Font). Wie bei der Codierung ordnen Schriftarten Zeichen Zahlen zu. Und wie Codierungen existieren Schriftarten zur Abbildung verschiedener Sprachen. Eine beliebte Schriftart zur Anzeige von japanischen Zeichen ist "MS PGothic". Sie enthält Informationen zur Anzeige von japanischen Schriftzeichen. Im Grunde genommen enthält sie "Bilder" für jedes Zeichen. Dementsprechend enthält sie keine Informationen zur Anzeige von Zeichen anderer Sprachen, wie beispielsweise Koreanisch.
  
Die meisten Schrifttypen der chinesischen Sprache enthalten auf ähnliche Weise japanische Zeichen, wobei die den Zeichen zugeordnete Nummern unterschiedlich sind. Obwohl die Information zur Anzeige von benötigten Zeichen auf dem Bildschirm in der Schrifttypdatei vorhanden ist, hat sie eine andere Nummer. Zur Anzeige des Zeichens auf dem Bildschirm wird dessen Nummer benutzt, um das Bild des Zeichens aufzusuchen. Als Resultat kommt dabei fehlerhaft angezeigter Text heraus.
+
Je nach enthaltenen Informationen können Schriftarten durchaus Zeichen aus anderen Sprachen abbilden. Beispielsweise "MS PGothic" englische Zeichen darstellen, da die in der japanischen Codierung den englischen Zeichen zugeordneten Nummern, denen der englischen Codierung entsprechen und die Schriftart Informationen zur Anzeige englischer Zeichen beinhaltet.
  
Um Texte aus unterschiedlichen Sprachen im selben Schrifttyp ordnungsgemäß anzuzeigen, muss der Text Unicode sein und ein Unicode-fähiger Schrifttyp genutzt werden. Obwohl der Unicode-Standard für jedes Zeichen eine Nummer definiert, ist der Mechanismus zur korrekten Darstellung der Schrifttyp.
+
Die meisten chinesischen Schriftarten enthalten japanische Zeichen, aber die den Zeichen zugeordneten Nummern sind unterschiedlich. Obwohl die Information zur Anzeige der Zeichen in der Schriftartendatei vorhanden ist, haben sie in der Regel eine andere Nummer. Bei der Anzeige des Zeichens wird dessen Nummer benutzt, um das passende Bild des Zeichens zu finden. Als Resultat kommt dabei fehlerhaft angezeigter Text heraus.
  
Viele Schrifttypen unterstützen den Unicode. Schrifttypen, die Unicode unterstützen, beinhalten nicht unbedingt Informationen zur Anzeige jedes einzelnen Zeichens. Zum Beispiel: Unicode-Schrifttypen, die nur thailändische Zeichen unterstützen oder Unicode-Schrifttypen, die nur koreanische Zeichen unterstützen. Einen Schrifttyp zu kreieren, der jedes Zeichen aus jeder Sprache enthält würde enormen Aufwand abverlangen. Aus diesem Grund existiert ein solcher nicht. Meist kann ein Schrifttyp gefunden werden, der die Anforderungen bestimmter Situationen erfüllt.
+
Um Texte unterschiedlicher Sprachen in der selben Schriftart ordnungsgemäß anzuzeigen, muss der Text im Unicode-Format vorliegen und eine Unicode-fähige Schriftart genutzt werden. Obwohl der Unicode-Standard für jedes Zeichen eine Nummer definiert, ist der Mechanismus zur korrekten Darstellung der "Bilder" die Schriftart.
  
 +
Viele Schriftarten unterstützen den Unicode. Schriftarten, die Unicode unterstützen, beinhalten aber nicht unbedingt Informationen zur Anzeige jedes einzelnen Zeichens. Es gibt etwa  Unicode-Schriftarten, die nur thailändische Zeichen unterstützen oder Unicode-Schriftarten, die nur koreanische Zeichen unterstützen. Einen Schriftart zu erstellen, der jedes Zeichen aus jeder Sprache enthält würde enormen Aufwand erfordern. Daher existiert eine solche bisher nicht. Meist kann aber eine Schriftart gefunden werden, der den Anforderungen bestimmter Situationen gerecht wird.
  
 
<hr>
 
<hr>
 
<div align="right">Hilfe Nummer: 8993000</div>
 
<div align="right">Hilfe Nummer: 8993000</div>

Aktuelle Version vom 14. Dezember 2018, 14:20 Uhr

Hilfe Nummer: 8993000

Asprova unterstützt Unicode, so dass in einem Projekt Strings in verschiedenen Sprachen verwendet werden können.

Speichern & Exportieren

Sowohl beim Speichern des Projekts, als auch beim Export von Daten wird Unicode unterstützt. Nachfolgend wird auf die verschiedenen Möglichkeiten eingegangen. Allen ist gemein, dass es bei der Nutzung mehrere Sprachen ohne die Nutzung von Unicode es zu fehlerhaften Darstellung von Text und verstümmeltem Text kommen kann.

Projektdatei

Asprovas ARU-Standarddateityp unterstützt Unicode, so dass dies der Dateityp ist, der für Projekte mit mehreren Texten genutzt werden sollte.

Unicode01.jpg

Export (in Textdatei)

Beim Export von Daten in Textdateien können sie als [Datenquelle] "Textdatei (Unicode)" setzen.

Unicode02.jpg

Die Daten werden dann in UTF-8 codiert in die Datei geschrieben. Um die exportierte Datei anzuzeigen, muss ein Unicode-fähiges Programm verwendet werden. (Seit Windows 2000 unterstützt der Editor in Windows Unicode.) Werden Textdateien mit dieser Einstellung importiert, so werde diese ebenfalls in UTF-8 erwartet.

XML-Export

Beim Export von XML-Dateien kann die Codierung in UTF-8 vorgegeben werden.

Unicode03.jpg

Ist "UTF-8" aktiviert, so wird die exportierte XML-Datei in UTF-8 codiert gespeichert.

Auslastungs-/ Bestandsgraphen exportieren (RDB/Spreadsheet)

Beim Export von Rohdaten für Graphen kann die Codierung in UTF-8 vorgegeben werden.

Unicode04.jpg

Ist "UTF-8" aktiviert, so wird die exportierte Datei in UTF-8 codiert gespeichert.

Über Unicode

Computer verwenden zur Verarbeitung von Textdateien ein System, in dem jedem Zeichen eine Nummer zugeordnet ist. Um Textdateien zwischen Computern auszutauschen, muss dafür auf den beteiligten Computern das gleiche System genutzt werden. Welche Nummer einem Zeichen zugeordnet ist, ist durch den Standard zur Codierung definiert. Ex existieren diverse Zeichencodierung-Standards, die meist der Zuweisung von Nummern zu Zeichen von nur einer bestimmten Sprache dienen.

Zum Beispiel wird in Japan üblicherweise die Codierung "Shift_JIS" verwendet. Sie wurde entwickelt, um Zeichen in der japanischen Sprache Nummern zuzuordnen, nicht aber Zeichen anderer Sprachen. "Shift_JIS kann dementsprechend keine Nummern von arabischen Schriftzeichen erkennen. Denn wenn ein Text-Dokument mit arabischen Schriftzeichen mit der Zeichencodierung "Shift_JIS" gespeichert wird, werden die arabischen Zeichen anders interpretiert, da sie die gleichen Nummern nutzen können, und das gespeicherte Dokument erscheint verstümmelt. Auf die gleiche Art erscheinen japanische Texte unter Verwendung einer Codierung für arabische Schriftzeichen verstümmelt.

Unicode ist eine Codierung zur Verarbeitung von Sprachen aus aller Welt. Es wurde nicht zur Verarbeitung einer bestimmten Sprache entwickelt, so dass mehrsprachige Textdokumente verarbeitet werden können.

Informationen zur Codierung ohne Unicode finden Sie hier.

Schriftarten

Die oben erläuterte "Codierung" ist der etablierte Standard zum Informationsaustausch zwischen Computern. Das System jedoch, mit dem Computer die Nummern in darstellbare Zeichen umwandelt, nennt sich "Schriftart" (Font). Wie bei der Codierung ordnen Schriftarten Zeichen Zahlen zu. Und wie Codierungen existieren Schriftarten zur Abbildung verschiedener Sprachen. Eine beliebte Schriftart zur Anzeige von japanischen Zeichen ist "MS PGothic". Sie enthält Informationen zur Anzeige von japanischen Schriftzeichen. Im Grunde genommen enthält sie "Bilder" für jedes Zeichen. Dementsprechend enthält sie keine Informationen zur Anzeige von Zeichen anderer Sprachen, wie beispielsweise Koreanisch.

Je nach enthaltenen Informationen können Schriftarten durchaus Zeichen aus anderen Sprachen abbilden. Beispielsweise "MS PGothic" englische Zeichen darstellen, da die in der japanischen Codierung den englischen Zeichen zugeordneten Nummern, denen der englischen Codierung entsprechen und die Schriftart Informationen zur Anzeige englischer Zeichen beinhaltet.

Die meisten chinesischen Schriftarten enthalten japanische Zeichen, aber die den Zeichen zugeordneten Nummern sind unterschiedlich. Obwohl die Information zur Anzeige der Zeichen in der Schriftartendatei vorhanden ist, haben sie in der Regel eine andere Nummer. Bei der Anzeige des Zeichens wird dessen Nummer benutzt, um das passende Bild des Zeichens zu finden. Als Resultat kommt dabei fehlerhaft angezeigter Text heraus.

Um Texte unterschiedlicher Sprachen in der selben Schriftart ordnungsgemäß anzuzeigen, muss der Text im Unicode-Format vorliegen und eine Unicode-fähige Schriftart genutzt werden. Obwohl der Unicode-Standard für jedes Zeichen eine Nummer definiert, ist der Mechanismus zur korrekten Darstellung der "Bilder" die Schriftart.

Viele Schriftarten unterstützen den Unicode. Schriftarten, die Unicode unterstützen, beinhalten aber nicht unbedingt Informationen zur Anzeige jedes einzelnen Zeichens. Es gibt etwa Unicode-Schriftarten, die nur thailändische Zeichen unterstützen oder Unicode-Schriftarten, die nur koreanische Zeichen unterstützen. Einen Schriftart zu erstellen, der jedes Zeichen aus jeder Sprache enthält würde enormen Aufwand erfordern. Daher existiert eine solche bisher nicht. Meist kann aber eine Schriftart gefunden werden, der den Anforderungen bestimmter Situationen gerecht wird.


Hilfe Nummer: 8993000