Unicode-Unterstützung: Unterschied zwischen den Versionen

Aus Asprova Hilfe
Wechseln zu: Navigation, Suche
(Imported from text file)
 
(Über Unicode)
 
(7 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
{{DISPLAYTITLE:Unicode Support}}
+
{{DISPLAYTITLE:Unicode-Unterstützung}}
 
<div align="right">Hilfe Nummer: 8993000</div>
 
<div align="right">Hilfe Nummer: 8993000</div>
 
 
<hr>
 
<hr>
Unicode-Unterstützung
 
  
Ab Version 4.2.0 unterstützt Asprova Unicodes. Wenn Texte mit mehreren verschiedenen Sprachen in einem Projekt vorhanden sind, kann dieser Text nun ohne Störungen angezeigt werden (vorausgesetzt, die Einstellungen der Schriftart sind geeignet).<br />Um Unicode-Daten in Ihren Projekten verwenden zu können, sollten Sie die unten angeführten und erläuterten Funktionen beachten.<br />(Um weiterhin mit Projektdaten wie zuvor zu verfahren, müssen keine Einstellungen geändert werden, das Programmverhalten wird nicht beeinflusst).
+
Asprova unterstützt Unicode, so dass in einem Projekt Strings in verschiedenen Sprachen verwendet werden können.  
  
Bitte beachten Sie, dass die Unicode-Unterstützung nicht automatisch bedeutet, dass Texte auf dem Bildschirm korrekt angezeigt werden. Beachten Sie das unten stehende Thema über Schriftarten.
+
== Speichern & Exportieren ==
 
+
Sowohl beim Speichern des Projekts, als auch beim Export von Daten wird Unicode unterstützt. Nachfolgend wird auf die verschiedenen Möglichkeiten eingegangen. Allen ist gemein, dass es bei der Nutzung mehrere Sprachen ohne die Nutzung von Unicode es zu fehlerhaften Darstellung von Text und verstümmeltem Text kommen kann.
 
 
aru-Dateien
 
 
 
Beim Speichern eines Projekts kann der Dateityp als Unicode festgelegt werden.
 
  
 +
=== Projektdatei ===
 +
Asprovas ARU-Standarddateityp unterstützt Unicode, so dass dies der Dateityp ist, der für Projekte mit mehreren Texten genutzt werden sollte.
  
 
[[Image:unicode01.jpg]]
 
[[Image:unicode01.jpg]]
  
Für Projekte mit mehrsprachigen Texten ist es ratsam, das Projekt als aru-Datei zu speichern.
+
=== Export (in Textdatei) ===
 
+
Beim Export von Daten in Textdateien können sie als [Datenquelle] "Textdatei (Unicode)" setzen.
<nowiki>*</nowiki> Wenn der aru-Dateityp nicht verwendet wird, können Projekte mit mehrsprachigen Texten beim nächsten Öffnen verzerrt erscheinen.
 
 
 
 
 
Datenexport (Text)
 
 
 
Beim Exportieren von Daten in eine Textdatei kann der Datenquellentyp als "Text Datei (Unicode)" angegeben werden.
 
 
 
  
 
[[Image:unicode02.jpg]]
 
[[Image:unicode02.jpg]]
  
Wenn Sie "Text Datei (Unicode)" verwenden, wird die exportierte Datei als UTF-8 Text geschrieben.<br />Um die exportierte Datei anzuzeigen, muss ein unicode-fähiger Text-Viewer verwendet werden. (Von Windows 2000 an sind die Standard-Editor-Programm unicode-fähig.)<br />In der gleichen Weise werden Textdateien mit dieser Einstellung importiert. Die importierte Textdatei sollte im UTF-8-Format vorliegen.
+
Die Daten werden dann in UTF-8 codiert in die Datei geschrieben. Um die exportierte Datei anzuzeigen, muss ein Unicode-fähiges Programm verwendet werden. (Seit Windows 2000 unterstützt der Editor in Windows Unicode.) Werden Textdateien mit dieser Einstellung importiert, so werde diese ebenfalls in UTF-8 erwartet.
 
 
<nowiki>*</nowiki>Wenn die Option (Unicode) nicht verwendet wird, können die exportierten Daten aus Projekten mit mehrsprachigen Texten ungeordnet erscheinen.
 
 
 
 
 
XML Export
 
 
 
Bei Verwendung der XML-Exportfunktion kann das Exportformat als Unicode festgelegt werden.
 
  
 +
=== XML-Export ===
 +
Beim Export von XML-Dateien kann die Codierung in UTF-8 vorgegeben werden.
  
 
[[Image:unicode03.jpg]]
 
[[Image:unicode03.jpg]]
  
Wenn das "UTF-8" Kontrollkästchen aktiviert ist, wird die exportierte XML-Datei im UTF-8-Format gespeichert.
+
Ist "UTF-8" aktiviert, so wird die exportierte XML-Datei in UTF-8 codiert gespeichert.
 
 
<nowiki>*</nowiki>Wenn die Option (Unicode) nicht verwendet wird, können die exportierten Daten aus Projekten mit mehrsprachigen Texten ungeordnet erscheinen.
 
 
 
 
 
Export von Auslastungsgraph und Bestandsgraph (RDB/Spreadsheet)
 
 
 
Beim Export von Diagrammdaten kann das Exportformat als Unicode festgelegt werden.
 
  
 +
=== Auslastungs-/ Bestandsgraphen exportieren (RDB/Spreadsheet) ===
 +
Beim Export von Rohdaten für Graphen kann die Codierung in UTF-8 vorgegeben werden.
  
 
[[Image:unicode04.jpg]]
 
[[Image:unicode04.jpg]]
  
Wenn das "UTF-8" Kontrollkästchen aktiviert ist, wird die exportierte Grafik-Datei im UTF-8-Format gespeichert.
+
Ist "UTF-8" aktiviert, so wird die exportierte Datei in UTF-8 codiert gespeichert.
 
 
<nowiki>*</nowiki>Wenn die Option (Unicode) nicht verwendet wird, können die exportierten Daten aus Projekten mit mehrsprachigen Texten ungeordnet erscheinen.
 
 
 
 
 
 
 
Über Unicodes
 
 
 
Um Textdateien zu verarbeiten, verwenden Computer ein System, bei dem jedem Charakter eine Nummer zugeteilt ist. <br />Um Textdateien zu einem anderen Computer kommunizieren zu können, kann, muss der andere Computer die Nummerierung, die jedem Zeichen zugeordnet ist, verstehen.
 
 
 
Welche Nummer einem Zeichen zugeordnet ist, ist durch einen Standard, bekannt als Zeichencodierung, definiert. <br />Es gibt viele verschiedene Zeichencodierungen und die meisten von ihnen sind Zwecks Zuweisung von Nummern zu Zeichen einer bestimmten Sprache entwickelt.
 
 
 
Zum Beispiel wird in Japan üblicherweise die Shift_JIS Zeichencodierung verwendet. Diese Codierung wurde entwickelt, um eine Nummer einem Zeichen in der japanischen Sprache zuweisen und keine Zeichen aus anderen Sprachen.<br />Als Ergebnis weist die Shift_JIS-Codierung keine Nummern aud die beispielweise arabische Schriftzeichen verarbeiten.<br />Wenn ein Text-Dokument mit arabischen Schriftzeichen mit der Zeichencodierung Shift_JIS gespeichert wird, werden die arabischen Zeichen anders interpretiert und das gespeicherte Dokument wird ungeordnet erscheinen.<br />In gleicher Weise erscheinen japanische Texte, die unter Verwendung einer Codierung für arabische Schriftzeichen gesichert wurden in ungeordneter Form.
 
 
 
Unicode ist eine Zeichenkodierung, die dazu entwickelt ist, Sprachen aus aller Welt zu verarbeiten.<br />Da Unicode nicht für die Verarbeitung von einer bestimmten Sprache entwickelt ist, können mehrsprachige Textdokumente verarbeitet werden.
 
 
 
  
Unicode und Schrifttyp
+
== Über Unicode ==
 +
Computer verwenden zur Verarbeitung von Textdateien ein System, in dem jedem Zeichen eine Nummer zugeordnet ist. Um Textdateien zwischen Computern auszutauschen, muss dafür auf den beteiligten Computern das gleiche System genutzt werden. Welche Nummer einem Zeichen zugeordnet ist, ist durch den Standard zur Codierung definiert. Ex existieren diverse Zeichencodierung-Standards, die meist der Zuweisung von Nummern zu Zeichen von nur einer bestimmten Sprache dienen.
  
Informationen zur Zeichencodierung finden Sie [[Über Ecodings…| hier ]].
+
Zum Beispiel wird in Japan üblicherweise die Codierung "Shift_JIS" verwendet. Sie wurde entwickelt, um Zeichen in der japanischen Sprache Nummern zuzuordnen, nicht aber Zeichen anderer Sprachen. "Shift_JIS kann dementsprechend keine Nummern von arabischen Schriftzeichen erkennen. Denn wenn ein Text-Dokument mit arabischen Schriftzeichen mit der Zeichencodierung "Shift_JIS" gespeichert wird, werden die arabischen Zeichen anders interpretiert, da sie die gleichen Nummern nutzen können, und das gespeicherte Dokument erscheint verstümmelt. Auf die gleiche Art erscheinen japanische Texte unter Verwendung einer Codierung für arabische Schriftzeichen verstümmelt.
  
Die oben erläuterte "Codierung" gilt als Standard für den Informationsaustausch zwischen Computern. Das System eines Computers, welches mit Blick auf auf die Zahl eines Zeichens entscheidet, wie dieses auf dem Bildschirm Zeichen angezeigt wird, ist bekannt als Schrifttyp (Font). Wie die Codierung bilden Schrifttypen Zeichen anhand von Zahlen ab. Wie Codierungen sind viele Schrifttypen entwickelt, um eine Sprache abzubilden. Ein Schrifttyp der beispielsweise genutzt wird um Japanisch azuzeigen, wird MS P Gothic genannt. Dieser Schrifttyp enthält Informationen, wie japanische Zeichen auf dem Bildschirm angezeigt werden sollen. Im Wesentlichen beinhaltet er "Bilder" für jedes Zeichen. Da dieser Typ jedoch für japanische Texte entwicklet ist, enthält er keine Informationen, wie beispielsweise koreanische Zeichen abgebildet werden können.
+
Unicode ist eine Codierung zur Verarbeitung von Sprachen aus aller Welt. Es wurde nicht zur Verarbeitung einer bestimmten Sprache entwickelt, so dass mehrsprachige Textdokumente verarbeitet werden können.
  
In Abhängigkeit von den spezifischen Informationen, die in dem Schrifttypen enthalten sind, können auch andere Sprachen als solche, für die er vorgesehen ist, angezeigt werden. Der oben angeführte Schrifttyp MS P Gothic beispielsweise kann Zeichen aus dem Englischen darstellen, auch wenn er keine koreanischen Zeichen anzeigen kann. Dies liegt daran, dass Zahlen, die englischen Zeichen zugeordnet sind in der japanischen Codierung vorkommen und selbe Bedeutung haben, wie in der englischen Codierung. Zudem enthält der Schrifttyp Informationen zur Wiedergabe von englischen Zeichen. Wie in diesem Fall ist es teilweise möglich, mehr als eine Sprache abzubilden.
+
Informationen zur Codierung ohne Unicode finden Sie [[Codierung|hier]].
  
Ebenso enthalten die meisten Schrifttypen, die für die chinesische Sprache entwickelt sind, Zeichen der japanischen Sprache, wobei die Zahlen, die den Zeichen zugeordnet sind unterschiedlich sind. Das bedeutet, dass auch wenn Informationen für die Ausgabe eines Zeichens auf einem Bildschirm in der Schrifttypen-Datei existieren, die Nummer eine andere ist. Wenn also ein solches Zeichen auf dem Bildschirm angezeigt wird, für das eine Number zu Wiedergabe des "Bildes" vorgesehen ist, wird ein ganz anderers Zeichen als gewünscht herausgegeben. Das Ergebnis ist ein ungeordneter und falscher Text. Es hängt also von der Schrifttypen-Datei ab, aber generell ist es schwierig, zwei Sprachen, durch die Nutzung von nur einer Schrifttypen-Datei abzubilden. Wenn die Codierung auf die chinesische Sprache eingestellt ist, wird der japanische Text ungeordnet und falsch ausgegeben und wenn die Codierung auf die japanische Sprache eingestellt ist, wird der chinesische Text ungeordnet und falsch ausgegeben.
+
=== Schriftarten ===
 +
Die oben erläuterte "Codierung" ist der etablierte Standard zum Informationsaustausch zwischen Computern. Das System jedoch, mit dem Computer die Nummern in darstellbare Zeichen umwandelt, nennt sich "Schriftart" (Font). Wie bei der Codierung ordnen Schriftarten Zeichen Zahlen zu. Und wie Codierungen existieren Schriftarten zur Abbildung verschiedener Sprachen. Eine beliebte Schriftart zur Anzeige von japanischen Zeichen ist "MS PGothic". Sie enthält Informationen zur Anzeige von japanischen Schriftzeichen. Im Grunde genommen enthält sie "Bilder" für jedes Zeichen. Dementsprechend enthält sie keine Informationen zur Anzeige von Zeichen anderer Sprachen, wie beispielsweise Koreanisch.
  
Um einen zuverlässigen Text, bestehend aus mehreren Sprachen und dem gleichen Schrifttyp wiederzugeben, ist es erforderlich, dass der Text zum einen als Unicode verfasst ist und das des Weiteren der Schrifttyp in der Lage ist diesen darzustellen. Obwohl der Unicode-Standard für jedes Zeichen eine Zahl definiert, der Mechnismus, der tatsächlich das korrekte "Bild" ausgibt, ist der Schrifttyp. Unicode und Schrifttyp mössen zusammen arbeiten. Es gibt viel Schrifttypen, die Unicode unterstützen, das bedeutet jedoch nicht zwingend, dass Informationen für die Ausgabe jedes möglichen Zeichensenthalten sind. Beispielsweise gibt es Unicode-Schrifttypen, die lediglich thaiwanesische Zeichen beinhalten und Unicode-Schrifttypen, die keine koreanischen Zeichen haben etc. Es wäre ein kaum zu bewältigender Aufwand, einen Schrifttypen zu entwickeln, der die Zeichen jeder Sprache enthält. Ein solcher Schrifttyp existiert bisher nicht. Generell ist es jedoch in den meisten Fällen möglich, einen Schrifttypen zu finden, der die Anforderungen einer bestimmten Situation erfüllt. (Zur Zeit ist der Schrifttyp "Arial Unicode MS" einer der vollständigsten Unicode-Schrifttypen. Dieser wurde auch bei den Screenshots in diesem Abschnitt genutzt)
+
Je nach enthaltenen Informationen können Schriftarten durchaus Zeichen aus anderen Sprachen abbilden. Beispielsweise "MS PGothic" englische Zeichen darstellen, da die in der japanischen Codierung den englischen Zeichen zugeordneten Nummern, denen der englischen Codierung entsprechen und die Schriftart Informationen zur Anzeige englischer Zeichen beinhaltet.
  
 +
Die meisten chinesischen Schriftarten enthalten japanische Zeichen, aber die den Zeichen zugeordneten Nummern sind unterschiedlich. Obwohl die Information zur Anzeige der Zeichen in der Schriftartendatei vorhanden ist, haben sie in der Regel eine andere Nummer. Bei der Anzeige des Zeichens wird dessen Nummer benutzt, um das passende Bild des Zeichens zu finden. Als Resultat kommt dabei fehlerhaft angezeigter Text heraus.
  
 +
Um Texte unterschiedlicher Sprachen in der selben Schriftart ordnungsgemäß anzuzeigen, muss der Text im Unicode-Format vorliegen und eine Unicode-fähige Schriftart genutzt werden. Obwohl der Unicode-Standard für jedes Zeichen eine Nummer definiert, ist der Mechanismus zur korrekten Darstellung der "Bilder" die Schriftart.
  
 +
Viele Schriftarten unterstützen den Unicode. Schriftarten, die Unicode unterstützen, beinhalten aber nicht unbedingt Informationen zur Anzeige jedes einzelnen Zeichens. Es gibt etwa  Unicode-Schriftarten, die nur thailändische Zeichen unterstützen oder Unicode-Schriftarten, die nur koreanische Zeichen unterstützen. Einen Schriftart zu erstellen, der jedes Zeichen aus jeder Sprache enthält würde enormen Aufwand erfordern. Daher existiert eine solche bisher nicht. Meist kann aber eine Schriftart gefunden werden, der den Anforderungen bestimmter Situationen gerecht wird.
  
 
<hr>
 
<hr>
 
<div align="right">Hilfe Nummer: 8993000</div>
 
<div align="right">Hilfe Nummer: 8993000</div>

Aktuelle Version vom 14. Dezember 2018, 14:20 Uhr

Hilfe Nummer: 8993000

Asprova unterstützt Unicode, so dass in einem Projekt Strings in verschiedenen Sprachen verwendet werden können.

Speichern & Exportieren

Sowohl beim Speichern des Projekts, als auch beim Export von Daten wird Unicode unterstützt. Nachfolgend wird auf die verschiedenen Möglichkeiten eingegangen. Allen ist gemein, dass es bei der Nutzung mehrere Sprachen ohne die Nutzung von Unicode es zu fehlerhaften Darstellung von Text und verstümmeltem Text kommen kann.

Projektdatei

Asprovas ARU-Standarddateityp unterstützt Unicode, so dass dies der Dateityp ist, der für Projekte mit mehreren Texten genutzt werden sollte.

Unicode01.jpg

Export (in Textdatei)

Beim Export von Daten in Textdateien können sie als [Datenquelle] "Textdatei (Unicode)" setzen.

Unicode02.jpg

Die Daten werden dann in UTF-8 codiert in die Datei geschrieben. Um die exportierte Datei anzuzeigen, muss ein Unicode-fähiges Programm verwendet werden. (Seit Windows 2000 unterstützt der Editor in Windows Unicode.) Werden Textdateien mit dieser Einstellung importiert, so werde diese ebenfalls in UTF-8 erwartet.

XML-Export

Beim Export von XML-Dateien kann die Codierung in UTF-8 vorgegeben werden.

Unicode03.jpg

Ist "UTF-8" aktiviert, so wird die exportierte XML-Datei in UTF-8 codiert gespeichert.

Auslastungs-/ Bestandsgraphen exportieren (RDB/Spreadsheet)

Beim Export von Rohdaten für Graphen kann die Codierung in UTF-8 vorgegeben werden.

Unicode04.jpg

Ist "UTF-8" aktiviert, so wird die exportierte Datei in UTF-8 codiert gespeichert.

Über Unicode

Computer verwenden zur Verarbeitung von Textdateien ein System, in dem jedem Zeichen eine Nummer zugeordnet ist. Um Textdateien zwischen Computern auszutauschen, muss dafür auf den beteiligten Computern das gleiche System genutzt werden. Welche Nummer einem Zeichen zugeordnet ist, ist durch den Standard zur Codierung definiert. Ex existieren diverse Zeichencodierung-Standards, die meist der Zuweisung von Nummern zu Zeichen von nur einer bestimmten Sprache dienen.

Zum Beispiel wird in Japan üblicherweise die Codierung "Shift_JIS" verwendet. Sie wurde entwickelt, um Zeichen in der japanischen Sprache Nummern zuzuordnen, nicht aber Zeichen anderer Sprachen. "Shift_JIS kann dementsprechend keine Nummern von arabischen Schriftzeichen erkennen. Denn wenn ein Text-Dokument mit arabischen Schriftzeichen mit der Zeichencodierung "Shift_JIS" gespeichert wird, werden die arabischen Zeichen anders interpretiert, da sie die gleichen Nummern nutzen können, und das gespeicherte Dokument erscheint verstümmelt. Auf die gleiche Art erscheinen japanische Texte unter Verwendung einer Codierung für arabische Schriftzeichen verstümmelt.

Unicode ist eine Codierung zur Verarbeitung von Sprachen aus aller Welt. Es wurde nicht zur Verarbeitung einer bestimmten Sprache entwickelt, so dass mehrsprachige Textdokumente verarbeitet werden können.

Informationen zur Codierung ohne Unicode finden Sie hier.

Schriftarten

Die oben erläuterte "Codierung" ist der etablierte Standard zum Informationsaustausch zwischen Computern. Das System jedoch, mit dem Computer die Nummern in darstellbare Zeichen umwandelt, nennt sich "Schriftart" (Font). Wie bei der Codierung ordnen Schriftarten Zeichen Zahlen zu. Und wie Codierungen existieren Schriftarten zur Abbildung verschiedener Sprachen. Eine beliebte Schriftart zur Anzeige von japanischen Zeichen ist "MS PGothic". Sie enthält Informationen zur Anzeige von japanischen Schriftzeichen. Im Grunde genommen enthält sie "Bilder" für jedes Zeichen. Dementsprechend enthält sie keine Informationen zur Anzeige von Zeichen anderer Sprachen, wie beispielsweise Koreanisch.

Je nach enthaltenen Informationen können Schriftarten durchaus Zeichen aus anderen Sprachen abbilden. Beispielsweise "MS PGothic" englische Zeichen darstellen, da die in der japanischen Codierung den englischen Zeichen zugeordneten Nummern, denen der englischen Codierung entsprechen und die Schriftart Informationen zur Anzeige englischer Zeichen beinhaltet.

Die meisten chinesischen Schriftarten enthalten japanische Zeichen, aber die den Zeichen zugeordneten Nummern sind unterschiedlich. Obwohl die Information zur Anzeige der Zeichen in der Schriftartendatei vorhanden ist, haben sie in der Regel eine andere Nummer. Bei der Anzeige des Zeichens wird dessen Nummer benutzt, um das passende Bild des Zeichens zu finden. Als Resultat kommt dabei fehlerhaft angezeigter Text heraus.

Um Texte unterschiedlicher Sprachen in der selben Schriftart ordnungsgemäß anzuzeigen, muss der Text im Unicode-Format vorliegen und eine Unicode-fähige Schriftart genutzt werden. Obwohl der Unicode-Standard für jedes Zeichen eine Nummer definiert, ist der Mechanismus zur korrekten Darstellung der "Bilder" die Schriftart.

Viele Schriftarten unterstützen den Unicode. Schriftarten, die Unicode unterstützen, beinhalten aber nicht unbedingt Informationen zur Anzeige jedes einzelnen Zeichens. Es gibt etwa Unicode-Schriftarten, die nur thailändische Zeichen unterstützen oder Unicode-Schriftarten, die nur koreanische Zeichen unterstützen. Einen Schriftart zu erstellen, der jedes Zeichen aus jeder Sprache enthält würde enormen Aufwand erfordern. Daher existiert eine solche bisher nicht. Meist kann aber eine Schriftart gefunden werden, der den Anforderungen bestimmter Situationen gerecht wird.


Hilfe Nummer: 8993000