ISO / IEC 8859-2: 1999 Informationstechnologie - 8-Bit-Einzelbyte-Zeichensätze - Teil 2: Lateinisches Alphabet Nr. 2 ist Teil der ISO / Erste Reihe von ASCII-basierten ASCII-Zeichencodierungen, erste Auflage, veröffentlicht 1987. Sie wird informell als "Latin-2" bezeichnet. Es ist in der Regel für zentrale [1] oder "osteuropäische" Sprachen gedacht, die in lateinischer Schrift geschrieben sind. Beachten Sie, dass sich ISO / IEC 8859-2 stark von der Codepage 852 (MS-DOS Latin 2, PC Latin 2) unterscheidet, die in tschechischen und slowakischen Regionen auch als "Latin-2" bezeichnet wird. [2] Die Codepage 912 ist eine Erweiterung.
ISO-8859-2 ist der von IANA bevorzugte Charset-Name für diesen Standard, wenn er mit den Steuercodes C0 und C1 aus ISO / IEC 6429 ergänzt wird. 0,1% aller Webseiten verwenden im Dezember 2018 ISO 8859-2. [3] Microsoft hat Codepage 28592 alias Windows-28592 der ISO-8859-2 in Windows zugewiesen. IBM hat der ISO 8859-2 die Codepage 1111 zugewiesen.
Windows-1250 ähnelt ISO-8859-2 und enthält alle druckbaren Zeichen und mehr. Einige davon werden jedoch neu angeordnet (im Gegensatz zu Windows-1252, bei dem alle druckbaren Zeichen aus ISO-8859-1 an derselben Stelle bleiben).
Diese Codewerte können für die folgenden Sprachen verwendet werden:
Es kann auch für Rumänisch verwendet werden, ist jedoch für diese Sprache nicht geeignet, da Buchstaben s und t mit Kommas unten fehlen, obwohl es s und t mit ähnlich aussehenden Cedillen bereitstellt. Diese Buchstaben wurden in den ersten Versionen des Unicode-Standards vereinheitlicht, was bedeutet, dass das Erscheinungsbild mit Cedilla oder mit einem Komma als Auswahlzeichen und nicht als separate Zeichen behandelt wurde. Fonts, die für die Verwendung mit Rumänisch vorgesehen sind, sollten daher theoretisch an diesen Codepunkten Zeichen mit einem Komma enthalten.
Microsoft stellte solche Schriftarten für in Rumänien verkaufte Computer nicht wirklich zur Verfügung. Dennoch wurden ISO / IEC 8859-2 und Windows-1250 (mit dem gleichen Problem) stark für Rumänisch verwendet. Unicode hat die Komma-Varianten später von den Cedilla-Varianten getrennt und hat seitdem die Führung für Webseiten übernommen, die jedoch oft ohnehin s und t mit Cedilla haben. Unicode-Notizen aus dem Jahr 2014 Zitat benötigt dass das Entstimmen der Buchstaben mit Komma unten ein Fehler war, der zu Korruption in rumänischen Daten führte: Vorhandene Daten und Eingabemethoden würden immer noch die älteren enthalten Cedilla-Codepunkte, die die Textsuche erschweren.
Codeseitenlayout [ edit ]
In der folgenden Tabelle werden Zeichen mit ihren entsprechenden Unicode-Codepunkten angezeigt.
Buchstabe Nummer Interpunktion Symbol Anderes undefined
No comments:
Post a Comment