ISO / IEC 8859-5: 1999 Informationstechnologie - 8-Bit-Einzelbyte-Codierung Grafische Zeichensätze - Teil 5: Lateinisches / Kyrillisches Alphabet ist Teil der ISO / IEC 8859-Reihe von ASCII-basierten Standardzeichencodierungen, erste Auflage, 1988 veröffentlicht. Es wird informell als Lateinisch / Kyrillisch bezeichnet . Es sollte Sprachen abdecken, die ein kyrillisches Alphabet verwenden, z. B. Bulgarisch, Weißrussisch, Russisch, Serbisch und Mazedonisch, es wurde jedoch nie weit verbreitet. In der Sowjetunion wäre es von 1933 bis 1990 auch für Ukrainisch verwendbar gewesen, aber es fehlt der ukrainische Brief der in der ukrainischen Orthographie vor und seit und während dieser Zeit außerhalb des Sowjets benötigt wird Ukraine. Daher erstellte IBM die Codepage 1124.
ISO-8859-5 ist der von IANA bevorzugte Zeichensatz für diesen Standard, wenn er mit den Steuercodes C0 und C1 aus ISO / IEC 6429 ergänzt wird.
Die 8-Bit-Kodierungen KOI8-R und KOI8-U, CP866 und auch Windows-1251 werden viel häufiger verwendet. Eine andere Möglichkeit, kyrillisch darzustellen, ist Unicode.
Die Windows-Codepage für ISO-8859-5 ist Codepage 28595 auch bekannt als Windows-28595 . [1]
Codepage-Layout [ edit
Buchstabe Nummer Interpunktion Symbol Anderes undefined
[ edit ]
Der ECMA-113-Standard entspricht ISO-8859-5 seit seiner zweiten Auflage, [2] seiner ersten Ausgabe (ISO) -IR-111) war eine Erweiterung des früheren KOI-8 (definiert durch GOST 19768-74), in dem die russischen Buchstaben nach Möglichkeit in gleicher Weise wie ihre ASCII-Äquivalente angeordnet sind. Der ursprüngliche Entwurf von ISO-8859-5 (DIS-8859-5: 1987) folgte ISO-IR-111, wurde jedoch [2] überarbeitet, nachdem GOST 19768-74 [3] durch das neue ISO-IR-153 ersetzt wurde 1987, in dem die russischen Buchstaben (außer Ё) in alphabetischer Reihenfolge angeordnet wurden. [3][4] ISO-IR-153 enthält die russischen Buchstaben einschließlich Ё und den geschützten Leerraum und den weichen Bindestrich; Das vollständige kyrillische Set von ISO-8859-5 wird auch als ISO-IR-144 bezeichnet. [5]
Möglicherweise als Folge dieser Verwirrung listet RFC 1345 fälschlicherweise eine weitere Codepage als "ISO" -IR-111 ", wobei die Buchstabenreihenfolge und die Groß- / Kleinschreibung von ISO-8859-5 mit der Zeilenreihenfolge von ISO-IR-111 kombiniert wird (und daher mit beiden in der Praxis nicht kompatibel, in der Praxis jedoch teilweise kompatibel [6] mit Windows-1251 ist [7] [6]
Die IBM-Code-Seite 1124 ist größtenteils mit ISO-8859-5 identisch, ersetzt jedoch ѓ durch ґ für den ukrainischen Gebrauch.
ISO-IR-200, "Uralic Supplementary Cyrillic Set", [8] wurde 1998 von Everson Gunn Teoranta (damals von Michael Everson vor der Gründung von Evertype im Jahr 2001 gerichtet) und 19659021 registriert ändert einige der nicht-russischen Buchstaben, um die Sprachen Kildin Sami, Komi und Nenets zu unterstützen, nicht jedoch von ISO-8859-5 selbst unterstützt. Michael Everson führte auch Mac OS Barents Cyrillic für dieselben Sprachen unter klassischem Mac OS ein.
ISO-IR-201, "Volgaic Supplementary Cyrillic Set", [10] wurde auf ähnliche Weise von Everson Gunn Teoranta eingeführt, um die in den russischen Titularrepubliken gesprochenen Sprachen Chuvash, Komi, Mari und Udmurt zu unterstützen.
Verweise [ edit ]
Externe Links [ edit ]
- ISO / IEC 8859-5: 1999
- Standard ECMA- 113: 8-Bit-codierte Zeichensätze mit einem Byte - lateinisches / kyrillisches Alphabet 3. Auflage (Dezember 1999)
- ISO-IR 144 kyrillischer Teil des lateinischen / kyrillischen Alphabets [1Mai1945] 1988 von ISO 8859-5 (2. Version)
No comments:
Post a Comment