ISO / IEC 8859-6: 1999 Informationstechnologie - 8-Bit-Einzelbyte-Zeichensätze - Teil 6: Lateinisches / Arabisches Alphabet ist Teil der ISO / IEC 8859-Serie von ASCII-basierten Standard-Zeichencodierungen, Erstausgabe 1987. Sie wird informell als Latin / Arabic bezeichnet. Es wurde entworfen, um Arabisch abzudecken. Es werden nur nominale Buchstaben codiert, keine vorgeformten Formen der Buchstaben, daher ist für die Anzeige eine Formgebungsverarbeitung erforderlich. Es enthält nicht die zusätzlichen Buchstaben, die zum Schreiben der meisten arabischsprachigen Sprachen außer Arabisch selbst (wie Persisch, Urdu usw.) erforderlich sind.
ISO-8859-6 ist der von IANA bevorzugte Charset-Name für diesen Standard, wenn er mit den Steuercodes C0 und C1 aus ISO / IEC 6429 ergänzt wird. Der Text ist in logischer Reihenfolge, daher ist für die Anzeige eine BiDi-Verarbeitung erforderlich. Nominal ISO-8859-6 ( -Codeseite 28596 ) ist für "visuelle Ordnung" und ISO-8859-6-I (19459004) -Codepage 38596 ) ist für die logische Reihenfolge. In der Praxis und für HTML- und XML-Dokumente erforderlich, steht ISO-8859-6 jedoch auch für logischen Auftragstext. Es gibt auch ISO-8859-6-E das angeblich erfordert, dass die Direktionalität explizit mit speziellen Steuerzeichen angegeben wird; Diese letztere Variante wird in der Praxis nicht verwendet. IBM hat die Codepage 1089 der ISO 8859-6 zugewiesen. [1] Dies ist eine Emulation für ihr AIX-Betriebssystem.
In modernen Anwendungen wird Unicode gegenüber ISO-8859-6 bevorzugt, insbesondere im Internet. Bedeutung der dominanten UTF-8-Codierung für Webseiten (siehe auch Arabisches Skript in Unicode, vollständige Abdeckung, im Gegensatz zu ISO-8859-6 oder Windows 1256, die keine Extras enthalten). 0,1% aller Webseiten verwenden ISO-8859-6. [2][3]
Geschichte [ edit ]
ASMO 708 wurde 1986 von der inzwischen aufgelösten arabischen Organisation für Standardisierung und Metrologie [4] entwickelt Der 8-Bit-Standard für arabischsprachige Länder. Das Design dieses Zeichensatzes wurde vom vorherigen 7-Bit-Standard ASMO 449 inspiriert, es handelt sich jedoch nicht einfach um den 7-Bit-Zeichensatz, der in den oberen Teil verschoben wurde. es gibt einige unterschiede.
ASMO 708 ist ein bidirektionaler Zeichensatz. Der untere Teil des Zeichensatzes unterscheidet sich von der Norm ISO 646 in den Ziffern und in einigen Interpunktionszeichen. Je nach Kontext (ob die Zahlen in lateinischer oder arabischer Schrift liegen), werden die Ziffern entweder als lateinische oder arabische Ziffern dargestellt. In Abhängigkeit vom Kontext werden auch symmetrische Interpunktionszeichen umgekehrt, d. H. Wenn ein Interpunktionszeichen mit einer Öffnung erscheint, wird die Form entsprechend der Richtung der Schrift unterschiedlich dargestellt.
Der obere Teil des Zeichensatzes enthält nur die arabischen Buchstaben, arabische Interpunktion, die sich von der lateinischen Interpunktion unterscheidet, sowie wenige andere Zeichen.
ASMO 708 wurde in enger Zusammenarbeit [5] mit ECMA entwickelt, die es 1986 als eigenen ECMA-114-Standard übernahm. Es wurde auch als ISO-Standard als ISO 8859-6 genehmigt. 19659013] Es wurde auch als [1279004] IR 127 [7] im Jahr 1986 in das internationale Register für codierte Zeichensätze eingetragen.
Beziehung zu anderen Zeichensätzen [ edit ]
Einige andere Zeichensätze beziehen sich auf ASMO 708:
- ASMO 708 / French 1 [8] fügt französische Kleinbuchstaben hinzu;
- French 1 / ASMO 708 [8] fügt französische Kleinbuchstaben in ihren ISO 8859-1-Codepunkten ein und versetzt Arabische
- ISO / IR 167 [9] fügt französische und deutsche Zeichen hinzu;
- Microsofts -Codepage 708 fügt für MS-DOS französische Zeichen in ihren typischen Codepunkten aus der Codepage 437 hinzu
- Sowohl die Microsoft-Codepage 710 (Transparent Arabic) als auch die Microsoft-Codepage 720 (Transparent ASMO) für MS-DOS fügen französische Zeichen in ihren typischen Codepunkten von der Codepage 437 bis hinzu. versetzt die arabischen Zeichen, um zu ermöglichen, dass sich die Boxzeichenzeichen von Codepage 437 in ihren ursprünglichen Codepunkten befinden;
- Microsofts Windows 1256 fügt französische Kleinbuchstaben in ihren Windows-1252-Codepunkten ein und versetzt die arabischen
Code-Chart edit ]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | ||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | |||||||||||||||||||||||||||||
1_ 16 | |||||||||||||||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | 0022 # 0023 | $ 0024 | % | % | % 0025 ] & 0026 | ' 0027 0028 | 0029 | * 002A + + 19659052]. 002C | - 19659052] 002D | 002E | / 002F | ||||||||||||||||
3_ 48 | 0/٠ 0030 | 1/١ 0031 | 2/٢ 0032 | 3/٣ 0033 | 4/٤ 0034 | 5/٥ 0035 | 6/٦ 0036 | 7/٧ 0037 | 8/٨ 0038 | 9/٩ 0039 | : 003A | ; 003B | <19659052] 003C | 003D | 003E | ? ] 4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 [19659597] E [19659597] E [19659597] E [19659597] E [19659597] E [19659509] ] F 0046 | G 0047 | H 0048 | I 0049 | J 004A | K 004B 004B 004C | M 004D | N 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 [19659597] U [1965950] V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A 005B 005B 005C | 005D | ^ 005E | _ 005F | |||||||||||||||||
6_ 96 | 0060 | a 0061 | b 0062 | c 0063 | d 0064 [19659597] d [19659597] d [19659597] d [19659597] d [19659597] d [19659597] d [19659597] d [19659597] d [19659509] d [19659509] d ] 0066 | g 0067 | h 0068 | i 0069 | j 006A | k 006B 006B 006C | m 006D | n 006E | o 006F | ||||||||||||||||
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 [19659597] u ] v 0076 | w 0077 | x 0078 | y 0079 | z 007A 007B 007C | } 007D | ~ 007E | ||||||||||||||||||
8_ 128 | |||||||||||||||||||||||||||||
9_ 144 | |||||||||||||||||||||||||||||
A_ 160 | NBSP 00A0 | ¤ 00A4 | 19 060C | SHY 00AD | |||||||||||||||||||||||||
B_ 176 | 65 061B | 19 061F | |||||||||||||||||||||||||||
C_ 192 | 19 0621 | 19 0622 | 19 0623 | 0624 | 19 0625 [1965952] 0625 | 1976 ] 65 0627 | ب 0628 | 0629 | 90 062 A | 062 B [196590117] [196590117] [196590117] [196590107] 062D | 19 062 E | D 062 F | |||||||||||||||||
D_ 208 | 19 0630 | 65 0631 | 19 0632 | 0633 | ش 0634 [1965952] 0634 | ] 0636 | ط 0637 | 19 0638 | oder 0639 | 65 063 A | |||||||||||||||||||
E_ | |||||||||||||||||||||||||||||
E_ | |||||||||||||||||||||||||||||
E_ | |||||||||||||||||||||||||||||
19 0640 | von 0641 | 19 0642 | ß 0643 [196590117] oder [196590117] [196590117] [196590117]] ] 0646 | 0647 | oder 0648 | 65 0649 | oder 064 A | 064 A | . 064 C | 064 D | 064 E | 064 F | |||||||||||||||||
F_ 240 | 19 0650 | 19 0651 | 19 0652 |
Die Codewerte 0xEB-0xF2 werden Kombinationszeichen zugewiesen.
No comments:
Post a Comment