Thai Industrial Standard 620-2533 allgemein als TIS-620 bezeichnet, ist der gebräuchlichste Zeichensatz und die Zeichenkodierung für die thailändische Sprache. Der Standard wird vom Thai Industrial Standards Institute (TISI), einem Organ des Industrieministeriums der Royal Thai Government, veröffentlicht und ist der einzige offizielle Standard für die Kodierung von Thai in Thailand. Der beschreibende Name des Standards lautet "Standard für thailändische Zeichencodes für Computer" (thailändisch: รับ สำหรับ อักขระ ไทย ที่ กับ คอมพิวเตอร์). "2533" bezieht sich auf das Jahr 2533 der buddhistischen Ära (1990), das Jahr, in dem die aktuelle Version des Standards veröffentlicht wurde; eine frühere Revision, TIS 620-2529 (1986), ist inzwischen überholt.
TIS-620 ist der von IANA bevorzugte Charset-Name für TIS-620, und dieser Charset-Name wird auch für ISO / IEC 8859-11 verwendet (wodurch bei 0xA0 ein Leerzeichen ohne Unterbrechung hinzugefügt wird, das nicht zugewiesen ist.) TIS-620). Wenn der IANA-Name verwendet wird, werden die Codes mit den Steuercodes C0 und C1 aus ISO / IEC 6429 ergänzt.
Struktur [ edit ]
TIS-620 ist ein herkömmlich strukturierter erweiterter ASCII-Zeichensatz, der die volle Kompatibilität mit 7-Bit-ASCII beibehält und den 8-Bit-Bereich hex A1 verwendet FB zur Kodierung des thailändischen Alphabets. Aufgrund der komplexen Kombination von thailändischen Vokalen und Diakritika ist TIS-620 nur für den Informationsaustausch vorgesehen. Eine zusätzliche Anzeige-Engine ist erforderlich, um die Zeichen richtig zusammenzusetzen.
Varianten [ edit ]
Eine nahezu identische Version von TIS-620 wurde 2001 als ISO / IEC 8859-11 angenommen. Der einzige Unterschied besteht darin, dass ISO / IEC 8859- 11 definiert Hex A0 als nicht unterbrochenes Leerzeichen, während TIS-620 es undefiniert, aber reserviert lässt. (In der Praxis wird dieser kleine Unterschied normalerweise ignoriert.)
Das ISO / IEC 8859-11-Set wurde von Ecma International auch als ISO-IR-166 registriert, aber diese Variante fügt explizite Escape-Codes hinzu, um den Anfang und das Ende von thailändischen Zeichenfolgen zu signalisieren.
Die Reihenfolge der TIS-620-Zeichensätze wurde im Wesentlichen genauso wie in Unicode (ISO / IEC 10646) verwendet. Der thailändische Block von Unicode ist U + 0E01 bis U + 0E7F, und thailändische TIS-620-Zeichen können in UTF-16 konvertiert werden, indem jedem Byte einfach 0E vorangestellt und Hexadezimal A0 vom Wert abgezogen wird.
Zeichensatz [ edit ]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ||||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | 0022 # 0023 | $ 0024 | 0025 0025 0025 | ] & 0026 | ' 0027 0028 | 0029 | * 19659036] 002A + + 002C | - 19659036] 002D | 002E | / 002F | ||||
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 535 ] 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A 003B ; 003C | = 003D | > 003E | 003F | |||
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | 0044 | 0045 0045 0045 | ] F 0046 | G 0047 | H 0048 | I 0049 | J 004A
Subscribe to:
Post Comments (Atom)
|
No comments:
Post a Comment