Friday, February 1, 2019

Thailändischer Industriestandard 620-2533 - Wikipedia


Thai Industrial Standard 620-2533 allgemein als TIS-620 bezeichnet, ist der gebräuchlichste Zeichensatz und die Zeichenkodierung für die thailändische Sprache. Der Standard wird vom Thai Industrial Standards Institute (TISI), einem Organ des Industrieministeriums der Royal Thai Government, veröffentlicht und ist der einzige offizielle Standard für die Kodierung von Thai in Thailand. Der beschreibende Name des Standards lautet "Standard für thailändische Zeichencodes für Computer" (thailändisch: รับ สำหรับ อักขระ ไทย ที่ กับ คอมพิวเตอร์). "2533" bezieht sich auf das Jahr 2533 der buddhistischen Ära (1990), das Jahr, in dem die aktuelle Version des Standards veröffentlicht wurde; eine frühere Revision, TIS 620-2529 (1986), ist inzwischen überholt.

TIS-620 ist der von IANA bevorzugte Charset-Name für TIS-620, und dieser Charset-Name wird auch für ISO / IEC 8859-11 verwendet (wodurch bei 0xA0 ein Leerzeichen ohne Unterbrechung hinzugefügt wird, das nicht zugewiesen ist.) TIS-620). Wenn der IANA-Name verwendet wird, werden die Codes mit den Steuercodes C0 und C1 aus ISO / IEC 6429 ergänzt.

Struktur [ edit ]

TIS-620 ist ein herkömmlich strukturierter erweiterter ASCII-Zeichensatz, der die volle Kompatibilität mit 7-Bit-ASCII beibehält und den 8-Bit-Bereich hex A1 verwendet FB zur Kodierung des thailändischen Alphabets. Aufgrund der komplexen Kombination von thailändischen Vokalen und Diakritika ist TIS-620 nur für den Informationsaustausch vorgesehen. Eine zusätzliche Anzeige-Engine ist erforderlich, um die Zeichen richtig zusammenzusetzen.

Varianten [ edit ]

Eine nahezu identische Version von TIS-620 wurde 2001 als ISO / IEC 8859-11 angenommen. Der einzige Unterschied besteht darin, dass ISO / IEC 8859- 11 definiert Hex A0 als nicht unterbrochenes Leerzeichen, während TIS-620 es undefiniert, aber reserviert lässt. (In der Praxis wird dieser kleine Unterschied normalerweise ignoriert.)

Das ISO / IEC 8859-11-Set wurde von Ecma International auch als ISO-IR-166 registriert, aber diese Variante fügt explizite Escape-Codes hinzu, um den Anfang und das Ende von thailändischen Zeichenfolgen zu signalisieren.

Die Reihenfolge der TIS-620-Zeichensätze wurde im Wesentlichen genauso wie in Unicode (ISO / IEC 10646) verwendet. Der thailändische Block von Unicode ist U + 0E01 bis U + 0E7F, und thailändische TIS-620-Zeichen können in UTF-16 konvertiert werden, indem jedem Byte einfach 0E vorangestellt und Hexadezimal A0 vom Wert abgezogen wird.

Zeichensatz [ edit ]

TIS-620
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F
0_
0
1_
16
2_
32
SP
0020
!
0021

0022
#
0023
$
0024
0025
0025
0025
] &
0026
'
0027
0028

0029
* 19659036] 002A
+
+

002C
- 19659036] 002D
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
535 ] 6
0036
7
0037
8
0038
9
0039
:
003A
003B
;
003C
=
003D
>
003E

003F
4_
64
@
0040
A
0041
B
0042
C
0043
D
0044
0044 0045
0045
0045
] F
0046
G
0047
H
0048
I
0049
J
004A

No comments:

Post a Comment