Sunday, September 30, 2018

Textual description of firstImageUrl

CCSID - Wikipedia


Ein CCSID ( codierter Zeichensatz-Bezeichner ) ist eine 16-Bit-Zahl, die eine bestimmte Codierung einer bestimmten Codepage darstellt. Beispielsweise ist Unicode eine Codepage, die mehrere Codierungsformen wie UTF-8, UTF-16 und UTF-32 enthält.

Unterschied zwischen einer Codepage und einer CCSID [ edit

Die Begriffe -Codepage und CCSID werden oft synonym verwendet obwohl sie auch nicht sind. Eine Codepage kann nur ein Teil dessen sein, was eine CCSID ausmacht. Die folgenden Definitionen von IBM helfen, diesen Punkt zu veranschaulichen:

  • Ein Glyphe ist das tatsächliche physikalische Muster von Pixeln oder Tinte, das auf einem Display oder Ausdruck angezeigt wird.
  • Ein Zeichen ist ein Konzept, das alle mit einem Zeichen verbundenen Glyphen abdeckt bestimmtes Symbol. Zum Beispiel "F", F "," F " F ", " F " und " F "sind alle verschiedene Glyphen, verwenden jedoch dasselbe Zeichen. Die verschiedenen Modifikatoren (fett, kursiv, unterstrichen, Farbe und Schriftart) ändern nicht die essentielle F-Note von F.
  • Ein Zeichensatz enthält die Zeichen, die erforderlich sind, damit ein bestimmter Mensch eine A ausführen kann sinnvolle Interaktion mit dem Computer. Es wird nicht festgelegt, wie diese Zeichen auf einem Computer dargestellt werden. [1] Diese Ebene ist die erste, die Zeichen in verschiedene Alphabete (Latein, Arabisch, Hebräisch, Kyrillisch usw.) oder ideografische Gruppen (z. B. Chinesisch, Koreanisch) unterteilt ). Es entspricht einem "Zeichen-Repertoire" im Unicode-Codierungsmodell.
  • Eine Codepage stellt eine bestimmte Zuordnung von Codepunktwerten zu Zeichen dar. [1] Sie entspricht einem "codierten Zeichensatz" in das Unicode-Codierungsmodell. Ein -Codepunkt für ein Zeichen ist die interne Darstellung dieses Zeichens in einer bestimmten Codepage durch den Computer. [1] Viele Zeichen werden durch verschiedene Codepunkte in verschiedenen Codepages dargestellt. Bestimmte Zeichensätze können mit Single-Byte-Codepages (die maximal 256 Codepunkte und damit maximal 256 Zeichen haben) ausreichend dargestellt werden, viele erfordern jedoch mehr. Beispiele sind JIS X 0208 und Unicode.
  • Ein Codierungsschema ist das Byte-Format einer Codepage. Es ordnet Codepunktwerte Sequenzen von einem oder mehreren Bytewerten in einem Computer zu. [2] Beispielsweise sind UTF-8 und UTF-16BE zwei Codierungen derselben Unicode-Codepage. In der Zeichendatenrepräsentationsarchitektur (CDRA) von IBM wird dies normalerweise mit einer ESID (Kodierungsschema-ID) dargestellt. [3] EUC und ISO-2022 sind andere Beispiele für Codierungsschemata.
  • Eine kodierte Zeichensatz-ID ( CCSID ) enthält alle Informationen, die erforderlich sind, um die Bedeutung und das Rendern von Zeichen in verschiedenen Verarbeitungsstufen und beim Austausch zuzuweisen und zu erhalten. Diese Informationen enthalten immer mindestens eine Codeseite, können jedoch mehrere Codeseiten mit unterschiedlichen Byte-Längen enthalten. Der CCSID ist auch ein Codierungsschema zugeordnet, das bestimmt, wie verschiedene Codepunkte behandelt werden. Dieser Mechanismus ermöglicht es einem Programm, bidirektionale Orientierung, Zeichenformung (hauptsächlich aus arabischen Zeichen) und andere komplexe Codierungsinformationen zu erkennen.

Beispiele [ edit ]

Die folgenden Beispiele zeigen, wie einige CCSIDs bestehen aus anderen CCSIDs.

CCSID 932
Zeichensatz Codepage CCSID Kodierungsschema
1122 897 897 SBCS
370 301 301 DBCS
CCSID 942
Zeichensatz Codepage CCSID Kodierungsschema
1172 1041 1041 SBCS
370 301 301 DBCS
CCSID 5028
Zeichensatz Codepage CCSID Kodierungsschema
1170 897 4993 SBCS
370 301 301 DBCS

Bei allen drei Varianten der Shift-JIS-CCSIDs handelt es sich um Multibyte-Zeichensätze (MBCS): Der Einzelbyte-Zeichensatz (SBCS) jeder CCSID ist unterschiedlich. Der Doppelbytezeichensatz (DBCS) -Abschnitt ist für jede CCSID derselbe. Die CCSID 5028 verwendet eine aktualisierte Codepage 897, die als CCSID 4993 bezeichnet wird. Die CCSID 932 verwendet die ursprüngliche Codepage 897, die CCSID 897. Die CCSID 942 verwendet ein anderes SBCS als die beiden anderen CCSIDs (1041).

Beachten Sie auch, wie sich CCSID 5028 und 4993 um 4096 (1000 im Hexadezimalwert) von der Vorgänger-CCSID mit der gleichen Codepage-ID unterscheiden. Dies ist eine übliche Art und Weise, dass CDRA eine aktualisierte CCSID bezeichnet.

Für diese Komplexität gibt es einige Gründe:

  • Viele der CCSIDs werden in IBM-Datenbanken wie DB2 verwendet, wobei ein Datenbankfeld nur eine SBCS-, DBCS- oder MBCS-Zeichenfolge unterstützt. CCSIDs erlauben Programmen zu unterscheiden, welche verwendet wird.
  • Wenn Zeichen wie die Einführung des Euro-Währungszeichens hinzugefügt oder ersetzt werden, kann man wissen, ob die gespeicherten Zeichenketten diese Zeichenergänzungen unterstützen oder nicht unterstützen, da eine andere CCSID vorliegt gebraucht. Diese Versionierung ist wichtig für die Integrität der Daten.
  • Sie ermöglicht die Wiederverwendung von Ressourcen unter ähnlichen CCSIDs. [4]

Verweise [ edit

External links [ ] edit ]

No comments:

Post a Comment