Tuesday, September 4, 2018

ISO / IEC 8859-15 - Wikipedia


ISO / IEC 8859-15: 1999 Informationstechnologie - 8-Bit-Einzelbyte-Zeichensätze - Teil 15: Lateinisches Alphabet Nr. 9 ist Teil der ISO / IEC 8859-Reihe von ASCII-basierten Standard-Zeichencodierungen, erste Ausgabe, 1999 veröffentlicht. Sie wird informell als Latin-9 (und vorübergehend Latin-0 ) bezeichnet. Es ähnelt ISO 8859-1 und ist daher auch für "westeuropäische" Sprachen gedacht, ersetzt jedoch einige weniger gebräuchliche Symbole durch das Eurozeichen und einige als notwendig erachtete Buchstaben: [1]

ISO-8859-15 der von IANA bevorzugte Zeichensatzname für diesen Standard, wenn er mit den Steuercodes C0 und C1 aus ISO / IEC 6429 ergänzt wird.

Microsoft hat die Codepage 28605 aa.k.a. Windows-28605 der ISO-8859-15 zugewiesen. IBM hat die Codepage 923 der ISO 8859-15 zugewiesen.

Alle druckbaren Zeichen sowohl von ISO / IEC 8859-1 als auch von ISO / IEC 8859-15 finden sich auch in Windows-1252. Seit Oktober 2016 verwenden 0,1% aller Websites ISO-8859-15. [2][3]

Geschichte [ edit ]

Die Kennung ISO 8859-15 wurde 1996 für die Sami-Sprachen vorgeschlagen. die schließlich abgelehnt wurde, aber als ISO-IR 197 übergeben wurde. 19459018 [4] [5] [6] [4] [8]

ISO 8859-15 wurde ursprünglich als ISO 8859-0 vorgeschlagen und wurde aus ISO 8859-1 erstellt, um 4 nicht verwendete oder selten verwendete Zeichen (¤, ¨, ´ und ¸) durch andere in ISO 8859-1 fehlende Zeichen zu ersetzen ( und zu keinem Zeitpunkt in einem anderen ISO 8859-Standard), und es wurden 6 weitere Zeichen ([¦±¼½)alsmöglicherWegfallvorgeschlagen[7]. Der Euro wurde bei der Einführung des Euro notwendig. Œ und œ sind französische Ligaturen, und Ÿ wird in französischen Volltexten benötigt, da sie in einigen richtigen Namen vorkommen, beispielsweise in der Stadt l'Ha l-les-Roses oder dem Dichter und Schriftsteller Pierre Louÿs. € war bei 0xA4, Œ und œ waren bei 0xB4 und 0xB8 im Vorschlag und Ÿ war bei 0xA8. Später wurden vier der sechs zum Löschen vorgeschlagenen Zeichen gelöscht und vier weitere neue Zeichen hinzugefügt. Diese Zeichen waren jedoch in vielen anderen ISO-Normen enthalten. Š, š, Ž und ž werden in einigen Lehnwörtern und bei der Transliteration russischer Namen in der finnischen und estnischen Typografie verwendet. Es wurde vorgeschlagen, das Euro-Zeichen anstelle des Pluszeichens anstelle des Währungszeichens zu setzen (wird in einigen Anwendungen als FELD-SEPARATOR und in einigen anderen Anwendungen für die SUBTOTAL-Abrechnungsfunktion verwendet;) wurde vorgeschlagen, um Verwirrung zu vermeiden. + - wäre ein Rückfall). Darin gab es starken Widerstand. Man sagte "Das vorgeschlagene" + - "ist kein ausreichender Rückschlag, da diese Sequenz, obwohl sie selten verwendet wird, bereits eine feste mathematische Bedeutung hat, die sich von" ± "unterscheidet, und sogar, wenn ein Leser die beabsichtigte Bedeutung ableiten würde "±", aus dem Kontext heraus, "+ -" anstelle von "±" wird den ätesthetischen Gefühlen eines Physikers mindestens genauso schaden wie "oe" anstelle einer oe-Ligatur eines Francophons. " Infolge des Widerspruchs behielt ISO 8859-15 das Plus-Minus-Zeichen bei und entfernte stattdessen das Währungszeichen. Da Diakritiker häufig in Großbuchstaben auf Französisch fallen gelassen werden (obwohl die Académie française diese Praxis [8] ablehnt), wurde ein Codepunkt für Ÿ nicht für ISO-8859-1 als notwendig erachtet, obwohl einer für dessen gegeben wurde Kleinbuchstaben-Äquivalent ÿ (bei 0xFF).

Ironischerweise waren die letzten drei Zeichen (Œ, œ, Ÿ) bereits 1983 im multinationalen Zeichensatz von MC (MCS) von DEC enthalten, einem Zeichensatz, aus dem ECMA-94 (1985) und ISO-8859-1 (1987) bestehen ) wurden abgeleitet. Da ihre ursprünglichen Codepunkte nun von anderen Zeichen belegt waren, mussten für deren Wiedereinführung weniger logische Codepunkte ausgewählt werden.

Es wurde versucht, ISO-8859-15 als Standardzeichensatz für die 8-Bit-Kommunikation festzulegen, konnte jedoch das beliebte ISO-8859-1 niemals ersetzen. Als der Standardzeichensatz für die Textkonsolen- und Terminalprogramme unter Linux verwendet wurde, als das Euro-Zeichen benötigt wurde, war die Verwendung von vollständigem Unicode nicht praktikabel, wurde jedoch durch UTF-8 ersetzt.

Coverage [ edit ]

ISO 8859-15 kodiert das, was als "lateinisches Alphabet Nr. 9" bezeichnet wird. Dieser Zeichensatz wird in ganz Amerika, Westeuropa, Ozeanien und weiten Teilen Afrikas verwendet. Es wird auch häufig in den meisten Standard-Romanisierungen ostasiatischer Sprachen verwendet.

Jedes Zeichen wird als einzelner 8-Bit-Codewert codiert. Diese Codewerte können in fast jedem Datenaustauschsystem verwendet werden, um in den folgenden Sprachen zu kommunizieren:

Moderne Sprachen mit vollständiger Abdeckung ihres Alphabets
Hinweise
  1. ^ Vollständige Unterstützung außer Ǿ / ǿ, die fehlen. Ǿ / ǿ kann durch Ø / ø ersetzt werden, um die Mehrdeutigkeit zu erhöhen.
  2. ^ Häufig unterstützt mit fast vollständiger Abdeckung des niederländischen Alphabets, da die fehlenden ij, 1945 immer sein sollten dargestellt als zweistelliges IJ oder ij in elektronischer Form.
  3. USA und moderne Briten.
  4. ^ Neue Orthographie.
  5. ^ Kurdish Unified Alphabet, basierend auf dem lateinischen Buchstaben set.
  6. ^ Grundlegende klassische Orthographie.
  7. ^ Grundlegende klassische Orthographie.
  8. ^ Rumi-Schrift.
  9. ^ Bokmål und Nynorsk.
  10. ^ 19659020] Europäer und Brasilianer.

Abdeckung von Interpunktionszeichen und Apostrophen [ edit ]

Für einige der oben genannten Sprachen fehlen die richtigen typografischen Anführungszeichen, da nur «,» "und" sind enthalten.

Außerdem liefert diese Kodierung nicht das richtige Zeichen für den Apostroph und orientierte einzelne Anführungszeichen, obwohl einige Texte den Abstand zwischen Akzent und Akzent verwenden, die beide Teil von ISO 8859-1 sind 6-förmige / 9-förmige Anführungszeichen oder Apostrophe (und dies funktioniert zuverlässig bei einigen Schriftstilen, bei denen alle diese Zeichen als geneigte Keilzeichen angezeigt werden).

Codepage-Layout [ edit

Buchstabe Anzahl Interpunktion [194590014] Symbol [194590014] Symbol [194590014] Symbol [194590014] Anderes undefined Unterschiede zu ISO-8859-1

Aliase [ edit ]

ISO 8859-15 hat auch die folgenden herstellerspezifischen Aliasnamen:

Siehe auch [ edit ]

Referenzen [ edit

  1. ^ "ISO-8859-15" . IANA . 8. März 2016 .
  2. ^ "Historische Trends bei der Verwendung von Zeichenkodierungen, November 2018". w3techs.com .
  3. ^ "Frequently Asked Questions". w3techs.com .
  4. ^ a b "Sami-Ergänzungslatein Satz Nr. 2" ]. www.itscj.ipsj.or.jp . 2019-01-05 .
  5. ^ Everson, Michael. "Vorgeschlagene ISO 8859-15" . 26. Februar 2017 .
  6. ^ Everson, Michael. "Vorgeschlagene ISO 8859-14 (später 15)" . 26. Februar 2017 .
  7. ^ Everson, Michael. "Vorgeschlagene ISO 8859-0 (später 15)" . 26. Februar 2017 .
  8. ^ "Accentuation des majuscules" [Accenting of capitals] (auf Französisch). Académie française . 8. August 2015 abgerufen. On veille donc, en bonne typographie, sémématiquement les capitales accentuées ... (19659074) ^ Baird, Cathy; Chiba, Dan; Chu, Winson; Fan, Jessica; Ho, Claire; Gesetz, Simon; Lee, Geoff; Linsley, Peter; Matsuda, Keni; Oscroft, Tamzin; Takeda, Shige; Tanaka, Linus; Tozawa, Makoto; Trute, Barry; Tsujimoto, Mayumi; Wu, Ying; Yau, Michael; Yu, Tim; Wang, Chao; Wong, Simon; Zhang, Weiran; Zheng, Lei; Zhu, Yan; Moore, Valarie (2002) [1996]. "Anhang A: Länderdaten". Oracle9i-Handbuch zur Unterstützung der Globalisierung der Datenbank (PDF) (Ausgabe 2 (9.2), Herausgeber). Oracle Corporation. Oracle A96529-01. Archiviert (PDF) vom Original am 2017-02-14 . 2017-02-14 .

Externe Links [ edit

No comments:

Post a Comment