Mittwoch, 12. Oktober 2005

Unicode und UTF-8

Die c’t schreibt in einem Artikel über Editoren: „Im Unterschied zu Unicode kommt UTF-8 bei Standardbuchstaben mit einem Byte aus [...]“ Tatsächlich aber sagt Unicode gar nichts über Bytes aus, denn „Unicode gibt jedem Zeichen seine eigene Nummer“ (Zitat von der Unicode-Webseite), und nichts weiter. Wie diese Nummer schließlich in Bytes umgesetzt wird, ist eine ganz andere Geschichte.

Genauso müsste natürlich streng genommen UTF-8 auch keinen Unicode beinhalten, sondern es ist lediglich eine Abbildung von Nummern auf Bytes. Was Sie im Artikel mit Unicode bezeichnen, ist vermutlich UCS-2 oder auch UTF-16, also eine Zwei-Byte-Darstellung. Die Verwirrung ist verständlich, war doch eine solche Unterscheidung bei den alten Kodierungen nicht üblich, man sprang quasi direkt von Zeichen zu Byte; heute würde ich sagen, es wurde als Abbildung die Identität benutzt.

PS: Als Erbsenzähler muss ich noch anmerken, dass der Standard-Zeichensatz unter Windows keineswegs ISO8859-1 ist, sondern vielmehr Windows 1252, welches an Stelle der reichlich überflüssigen oberen Steuerzeichen Symbole wie das Euro-Zeichen und die deutschen Anführungszeichen enthält. Keine schlechte Idee an sich, aber halt nicht konform zu irgendwelchen Standards, und damit ein typischer Fall.

Musikliste

Mein Lesestoff



Dr. Eckart von Hirschhausen
Glück kommt selten allein

Gesehene Filme

Aktuelle Beiträge

Neues Layout der 1822direkt
Das neue, frische Layout der 1822direkt. Man betrachte...
Highbrow - 20. Okt, 20:57
Bescheuerte Ausführungsreihenfolge
Mein Bild des Tages: Eclipse wartet also mit dem...
Highbrow - 29. Jun, 21:30
Trügerische Sicherheit?...
Dein Problem ist wahrscheinlich schon überholt. Ich...
Ben Oni (Gast) - 30. Mai, 20:58
KI.KA. beschneidet und...
Der KI.KA. und das Sandmännchen. Seit einiger Zeit...
Highbrow - 24. Apr, 13:48
Die Stellen wahrscheinlich...
Die Stellen wahrscheinlich gerade die Serie um. Da...
vuffiraa - 18. Dez, 09:57

Credits

User Status

Du bist nicht angemeldet.

Fallout 3
Informatik
Reise
Senf
Unernst
Video
Profil
Abmelden
Weblog abonnieren