Toplinks zu diesem Thema:
Iso, Englisch, Universal
Der Artikel Universal Character Set gehört zur Kategorie: ISO-Standard, Zeichenkodierung
Der Universal Character Set (UCS) ist eine Zeichenkodierung, die im internationalen Standard ISO/IEC 10646 definiert ist. Für alle praktischen Belange ist dies dasselbe wie Unicode.
Er wird von ISO/IEC/JTC1/SC2/WG2 entwickelt.
Ursprünglich wurden diese beiden Formate definiert:
- UCS-2: Kodierung in 2 Byte; lässt sich der Kode nicht mit 16 Bit darstellen, so werden zwei 16-Bit-Wörter benutzt. Details siehe UTF-16.
- UCS-4: Kodierung in 4 Byte
Die Gruppe arbeitet sehr eng mit dem Unicode-Konsortium zusammen, die die Standards ständig in neuen Versionen synchronisieren. So ist UCS-2 ein Synonym für UTF-16 und UCS-4 für UTF-32. Aufgrunddessen sind alle Kodierungen aus Interoperabilitätsgründen auf die für Unicode bedeutungsvollen 1.114.112 (= 220+216) Zeichen (von U+00000 bis U+10FFFF) beschränkt.
In der Version ISO/IEC 10646-3:2003 werden die gleichen Formate UTF-8, UTF-16 und UTF-32 beschrieben wie in Unicode 4.0.
Gegenüberstellung der Versionen
- ISO/IEC 10646-1:1993 ≈ Unicode 1.1
- ISO/IEC 10646-1:2000 ≈ Unicode 3.0
- ISO/IEC 10646-2:2001 ≈ Unicode 3.2
- ISO/IEC 10646-3:2003 ≈ Unicode 4.0
Siehe auch: Unicode Transformation Format (UTF), Unicode
Weblinks
- Unicode Relationship to ISO/IEC 10646 (englisch)
- Unicode FAQ: What is the difference between UCS-2 and UTF-16?
Diskussion der Autoren über den Artikel: Universal Character Set
UTF-16 !
UCS-2 =Siehe Diskusson unter UTF-16
--BerndEckenfels 08:45, 25. Mär 2005 (CET)