Universal Character Set

Toplinks zu diesem Thema:
Iso, Englisch, Universal


Der Artikel Universal Character Set gehört zur Kategorie: ISO-Standard, Zeichenkodierung
Der Universal Character Set (UCS) ist eine Zeichenkodierung, die im internationalen Standard ISO/IEC 10646 definiert ist. Für alle praktischen Belange ist dies dasselbe wie Unicode.

Er wird von ISO/IEC/JTC1/SC2/WG2 entwickelt.

Ursprünglich wurden diese beiden Formate definiert:

  • UCS-2: Kodierung in 2 Byte; lässt sich der Kode nicht mit 16 Bit darstellen, so werden zwei 16-Bit-Wörter benutzt. Details siehe UTF-16.
  • UCS-4: Kodierung in 4 Byte

Die Gruppe arbeitet sehr eng mit dem Unicode-Konsortium zusammen, die die Standards ständig in neuen Versionen synchronisieren. So ist UCS-2 ein Synonym für UTF-16 und UCS-4 für UTF-32. Aufgrunddessen sind alle Kodierungen aus Interoperabilitätsgründen auf die für Unicode bedeutungsvollen 1.114.112 (= 220+216) Zeichen (von U+00000 bis U+10FFFF) beschränkt.

In der Version ISO/IEC 10646-3:2003 werden die gleichen Formate UTF-8, UTF-16 und UTF-32 beschrieben wie in Unicode 4.0.

Gegenüberstellung der Versionen

  • ISO/IEC 10646-1:1993 ≈ Unicode 1.1
  • ISO/IEC 10646-1:2000 ≈ Unicode 3.0
  • ISO/IEC 10646-2:2001 ≈ Unicode 3.2
  • ISO/IEC 10646-3:2003 ≈ Unicode 4.0

Siehe auch: Unicode Transformation Format (UTF), Unicode

Weblinks


Diskussion der Autoren über den Artikel: Universal Character Set


UTF-16 !

UCS-2 =

Siehe Diskusson unter UTF-16

--BerndEckenfels 08:45, 25. Mär 2005 (CET)



Diese Definition bzw. Erklärung des Begriff Universal Character Set und dessen Bedeutung wurde zuletzt am 8.2.2006 aktualisiert (Glossar Lexikon Enzyklopädie).


Wikipedia GNU FDL Artikel anzeigen Artikel bearbeiten