Rechenanlagen (Hosts) und Datensichtstationen arbeiten mit je einem Satz von Buchstaben, Ziffern und Zeichen, aus denen Wörter und andere elementare Bestandteile einer Sprache aufgebaut sind, dem sogenannten Zeichensatz (character set).
Durch die Erweiterung dieser Zeichensätze können landesspezifische Zeichendarstellungen, wie z.B. Umlaute (deutsch) oder Akzente (französisch), innerhalb eines Zeichensatzes gleichzeitig angeboten werden.
Ein codierter Zeichensatz (coded character set, CCS) ist die eindeutige Darstellung der Zeichen eines Zeichensatzes in binärer Form. Der Inhalt eines codierten Zeichensatzes und seine Regeln, wie z.B. die Sortierreihenfolge und Konvertierungsvorschriften, sind durch internationale Normen festgelegt.
Beispiel
Das Zeichen „ä“ ist im codierten Zeichensatz EBCDIC.DF.03-DRV (deutsche Referenzversion) durch das Byte X’FB’, in EBCDIC.DF.04-1 durch das Byte X’43’ dargestellt.
Jeder codierte Zeichensatz (kurz: Code) wird durch seinen eindeutigen Namen (coded character set name,
CCSN) bestimmt.
Beispiel
Der Code EBCDIC.DF.03-IRV (Internationale Referenzversion) hat den Namen „EDF03IRV“.
Eine Liste der existierenden Codes befindet sich im Anhang von [15].
Im BS2000 werden durch das Softwareprodukt XHCS Zeichensätze bereitgestellt. Standardmäßig gehören dazu:
7-Bit-Zeichensätze, wie z.B.
ISO646
(Internationaler 7-Bit-Zeichensatz, ASCII),EDF03IRV
(Internationale Referenz Version, EBCDIC),EDF03DRV
(Deutsche Referenz Version, EBCDIC).8-Bit-Zeichensätze, wie z.B.
ISO88591
(Lateinisches Alphabet Nr.1, ASCII),EDF041
(Lateinisches Alphabet Nr.1, EBCDIC),EDF04DRV
(Erweiterung vonEDF03DRV
) usw.Die 3 Unicode-Zeichensätze
UTF16
,UTF8
undUTFE
.