Der EDT lässt grundsätzlich nur Zeichensätze zu, die von der aktuellen XHCS-Installation unterstützt werden.
Dies gilt sowohl für den Stapelbetrieb als auch für den Dialogbetrieb.
Der Kommunikationszeichensatz muss mit der Datensichtstation verträglich sein, allerdings kann es ein anderer sein, als der Zeichensatz der Daten.
Die notwendigen Konvertierungen werden über XHCS abgewickelt und auch die Eigenschaften der Zeichen (Groß-/Kleinbuchstaben, Sonderzeichen) werden von XHCS bereitgestellt.
Standardmäßig werden neben den Unicode-Zeichensätzen und allen EBCDIC-Zeichensätzen auch die ISO-Zeichensätze zugelassen.
Behandlung ungültiger Zeichen
In Unicode-Zeichensätzen ist es möglich, dass Bytesequenzen illegal sind. So können z.B. in UTFE
oder UTF8
mehrere Mehrbyte-Einleiter hintereinander stehen. Der EDT lehnt die Eingabe solcher, illegaler Bytesequenzen grundsätzlich ab, sei es beim Einlesen von Dateien oder Variablen oder bei Eingaben im Hex-Modus.
In UTF16
sind dabei nur die Zeichen aus dem Surrogat-Bereich (xD800-xDFFF
) illegal.
Alle anderen Zeichen d.h. 2-Byte-Sequenzen werden akzeptiert, auch wenn sie nicht am Terminal darstellbar sind. Auch werden besondere Semantiken vom EDT nicht berücksichtigt, z.B., dass ein Zeichen keinen Vorschub auslösen soll. Insbesondere hat auch ein Byte Order Mark (BOM) keine Wirkung, sondern wird einfach als Zeichen übernommen.
Bei 7-Bit-Zeichensätzen oder nicht vollständig definierten 8-Bit-Zeichensätzen werden aus Kompatibilitätsgründen alle Bytes akzeptiert und unverändert übernommen. Solche undefinierten Zeichen können aber niemals in einen anderen Zeichensatz konvertiert werden.
Behandlung nationaler 7-Bit-Zeichensätze
Im Unicode-Modus sind alle 7-Bit-Zeichensätze zulässig, die in XHCS definiert sind (zur Behandlung nationaler 7-Bit-Zeichensätze siehe Abschnitt „Der Zeichensatz EDF03DRV“).
Welche Zeichensätze aktuell unterstützt werden, kann mit der Anweisung @SHOW CCS abgefragt werden.