Ersatzzeichen - Substitute character

Ein Ersatzzeichen (␚) ist ein Steuerzeichen , das verwendet wird, um leere Zeichen aufzufüllen, falls sie in Blöcken fester Größe gesendet werden müssen, und an die Stelle eines Zeichens zu treten, das als ungültig oder fehlerhaft oder nicht darstellbar erkannt wird auf einem bestimmten Gerät. Es wird in einigen Programmiersprachen auch als Escape-Sequenz verwendet .

Im ASCII- Zeichensatz wird dieses Zeichen durch die Zahl 26 ( 1A hex ) codiert . Standard - Tastaturen diesen Code zu übertragen , wenn die Ctrlund ZTasten gleichzeitig gedrückt werden ( Strg + Z , vereinbarungsgemäß oft wie beschrieben ^ Z ). Unicode kodiert dieses Zeichen, empfiehlt jedoch, stattdessen das Ersatzzeichen ( , U+FFFD) zu verwenden, um nicht dekodierbare Eingaben darzustellen, wenn die Ausgabekodierung damit kompatibel ist.

Verwendet

Ende der Datei

Historisch gesehen war es unter PDP-6- Monitor, RT-11 , VMS und TOPS-10 und in frühen PC- Betriebssystemen CP/M 1 und 2 (und Derivaten wie MP/M ) notwendig, das Ende einer Datei explizit zu markieren (EOF), da das CP/M- Dateisystem die genaue Dateigröße nicht selbst aufzeichnen konnte; Dateien wurden in Extents (Datensätzen) einer festen Größe zugewiesen, wobei normalerweise etwas zugewiesener, aber ungenutzter Speicherplatz am Ende jeder Datei übrig blieb. Dieser zusätzliche Platz wurde mit 1A 16 ( hex ) Zeichen unter CP/M gefüllt . Die von CP/M 3 und höher verwendeten erweiterten CP/M-Dateisysteme (und Derivate wie Concurrent CP/M , Concurrent DOS und DOS Plus ) unterstützten bytegranulare Dateien, daher war dies keine Voraussetzung mehr, blieb aber als Konvention (besonders für Textdateien ), um die Abwärtskompatibilität zu gewährleisten.

In CP/M , 86-DOS , MS-DOS , PC DOS , DR-DOS und ihren verschiedenen Derivaten wurde das SUB-Zeichen auch verwendet, um das Ende eines Zeichenstroms anzuzeigen und damit Benutzereingaben in einem interaktiven . zu beenden Befehlszeilenfenster (und wird als solches oft verwendet, um die Umleitung von Konsoleneingaben zu beenden, z. B. wie von initiiert COPY CON: TYPEDTXT.TXT).

Obwohl es technisch nicht mehr erforderlich ist, das Ende einer Datei anzuzeigen, unterstützen viele Texteditoren und Programmiersprachen diese Konvention immer noch oder können so konfiguriert werden, dass sie dieses Zeichen beim Bearbeiten am Ende einer Datei einfügen oder zumindest im Text richtig damit umgehen Dateien. In solchen Fällen wird es oft als "weiches" EOF bezeichnet, da es nicht unbedingt das physische Ende der Datei darstellt, sondern eher ein Marker ist, der darauf hinweist, dass "über diesen Punkt hinaus keine nützlichen Daten vorhanden sind". In Wirklichkeit können über dieses Zeichen hinaus bis zum eigentlichen Ende der Daten im Dateisystem noch mehr Daten vorhanden sein, so dass damit Dateiinhalte ausgeblendet werden können, wenn die Datei an der Konsole eingegeben oder in Editoren geöffnet wird. Viele Dateiformatstandards (zB PNG oder GIF ) enthalten das SUB-Zeichen in ihren Headern, um genau diese Funktion auszuführen. Einige moderne Textdateiformate (zB CSV-1203 ) empfehlen immer noch, ein nachgestelltes EOF-Zeichen als letztes Zeichen in der Datei anzuhängen. Durch die Eingabe von Control+ wird Zjedoch weder unter DOS noch unter Windows ein EOF-Zeichen in eine Datei eingebettet , noch verwenden die APIs dieser Systeme das Zeichen, um das tatsächliche Ende einer Datei anzugeben.

Einige Programmiersprachen (zB Visual Basic ) lesen nicht über einen "weichen" EOF hinaus, wenn die eingebauten Textdatei-Leseprimitiven (INPUT, LINE INPUT usw.) verwendet werden, und es müssen alternative Methoden angewendet werden, zB Öffnen der Datei im Binärmodus oder Verwenden des Dateisystemobjekts, um darüber hinauszugehen.

Zeichen 26 wurde verwendet, um "Ende der Datei" zu markieren, obwohl ASCII dieses Zeichen als Ersatz bezeichnet und andere Zeichen enthält, um "Ende der Datei" anzuzeigen. Nummer 28, die " File Separator " genannt wird, wurde auch für ähnliche Zwecke verwendet.

Andere Verwendungen

In Unix- Betriebssystemen wird dieses Zeichen normalerweise verwendet, um den aktuell ausgeführten interaktiven Prozess anzuhalten. Der ausgesetzte Prozess kann dann im Vordergrundmodus (interaktiv) wieder aufgenommen werden, oder veranlasst werden, die Ausführung im Hintergrundmodus wieder aufzunehmen , oder beendet werden . Bei Eingabe durch einen Benutzer an seinem Computerterminal wird dem aktuell laufenden Vordergrundprozess ein "Terminal Stop" ( SIGTSTP )-Signal gesendet, das im Allgemeinen bewirkt, dass der Prozess seine Ausführung aussetzt. Der Benutzer kann die Prozessausführung später fortsetzen, indem er den Befehl "Vordergrund" ( fg) oder den Befehl " Hintergrund " ( bg) verwendet.

Der Bericht zu Unicode-Sicherheitsüberlegungen empfiehlt dieses Zeichen als sicheren Ersatz für nicht zuordenbare Zeichen während der Zeichensatzkonvertierung.

In vielen GUIs und Anwendungen kann Control+ Z( ⌘ Command+ Zunter Mac OS) verwendet werden, um die letzte Aktion rückgängig zu machen . In vielen Anwendungen können auch frühere Aktionen als die letzte durch mehrmaliges Drücken von Control+ rückgängig gemacht werden Z. Control+ Zwar eine von wenigen Tastatursequenzen , die von den Programmdesignern von Xerox PARC ausgewählt wurden , um die Textbearbeitung zu steuern .

Darstellung

ASCII- und Unicode- Darstellung von "Ersatz":

  • Oktalcode: 32
  • Dezimalcode: 26
  • Hexadezimalcode: 1A, U+001A
  • Merkzeichen: SUB
  • Binärwert: 11010

Siehe auch

Verweise

Weiterlesen