Sechs-Bit-Zeichencode - Six-bit character code
Ein Sechs-Bit-Zeichencode ist eine Zeichencodierung, die für die Verwendung auf Computern mit Wortlängen von einem Vielfachen von 6 entwickelt wurde. Sechs Bits können nur 64 verschiedene Zeichen codieren, daher enthalten diese Codes im Allgemeinen nur die Großbuchstaben, die Ziffern und einige Satzzeichen , und manchmal auch Steuerzeichen. Das 7-Spur- Magnetbandformat wurde entwickelt, um Daten in solchen Codes zusammen mit einem zusätzlichen Paritätsbit zu speichern .
Arten von Sechs-Bit-Codes
Ein früher Sechs-Bit-Binärcode wurde für Braille verwendet , das Lesesystem für Blinde, das in den 1820er Jahren entwickelt wurde.
Die frühesten Computer verarbeiteten nur numerische Daten und sahen keine Vorkehrungen für Zeichendaten vor. Sechs-Bit-BCD mit mehreren Varianten wurde von IBM auf frühen Computern wie dem IBM 702 im Jahr 1953 und dem IBM 704 im Jahr 1954 verwendet. Sechs-Bit-Codierungen wurden ab 1964 durch den 8-Bit- EBCDIC- Code ersetzt, als System/ 360 standardisiert auf 8-Bit- Bytes . Es gibt einige Varianten dieser Art von Code (siehe unten ).
Sechs-Bit-Zeichencodes folgten im Allgemeinen dem Fünf-Bit- Baudot-Code und gingen dem Sieben-Bit- ASCII voran . Eine beliebte Variante war DEC SIXBIT. Dies sind einfach die ASCII-Zeichencodes von 32 bis 95, codiert als 0 bis 63 durch Subtrahieren von 32 (dh Spalten 2, 3, 4 und 5 der ASCII-Tabelle (16 Zeichen pro Spalte), verschoben in die Spalten 0 bis 3, durch Subtrahieren von 2 von den hohen Bits); es enthält Leerzeichen, Satzzeichen, Zahlen und Großbuchstaben, aber keine Steuerzeichen. Da es keine Steuerzeichen enthielt, nicht einmal Zeilenende, wurde es nicht für die allgemeine Textverarbeitung verwendet. Jedoch sechs Zeichen Namen wie Dateinamen und Assembler Symbole könnten in einem einzigen gespeichert werden 36-Bit - Wort der PDP-10 , und die drei Zeichen in jedem Wort der Fits PDP-1 und zwei Zeichen in jedem Wort des Fits PDP 8 .
Sechs-Bit-Codes könnten mehr als 64 Zeichen durch die Verwendung von Shift-Out- und Shift-In-Zeichen codieren , die im Wesentlichen zwei verschiedene 62-Zeichensätze enthalten und zwischen ihnen wechseln. Das beliebte Kommunikationsterminal IBM 2741 beispielsweise unterstützte eine Vielzahl von Zeichensätzen von bis zu 88 Druckzeichen plus Steuerzeichen.
Für Unicode wurde eine UTF-6- Codierung vorgeschlagen, die jedoch von Punycode abgelöst wurde .
BCD-Sechs-Bit-Code
Sechs-Bit- BCD- Code war die Anpassung des Lochkartencodes an den Binärcode . IBM verwendete die Begriffe binär-codierte Dezimalzahl und BCD auf die Variationen der BCD- Alphamerik, die in den meisten frühen IBM-Computern verwendet wurden, einschließlich der IBM 1620- , IBM 1400-Serie und nicht- dezimalen Architekturmitgliedern der IBM 700/7000-Serie .
COBOL-Datenbanken mit 6-Bit-Code
Ein Sechs-Bit-Code wurde auch in COBOL-Datenbanken verwendet, in denen Informationen zum Ende des Datensatzes separat gespeichert wurden.
Sechs-Bit-Code der Magnetstreifenkarte
Ein Sechs-Bit-Code mit hinzugefügtem ungeraden Paritätsbit wird auf Spur 1 von Magnetstreifenkarten verwendet , wie in ISO/IEC 7811 -2 spezifiziert .
DEC-Sechs-Bit-Code
Ein DEC SIXBIT-Code, der einige Steuerzeichen enthält – zusammen mit SO/SI , die eine Codeerweiterung ermöglicht – wurde 1963 als ECMA - 1 spezifiziert (siehe unten ). Eine andere, weniger verbreitete Variante wird erhalten, indem man einfach das High-Bit eines ASCII-Codes im Bereich 32 - 95 entfernt (Codes 32 - 63 bleiben an ihrer Position, höhere Werte werden von ihnen abgezogen). Eine solche Variante wurde manchmal auf DECs PDP-8 (1965) verwendet.
FIELDATA-Sechs-Bit-Code
FIELDATA war ein Sieben-Bit-Code (mit optionaler Parität), von dem nur 64 Code-Positionen (die sechs Bits belegen) formal definiert waren. Eine Variante wurde von den Computern der 1100-Serie von UNIVAC verwendet . Den Code als einen Sechs-Bit-Code behandelnd, verwendeten diese Systeme ein 36-Bit-Wort (das sechs solcher reduzierten FIELDATA-Zeichen speichern kann).
Braille-Sechs-Bit-Code
Braillezeichen werden mit sechs Punktpositionen dargestellt, die in einem Rechteck angeordnet sind. Jede Position kann einen erhabenen Punkt enthalten oder nicht, sodass Braille als ein Sechs-Bit-Binärcode betrachtet werden kann. Einige modernere Braille-Systeme fügen zwei zusätzliche Punkte hinzu, wodurch diese Systeme stattdessen zu einem 8-Bit-Code werden.
Sechs-Bit-Codes für die Binär-zu-Text-Codierung
Die Übertragung von Binärdaten über Systeme, die nur für Text ausgelegt sind, kann manchmal zu Problemen führen. Beispielsweise unterstützte E-Mail in der Vergangenheit nur 7-Bit-ASCII-Codes und würde das 8. Bit entfernen, wodurch Binärdaten beschädigt wurden, die direkt über einen problematischen Mailserver gesendet wurden. Andere Systeme können Probleme verursachen, indem sie Steuerzeichen während der Speicherung oder Übertragung falsch interpretieren. Es gibt eine Anzahl von Schemata, um 8-Bit-Daten in Nur-Text-Darstellungen zu packen, die Text-Mail-Systeme passieren können, um am Zielort zu dekodieren. Beispiele für 6-Bit- Zeichenuntermengen, die zum Packen von Binärdaten verwendet werden, umfassen Uuencode und Base64 . Diese Sätze enthalten keine Steuerzeichen (nur druckbare Zahlen, Buchstaben, einige Satzzeichen und eventuell Leerzeichen) und ermöglichen die Übertragung von Daten über jedes Medium, das auch für Menschen lesbaren Text übertragen kann.
Beispiele für BCD-Sechs-Bit-Codes
IBM, die die kommerzielle Datenverarbeitung dominierten, verwendet eine Vielzahl von Sechs-Bit-Codes, die an den auf Lochkarten verwendeten Zeichensatz gebunden waren , siehe BCD (Character Encoding) .
Die Zeichencodes anderer Hersteller sind unten mit ihren Unicode- Äquivalenten aufgeführt.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
0 0030 |
# 0023 |
@ 0040 |
TAPE MARK |
|||
1_ |
SP 0020 |
/ 002F |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
RECORD MARK |
, 002C |
% 0025 |
|||
2_ |
- 002D |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
P 0050 |
Q 0051 |
R 0052 |
-0 002D 0030 |
0024 $ |
* 002A |
|||
3_ |
& 0026 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Ich 0049 |
+0 002B 0030 |
. 002E |
¤ 00A4 |
GROUP MARK |
Brief Nummer Interpunktion Symbol Sonstiges Nicht definiert
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
0 0030 |
= 003D |
− 2212 |
||||
1_ |
SP 0020 |
/ 002F |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
, 002C |
( 0028 |
||||
2_ |
— 2014 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
P 0050 |
Q 0051 |
R 0052 |
-0 002D 0030 |
0024 $ |
* 002A |
|||
3_ |
+ 002B |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Ich 0049 |
+0 002B 0030 |
. 002E |
) 0029 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
: 003A |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
0 0030 |
= 003D |
≠ 2260 |
≤ 2264 |
! 0021 |
[ 005B |
1_ |
SP 0020 |
/ 002F |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
] 005D |
, 002C |
( 0028 |
→ 2192 |
≡ 2261 |
~ 007E |
2_ |
− 2212 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
P 0050 |
Q 0051 |
R 0052 |
% 0025 |
0024 $ |
* 002A |
↑ 2191 |
↓ 2193 |
> 003E |
3_ |
+ 002B |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Ich 0049 |
< 003C |
. 002E |
) 0029 |
≥ 2265 |
? 003F |
; 003B |
Beispiele für Sechs-Bit-ASCII-Varianten
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
0024 $ |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
1_ |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
2_ |
@ 0040 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Ich 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
3_ |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
Brief Nummer Interpunktion Symbol Sonstiges Nicht definiert
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
SP 0020 |
HT 0009 |
LF 000A |
VT 000B |
FF 000C |
CR 000D |
SO 000E |
SI 000F |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
1_ |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
2_ |
NUL 0000 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Ich 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
3_ |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
ESC 001B |
DEL 007F |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
1_ |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
£ 00A3 |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
2_ |
@ 0040 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Ich 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
3_ |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
0024 $ |
] 005D |
↑ 2191 |
← 2190 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
@ 0040 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
Ich 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
1_ |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
2_ |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
0024 $ |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
GOST 6-Bit-Code
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _EIN | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
+ 002B |
- 002D |
/ 002F |
, 002C |
. 002E |
SP 0020 |
1_ |
⏨ 23E8 |
↑ 2191 |
( 0028 |
) 0029 |
× 00D7 |
= 003D |
; 003B |
[ 005B |
] 005D |
* 002A |
' 2018 |
' 2019 |
≠ 2260 |
< 003C |
> 003E |
: 003A |
2_ |
А 0410 |
Б 0411 |
В 0412 |
Г 0413 |
Д 0414 |
Е 0415 |
Ж 0416 |
З 0417 |
И 0418 |
Й 0419 |
К 041A |
Л 041B |
М 041C |
Н 041D |
О 041E |
П 041F |
3_ |
Р 0420 |
С 0421 |
Т 0422 |
У 0423 |
Ф 0424 |
Х 0425 |
Ц 0426 |
Ч 0427 |
Ш 0428 |
Щ 0429 |
Ы 042B |
Ь 042C |
Э 042D |
Ю 042E |
Я 042F |
DEL 007F |
Brief Nummer Interpunktion Symbol Sonstiges Nicht definiert
Beispiel für Sechs-Bit-Braille-Codes
Die folgende Tabelle zeigt die Anordnung der Zeichen mit Hex-Wert, entsprechendem ASCII-Zeichen, Braille-6-Bit-Codes (Punktkombinationen), Braille- Unicode- Glyphe und der allgemeinen Bedeutung (die tatsächliche Bedeutung kann sich je nach Kontext ändern).
|
|
Siehe auch
- Binärcodierte Dezimalzahl
- BCD (Zeichencodierung)
- CDC-Anzeigecode
- DEC RADIX 50 / MOD40
- IBM SQUOZE
- IBM Transcodierung
- ASCII
- Baudot-Code
- EBCDIC
- Unicode
- ANSI X3.64
- UTF-8
- UTF-16
Verweise
Externe Links
- "Control Data 1604-C Computer Reference Manual" (PDF) . (7,44 MB)
- "ECMA-Standard für einen 6-Bit-Ein-/Ausgabe-Zeichencode" (PDF) . (1,53 MB)
- SIXBIT-Zeichencode-Referenz Digital Equipment Corporation SIXBIT-Zeichencodierungssystem