ISO lateinisches Alphabet - ISO basic Latin alphabet

Das ISO-Basis-Lateinalphabet ist ein lateinisches Alphabet und besteht aus zwei Sätzen von 26 Buchstaben, die in verschiedenen nationalen und internationalen Standards kodifiziert sind und in der internationalen Kommunikation weit verbreitet sind. Es sind die gleichen Buchstaben, aus denen das englische Alphabet besteht .

Die beiden Sets enthalten jeweils die folgenden 26 Buchstaben:

ISO lateinisches Alphabet
Lateinisches Alphabet in Großbuchstaben EIN B C D E F g h ich J K L m n Ö P Q R S T U V W x Ja Z
Lateinisches Alphabet in Kleinbuchstaben ein B C D e F g h ich J k l m n Ö P Q R S T du v w x ja z

Geschichte

In den 1960er Jahren wurde der Computer- und Telekommunikationsindustrie in der Ersten Welt klar, dass eine nicht proprietäre Methode zum Codieren von Zeichen benötigt wurde. Die International Organization for Standardization (ISO) hat die lateinische Schrift in ihrem ( ISO/IEC 646 ) 7-Bit-Zeichencodierungsstandard gekapselt . Um eine breite Akzeptanz zu erreichen, basierte diese Kapselung auf der gängigen Verwendung. Der Standard basierte auf dem bereits veröffentlichten American Standard Code for Information Interchange , besser bekannt als ASCII , der im Zeichensatz die 26 × 2 Buchstaben des englischen Alphabets beinhaltete . Spätere von der ISO herausgegebene Standards, zum Beispiel ISO/IEC 8859 (8-Bit-Zeichenkodierung) und ISO/IEC 10646 ( Unicode Latin ), haben weiterhin die 26 × 2 Buchstaben des englischen Alphabets als lateinische Grundschrift mit Erweiterungen definiert um andere Briefe in anderen Sprachen zu bearbeiten.

Terminologie

Der Unicode-Block , der das Alphabet enthält, heißt " C0 Controls and Basic Latin ". Es gibt zwei Unterrubriken:

  • "Lateinisches Großbuchstabenalphabet": Die Buchstaben beginnen bei U+0041 und enthalten die Zeichenfolge LATIN CAPITAL LETTER in ihren Beschreibungen
  • "Lateinisches Alphabet in Kleinbuchstaben": die Buchstaben beginnen bei U+0061 und enthalten in ihrer Beschreibung die Zeichenfolge LATIN SMALL LETTER

Es gibt auch zwei weitere Sätze im Formularblock Halfwidth und Fullwidth :

  • Großbuchstaben: Die Buchstaben beginnen bei U+FF21 und enthalten in ihren Beschreibungen die Zeichenfolge FULLWIDTH LATIN CAPITAL LETTER
  • Kleinbuchstaben: Die Buchstaben beginnen bei U+FF41 und enthalten in ihren Beschreibungen die Zeichenfolge FULLWIDTH LATIN SMALL LETTER

Zeitleiste für Kodierungsstandards

  • 1865 Der Internationale Morsecode wurde auf dem Internationalen Telegraphiekongress in Paris standardisiert und später von der International Telecommunication Union (ITU) zum Standard gemacht.
  • 1950er Jahre Sprechfunk-Rechtschreibalphabet von ICAO

Zeitleiste für weit verbreitete Computercodes, die das Alphabet unterstützen

  • 1963: ASCII (7-Bit-Zeichencodierungsstandard der American Standards Association , die 1969 zu ANSI wurde)
  • 1963/1964: EBCDIC (entwickelt von IBM und unterstützt die gleichen alphabetischen Zeichen wie ASCII, jedoch mit anderen Codewerten)
  • 1965-04-30: Von der ECMA als ECMA-6 ratifiziert, basierend auf den Arbeiten des Technischen Komitees TC1 der ECMA seit Dezember 1960.
  • 1972: ISO 646 ( ISO- 7-Bit-Zeichencodierungsstandard, der die gleichen alphabetischen Codewerte wie ASCII verwendet, überarbeitet in der zweiten Ausgabe ISO 646:1983 und der dritten Ausgabe ISO/IEC 646:1991 als gemeinsamer ISO/IEC- Standard)
  • 1983: ITU-T-Empf. T.51 | ISO/IEC 6937 (eine Multi-Byte-Erweiterung von ASCII)
  • 1987: ISO/IEC 8859-1 : 1987 (8-Bit-Zeichenkodierung)
    • Anschließend wurden weitere Versionen und Teile von ISO/IEC 8859 veröffentlicht.
  • Mitte bis Ende der 1980er Jahre: Windows-1250 , Windows-1252 und andere in Microsoft Windows verwendete Codierungen (einige ähnlich ISO/IEC 8859-1)
  • 1990: Unicode 1.0 (entwickelt vom Unicode Consortium ), enthalten im Block „ C0 Controls and Basic Latin “ mit den gleichen alphabetischen Codewerten wie ASCII und ISO/IEC 646
    • Anschließend wurden andere Versionen von Unicode veröffentlicht und später wurde es auch ein gemeinsamer ISO/IEC- Standard, wie unten beschrieben.
  • 1993: ISO/IEC 10646-1 :1993, ISO/IEC-Standard für Zeichen in Unicode 1.1
    • Anschließend wurden weitere Versionen von ISO/IEC 10646-1 und eine von ISO/IEC 10646-2 veröffentlicht. Seit 2003 werden die Normen unter dem Namen „ISO/IEC 10646“ ohne Aufteilung in zwei Teile veröffentlicht.
  • 1997: Windows-Glyphenliste 4

Darstellung

Die Buchstaben des lateinischen ISO-Alphabets auf einer 16-Segment-Anzeige (plus die arabischen Ziffern ).

In ASCII gehören die Buchstaben zu den druckbaren Zeichen und in Unicode seit Version 1.0 zum Block " C0 Controls and Basic Latin ". In beiden Fällen sowie in ISO/IEC 646 , ISO/IEC 8859 und ISO/IEC 10646 belegen sie die Positionen in hexadezimaler Schreibweise 41 bis 5A für Großbuchstaben und 61 bis 7A für Kleinbuchstaben.

Groß-/Kleinschreibung wird nicht beachtet, alle Buchstaben haben Codewörter im ICAO-Buchstabieralphabet und können mit Morsecode dargestellt werden .

Verwendungszweck

Alle Kleinbuchstaben werden im International Phonetic Alphabet (IPA) verwendet. In X-SAMPA und SAMPA haben diese Buchstaben den gleichen Klangwert wie in IPA.

Alphabete, die den gleichen Satz von Buchstaben enthalten

Die folgende Liste enthält nur Alphabete, die fehlen:

  • Buchstaben, deren diakritische Zeichen sie zu unterschiedlichen Buchstaben machen.
  • Multigraphen, die verschiedene Buchstaben darstellen.
Alphabet diakritisches Zeichen Multigraphen (die keine unterschiedlichen Buchstaben darstellen) Ligaturen
Afrikaans-Alphabet á , é , è , ê , ë , í , î , ï , ó , ô , ú , û , ý
Katalanisches Alphabet à , é , è , í , ï , ó , ò , ú , ü , ç , lꞏl gu ⟩, ⟨ ig ⟩, ⟨ ix ⟩, ⟨ ll ⟩, ⟨ ny ⟩, ⟨ qu ⟩, ⟨ rr ⟩, ⟨ ss
Niederländisches Alphabet ä , é , è , ë , ï , ö , ü Der Digraphij ⟩ wird manchmal als separater Buchstabe angesehen. Wenn dies der Fall ist, ersetzt es normalerweise ⟨y⟩ oder wird mit diesem vermischt. Andere Digraphen: ⟨ aa ⟩, ⟨ ae ⟩, ⟨ ai ⟩, ⟨ au ⟩, ⟨ ch ⟩, ⟨ ee ⟩, ⟨ ei ⟩, ⟨ eu ⟩, ⟨ dh ⟩, ⟨ oe ⟩, ⟨ oi ⟩, ⟨ oo ⟩ , ⟨ ou ⟩, ⟨ ui ⟩, ⟨ uu
englisches Alphabet nur in Lehnwörtern (siehe unten) sh/shw ⟩, ⟨ ch/j ⟩, ⟨ ea/i ⟩, ⟨ ou/au ⟩, ⟨ th/d ⟩, ⟨ ph/f ⟩, ⟨ ng/ngh/ngk/ngg ⟩⟨ qu/kw æ , œ ue (archaisch)
Französisches Alphabet à , â , ç , é , è , ê , ë , î , ï , ô , ù , û , ü , ÿ ai ⟩, ⟨ au ⟩, ⟨ ei ⟩, ⟨ eu ⟩, ⟨ oi ⟩, ⟨ ou ⟩, ⟨ eau ⟩, ⟨ ch ⟩, ⟨ ph ⟩, ⟨ gn ⟩, ⟨ an ⟩, ⟨ am ⟩, ⟨ en ⟩, ⟨ em ⟩, ⟨ in ⟩, ⟨ im ⟩, ⟨ on ⟩, ⟨ om ⟩, ⟨ un ⟩, ⟨ um ⟩, ⟨ yn ⟩, ⟨ ym ⟩, ⟨ ain ⟩, ⟨ aim ⟩, ⟨ ein ⟩, ⟨ oin ⟩, ⟨ ⟩, ⟨ æ , œ ,
Deutsches Alphabet ä , ö , ü sch ⟩, ⟨ qu ⟩, ⟨ ch ⟩, ⟨ ph ⟩, ⟨ ng ⟩, ⟨ dh ⟩, ⟨ ck ⟩, ⟨ ei ⟩, ⟨ eu ⟩, ⟨ äu ß (manchmal als Buchstabe angesehen)
Italienisches Alphabet (erweitert) à , è , é , ì , ò , ù ch ⟩, ⟨ ci ⟩, ⟨ gh ⟩, ⟨ gi ⟩, ⟨ gl ⟩, ⟨ gli ⟩, ⟨ gn ⟩, ⟨ sc ⟩, ⟨ sci
Ido-Alphabet keiner qu ⟩, ⟨ ch ⟩, ⟨ sh keiner
Indonesisches Alphabet nur in Lernmaterialien (siehe unten) kh ⟩, ⟨ ng ⟩, ⟨ ny ⟩, ⟨ sy ⟩, Diphthonge: ai, au, ei, oi
Interlingua-Alphabet nur in unassimilierten Lehnwörtern (siehe unten) ch ⟩, ⟨ ph ⟩, ⟨ qu ⟩, ⟨ rh ⟩, ⟨ sh keiner
Javanisches lateinisches Alphabet é , è dh ⟩, ⟨ kh ⟩, ⟨ ng ⟩, ⟨ ny ⟩, ⟨ sy ⟩, ⟨ th keiner
Luxemburgisches Alphabet ä , é , ë
Malaiisches Alphabet nur in Lernmaterialien (siehe unten) gh ⟩, ⟨ kh ⟩, ⟨ ng ⟩, ⟨ ny ⟩, ⟨ sy keiner
Portugiesisches Alphabet ã , õ , á , é , í , ó , ú , â , ê , ô , à , ç ch ⟩, ⟨ lh ⟩, ⟨ nh ⟩, ⟨ rr ⟩, ⟨ ss ⟩, ⟨ am ⟩, ⟨ em ⟩, ⟨ im ⟩, ⟨ om ⟩, ⟨ um ⟩, ⟨ ãe ⟩, ⟨ ão ⟩, ⟨ õe Ich keiner
Sundanesisches lateinisches Alphabet é eu ⟩, ⟨ ng ⟩, ⟨ ny keiner

Englisch ist eine der wenigen modernen Sprachen Europäische keine diakritischen Zeichen für native Worte erfordern (obwohl ein diaeresis von einigen amerikanischen Verlegern in Wörtern wie „cooperation“ verwendet wird).

Die konstruierte Sprache Interlingua verwendet niemals diakritische Zeichen außer in nicht assimilierten Lehnwörtern. Sie können jedoch entfernt werden, wenn sie nicht dazu dienen, den Vokal zu modifizieren (zB cafe , von französisch : café ).

Malaiisch und Indonesisch (basierend auf Malaiisch) sind die einzigen Sprachen außerhalb Europas, die das gesamte lateinische Alphabet verwenden und keine diakritischen Zeichen und Ligaturen erfordern. Viele der über 700 Sprachen Indonesiens verwenden auch das indonesische Alphabet, um ihre Sprachen zu schreiben, einige wie Javanisch, die diakritische Zeichen é und è hinzufügen, und einige lassen q, x und z weg.

Spaltennummerierung

Das römische (lateinische) Alphabet wird häufig für die Spaltennummerierung in einer Tabelle oder einem Diagramm verwendet. Dies vermeidet Verwechslungen mit Zeilennummern, die arabische Ziffern verwenden . Eine 3-mal-3-Tabelle würde beispielsweise die Spalten A, B und C enthalten, die den Zeilen 1, 2 und 3 gegenübergestellt sind. Wenn weitere Spalten über Z hinaus benötigt werden (normalerweise der letzte Buchstabe des Alphabets), wird die Spalte sofort nach Z ist AA, gefolgt von AB, und so weiter (siehe bijektive Basis-26-System ). Dies erkennt man, wenn man in einem Tabellenkalkulationsprogramm wie Microsoft Excel oder LibreOffice Calc ganz nach rechts scrollt .

Dies sind zweistellige "Buchstaben" für Tabellenspalten, genauso wie 10 bis 99 zweistellige Zahlen sind. Das griechische Alphabet hat eine ähnliche erweiterte Form, die bei Bedarf solche zweistelligen Buchstaben verwendet, aber es wird für Kapitel einer Bruderschaft verwendet und nicht für Spalten einer Tabelle.

Solche zweistelligen Buchstaben für Aufzählungszeichen sind AA, BB, CC usw. im Gegensatz zu dem oben erläuterten zahlenartigen Stellenwertsystem für Tabellenspalten.

Siehe auch

Anmerkungen

Verweise