Wolfgang von Kempelens Sprechmaschine - Wolfgang von Kempelen's speaking machine

Eine Replik von Kempelen Sprechmaschine, gebaut 2007-09 am Institut für Phonetik, Universität des Saarlandes , Saarbrücken , Deutschland

Die Sprechmaschine von Wolfgang von Kempelen ist ein manuell betriebener Sprachsynthesizer, der 1769 vom österreichisch-ungarischen Autor und Erfinder Wolfgang von Kempelen entwickelt wurde . Es war in diesem selben Jahr , dass er seinen weit mehr berüchtigt Beitrag zur Geschichte beendet: Der Türke , ein Schach -playing Automat , später eine sehr weitreichende und aufwendige Hoax aufgrund der Schachspieles Mensch-Sein besetzt seine Innereien sein enthüllen . [4] Während der Bau des Türken in sechs Monaten abgeschlossen war, beschäftigte Kempelens Sprechmaschine die nächsten zwanzig Jahre seines Lebens. [2] Nach zwei konzeptionellen "Sackgassen" in den ersten fünf Jahren der Forschung führte Kempelens dritte Richtung ihn schließlich zu dem Entwurf, den er als "endgültig" erachtete: ein funktionales Repräsentationsmodell des menschlichen Stimmapparates . [3]

Erstes Design

Kempelens erstes Experiment mit der Sprachsynthese umfasste nur die rudimentärsten Elemente des Vokaltrakts, die zur Erzeugung sprachähnlicher Klänge erforderlich sind. Ein Küchenbalg, mit dem Feuer in Holzöfen geschürt wurden, wurde als Lungensatz zur Versorgung des Luftstroms herangezogen. Ein Schilfrohr, das aus einem gewöhnlichen Dudelsack extrahiert wurde, wurde als Glottis implementiert , die Quelle des rohen Grundschalls im Vokaltrakt. Die Glocke einer Klarinette sorgte trotz ihrer starren Form für einen ausreichenden Mund. Dieses Grundmodell konnte nur einfache Vokale erzeugen, obwohl eine zusätzliche Artikulation möglich war, indem die Hand an der Glockenöffnung positioniert wurde, um den Luftstrom zu behindern. Die physische Hardware zum Aufbau der Nasen- , Spreng- und Reibungselemente , die die meisten Konsonanten benötigen, war jedoch nicht vorhanden. Kempelen hat, wie viele andere frühe Pioniere der Phonetik , die Quelle der wahrgenommenen "höheren Frequenzen" bestimmter Klänge als Funktion der Stimmritze und nicht als Funktion der Formanten des gesamten Stimmapparates missverstanden. Reed-Design für einen Mehrblatt-Ansatz. [2] [3]

Zweites Design

Das zweite Design beinhaltete eine Konsole, ähnlich der einer Musikorgel aus dieser Zeit, in der der Bediener einen Satz Schlüssel besetzte, einen für jeden Buchstaben. Die Geräusche wurden von einem gemeinsamen Balg erzeugt, der Luft durch verschiedene Rohre mit den entsprechenden Formen und Hindernissen führte, die zur Herstellung dieses Buchstabens erforderlich waren. Durch Experimente stellte er fest, dass die Resonanzlänge des Blattes für die Erzeugung der Hochfrequenzkomponenten bestimmter Vokale und Frikative nicht entscheidend war , weshalb er sie aus Gründen der Konsistenz zwischen den Buchstaben alle auf die gleiche Tonhöhe abstimmte. Obwohl zu diesem Zeitpunkt nicht alle Buchstaben vertreten waren, hatte Kempelen die Technologie entwickelt, die zur Erzeugung der meisten Vokale und mehrerer Konsonanten erforderlich war, einschließlich des Plosivs / p / und des Nasal / m /, und war daher in der Lage, Silben und Kurzbilder zu bilden Wörter. Dies führte jedoch sofort zum Hauptfehler seines zweiten Entwurfs: Die Parallelität der mehreren Stimmzungen ermöglichte es, dass mehr als ein Buchstabe gleichzeitig erklingen konnte. Und während des Aufbaus von Silben und Wörtern machte die klangliche „Überlappung“ (jetzt als Co-Artikulation bezeichnet ) Klänge für die menschliche Sprache sehr untypisch und untergrub die Absicht des Entwurfs insgesamt. Kempelen kommentiert:
„Um meine Experimente fortzusetzen, war es vor allem notwendig, dass ich genau wusste, was ich nachahmen wollte. Ich musste ein formelles Studium der Sprache machen und mich ständig mit der Natur befassen, während ich meine Experimente durchführte. Auf diese Weise machten meine Sprechmaschine und meine Theorie über Sprache gleichermaßen Fortschritte, wobei die eine als Leitfaden für die andere diente. “ [3]
"Es war möglich, nach den Methoden, die ich angewendet hatte, separate Buchstaben zu erfinden, diese aber niemals zu Silben zu kombinieren, und es war absolut notwendig, der Natur zu folgen, die nur eine Stimmritze und einen Mund hat was jeder Ton auftaucht und was ihnen eine Einheit gibt. " [2] [3]
So begann Kempelen mit der Arbeit an seinem dritten und letztendlich endgültigen Entwurf, der selbst in vielerlei Hinsicht eine "möglichst genaue" Darstellung der Physiologie des Stimmapparates war.

Drittes Design

Der dritte Ansatz folgte einem ähnlichen Design wie der erste, der dem natürlichen Design des menschlichen Stimmapparates konzeptionell getreuer war als der zweite. Es bestand nach wie vor aus einem Balg, einem Schilfrohr und einem simulierten Mund (diesmal aus Kautschuk , um Vokale besser von Hand manipulieren zu können), enthielt aber auch einen "Hals", zu dem eine "Nasenhöhle" gehörte. wurde angebracht (komplett mit zwei "Nasenlöchern" zum Aussprechen von Nasenkonsonanten) sowie mehreren Hebeln und Röhren, die zum Aussprechen von / s / und / ʃ / vorgesehen waren, einem Stab, der die Schilfvibration stören würde, um / r / zu artikulieren und zu trennen , kleinere Bälge, die es Luft ermöglichen würden, das Schilfrohr zu passieren, während der Mund vollständig geschlossen war (eine Funktion, die für die Aussprache von / b / erforderlich ist). Zu einem bestimmten Zeitpunkt war ein spezielles Ventil zur Simulation von / f / enthalten, das jedoch später entfernt wurde, als sich herausstellte, dass das gleiche Geräusch erzielt werden konnte, indem einfach alle Öffnungen der Maschine geschlossen wurden und Luft aus den Rissen austreten konnte. In ähnlicher Weise gab es an einem Punkt des Entwurfs eine alternative "Mund" -Baugruppe, die aus einer Holzkiste mit zwei Klappläden bestand, die als Lippen fungierten. In der Kiste befand sich eine schwenkbare, mit Schnüren betätigte Holzklappe, die als Zunge fungierte. Der Zweck dieser Anordnung war es, den Mund und die Zunge bei der Konstruktion von Sprengstoffen wie "b" und "d" nachzuahmen, wurde jedoch später entfernt, als Kempelen erkannte, dass die Maschine ohne eine geeignete Zunge niemals in der Lage sein würde, / t zu produzieren /, / d /, / k / und / ɡ /. Er fand seinen Weg um dieses gesamte Problem herum, indem er / t / und / k / durch / p / und / d / und / ɡ / durch / b / ersetzte (was sich nur in der Stimme von / p / unterschied). Im Zusammenhang mit einem vertrauten Wort ignorierten die Zuhörer die falsche Aussprache häufig insgesamt (ein Phänomen, das später von Forschern auf dem Gebiet der Kognitionswissenschaft untersucht wurde ). Kempelen glaubte, dass die Menschen die Fehler, die seine Maschine aufgrund der Frequenz der von ihm gewählten Resonanzlänge von Schilf und Stimmtrakt machte, eher verzeihen, was eine Resonanz erzeugt, die einem kleinen Kind viel ähnlicher ist als der eines Erwachsenen. [2] [3] Dieses dritte Design war im Gegensatz zu den vorherigen vollständig in der Lage, vollständige Phrasen in Französisch, Italienisch und Englisch zu sprechen (Deutsch war möglich, erforderte jedoch aufgrund der häufigeren Verwendung ein höheres Qualifikationsniveau des Bedieners von Konsonanten in deutscher Sprache). Seine größte Einschränkung war der Balg, der, obwohl er sechsmal so groß war wie die menschliche Lunge, viel schneller luftleer war als der seines menschlichen Gegenstücks. Da das Design auf einem einzigen Blatt als Glottal-Schallquelle basierte, hatte er keines der Probleme der Koartikulation, die mit dem zweiten Design einhergingen. Dieses einzelne Blatt bedeutete aber auch, dass die sprechende Maschine eine monotone Stimme hatte. [4] Kempelen verbrachte einige Zeit damit, verschiedene prosodische Tonhöhenvariationsmechanismen in die Schilfbaugruppe einzuführen , aber ohne Erfolg. Er beschloss, das Design zu verlassen, um es von der nächsten Gruppe von Experimentatoren zu verbessern. Alle diese wichtigen Ergänzungen für das dritte Design stammen aus den zwei Jahrzehnten intensiver Erforschung des Vokaltrakts in Bezug auf gesprochene Sprachen durch Kempelen, für die das Verhalten jedes entscheidenden physiologischen Elements der Sprachproduktion untersucht und akustisch und / oder mechanisch repliziert wurde . [3]

Ein bedeutender Beitrag

Kurz nach der Fertigstellung und Ausstellung seiner Speaking Machine im Jahr 1804 starb von Kempelen, allerdings nicht bevor er eine äußerst umfassende Zeitschrift der letzten zwanzig Jahre seiner Forschung in der Phonetik veröffentlichte. Das 456-seitige Buch mit dem Titel Mechanismus der Menschliche Sprache nebst Beschreibung Eines sprechende Maschine (was übersetzt den Mechanismus der menschlichen Sprache, mit einer Beschreibung einer Sprechmaschine , im Jahr 1791 veröffentlicht) [2] [4] , enthielt jeder technischer Aspekt sowohl Kempelens Konstruktion der Sprechmaschine (einschließlich der vorläufigen Entwürfe) als auch seine Studien über den menschlichen Stimmapparat. [3]

1837 ließ Sir Charles Wheatstone das Werk von Wolfgang von Kempelen wieder auferstehen und schuf eine verbesserte Nachbildung seiner Sprechmaschine. [3] [4] Mit neuen Technologien, die in den letzten 50 Jahren entwickelt wurden, konnte Wheatstone Komponenten der akustischen Sprache weiter analysieren und synthetisieren, was zur zweiten Welle wissenschaftlichen Interesses an der Phonetik führte. Nachdem ein junger Alexander Graham Bell Wheatstones verbesserte Nachbildung der Sprechmaschine auf einer Ausstellung gesehen hatte, machte er sich daran, mit Hilfe und Ermutigung seines Vaters seine eigene Sprechmaschine zu bauen. [4] [5] Bells Experimente und Forschungen führten schließlich 1876 zu seiner Erfindung des Telefons [4] , die die globale Kommunikation revolutionierte.

1968 baute Marcel Van den Broecke (Universität Amsterdam) im Rahmen einer Magisterarbeit eine Replik, über die er in "Sound Structures", Marcel van den Broecke, Vincent van Heuven und Wim Zonneveld (Hrsg.), Kapitel 2, berichtete , S. 9-19: "Wolfgang von Kempelens sprechende Maschine als Darsteller", Foris Publications, Dordrecht-Niederlande / Cinnaminson-USA, 1983. Akustische Vorhersagen unter Verwendung von N-Röhren-Approximationen des Vokaltrakts und deren Anwendung auf die Eigenschaften des Replikats zeigten, was war bereits perzeptuell festgestellt worden, nämlich dass die Maschine nur zwei vokalähnliche Geräusche erzeugen konnte, nämlich. ein / a / -ähnlicher Vokal und ein / o / -ähnlicher Vokal. Von den hergestellten Konsonanten ist der Allzweck-Sprengstoff sehr überzeugend. Ein Allzweck-Nasenflügel kann ebenfalls leicht identifiziert werden, aber Zischlaute und das Rasseln sind ebenso unangenehm wie der Augenzeuge von Windisch, der zwei Jahrhunderte zuvor berichtet hatte.

Verweise

  1. Von Kempelen, Wolfgang, Mechanismus Der Menschlichen Sprache Nebst Beschreibung Seiner Sprechenden Maschine , Österreich: Stuttgart-Bad Cannstatt, 1970.
  2. Wolfgang von Kempelen: Der Mechanismus der menschlichen Sprache. / Der Mechanismus der menschlichen Sprache. : Kommentierte Transliteration & Übertragung ins Englische / Kommentierte Transliteration & Übersetzung ins Englische. Herausgegeben von / Herausgegeben von Fabian Brackhane, Richard Sproat & Jürgen Trouvain; Dresden 2017 ( Online-Version ).
  3. Dudley, Homer & Tarnoczy, TH, Die sprechende Maschine von Wolfgang Von Kempelen. The Journal of the Acoustical Society of America , Band 22, Nr. 2, März 1950: S. 151–166.
  4. Linggard, R., Elektronische Sprachsynthese , Cambridge: Cambridge University Press , 1985: S. 4–9
  5. Standage, Tom, The Turk: Das Leben und die Zeiten der berühmten Schachspielmaschine des 18. Jahrhunderts , New York: Walker & Company , 2002: S. 76–81
  6. Rossing, Thomas et al., The Science of Sound , San Francisco: Addison-Wesley , 2002: S. 365

Externe Links