Wolfgang von Kempelens talmaskin

En kopia av Kempelens talmaskin, byggd 2007–09 vid institutionen för fonetik, Saarlands universitet , Saarbrücken , Tyskland

Wolfgang von Kempelens talmaskin är en manuellt manövrerad talsyntes som började utvecklas 1769, av den österrikisk-ungerske författaren och uppfinnaren Wolfgang von Kempelen . Det var samma år som han fullbordade sitt långt mer ökända bidrag till historien: Turken, en schackspelande automat , som senare visade sig vara en mycket långtgående och utarbetad bluff på grund av att den schackspelande människan ockuperade dess inre . [4] Men medan turkens konstruktion var klar på sex månader, upptog Kempelens talmaskin de följande tjugo åren av hans liv. [2] Efter två konceptuella "återvändsgränder" under de första fem åren av forskning, ledde Kempelens tredje riktning till slut honom till designen som han kände sig bekväm med att betrakta som "slutlig": en funktionell representationsmodell av den mänskliga röstkanalen . [3]

Första designen

Kempelens första experiment med talsyntes involverade endast de mest rudimentära delarna av röstkanalen som var nödvändiga för att producera talliknande ljud. En köksbälg, som användes för att elda i vedeldade spisar, anropades som en uppsättning lungor för att tillföra luftflödet. En vass extraherad från en vanlig säckpipa implementerades som glottis , källan till det råa fundamentala ljudet i sångkanalen. Klockan på en klarinett gav en tillräcklig mun, trots sin stela form. Denna grundläggande modell kunde bara producera enkla vokalljud, även om ytterligare artikulation var möjlig genom att placera sin hand vid klocköppningen för att hindra luftflödet. Den fysiska hårdvaran för att konstruera nasals , plosiver och frikativ som de flesta konsonanter kräver var dock inte närvarande. Kempelen, liksom många andra tidiga pionjärer inom fonetik , missförstod källan till de uppfattade "högre frekvenserna" av vissa ljud som en funktion av glottis, snarare än som funktionen av formanter i hela sångkanalen, så han övergav sin singel- vassdesign för ett tillvägagångssätt med flera rör. [2][3]

Andra designen




Den andra designen involverade en konsol, liknande den för ett musikorgel från perioden, där operatören bemannade en uppsättning nycklar, en för varje bokstav. Ljuden producerades av en vanlig bälg som matade luft genom olika rör med lämpliga former och hinder som behövs för att producera den bokstaven. Genom experiment upptäckte han att vassens resonanslängd inte var avgörande för skapandet av högfrekventa komponenter i vissa vokaler och frikativ, så han ställde in dem alla till samma tonhöjd för att skapa överensstämmelse mellan bokstäverna. Även om inte alla bokstäver var representerade vid denna tidpunkt, hade Kempelen utvecklat den teknik som krävdes för att producera de flesta vokaler och flera konsonanter, inklusive den plosiva /p/, och den nasala /m/, och var därför i en position att börja bilda stavelser och korta ord. Detta ledde dock omedelbart till den primära bristen i hans andra design: den parallella naturen hos de multipla vassen gjorde att mer än en bokstav kunde ljuda åt gången. Och i processen att bygga stavelser och ord, gjorde den soniska "överlappningen" (nu kallad samartikulation ) ljud mycket okarakteristiska för mänskligt tal, vilket helt och hållet undergräver designens avsikt. Kempelen kommenterar: ”För att kunna fortsätta mina experiment var det framför allt nödvändigt att jag hade en perfekt kunskap om vad jag ville imitera. Jag var tvungen att göra en formell studie av tal och ständigt konsultera naturen när jag utförde mina experiment. På detta sätt gjorde min talmaskin och min teori om tal lika framsteg, den ena fungerade som vägledning för den andra." [3] "Det var möjligt, enligt de metoder jag hade använt, att uppfinna separata bokstäver, men att aldrig kombinera dem till stavelser, och att det var absolut nödvändigt att följa naturen som bara har en glottis och en mun, genom som varje ljud kommer fram och som ger en enhet åt dem." [2][3] Sålunda började Kempelen arbetet med sin tredje, och slutligen slutliga design, som i sig på många sätt var en "nära-som-möjlig" representation av fysiologin i röstkanalen .

Tredje designen

Det tredje tillvägagångssättet följde en liknande design som den första, som var konceptuellt mer trogen den naturliga utformningen av den mänskliga röstkanalen än den andra. Den bestod, precis som tidigare, av en bälg, en vass och en simulerad mun (denna gång gjord av Indien-gummi , för bättre skapande av vokalljud via handmanipulation), men inkluderade också en "hals" till vilken en "näshåla" var fäst (komplett med två "näsborrar" för att uttala nasala konsonanter), samt flera spakar och rör avsedda för att uttala /s/ och /ʃ/, en stav som skulle störa vassens vibration för att artikulera /r/ och separera , mindre bälg som skulle låta luft passera vassen medan munnen var helt stängd (en egenskap som krävs för att uttala /b/). Vid ett tillfälle ingick en speciell ventil avsedd att simulera /f/, men togs senare bort när det avslöjades att samma ljud kunde uppnås genom att helt enkelt stänga alla öppningar i maskinen och låta luft läcka från sprickorna. På samma sätt, vid ett tillfälle i designen, fanns det en alternativ "mun"-enhet bestående av en trälåda med ett par gångjärnsförsedda luckor som fungerade som läppar. Inuti lådan fanns en gångjärnsförsedd, trä, strängmanövrerad flik som fungerade som en tunga. Syftet med denna montering var att efterlikna munnen och tungan i konstruktionen av plosiver som "b" och "d", men togs senare bort när Kempelen insåg att utan en ordentlig tunga skulle maskinen aldrig kunna producera /t /, /d/, /k/ och /ɡ/. Han hittade sin väg runt hela detta problem genom att ersätta /t/ och /k/ med /p/, och /d/ och /ɡ/ med /b/ (som i sig bara skilde sig från /p/). I samband med ett välbekant ord ignorerade lyssnare ofta feluttalet helt och hållet (ett fenomen som senare utforskades av forskare inom kognitionsvetenskap ) . Kempelen trodde att folk var mer förlåtande för de fel som gjordes av hans maskin på grund av frekvensen av den resonanslängd som han valde att använda, vilket skapar en resonans mycket mer som ett litet barn än hos en vuxen. [2] [3] Denna tredje design, till skillnad från de före den, var helt kapabel att tala fullständiga fraser på franska, italienska och engelska (tyska var möjligt, men krävde en högre skicklighetsnivå av operatören, på grund av den mer frekventa användningen av konsonanter i det tyska språket). Dess största begränsning var bälgen, som, även om den var sex gånger större än mänskliga lungor, rann ut på luft mycket snabbare än den hos sin mänskliga motsvarighet. Eftersom designen baserades på ett enda rör som den glottala ljudkällan, hade han inga av problemen med samartikulation som följde med den andra designen. Men det enda röret innebar också att Speaking Machine hade en monoton röst. [4] Kempelen ägnade lite tid åt att försöka införa flera prosodiska tonhöjdsvariationsmekanismer i vassaggregatet, men utan resultat. Han bestämde sig för att lämna designen för att förbättras av nästa grupp experimenterare. Alla dessa viktiga tillägg för den tredje designen kom från de två decennierna av intensiv forskning av röstkanalen i relation till talade språk av Kempelen, för vilka beteendet hos varje avgörande fysiologiskt element i talproduktion granskades och replikerades akustiskt och/eller mekaniskt. . [3]

Ett betydande bidrag

Strax efter färdigställandet och utställningen av hans Talmaskin, 1804, dog von Kempelen, dock inte innan han publicerade en ytterst omfattande tidskrift om de senaste tjugo åren av hans forskning i fonetik. Den 456-sidiga boken, med titeln Mechanismus der menschlichen Sprache nebst Beschreibung einer sprechenden Maschine (som översätts till The Mechanism of Human Speech, with a Description of a Speaking Machine , publicerad 1791) [2][4] innehöll alla tekniska aspekter av både Kempelens konstruktion av Speaking Machine (inklusive de preliminära designerna) och hans studier av den mänskliga röstkanalen. [3]

År 1837 återuppväckte Sir Charles Wheatstone Wolfgang von Kempelens verk och skapade en förbättrad kopia av hans Speaking Machine. [3] [4] Med hjälp av ny teknik som utvecklats under de senaste 50 åren kunde Wheatstone ytterligare analysera och syntetisera komponenter i akustiskt tal, vilket gav upphov till den andra vågen av vetenskapligt intresse för fonetik. Efter att ha sett Wheatstones förbättrade replika av Speaking Machine på en utställning, gav sig en ung Alexander Graham Bell i väg att konstruera sin egen talmaskin med hjälp och uppmuntran av sin far. [4][5] Bells experiment och forskning ledde slutligen till hans uppfinning av telefonen 1876 [4] , vilket revolutionerade global kommunikation.

År 1968 byggde Marcel Van den Broecke (Universitetet i Amsterdam) en replik som en del av en magisterexamen, om vilken han rapporterade i "Sound Structures", Marcel van den Broecke, Vincent van Heuven och Wim Zonneveld (red.), kapitel 2 , s 9-19: "Wolfgang von Kempelens Speaking Machine as a Performer", Foris Publications, Dordrecht-Netherlands/Cinnaminson-USA, 1983. Akustiska förutsägelser med hjälp av N-rörsapproximationer av röstkanalen och applicering av dem på replikans egenskaper visade vad hade redan fastställts perceptuellt, nämligen att maskinen bara kunde producera två vokalliknande ljud, dvs. en /a/-liknande vokal och en /o/-liknande vokal. Av de producerade konsonanterna är den allmänna plosiven mycket övertygande. En nasal för allmänt bruk kan också lätt identifieras, men sibilanter och den skramlande /r/ är lika obehagliga som ögonvittnet von Windisch rapporterade två sekel tidigare.

  1. Von Kempelen, Wolfgang, Mechanismus Der Menschlichen Sprache Nebst Beschreibung Seiner Sprechenden Maschine , Österrike: Stuttgart-Bad Cannstatt, 1970.
  2. Wolfgang von Kempelen: Der Mechanismus der menschlichen Sprache. / The Mechanism of Human Speech. : Kommentierte Translitteration & Übertragung ins Englische / Kommentarer Translitteration & Translation into English. Herausgegeben von / Redigerad av Fabian Brackhane, Richard Sproat & Jürgen Trouvain; Dresden 2017 ( Online-version ).
  3. Dudley, Homer & Tarnoczy, TH, The Speaking Machine of Wolfgang Von Kempelen. The Journal of the Acoustical Society of America , vol 22, nr 2, mars 1950: sid 151–166.
  4. Linggard, R., Electronic Synthesis of Speech , Cambridge: Cambridge University Press , 1985: s 4–9
  5. Standage, Tom, The Turk: The Life and Times of the Famous Eighteenth-Century Chess-Playing Machine , New York: Walker & Company , 2002: s 76–81
  6. Rossing, Thomas, et al., The Science of Sound , San Francisco: Addison-Wesley , 2002: s 365

externa länkar