Margaret Masterman

Margaret Masterman
Född ( 1910-05-04 ) 4 maj 1910
London, England
dog 1 april 1986 (1986-04-01) (75 år)
Cambridge , England
Alma mater Newnham College, Cambridge
Känd för Cambridge Language Research Unit
Make
.
( m. 1932 <a i=3>).
Barn 2
Föräldrar)
Charles FG Masterman Lucy Blanche Lyttelton
Vetenskaplig karriär
Fält Beräkningslingvistik
institutioner Lucy Cavendish College, Cambridge

Margaret Masterman (4 maj 1910 – 1 april 1986) var en brittisk lingvist och filosof , mest känd för sitt banbrytande arbete inom beräkningslingvistik och särskilt maskinöversättning . Hon grundade Cambridge Language Research Unit.

Biografi

Margaret Masterman föddes i London den 4 maj 1910 av Charles FG Masterman , en brittisk radikal liberal politiker och chef för War Propaganda Bureau , och Lucy Blanche Lyttelton , en politiker, poet och författare. 1932 gifte hon sig med Richard Bevan Braithwaite , en filosof. De hade en son, Lewis Charles (född 1937) och en dotter, Catherine Lucy (född 1940).

Arbete

Margaret Masterman var en av sex studenter i Wittgensteins kurs 1933–34 vars anteckningar sammanställdes som The Blue Book . 1955 grundade och ledde hon Cambridge Language Research Unit (CLRU), som växte från en informell diskussionsgrupp till ett stort forskningscenter inom datorlingvistik på sin tid. Hon var student vid Newnham College, Cambridge och läste moderna språk och sedan Moral Sciences (som filosofin hette då). Cambridge Language Research Unit grundades i en liten men vacker byggnad kallad Adie's Museum som hade inrymt konst från fjärran östern: små buddhistiska skulpturer byggdes in i dess väggar och snidade dörrar. Under en period av tjugo år från och med 1953 var det en källa till betydande forskning inom maskinöversättning, beräkningslingvistik och kvantfysik även om den var utanför de officiella universitetsstrukturerna i Cambridge. Det finansierades av bidrag från amerikanska organ (AFOSR, ONR, NSF), brittiska myndigheter (OTI) och senare från EU-medel i Luxemburg. Dess datorfaciliteter var primitiva - en gammal ICL 1202-dator --- och de flesta av dess mer seriösa beräkningar gjordes antingen på Cambridge University-maskinen, i dåvarande Mathematical Laboratory - eller av CLRU-besökare på platser i USA. Ett mått på dess inverkan, och från en personal som aldrig översteg tio personer, var det av Annual Lifetime Achievement Awards från Association for Computational Linguistics i USA, tre har tilldelats CLRU-alumner: Martin Kay , Karen Spärck Jones och Yorick Wilks .

Margaret Masterman var före sin tid med ett tjugotal år: många av hennes övertygelser och förslag för språkbehandling med dator har nu blivit en del av det gemensamma beståndet av idéer inom artificiell intelligens (AI) och maskinöversättning (MT). Hon kunde aldrig göra tillräckliga anspråk på dem eftersom de var oacceptabla när hon publicerade dem, och så när de skrevs upp senare av hennes elever eller självständigt "upptäcktes" av andra, fanns det inga spår tillbaka till henne, särskilt inom dessa områden. där lite eller ingenting över tio år någonsin läses om.

Kärnan i hennes övertygelse om språkbearbetning var att den måste återspegla språkets koherens, dess redundans som en signal. Denna idé var ett partiellt arv från den gamla "informationsteoretiska" synen på språk: för henne innebar det att processer som analyserar språk måste ta hänsyn till dess repetitiva och överflödiga strukturer och att en författare fortsätter att säga samma sak om och om igen på olika sätt. sätt; bara om skribenten gör det kan oklarheterna tas bort från signalen. Detta ledde ibland till att hon överbetonade den verkliga och explicita överflöd som hon hittade i rytmiska och repetitiva verser och hävdade, osannolikt, att normal engelska bara var sådär om vi bara kunde se det rätt.

Detta ledde under senare år till den nyckelroll hon tilldelade rytm, stress, andningsgrupperingar och de gränser de sätter på text och förståelseprocesser. För att uttrycka det grovt var hennes påstående att språk är som de är, åtminstone delvis, eftersom de produceras av varelser som andas med ganska jämna mellanrum. Det kommer att vara uppenbart varför sådana påståenden inte ens kunde underhållas medan Chomskys åsikter var framträdande i språkstudier. Däremot kunde hon aldrig ge systematiska ytkriterier genom vilka andningsgrupperna och stressmönstren skulle identifieras av ytsignaler, eller kunde reduceras till andra kriterier som syntax eller morfologi, och hon skulle inte heller bli involverad i den faktiska fysiken av röstmönster.

Hennes åsikter om betydelsen av semantik i språkbehandling (som hon fortsatte att försvara under högåren av Chomskyan syntax mellan 1951 och 1966) var mycket influerad av RH Richens syn på klassificering och beskrivning med hjälp av ett språk av semantiska primitiver med sin egen syntax. Dessa, tillsammans med tillhörande påståenden om semantisk mönstermatchning på yttext, utvecklades i faktiska program, från vilka man kunde anta att hon var en rakt på sak tro på existensen av semantiska primitiver i någon katziansk eller schankisk mening. Ingenting kunde vara längre ifrån sanningen: för hon var alldeles för mycket en Wittgensteinsk skeptiker till förmågan hos ett begränsat underspråk eller logik att ta på sig hela språkets roll. Hon hävdade alltid att semantiska primitiver bara skulle vara meningsfulla om det fanns empiriska kriterier för deras upptäckt och en teori som möjliggjorde det faktum att de också skulle utveckla exakt polysemin hos vilket högre eller naturligt språk som helst; och hon betonade alltid primitivernas funktionella roll i till exempel att lösa sinnets tvetydighet och som ett interlingua för MT.

Hon hoppades att flykten från problemet med ursprunget till semantiska primitiver skulle ligga i antingen empiriska klassificeringsförfaranden som fungerar på verkliga texter (på det sätt som vissa nu talar om att härleda primitiver genom massiv konnektionistisk inlärning), eller genom att ha en adekvat formell teori om struktur av synonymordbok, som hon ansåg explicitera vissa underliggande strukturer av de semantiska relationerna i ett naturligt språk: en teori sådan att "primitiver" skulle dyka upp naturligt som den organiserande klassificeringen av synonymordboken. Under några år utforskade hon och kollegor gitterteori som den underliggande formella strukturen för en sådan synonymordbok.

Två andra bekymmer som gick genom hennes intellektuella liv beror mycket på den period då Michael Halliday , som universitetslektor i kinesiska vid Cambridge, var en kollega vid CLRU. Hon fick av honom idén att syntaktisk teori var fundamentalt semantisk eller pragmatisk, antingen i dess kategorier och deras grundläggande definition, eller i termer av syntaxens roll som en organiserande princip för semantisk information. Hon var den första AI-forskaren som påverkades av Halliday, långt före Terry Winograd . Återigen blev hon under en avsevärd period upptagen av de kinesiska ideogrammens natur och funktion, eftersom hon ansåg att de på ett empiriskt sätt klargjorde problem som Wittgenstein brottats med i sin så kallade bild-teori-om-sanning. Detta fick henne att överdriva det allmänna i ideogrammatiska principer och att tyckas anse att engelska egentligen var ganska lik kinesiska om bara sett korrekt, med dess betydelseatomer, mycket tvetydig och praktiskt taget oböjd. Det var en uppfattning som fann liten eller ingen sympati i tidens dominerande språkliga eller beräkningsmässiga strömningar.

Hennes huvudsakliga skapelse 1953, en som varade i tjugo år, var Cambridge Language Research Unit, som växte fram ur en informell diskussionsgrupp med ett mycket heterogent medlemskap som var intresserad av språk ur filosofiska och beräkningsmässiga synpunkter. Därefter var försöket att bygga språkbehandlingsprogram som hade en sund filosofisk grund ett utmärkande drag för enhetens arbete. Detta förhållningssätt till språkbehandling, och den specifika form det tog i användningen av en synonymordbok som det huvudsakliga redskapet för semantiska operationer, kommer förmodligen att ses som enhetens stora bidrag till området som helhet, och det var Margaret som var huvudansvarig för dem. Hennes vision av språkbehandling och dess möjligheter var anmärkningsvärd vid en tid då datorer var mycket rudimentära: mycket av CLRU:s arbete måste faktiskt göras på föregångarna till datorer, nämligen Holleriths hålkortsmaskiner. På samma sätt var Margarets beslutsamhet att etablera och underhålla enheten, med den enorma ansträngning för att samla in pengar som detta innebar, mycket slående: det faktum att den kunde fortsätta i årtionden, och under perioder då det var svårt att få offentligt stöd för sådant arbete, är en hyllning till Margarets uthållighet och charm. Det är svårt för oss nu, i dessa dagar av artificiell intelligens på den vanliga marknaden, och mycket kraftfulla persondatorer, att inse hur svårt det var att få de ekonomiska resurser som behövdes för språkbehandlingsforskning och de tekniska resurserna för att göra verklig experiment.

Den kanske bästa kommentaren om Margarets initiativ när det gäller forskning om språkbearbetning, och specifikt på maskinöversättningsarbete, kommer från en något oväntad källa. Maskinöversättning, efter en inledande period av höga förhoppningar och några stora anspråk, kastades ut i yttre mörker 1966 av finansiärer som inte såg någon avkastning för sina pengar. När Woody Bledsoe, en av de mångåriga ledarna inom området, men i områden helt utanför språket, granskade tjugofem års forskning om artificiell intelligens i sitt presidenttal till American Association for Artificial Intelligence 1985, om dem som försökte maskinöversätta på femtio- och sextiotalet: "De kan ha misslyckats, men de gjorde rätt i att försöka; vi har lärt oss så mycket av deras försök att göra något så svårt".

Det hon och CLRU försökte göra var långt före sin tid. Ansträngningar gjordes för att ta itu med grundläggande problem med dåtidens datorer som hade kapaciteten hos ett modernt digitalt armbandsur. Trots alla typer av problem producerade enheten många publikationer om språk och relaterade ämnen, inklusive informationssökning och automatisk klassificering. I över tio år var enhetens närvaro starkt känd på fältet, alltid med tonvikt på grundläggande semantiska problem med språkförståelse. Margaret hade inte tid för dem som kände att allt som behövdes göras var syntaktisk analys, eller att fullständig analys var nödvändig innan du gjorde något annat. Nu när språkets semantik betraktas som en grundläggande del av dess förståelse med maskin, verkar CLRUs idéer märkligt moderna.

Margarets främsta bidrag till CLRU:s liv låg i den ständiga intellektuella stimulans hon gav till dess forskning, och genom detta till det större naturspråksbearbetningssamhället: hon hade vidsträckta bekymmer och laterala idéer, vilket ledde henne till att t.ex. föreslå synonymordboken som ett sätt att utföra många distinkta språkbearbetningsuppgifter, som indexering och översättning. Margarets betoning på algoritmer, och på att testa dem, var avgörande för utvecklingen av CLRU:s arbete med språkbehandling; men hennes idéer var anmärkningsvärda, särskilt för dem som arbetade med henne, inte bara för deras intellektuella egenskaper, utan för deras rena glädje.

Seriös forskning stannade vid CLRU omkring 1978 och Margaret försökte starta om CLRU 1980 med William Williams i hopp om att den nya sorten av mikrodatorer skulle kunna användas för att utveckla hennes algoritmer för naturligt språköversättning. Margaret gick de 7 milen från Millington Road i Cambridge till Orwell och köpte två North Star Horizon- datorer från Intelligent Artefacts (se ST Robotics ). Dessa installerades med Forth , skrivet av David Sands och användes av olika studenter från University of Cambridge som programmerade in Margarets algoritmer i datorerna. Margarets inställning till översättning av naturliga språk vid denna tidpunkt var att dela upp en mening i "andningsgrupp"-segment. Eftersom varje andningsgrupp hade en unik betydelse kunde den översättas till målspråket och målsatsen rekonstrueras med hjälp av de översatta andningsgrupperna. Detta stod i kontrast till den tidens dominerande språköversättningstekniker, särskilt Systran som använde ett ordboks- och regelbaserat system som fortfarande används idag. När Margaret dog 1986 stängde William Williams CLRU och dess unika bibliotek med tidiga MT-dokument dumpades i en låda, trots att två universitetsorgan hade erbjudit sig att ge det ett hem.

Hon var en av medgrundarna till Lucy Cavendish College och dess första vicepresident (1965–1975). Hon var en systerdotter till Lucy Cavendish som skolan är uppkallad efter. Hon var också en grundare och den stora inspirationen för Epiphany Philosophers , en grupp som delade ett visst medlemskap med CLRU och var dedikerad till studiet av förhållandet mellan vetenskap och religion och formerna för religiös praktik.

1965 läste Margaret Masterman verket: "The Nature of a Paradigm" vid Fourth International Colloquium in the Philosophy of Science, i London. Hon genomförde en detaljerad textkritik av Thomas S. Kuhns bok, The Structure of Scientific Revolutions (1962), och karakteriserade boken som "på en gång vetenskapligt tydlig och filosofiskt obskyr". Masterman berömde Kuhn som "en av vår tids framstående vetenskapsfilosofer" och hans uppfattning om paradigm som "en grundläggande idé och en ny inom vetenskapsfilosofin." Hon kritiserade Thomas Kuhn för hans vaga och inkonsekventa användning av begreppet "Paradigm", och noterade att det används i minst 21 olika betydelser, som kan sammanfattas i tre grupper: metaparadigm, sociologiska paradigm och artefakt- eller konstruktionsparadigm. Masterman föreslog att Kuhns kritiker inom vetenskapsfilosofin endast sysslade med metaparadigm och utforskade insikterna och implikationerna av de olika föreställningarna. Denna kritik accepterades av Thomas Kuhn och var avgörande i förskjutningen av begreppet "Paradigm" till "Incommensurability".

Anteckningar

  •   Wilks, Yorick (2000). "Margaret Masterman". I Hutchins, John (red.). Tidiga år i maskinöversättning: memoarer och biografier om pionjärer . ISBN 978-90-272-4586-1 .
  • Lucy Cavendish College Archive
  •   Masterman, Margaret (2003). Wilks, Yorick (red.). Språk, sammanhållning och form: utvalda artiklar av Margaret Masterman, med kommentarer . Cambridge University Press. ISBN 978-90-272-4586-1 .
  •   Leon, Jacqueline (2000). Desmet, Paul (red.). Traduction automatique et formalization du language: les tentatives du Cambridge Language Research Unit (1955-1960) . Språkvetenskapens historia och grammatisk praxis. Peeters. ISBN 978-90-272-4586-1 .
  •   Williams, William (1987). Margaret Masterman: In Memoriam . Datorer och översättning. Springer. ISBN 978-90-272-4586-1 .