Interaktiv maskinöversättning
Interaktiv maskinöversättning ( IMT ) är ett specifikt delområde för datorstödd översättning . Under detta översättningsparadigm försöker datorprogramvaran som hjälper den mänskliga översättaren att förutsäga den text som användaren kommer att mata in genom att ta hänsyn till all information den har tillgänglig . Närhelst en sådan förutsägelse är felaktig och användaren ger feedback till systemet, utförs en ny förutsägelse med hänsyn till den nya informationen som är tillgänglig. Sådan process upprepas tills den tillhandahållna översättningen matchar användarens förväntningar.
Interaktiv maskinöversättning är speciellt intressant när man översätter texter i domäner där det inte är tillåtet att mata ut en översättning som innehåller fel, vilket kräver att en mänsklig användare ändrar översättningarna som tillhandahålls av systemet. I sådana fall har interaktiv maskinöversättning visat sig ge fördelar för potentiella användare. Ändå finns det få kommersiella program som implementerar interaktiv maskinöversättning och arbete som utförs på fältet är mestadels begränsat till akademisk forskning .
Historia
Historiskt sett är interaktiv maskinöversättning född som en utveckling av det datorstödda översättningsparadigmet, där den mänskliga översättaren och maskinöversättningssystemet var tänkta att fungera som en tandem . Detta första arbete utökades inom forskningsprojektet TransType, finansierat av den kanadensiska regeringen. I detta projekt var den mänskliga interaktionen inriktad på att producera måltexten för första gången genom att bädda in datadrivna maskinöversättningstekniker i den interaktiva översättningsmiljön med målet att uppnå det bästa från båda aktörerna: effektiviteten hos det automatiska systemet och mänskliga översättares tillförlitlighet.
Senare utökade ett större forskningsprojekt, TransType2, finansierat av EU-kommissionen sådant arbete genom att analysera införlivandet av ett komplett maskinöversättningssystem i processen, med målet att producera en komplett översättningshypotes, som den mänskliga användaren tillåts att ändra eller acceptera. Om användaren bestämmer sig för att ändra hypotesen, försöker systemet att på bästa sätt använda sådan feedback för att producera en ny översättningshypotes som tar hänsyn till de ändringar som användaren infört.
På senare tid syftade CASMACAT, också finansierat av Europeiska kommissionen , till att utveckla nya typer av assistans till mänskliga översättare och integrerade dem i en ny arbetsbänk, bestående av en redaktör, en server och analys- och visualiseringsverktyg. Arbetsbänken designades på ett modulärt sätt och kan kombineras med befintliga datorstödda översättningsverktyg. Dessutom kan CASMACAT-arbetsbänken lära sig av interaktionen med den mänskliga översättaren genom att uppdatera och anpassa sina modeller direkt baserat på användarens översättningsval.
Det senaste arbetet med att involvera en omfattande utvärdering med mänskliga användare avslöjade det faktum att interaktiv maskinöversättning till och med kan användas av användare som inte talar källspråket för att uppnå nära professionell översättningskvalitet. Dessutom klargjorde det också det faktum att ett interaktivt scenario är mer fördelaktigt än ett klassiskt scenario efter upplagan.
De tidigare beskrivna tillvägagångssätten förlitar sig på ett tätt kopplat underliggande korpusbaserat maskinöversättningssystem (vanligtvis ett statistiskt maskinöversättningssystem ) som används som en glaslåda , och därför ärver bristerna i översättningssystemen och begränsar användningen av interaktiv maskinöversättning för vissa scenarier. Av denna anledning utvecklades ett tillvägagångssätt som använder någon form av tvåspråkig resurs (inte begränsat till maskinöversättning) som en svart låda för att tillhandahålla interaktiv maskinöversättning. Detta tillvägagångssätt kan inte extrahera så mycket information från de tvåspråkiga resurser som används, på grund av interaktionens svarta låda, men kan använda vilken resurs som helst som är tillgänglig för användaren. Forecat är en svart-box interaktiv maskinöversättningsimplementering som är tillgänglig både som en webbapplikation (som inkluderar en webbsida och ett webbtjänstgränssnitt) och som ett plugin för OmegaT (Forecat-OmegaT).
Bearbeta
Den interaktiva maskinöversättningsprocessen börjar med att systemet föreslår en översättningshypotes för användaren. Sedan kan användaren acceptera hela meningen som korrekt, eller kan modifiera den om han anser att det finns något fel. Vanligtvis, när man modifierar ett givet ord, antas det att prefixet tills det ordet är korrekt, vilket leder till ett vänster-till-höger-interaktionsschema. När användaren har ändrat ordet som anses vara felaktigt, föreslår systemet ett nytt suffix, dvs resten av meningen. Sådan process fortsätter tills den tillhandahållna översättningen tillfredsställer användaren.
Även om den förklaras på ordnivå, kan den tidigare processen också implementeras på teckennivå, och därför tillhandahåller systemet ett suffix närhelst den mänskliga översättaren skriver in ett enda tecken. Dessutom pågår ansträngningar för att ändra det typiska vänster-till-höger-interaktionsschemat för att göra interaktion mellan människa och maskin enklare.
Ett liknande tillvägagångssätt används i översättningsverktyget Caitra .
Utvärdering
Utvärdering är en svår fråga i interaktiv maskinöversättning. Helst bör utvärdering ske i experiment som involverar mänskliga användare. Men med tanke på den höga monetära kostnad detta skulle innebära är detta sällan fallet. Dessutom, även när man överväger mänskliga översättare för att utföra en verklig utvärdering av interaktiva maskinöversättningstekniker, är det inte klart vad som bör mätas i sådana experiment, eftersom det finns många olika variabler som bör beaktas och inte kan kontrolleras, som är till exempel den tid det tar för användaren att vänja sig vid processen. I CASMACAT-projektet har några fältförsök genomförts för att studera några av dessa variabler.
För snabba utvärderingar i laboratorieförhållanden mäts interaktiv maskinöversättning med hjälp av tangenttrycksförhållandet eller ordet slagförhållande . Sådana kriterier försöker mäta hur många tangenttryckningar eller ord som användaren behövde införa innan han producerade det slutliga översatta dokumentet.
Skillnader med klassisk datorstödd översättning
Även om interaktiv maskinöversättning är ett delområde av datorstödd översättning , är det främsta attraktiva hos den förra med avseende på den senare interaktiviteten. I klassisk datorstödd översättning kan översättningssystemet föreslå en översättningshypotes i bästa fall, och då måste användaren efterredigera en sådan hypotes. Däremot producerar systemet i interaktiv maskinöversättning en ny översättningshypotes varje gång användaren interagerar med systemet, dvs efter att varje ord (eller bokstav) har introducerats.
Se även
- Maskinöversättning
- Statistisk maskinöversättning
- Datorstödd översättning
- Beräkningslingvistik
- Redigering av inlägg
- Översättning