Hybrid maskinöversättning
Hybrid maskinöversättning är en metod för maskinöversättning som kännetecknas av användningen av flera metoder för maskinöversättning inom ett enda maskinöversättningssystem. Motivationen för att utveckla hybrida maskinöversättningssystem härrör från misslyckandet med någon enskild teknik för att uppnå en tillfredsställande noggrannhetsnivå. Många hybrid maskinöversättningssystem har varit framgångsrika i att förbättra översättningarnas noggrannhet, och det finns flera populära maskinöversättningssystem som använder hybridmetoder.
Närmar sig
Flermotorig
Denna metod för hybrid maskinöversättning innebär att flera maskinöversättningssystem körs parallellt. Den slutliga uteffekten genereras genom att kombinera utdata från alla delsystem. Oftast använder dessa system statistiska och regelbaserade översättningsundersystem, men andra kombinationer har undersökts. Till exempel har forskare vid Carnegie Mellon University haft viss framgång med att kombinera exempelbaserade , överföringsbaserade , kunskapsbaserade och statistiska översättningsundersystem till ett maskinöversättningssystem.
Generering av statistiska regler
Detta tillvägagångssätt innebär att man använder statistiska data för att generera lexikaliska och syntaktiska regler. Inmatningen bearbetas sedan med dessa regler som om det vore en regelbaserad översättare. Detta tillvägagångssätt försöker undvika den svåra och tidskrävande uppgiften att skapa en uppsättning omfattande, finkorniga språkregler genom att extrahera dessa regler från utbildningskorpusen. Detta tillvägagångssätt lider fortfarande av många problem med normal statistisk maskinöversättning , nämligen att översättningens noggrannhet kommer att bero mycket på likheten mellan inmatningstexten och texten i utbildningskorpusen. Som ett resultat har denna teknik haft störst framgång i domänspecifika applikationer och har samma svårigheter med domänanpassning som många statistiska maskinöversättningssystem .
Multi-Pass
Detta tillvägagångssätt involverar seriebehandling av inmatningen flera gånger. Den vanligaste tekniken som används i flerpassage maskinöversättningssystem är att förbehandla indata med ett regelbaserat maskinöversättningssystem. Utdata från den regelbaserade förprocessorn skickas till ett statistiskt maskinöversättningssystem, som producerar den slutliga utdatan. Denna teknik används för att begränsa mängden information som ett statistiskt system behöver ta hänsyn till, vilket avsevärt minskar den processorkraft som krävs. Det tar också bort behovet av att det regelbaserade systemet ska vara ett komplett översättningssystem för språket, vilket avsevärt minskar mängden mänsklig ansträngning och arbete som krävs för att bygga systemet.
Förtroendebaserad
Detta tillvägagångssätt skiljer sig från de andra hybridmetoderna genom att i de flesta fall endast en översättningsteknik används. Ett konfidensmått produceras för varje översatt mening från vilken ett beslut kan fattas om man ska prova en sekundär översättningsteknik eller fortsätta med den initiala översättningen. SMT används också när vanliga felmönster som flera upprepade ord visas i sekvens, vilket är vanligt med NMT när uppmärksamhetsmekanismen är förvirrad.