Anusaaraka

Anusaaraka
Skrivet i CLIPS, Python, Perl, C, C++
Operativ system POSIX-kompatibel
Tillgänglig i Engelska-Hindi
Typ Maskinöversättning
Licens GNU General Public License
Hemsida https://ltrc.iiit.ac.in/Anusaaraka/anu_home.html

Anusaaraka är en programvara för åtkomst av engelska till hindi (översättning), som använder algoritmer härledda från Pāṇinis Ashtadhyayi (grammatikregler). Mjukvaran utvecklas av Chinmaya International Foundation (CIF) vid International Institute of Information Technology, Hyderabad (IIIT-H) och University of Hyderabad (Department of Sanskrit Studies) . Anusaaraka ses som en blandning av traditionella avancerade indiska shastras och avancerad samtida teknologi.

Anusaaraka är avsedd att ge användare tillgång till text på vilket indiskt språk som helst efter översättning från källspråket (dvs engelska eller något annat regionalt indiskt språk). I dagens informationsålder finns stora mängder information tillgänglig på engelska – oavsett om det är information för tävlingsprov eller allmän läsning. Men många människor vars primära språk är hindi eller något annat indiskt språk kan inte få tillgång till information på engelska. Anusaaraka syftar till att överbrygga denna språkbarriär genom att tillåta en användare att skriva in en engelsk text i Anusaaraka och läsa den på ett valfritt indiskt språk.

Anusaaraka har fått sitt namn från sanskritordet "anusaran" som betyder "att följa". Det kallas så, eftersom den översatta Anusaaraka-utgången visas i lager – dvs en sekvens av steg som följer varandra tills den slutliga översättningen visas för användaren.

Funktioner

Trogen återgivning av text på källspråk

Genom de olika lagren av Anusaaraka-utdata finns det ett försök att säkerställa att användaren ska kunna förstå informationen i den engelska meningen. Denna ansträngning ges större vikt än att ge perfekta meningar på hindi, för det skulle vara meningslöst att ha en översättning som läser bra men som inte riktigt fångar informationen i källtexten.

Lagerutmatningen är unik för Anusaaraka. Således kan källspråkstextinformation och hur hindiöversättningen slutligen kommer fram till användaren. Den kritiska egenskapen hos den skiktade utmatningen är att informationsöverföringen görs på ett kontrollerat sätt vid varje steg, vilket gör det möjligt att återgå utan förlust av information. Även eventuell skada på information som inte kan undvikas i en översättningsprocess sker sedan gradvis. Därför, även om den översatta meningen inte är lika "perfekt" som mänsklig översättning, med viss ansträngning och orientering när det gäller att läsa Anusaaraka-utdata, kan en individ förstå vad källtexten antyder genom att titta på de lager och sammanhang där meningen förekommer.

Reversibilitet

Funktionen med gradvis överföring av information från ett lager till nästa ger Anusaaraka en ytterligare fördel genom att göra översättningsprocessen reversibilitet – en funktion som inte kan uppnås med ett konventionellt maskinöversättningssystem. En tvåspråkig användare av Anusaaraka kan när som helst komma åt källspråkstexten på engelska på grund av transparensen i utdata. En viss mängd orientering om hur man läser Anusaaraka-utdata skulle krävas för detta.

Genomskinlighet

Visning av steg-för-steg översättningslager ger en ökad nivå av förtroende för slutanvändaren, eftersom han kan spåra tillbaka till källan och få klarhet angående översatt text genom analys av utdatalagren och viss referens till sammanhang.

Provutgång

Ett exempel på utdata från Anusaaraka-systemet.

Färgerna i utgången indikerar ordkategorin:

substantiv-fras
verb-fras
adjektiv-fras
adverbial-fras
preposition
konjunktioner
interjektioner

Se även

externa länkar