Euromatrix

EuroMatrix är ett projekt som pågick från september 2006 till februari 2009. Projektet syftade till att utveckla och förbättra system för maskinöversättning (MT) mellan alla officiella språk inom Europeiska Unionen (EU).

EuroMatrix följdes upp av ett annat projekt EuroMatrixPlus (mars 2009 till februari 2012).

Förhållningssätt till översättning

EuroMatrix utforskade att använda språklig kunskap i statistisk maskinöversättning . Statistiska tekniker kombinerades med regelbaserad metod, vilket resulterade i hybrid MT- arkitektur. Projektet experimenterade med att kombinera metoder och resurser från statistisk MT, regelbaserad MT, ytlig språkbehandling och beräkningslexikografi och morfologi.

Projektmål

EuroMatrix fokuserade på högkvalitativ översättning för publicering av tekniska, sociala, juridiska och politiska dokument. Den tillämpade avancerad MT-teknik på alla par av EU-språk; språken i nya och sannolikt att bli EU-medlemsstater beaktades också.

Årlig internationell utvärdering

Konkurrenskraftiga årliga internationella utvärderingar av maskinöversättningsmöten (”MT-maraton”) anordnades för att samla MT-forskare. Deltagare i maratonloppen översatte testset med sina system. Testseten utvärderades sedan med såväl manuella som automatiska mätvärden.

MT-maraton var flerdagarshändelser som bestod av flera evenemang - sommarskola, labblektioner, forskningssamtal, workshops, konventioner med öppen källkod, forskningspresentationer.

Lista över MT-maraton

namn Datum Plats
Maskinöversättningsmaraton 2007 16–20 april 2007 Edinburgh, Storbritannien
Maskinöversättningsmaraton 2008 12–17 maj 2008 Berlin, Tyskland
Maskinöversättningsmaraton 2009 26–30 januari 2009 Prag, Tjeckien

Resultat

Flera verktyg och resurser skapades eller stöddes av projektet:

  • Moses , en öppen källkod för statistisk maskinöversättningsmotor
  • Europarl Corpus , version 3
  • Resultat från workshops om statistisk maskinöversättning (2007, 2008, 2009)
  • CzEng Corpus, version 0.7

Finansiering

EuroMatrix-projektet sponsrades av EU:s program för informationssamhällets teknologi .

Den totala kostnaden för projektet var 2 358 747 €, från vilket Europeiska unionen bidrog med 2 066 388 €.

Projektmedlemmar

Erfarna forskargrupper inom maskinöversättning som är internationellt erkända, samt relevanta industriella partners deltog i projektet. Konsortiet inkluderade University of Edinburgh (Storbritannien), Charles University (Tjeckien), Saarland University (Tyskland), Centre for the Evaluation of Language and Communication Technologies (Italien), MorphoLogic (Ungern) och GROUP Technologies AG (Tyskland) .

Projektet koordinerades av Hans Uszkoreit , professor i datorlingvistik vid Saarlands universitet.

externa länkar