Euromatrix
EuroMatrix är ett projekt som pågick från september 2006 till februari 2009. Projektet syftade till att utveckla och förbättra system för maskinöversättning (MT) mellan alla officiella språk inom Europeiska Unionen (EU).
EuroMatrix följdes upp av ett annat projekt EuroMatrixPlus (mars 2009 till februari 2012).
Förhållningssätt till översättning
EuroMatrix utforskade att använda språklig kunskap i statistisk maskinöversättning . Statistiska tekniker kombinerades med regelbaserad metod, vilket resulterade i hybrid MT- arkitektur. Projektet experimenterade med att kombinera metoder och resurser från statistisk MT, regelbaserad MT, ytlig språkbehandling och beräkningslexikografi och morfologi.
Projektmål
EuroMatrix fokuserade på högkvalitativ översättning för publicering av tekniska, sociala, juridiska och politiska dokument. Den tillämpade avancerad MT-teknik på alla par av EU-språk; språken i nya och sannolikt att bli EU-medlemsstater beaktades också.
Årlig internationell utvärdering
Konkurrenskraftiga årliga internationella utvärderingar av maskinöversättningsmöten (”MT-maraton”) anordnades för att samla MT-forskare. Deltagare i maratonloppen översatte testset med sina system. Testseten utvärderades sedan med såväl manuella som automatiska mätvärden.
MT-maraton var flerdagarshändelser som bestod av flera evenemang - sommarskola, labblektioner, forskningssamtal, workshops, konventioner med öppen källkod, forskningspresentationer.
Lista över MT-maraton
namn | Datum | Plats |
---|---|---|
Maskinöversättningsmaraton 2007 | 16–20 april 2007 | Edinburgh, Storbritannien |
Maskinöversättningsmaraton 2008 | 12–17 maj 2008 | Berlin, Tyskland |
Maskinöversättningsmaraton 2009 | 26–30 januari 2009 | Prag, Tjeckien |
Resultat
Flera verktyg och resurser skapades eller stöddes av projektet:
- Moses , en öppen källkod för statistisk maskinöversättningsmotor
- Europarl Corpus , version 3
- Resultat från workshops om statistisk maskinöversättning (2007, 2008, 2009)
- CzEng Corpus, version 0.7
Finansiering
EuroMatrix-projektet sponsrades av EU:s program för informationssamhällets teknologi .
Den totala kostnaden för projektet var 2 358 747 €, från vilket Europeiska unionen bidrog med 2 066 388 €.
Projektmedlemmar
Erfarna forskargrupper inom maskinöversättning som är internationellt erkända, samt relevanta industriella partners deltog i projektet. Konsortiet inkluderade University of Edinburgh (Storbritannien), Charles University (Tjeckien), Saarland University (Tyskland), Centre for the Evaluation of Language and Communication Technologies (Italien), MorphoLogic (Ungern) och GROUP Technologies AG (Tyskland) .
Projektet koordinerades av Hans Uszkoreit , professor i datorlingvistik vid Saarlands universitet.