Dataorienterad analys
Dataorienterad parsning ( DOP , även dataorienterad bearbetning ) är en probabilistisk modell inom beräkningslingvistik . DOP skapades av Remko Scha 1990 med syftet att utveckla ett prestationsorienterat grammatikramverk. Till skillnad från andra probabilistiska modeller tar DOP hänsyn till alla underträd som finns i en trädbank snarare än att vara begränsade till till exempel 2-nivåer underträd (som PCFG ), vilket möjliggör mer kontextkänslig information.
Flera varianter av DOP har utvecklats. Den ursprungliga versionen som utvecklades av Rens Bod 1992 baserades på trädsubstitutionsgrammatik, medan på senare tid har DOP kombinerats med lexikal-funktionell grammatik (LFG). Den resulterande DOP-LFG hittar en applikation i maskinöversättning . Annat arbete med inlärning och parameteruppskattning för DOP har också hittat sin väg till maskinöversättning.
- ^ R. Bod, R. Scha och K. Sima'an, Data-Oriented Parsing, CSLI Publications, 2003, pp.1-5.
- ^ R. Bod, A computational model of language performance: Data oriented parsing, i: COLING 1992 Volym 3: The 15th International Conference on Computational Linguistics, https://www.aclweb.org/anthology/C92-3126.pdf
externa länkar
- Remko Scha Forskning om DOP
- DOP hemsida
- Khalil Sima'an: Att lära sig DOP-modeller från trädbankar; Beräkningskomplexitet
- Andy Way (1999). En hybridarkitektur för robust MT med LFG-DOP. Journal of Experimental and Theoretical Artificial Intelligence 11 (3):441–471.