DARPA TIDES-programmet
Translingual Information Detection, Extraction and Summarization (TIDES) är ett teknologiutvecklingsprogram finansierat av US Defense Advanced Research Projects Agency ( DARPA ), fokuserat på automatiserad bearbetning och förståelse av språkdata. Det primära målet med programmet är att göra det möjligt för engelsktalande att hitta och tolka nödvändig information snabbt och effektivt oavsett originalspråket.
Komponenter
De fyra komponenterna i tekniken som utvecklas av TIDES inkluderar:
- Detektion – Lokalisera nödvändig information.
- Extraktion – Ta fram nyckelfakta.
- Sammanfattning – Minska informationen till en läsbar längd.
- Översättning – Konvertera text från ett annat språk till engelska.
Verktyg för upptäckt, extrahering och sammanfattning måste fungera inom ett språk (enspråkigt) och över språk (översättningsspråk), för att användas av personer som bara talar engelska. Förutom att utveckla tekniken forskar TIDES också på metoder för att snabbt och billigt anpassa den till andra språk, inklusive språk med begränsade språkliga resurser. TIDES syftar till att integrera komponentfunktionerna tillsammans och med andra teknologier för att producera verktyg för verkliga applikationer.
Undersökande Data Warehouse
FBI :s Investigative Data Warehouse innehåller ett nyhetsbibliotek med öppen källkod, som innehåller nyheter som samlats in av TIDES-programmet . Informationen samlas in från offentliga webbplatser runt om i världen, inklusive Ha'aretz , Pravda , Jordan Times , The People's Daily , The Washington Post , och andra. Den använder MiTAP- systemet (Mitre Text and Audio Processing) .
Se även
Anteckningar och bibliografi
- FBI Information Resources Division (IRD) (2003-12-03). "Investigative Data Warehouse-SECRET (IDW-S) System Security Plan" (PDF) . Electronic Frontier Foundation. sid. 58.
- FBI Office of the Program Management Executive (2004-11-29). "Security Concept of Operations (S-CONOPS), Investigative Data Warehouse (IDW) Program" (PDF) . Electronic Frontier Foundation. sid. 50.