TimeML
TimeML är en uppsättning regler för att koda dokument elektroniskt. Det definieras i TimeML Specification version 1.2.1 som utvecklats av flera försök, till stor del ledda av Laboratory for Linguistics and Computation vid Brandeis University .
TimeML-projektets mål är att skapa ett standardspråk för tidshändelser i ett dokument. TimeML tar upp fyra problem med händelseuppmärkning, inklusive tidsstämpling (med vilken en händelse är förankrad till en tidpunkt), ordning av händelser med avseende på varandra, resonemang med kontextuellt underspecificerade tidsuttryck och resonemang om händelsernas längd och deras utfall.
Historia
TimeML konceptualiserades 2002 under TERQAS-workshoparna (Time and Event Recognition for Question Answering Systems), som anordnades av professor James Pustejovsky från Brandeis University . TERQAS-workshoparna syftade till att ta itu med problemet med hur man förbättrar för svar på naturliga frågor för att svara på tidsbaserade frågor om händelserna och enheterna i nyhetsartiklar. Under dessa workshops definierades TimeML version 1.0 och TimeBank-korpusen skapades som en illustration.
Under 2003 producerade TANGO (TimeML Annotation Graphical Organizer) workshops ett grafiskt anteckningsverktyg för TimeML.
Projektet TARSQI (Temporal Awareness and Reasoning Systems for Question Interpretation) utvecklar för närvarande algoritmer som taggar händelser och tidsuttryck i naturliga språktexter, förankrar dem temporärt och ordnar dem.
versioner
Enligt den officiella TimeML-webbplatsen finns det för närvarande tre versioner av TimeML-specifikationsspråket, även om det ryktas att andra versioner finns.
Version 1.1
TimeML version 1.1 producerades 2004.
Version 1.2
TimeML version 1.2 producerades 2004, kort efter releasen av version 1.1.
Version 1.2.1
År 2005 definierades version 1.2.1. Det gjordes flera ändringar i språket och beskrivs i version 1.2.1 TimeML-riktlinjen som sådan:
- Attributet nf_morph som var en del av MAKEINSTANCE har ändrats till pos (del av tal), och PRESPART, PASTPART och INFINITIVE element i nf_morph omfördelas till tid.
- Det valfria syntaxattributet lades till i SLINK, ALINK och TLINK. Syntax kan användas för att hålla CDATA, men används i allmänhet bara av anteckningsprogram för att hålla data som ledde till skapandet av taggen.
- Det valfria kommentarattributet lades till i alla TimeML-element, i syfte att ge (mänskliga) annotatorer en plats att sätta observationer om kommenterad text.
ISO-TimeML
ISO-TimeML presenterades för ISO för övervägande som en standard i augusti 2007. Den reviderades sedan, röstades igenom och godkändes som en internationell standard i mars 2009.
Arbetsgruppsmedlemmar
- James Pustejovsky från Brandeis University (redaktör)
- Rob Gaizauskas
- Graham Katz
- Bob Ingria
- Jose Castaño
- Roser Saurí
- Anna Rumshisky
- Inderjeet Mani
- Antonio Sanfilippo
- Dragomir Radev
- Patrick Hanks
- Marc Verhagen
- Beth Sundheim
- Andrea Setzer
- Frank Schilder
- Jerry Hobbs
TimeML-taggar
Följande taggar definieras av TimeML-specifikationen version 1.2.1.
TIMEML
TIMEML-taggen liknar root-taggen i ett XML-dokument. Den deklarerar att resten av dokumentet som omges av TIMEML-taggen är kodat med TimeML-taggar.
HÄNDELSE
Taggen EVENT används för att kommentera de element i en text som markerar de semantiska händelserna som beskrivs av den. Syntaktisk är HÄNDELSER vanligtvis verb, även om händelsenamn, som "krasch" i "...dödad av kraschen", också kommer att annoteras som HÄNDELSER. Taggen EVENT används också för att kommentera en delmängd av tillstånden i ett dokument. Denna delmängd av tillstånd inkluderar de som antingen är övergående eller explicit markerade som deltagande i en tidsrelation. Se riktlinjerna för TimeML-kommentarer för mer information.
TIMEX3
TIMEX3-taggen används främst för att markera explicita tidsuttryck, såsom tider, datum, varaktigheter, etc. Den är modellerad på Setzers (2001) TIMEX-tagg, såväl som TIDES (Ferro, et al. (2002)) TIMEX2 märka. Eftersom det skiljer sig både i attributstruktur och i användning, verkade det bäst att ge det ett separat namn, som avslöjar dess arv samtidigt som det indikerar att det skiljer sig från dess förfäder.
SIGNAL
SIGNAL-taggen representerar en tidssignal. Dessa är alla funktionsord som antyder ett visst tidsförhållande. Exempel på SIGNALER är: när, i, efter .
TLINK
TLINKS, eller Temporal Links etablerar relationer mellan två eller flera händelser i syfte att beställa dem i tid. Temporala länkar är vanligast eftersom de visar hur TimeML-elementen (händelser och tidsmässiga uttryck) är tidsmässigt relaterade till varandra.
EN LÄNK
Händelser som är markerade som ASPEKTUELL introducerar en ALINK eller Aspectual Link. Dessa länkar är ganska enkla eftersom de bara uppstår när en aspektuell händelse har en annan händelse som argument. Till exempel, i meningen "Maria genomförde maraton" är "avslutad" en aspektuell händelse medan maraton är en händelse.
SLINKA
Liksom ALINK, introduceras SLINKs (Underordnade länkar) endast av vissa händelseklasser, nämligen rapportering av händelser, intensiva händelser (I ACTION och I STATE) och perceptionshändelser. Dessutom måste dessa händelser underordna en annan händelse genom att ta den som ett argument. SLINKS används huvudsakligen för att möjliggöra tidsmässiga relationer även för händelser som kan ha inträffat eller inte. Till exempel, rapportering av händelser som "sagt" introducerar en EVIDENTIAL SLINK. Tänk på meningen ""Han slutade inte ens," sa ett vittne. Här är "stopp"-händelsen underordnad den "sagda" händelsen.