HFST

Helsingfors Finite-State Technology
Utvecklare HFST-lag
Initial release 2008 ; 15 år sedan ( 2008 )
Stabil frisättning
3.15.4 / 13 februari 2021 ; för 2 år sedan ( 2021-02-13 )
Förvar
Skrivet i C++ , Python , Java
Operativ system Plattformsoberoende : Linux , Mac OS X , Windows
Plattform x86
Tillgänglig i engelsk
Typ Finite-state verktygslåda
Licens GPLv3 , del Apache
Hemsida hfst .github .io

Helsinki Finite-State Technology ( HFST ) är ett datorprogrammeringsbibliotek och en uppsättning verktyg för naturlig språkbehandling med finita- tillståndsautomater och finita-tillståndsgivare . Det är gratis programvara med öppen källkod , släppt under en blandning av GNU General Public License version 3 (GPLv3) och Apache License .

Funktioner

Biblioteket fungerar som ett utbytande gränssnitt till flera backends, såsom OpenFST, foma och SFST. Verktygen omfattar olika kompilatorer, såsom hfst-twolc (en kompilator för morfologiska tvånivåregler), hfst-lexc (en kompilator för lexikondefinitioner) och hfst-regexp2fst (en kompilator för reguljära uttryck). Funktioner från Xerox proprietära skriptspråk xfst dupliceras i hfst-xfst, och mönstermatchningsverktyget pmatch i hfst-pmatch, som går utöver finita-tillståndsformalismen genom att ha rekursiva övergångsnätverk (RTN).

Biblioteket och verktygen är skrivna i C++ , med ett gränssnitt till biblioteket i Python och ett verktyg för att leta upp resultat från givare som portats till Java och Python.

Givare i HFST kan innehålla vikter beroende på backend. För att utföra FST-operationer är detta för närvarande endast möjligt via OpenFST-backend. HFST tillhandahåller två inbyggda backends, en designad för snabb uppslagning ( hfst-optimized-lookup ), den andra för formatutbyte. Båda kan vägas.

Används

HFST har använts för att skriva olika språkliga verktyg, såsom stavningskontroller, avstavare och morfologier. Morfologiska ordböcker skrivna i andra formalismer har också konverterats till HFST:s format.

Se även

Anteckningar

externa länkar

Lindén, Krister; Axelson, Erik; Drobac, Senka; Hardwick, Sam; Kuokkala, Juha; Niemi, Jyrki; Pirinen, Tommi; Silfverberg, Miikka (2013). "HFST - Ett system för att skapa NLP-verktyg" . I Mahlow, Cerstin; Piotrowski, Michael (red.). System och ramar för beräkningsmorfologi . System och ramar för beräkningsmorfologi . Kommunikation inom data- och informationsvetenskap. Vol. 380. Humboldt-Universität i Berlin: Springer. s. 53–71.