Naturligt språk verktygslåda

Naturligt språk verktygslåda
Originalförfattare	Steven Bird, Edward Loper, Ewan Klein
Utvecklare	Team NLTK
Initial release	2001 ; 22 år sedan
Stabil frisättning	3.8 / 12 december 2022 ; 2 månader sedan
Förvar	github .com /nltk /nltk ;
Skrivet i	Pytonorm
Typ	Naturlig språkbehandling
Licens	Apache 2.0
Hemsida	www .nltk .org

Analysera träd genererat med NLTK

Natural Language Toolkit , eller mer allmänt NLTK , är en svit av bibliotek och program för symbolisk och statistisk naturlig språkbehandling (NLP) för engelska skriven i programmeringsspråket Python . Den utvecklades av Steven Bird och Edward Loper vid avdelningen för data- och informationsvetenskap vid University of Pennsylvania . NLTK innehåller grafiska demonstrationer och exempeldata. Den åtföljs av en bok som förklarar de underliggande koncepten bakom språkbearbetningsuppgifterna som stöds av verktygslådan, plus en kokbok.

NLTK är avsett att stödja forskning och undervisning inom NLP eller närbesläktade områden, inklusive empirisk lingvistik , kognitiv vetenskap , artificiell intelligens , informationssökning och maskininlärning . NLTK har framgångsrikt använts som ett läromedel, som ett individuellt studieverktyg och som en plattform för prototypframställning och uppbyggnad av forskningssystem. Det finns 32 universitet i USA och 25 länder som använder NLTK i sina kurser. NLTK stöder funktioner för klassificering, tokenisering, stemming, taggning, parsning och semantiska resonemang.

Bibliotekets höjdpunkter

Diskursrepresentation
Lexikal analys : Ord- och texttokenizer
n-gram och kollokationer
Ordordstaggare
Trädmodell och textchunker för att fånga
Erkännande av namngiven enhet

Se även

SpaCy

externa länkar

Officiell hemsida