Naturligt språk verktygslåda
Originalförfattare | Steven Bird, Edward Loper, Ewan Klein |
---|---|
Utvecklare | Team NLTK |
Initial release | 2001 |
Stabil frisättning | |
Förvar | |
Skrivet i | Pytonorm |
Typ | Naturlig språkbehandling |
Licens | Apache 2.0 |
Hemsida |
Natural Language Toolkit , eller mer allmänt NLTK , är en svit av bibliotek och program för symbolisk och statistisk naturlig språkbehandling (NLP) för engelska skriven i programmeringsspråket Python . Den utvecklades av Steven Bird och Edward Loper vid avdelningen för data- och informationsvetenskap vid University of Pennsylvania . NLTK innehåller grafiska demonstrationer och exempeldata. Den åtföljs av en bok som förklarar de underliggande koncepten bakom språkbearbetningsuppgifterna som stöds av verktygslådan, plus en kokbok.
NLTK är avsett att stödja forskning och undervisning inom NLP eller närbesläktade områden, inklusive empirisk lingvistik , kognitiv vetenskap , artificiell intelligens , informationssökning och maskininlärning . NLTK har framgångsrikt använts som ett läromedel, som ett individuellt studieverktyg och som en plattform för prototypframställning och uppbyggnad av forskningssystem. Det finns 32 universitet i USA och 25 länder som använder NLTK i sina kurser. NLTK stöder funktioner för klassificering, tokenisering, stemming, taggning, parsning och semantiska resonemang.
Bibliotekets höjdpunkter
- Diskursrepresentation
- Lexikal analys : Ord- och texttokenizer
- n-gram och kollokationer
- Ordordstaggare
- Trädmodell och textchunker för att fånga
- Erkännande av namngiven enhet
Se även
externa länkar
- Programvara för dataanalys
- Gratis språklig programvara
- Gratis vetenskap programvara
- Gratis programvara programmerad i Python
- Parsing av naturligt språk
- Naturlig språkbehandling
- Bearbetningsverktyg för naturligt språk
- Ämnestubbar för programmeringsspråk
- Python (programmeringsspråk) bibliotek
- Statistisk naturlig språkbehandling