BulNet

Bulgarian WordNet ( BulNet ) är en elektronisk flerspråkig ordbok med synonymuppsättningar tillsammans med deras förklarande definitioner och uppsättningar av semantiska relationer med andra ord i språket.

Det följer Princeton WordNet (PWN) ramverket som implementerar de traditionella semantiska nätverken vars struktur består av noder och relationer mellan noderna.

Allmän information

BulNet startades inom det EU-finansierade projektet BalkaNet - a Multilingual Semantic Network of the Balkan Languages. Efter BalkaNets färdigställande. utvecklingen av BulNet fortsatte med stöd från bulgariska myndigheterna.

Innehåll i BulNet

Kategorier

Från och med 2015 innehöll BulNet mer än 80 000 synonymuppsättningar fördelade på nio delar av tal - substantiv, verb, adjektiv, adverb, pronomen, prepositioner , konjunktioner , partiklar och interjektioner .

Orden som ingår i BulNet har valts ut enligt olika kriterier. Huvudkriterierna är frekvensanalysen av ordets förekomster i stora textkorpus och införandet av synsets . Synseten inkluderar de som redan finns i ordnäten för andra språk och synsset som motsvarar högfrekventa ordsinne som finns i parallella korpus.

Synsets

Varje synset kodar för likvärdighetsrelationen mellan ett antal lexikaliska objekt — LITERALS (minst en bör uttryckligen representeras i SYNSET), var och en av dem har en unik betydelse (specificerad av värdet av SENSE) — som hänför sig till en och samma orddel (anges som värdet av POS) och representerar en och samma lexikaliska betydelse (specificeras som värdet av DEF). Varje synset är kopplat till sin motsvarighet i PWN 3.0 med hjälp av ett unikt identifikationsnummer - ID. De vanliga synseten på Balkanspråken är markerade som gemensamma begreppsundergrupper — BCS .

I en enspråkig databas bör ett synset kopplas till minst ett annat synset genom en intraspråkig relation. Icke-obligatorisk information kan också kodas såsom exempel på användning, stilistiska särdrag, morfologiska eller syntaktiska egenskaper, detaljer om författare och senaste redigering.

Semantiska relationer

Det stora antalet relationer som är kodade i BulNet illustrerar effektivt språkets semantiska och härledda rikedom som erbjuder olika möjligheter för många tillämpningar av den flerspråkiga databasen. BulNet erbjuder språkliga lösningar på semantisk nivå såsom alternativ för synonymval, frågor om semantiska relationer för ett ord i språkets lexikala system ( antonymi , holonymi , etc.), förklarande definitionsfrågor och översättningsekvivalenter för ett lexikalt objekt.

BulNet är en elektronisk flerspråkig ordbok med synonymuppsättningar tillsammans med deras förklarande definitioner och uppsättningar av semantiska relationer med andra ord i språket.

Hydra

Hydra är ett OS-oberoende system designat för wordnet-utveckling, validering och utforskning. Programmet gör det möjligt för användare att bläddra och redigera valfritt antal enspråkiga ordnät åt gången. De enskilda ordnäten är synkroniserade, så att motsvarande synonymuppsättningar, eller synsets, kan ses och utforskas parallellt.

Källor

externa länkar