Bibliogram

Ett bibliogram är en grafisk representation av frekvensen av vissa målord, vanligtvis substantivfraser, i en given text. Termen introducerades 2005 av Howard D. White för att namnge det språkliga föremål som studerats, men inte tidigare namngetts, inom informatik , scientometri och bibliometri . Substantivfraserna i rankningen kan vara författare, tidskrifter, ämnesrubriker eller andra indexerande termer. De "textsträckor" kan vara en bok, en uppsättning relaterade artiklar, en ämnesbibliografi, en uppsättning webbsidor etc. Bibliogram genereras alltid från skrifter, vanligtvis från vetenskaplig eller vetenskaplig litteratur.

Definition

Ett bibliogram är en verbal konstruktion som görs när substantivfraser från långa textsträckor rankas högt till lågt efter deras frekvens av samtidig förekomst med en eller flera användarangivna frötermer. Varje bibliogram har tre komponenter:

En fröterm som sätter ett sammanhang .
Ord som förekommer tillsammans med fröet över någon uppsättning poster.
Antal (frekvenser) med vilka samförekommande ord kan ordnas högt till lågt.

Som en familj av term-frekvensfördelningar har bibliogrammet ofta skrivits om under beskrivningar som:

positiv snedfördelning
empirisk hyperbolisk
skalningsfritt (se även Skalfritt nätverk )
maktlagen
storleksfrekvensfördelning
omvänd-J

Det kallas ibland en "core and scatter"-fördelning. "Kärnan" består av relativt få topprankade termer som totalt sett står för en oproportionerligt stor andel samförekomster.

"Scattern" består av relativt många lägre rankade termer som står för den återstående andelen samförekomster. Vanligtvis är de högst rankade termerna inte bundna i frekvens, men identiska frekvenser och bundna rankningar blir vanligare när frekvenserna blir mindre. Längst ner i fördelningen är en lång svans av termer bundna i rang eftersom var och en förekommer tillsammans med frötermen endast en gång.

I de flesta fall kan bibliogram beskrivas av maktlagar som Zipfs lag och Bradfords lag . I detta avseende har de länge studerats av matematiker och statistiker inom informationsvetenskap. Men dessa behandlingar ignorerar vanligtvis de kvalitativa betydelserna av de rankade termerna själva, som ofta är av intresse i sig själva. Till exempel gjordes följande bibliogram med en författares namn som frö och visar de beskrivningar som förekommer tillsammans med hennes namn i ERIC -databasen. Beskrivningarna rankas efter hur många av hennes artiklar de användes för att indexera:

6 Kreativitet 4 Kreativitetstester 3 Divergent tänkande 2 Grundskolans matematik 2 Undervisning 2 Matematikutbildning 2 Problemlösning 2 Forskning 2 Tid 1 Acceleration 1 Ångest 1 Nybörjarlärare 1 Beteendemål 1 Barnutveckling 1 Klassrumstekniker 1 Kognitiv utveckling etc.

Den här författaren är forskare inom utbildning och det kommer att synas att termerna profilerar hennes intellektuella intressen genom åren. I allmänhet kan bibliogram användas för att:

föreslå ytterligare termer för sökstrategier
kännetecknar forskares, vetenskapsmäns eller institutioners arbete
visa vem en författare citerar över tid
visa vem som citerar en författare över tid
visa de andra författare som en författare samciteras med över tid
visa de ämnen som är kopplade till en tidskrift eller en författare
visa författare, organisationer eller tidskrifter som är kopplade till ett ämne
visa biblioteksklassificeringskoder kopplade till ämnesrubriker och vice versa
visa populariteten för föremål i bibliotekens samlingar
modellera litteraturens struktur med titeltermer, deskriptorer, författarnamn, tidskriftsnamn

Bibliogram kan skapas med kommandot RANK på Dialog (andra leverantörer har liknande kommandon), rankningsalternativ inom WorldCat , HistCite , Google Scholar och billig programvara för innehållsanalys.

White föreslår att bibliogram har en parallell konstruktion i vad han kallar associograms . Dessa är de rangordnade listorna över ordassociationsnormer som studerats inom psykolingvistik . De liknar bibliogram i statistisk struktur men genereras inte från skrifter. Snarare genereras de genom att presentera paneler av människor med en stimulusterm (som fungerar som en fröterm) och tabellera de ord de associerar med fröet efter frekvens av samtidig förekomst. De är för närvarande av intresse för informationsvetare som ett icke-standardiserat sätt att skapa synonymordbok för dokumenthämtning.

Exempel

Andra exempel på bibliogram är den ordnade uppsättningen av en författares medförfattare eller listan över författare som publiceras i en specifik tidskrift tillsammans med deras antal artiklar. Ett populärt exempel är listan över ytterligare titlar att överväga för köp som du får när du söker efter en vara i Amazon . Dessa föreslagna titlar är de översta termerna i "kärnan" i ett bibliogram bildat med din sökterm som frö. Frekvenserna är räkningar av de gånger de har samköpts med fröet.

Exempel på associagram kan hittas i Edinburgh Associative Thesaurus .

Andra metoder

Liknande men olika metoder används vid dataklustring och datautvinning . Google Sets skapar också en lista med associerade termer till en given uppsättning termer.

Se även

Howard D. White (2005): On Extending Informetrics: An Opinion Paper . I: Proceedings of the 10th International Congress of the International Society for Scientometrics and Informetrics. Stockholm sid. 442-449