Forskarindex och effekt

Forskarindex används för att mäta forskares bidrag till deras forskningsområden. Sedan Jorge E. Hirschs artikel 2005 har användningen av forskarindex ökat.

Definition

Ibland kallas bibliometri , forskarindex är matematiska och statistiska verktyg som mäter betydelsen av bidragen från en akademiker till sitt forskningsområde. Scholarindex kan innehålla andra bedömningar som citationsspårning och tidskriftsrankning.

Skapande

Varje aggregator av citat och referenser kan, givet tid, pengar och lust, generera sin egen uppsättning vetenskapsindex. Förlag som är framstående inom detta område inkluderar Elsevier och Thomson Reuters .

Kommersiell programvara som använder tolkar och webbsökmotorer för att generera uppsättningar av forskarindex eller individuella resultat är nu tillgängliga. Exempel är: Publicera eller Fördärva ; 'ScholarIndex'; ' Scopus ' och ' Google Scholar '.

Varje mjukvaruleverantör använder i första hand sina egna data såväl som tidskrifter, publikationer, auktoritetsfiler, index och ämneskategorier för att producera uppsättningar av forskarindex.

Medan vissa företag tillhandahåller uppgifterna och den utvärderade statistiken som gratis nedladdningar, kräver andra prenumerationer för att täcka kostnader för tillverkning och underhåll av en effektiv analys, sökmotor och dokumentdatabas.

Använda sig av

Forskarindex tillåter val av tidskriftssamlingar, tillämpning av forskningsmedel, rankning av tidskrifter och fastställande av betydande bidragsgivare inom ett ämnesområde.

Förespråkare av forskarindex rekommenderar att de används inom områden som sambandstjänster, referenser, instruktioner och samlingshantering.

Kritiker av användningen av forskarindex nämner deras begränsningar på grund av frågor om noggrannhet, giltighet och tillämplighet och debatterar deras tillämpning på anställning, anställning, finansiering, prisutdelning och medlemskapsbeslut.

Även om forskarindex kanske inte helt beskriver effekten av en enskild forskares arbete, kommer vissa akademiker att bestämma sina egna forskarindex att inkludera i till exempel reklammaterial och curriculum vita. Andra kanske studerar sina vetenskapliga index helt enkelt för sin egen skull.

De som är intresserade av området forskarindex kan tycka att resultaten, till exempel datavisualiseringsprojekt, är spännande.

Typer

Hittills har ett antal forskarindex utvecklats. Det ena är "h-indexet" som introducerades av Jorge E. Hirsch i augusti 2005. Hirsch beskrev h-indexet som opartiskt eftersom det involverade förhållandet mellan en akademikers volym publicerade artiklar och antalet citeringar för dessa artiklar som skapar mindre partiskhet än endera åtgärden ensam.

Ett annat forskarindex är 'g-index' som mäter citeringsantal av alla väl citerade verk över en tidsperiod. 'm-kvoten' utvecklades för att införa en tidsgräns för h-indexet som annars var en ständigt ökande kvantitet.

Andra varianter av h-indexet som hI-index, e-index och andra håller på att utvecklas och ses över.

Erdős -numret utvecklades för att mäta publiceringskedjan som startades av Paul Erdős.

Alla sådana forskarindex kvantifierar bidraget från en forskare endast baserat på citeringar av deras arbete. Helst skulle en bedömning av en forskares bidrag till sitt område innefatta både forskarindex och en analys av kvaliteten på själva arbetet.

h -index

H - indexet föreslogs av Jorge E. Hirsch , en fysiker vid UCSD , 2005.

Henry Schaefer, från University of Georgia , USA, skapade tillsammans med kollegan Amy Peterson rankningar enligt h-index, från ISI Web of Science. Även om webbaserade applikationer kan beräkna h-index, var Peterson tvungen att leta efter felstavade eller dubblerade namn.

h - indexet definieras enligt följande:

En vetenskapsman har index h om h av hans eller hennes N artiklar har minst h citat vardera, och de andra ( N - h ) artiklarna inte har fler än h citat vardera.

För att beräkna h-indexet ordnas uppsatserna skrivna av en akademiker i fallande ordning efter antal citeringar. H-indexet är där antalet artiklar är lika med antalet citeringar (som börjar med den tidning som har flest citat).

Även om h-indexet används ofta tar inte hänsyn till kvaliteten på papperen; andra artiklar som citerar de akademiska publikationerna; antalet medförfattare och författarens position i författarlistan. Dessutom ges alla fält lika värde.

En annan begränsning är att h-indexet inte varierar över tiden ^{[ citat behövs ]} . Till exempel Évariste Galois ett h-index på 2 medan Claude Shannon hade ett h-index på 7, ökat till 62 2020.

m -kvot

Medan h -indexet är oberoende av datumet för en akademikers karriär, syftar m-kvoten till att väga perioden av akademisk strävan för att minska biasen till förmån för forskare med längre karriärer.

Således, om n =antal år sedan den första publicerade artikeln av vetenskapsmannen, m-kvoten=h-index/ n .

dock hända att m -kvoten inte stabiliseras förrän senare i vetenskapsmannens karriär. för forskare i början av sin karriär, som har låga h- index, kan små förändringar i h-index leda till stora förändringar i m -kvoten. Hirsch antyder att forskarens första publicerade artikel kanske inte alltid är den lämpliga utgångspunkten, särskilt om det var ett mindre bidrag som publicerades långt före akademikerns period av ihållande produktivitet.

Även om m -kvoten lägger till tid som en viktningsfaktor, tillgodoser den inte de stora nackdelarna med h -index inklusive publiceringskvalitet och citeringskvalitet.

g -index

g -index är en variant av h -index , som tar hänsyn till citeringsutvecklingen för de mest citerade artiklarna över tiden.

En uppsättning papper har ett g -index g om g är den högsta rangen så att de översta g papper har tillsammans minst g ^2 citeringar.

Med andra ord, g -index g är den största rangordningen (där tidningarna är ordnade i fallande ordning efter antalet citeringar de fått) så att de första g tidningarna har (tillsammans) minst g ^2 citeringar.

Det kan bevisas att för vilken uppsättning papper som helst g -index alltid existerar och är unik.

$g=\left({\frac {\alpha -1}{\alpha -2}}\right)^{\frac {\ alfa -1}{\alpha }}{\frac {1}{T^{\alpha }}}$

där den Lotkaianska exponenten och där T anger det totala antalet källor.

Eftersom $h=T^{1/\alpha }$ , $g=\left({\frac {\alpha -1}{\alpha -2}}\right)^{\frac {\alpha -1}{\alpha }}h>h$

Till exempel, om 2 vetenskapsmän har h -index 4, kan det hända att en av dem har publicerat 4 artiklar som har 4 eller fler citeringar, medan en annan vetenskapsman kan ha publicerat 10 artiklar varav 3 har mer än 100 citeringar och den 4:e papper har 4 citeringar, och de återstående har mindre än 4 citeringar.

I ett försök att erbjuda en högre viktning till den andra forskaren som sammanlagt har fått mer än 304 citeringar för 10 artiklar, föreslogs g -indexet. I vårt exempel har alltså den första vetenskapsmannen g-index=4, medan den andra vetenskapsmannen har g-index betydligt högre.

Erdős nummer

Ett Erdős-nummer mäter samarbetsavståndet mellan en person och matematikern Paul Erdős, mätt efter författarskap av matematiska uppsatser.

Med tanke på att Paul Erdős har ett index=0, har personer som skrivit med honom ett index=1, medförfattare till dessa medförfattare har index=2, och så vidare. För att beräkna ens Erdős-tal, lägg till 1 till Erdős-talet för alla medförfattare med det lägsta Erdős-talet. Erdős-Number-projektet vid Oakland University har en webbplats som spårar Erdős antal forskare över hela världen.

En varning är att de flesta Erdős-tal som registrerats hittills sträcker sig upp till 13, men genomsnittet är mindre än 5, och nästan alla med ett ändligt Erdős-tal har ett nummer mindre än 8.

Nav och myndighetsindex

Utvärdering av en forskares fullständiga bidrag till sitt forskningsområde kan bedömas på två sätt. En är genom att redogöra för antalet citeringar som forskaren har fått. Den andra är genom att redogöra för kvaliteten på de referenser som forskaren hänvisar till.

Även om det är starkt citerat gör en forskare till en stark auktoritet inom sitt område, men att ha starka referenser gör en forskare till ett starkt nav, som känner till allt viktigt arbete inom det området. Beräkning av nav- och auktoritetsindex kräver kunskap om sambanden mellan forskare som citeras eller refereras till.

Algoritmen Hubs and Authorities kan användas för att beräkna dessa index. Algoritmen utför en länkanalys på ett givet nätverk och tilldelar två poäng till varje nod: ett nav och en auktoritet.;

En värdefull och informativ nod i ett nätverk pekas vanligtvis på ett stort antal länkar, det vill säga den har en stor indegree (se fig. 1). En sådan nod kallas auktoritet.

En nod som pekar på många auktoritetsnoder är i sig en användbar resurs och kallas ett nav. Ett nav har vanligtvis en stor övergrad. I samband med litteraturcitering är ett nav ett granskningspapper som citerar många originalartiklar, medan en auktoritet är ett original som citeras av många tidningar.

S anslutningsmöjligheter, indikerar noderna y in-graden och noderna i x indikerar ut-graden för noden S.

Ett nätverk kan konstrueras av noder som representerar författare och länkar som anger referenser till publicerade artiklar. Utgående länkar anger vem författaren citerade och inkommande länkar anger vem som citerade författaren.

En forskars navpoäng är summan av författares poäng vars verk citeras. En forskars auktoritetspoäng är summan av författares navpoäng som refererade forskarens arbete.

Navpoängen ökar om författaren citerar artiklar publicerade av författare med höga auktoritetspoäng. Auktoritetspoängen ökar när publicerade artiklar citeras av författare med hög navpoäng.

$h(x)\leftarrow \sum _{x\rightarrow y}a(y)$

$a(x)\leftarrow \sum _{y\rightarrow x}h(y)$

Ekvationerna kan skrivas om i en matris-vektorform. Låt A vara en närliggande matris för nätverket och vektorerna h och a för att innehålla alla hubbar respektive auktoritetspoäng. Därefter kan poängen beräknas med följande formler.

${\vec {h}}=(1/\lambda _{h})AA^{T}{\vec {h}}$

${\vec {a}}=(1/\lambda _{a})A^{T}A{\vec {a}}$

Implementering av hubbar och auktoritetsindexalgoritm

Nav och myndigheters index kräver kunskap om kopplingen mellan forskare som refererar och citerar varandras arbete. Eftersom det inte alltid är möjligt att exakt erhålla dessa anslutningsmönster, kan närliggande matris (A) avseende forskarens anslutningar uppskattas.

Till exempel har en vetenskapsman en uppskattad lokal anslutningsmatris. Det är en kombination av det verk som han citeras av och verk som han citerar. När närliggande nätverk väl har uppskattats, bestäms nav- och auktoritetsindexen genom egennedbrytning av (AA') respektive (A'.A) . Stegen som följs för denna specifika implementering är följande:

Steg 1: Låt den forskare som ska utvärderas vara S . Denna forskare söks i Scopus och det totala antalet citeringar han har fått= c , och det totala antalet referenser han har använt= r .
S verk registreras som en uppsättning Y . Listan över forskare som har remitterats av S är antecknad som X . Valet av medlemmar i X och Y görs i ordningen med minskande citeringar i Scopus. Eftersom en uppskattning av närliggande matris A var tillräcklig, registrerade vi således medlemmar av X och Y med citeringar större än 100 i Scopus. Låt antalet signifikanta hänvisningar = c _s , och antalet signifikanta referenser = r _s . För varje signifikant medlem av X och Y utvärderar man förhållandet mellan (antal citat/antal referenser) som vikter av matris A.
Steg 3: När vikterna som motsvarar de signifikanta medlemmarna av X och Y har beräknats, uppskattas vikterna för icke-så-signifikanta medlemmar slumpmässigt. Således genereras slumpmässiga vikter för c − c _s citeringar för medlemmar av Y och r − r _s referenser för medlemmar av X . Matrisen A genereras således som:

A	Kolumn	S	X
Radindex	S	0	1
	X	0	0
	Y	1	0

Där block av X och block av Y ersätter '1:orna. Anslutningen följer fig 2.

. 2. Denna bild visar kopplingarna mellan S , X , Y för att generera närliggande matris A. Endast S är ansluten till X och Y är ansluten till S , alla andra anslutningar är 0. A är en enkelriktad närliggande matris.

Steg 4: Den initiala navvektorn beräknas som primär egenvektor (med det högsta egenvärdet) för AA' och normaliseras mellan [0,1]. Den initiala auktoritetsvektorn är den primära egenvektorn för A'.A och normaliserad också. Eftersom dessa index är relaterade till varandra, blir navvektorn A*initial auktoritetsvektor, och auktoritetsvektorn blir A'*initial navvektor. Eftersom vetenskapsmannen 'S' var den första posten i matris A, är därför det första värdet för nav- och auktoritetsvektorerna nav-auktoritetsindexen för forskaren S. Pseudokoden för densamma är följande. S är en forskare vars navindex är h och auktoritetsindex är a .

Pseudokod

1 $h_{i}\leftarrow principal~eigen~vector(AA^{T})$

2 $a_{i}\leftarrow principal~eigen~vector(A^{T}A )$

3 $h=A*a_{i}$

4 $a=A^{T}*h_{i}$

Exempel 1: Forskarindex för välkända forskare

Forskare	h-index (med Publish eller Perish)	g-index (med Publish eller Perish)	h-index (med Scopus )	Hubindex (per 10^2)	Myndighetsindex
Newman, MEJ	65	210	51	210,54	129,3687
Einstein, Albert	92	231	N/A (inget inlämnat efter 1995)	0	99,9586
Shannon, CE	44	228	N/A (inget inlämnat efter 1995)	0	15,9117
Erdős, Paul	76	142	8	0,406490	77,8040
Shenker, Scott	105	253	36	29,173	171,1167
Hirsch, Jorge E.	31	70	21	78,938	151,5361
Pople, John	87	293	29	123,7993	355,6553

Tabellen använder endast Scopus som en sökmotor och närliggande matris är en uppskattning, så resultaten i tabellform ovan är extremt aggregerade versioner och de får inte förväxlas med absoluta index. En bättre uppskattning av närliggande matris kan ge variationer i indexen. Dessutom håller Scopus reda på artiklar endast efter 1995, så det är en ytterligare begränsning. (Alla index har utvärderats den 12 december 2011.)

I den här tabellen är det uppenbart att olika sökmotorer ger olika h-index. Det är möjligt att en forskare med högt h-index kan vara en stark auktoritet men inte nödvändigtvis ett starkt nav. Giltigheten av webbsökmotorer bedöms eftersom dokument före 1995 är otillgängliga. Antalet publikationer av en viss författare i en viss databas är ansvarig för att påverka nav-myndighetsindexen. Tvärvetenskapligt arbete kan vara väl bedömt av nav-myndighetsindex till skillnad från andra index.

Exempel 2: Prognostiserade nav-auktoritetsindex med tiden (leksaksexempel)

Detta är ett exempel för att förstå samspelet mellan de olika forskarindexen.

En ny forskare som började sin akademiska karriär 2009, har publicerat 3 artiklar. Två tidningar har två citat vardera medan den tredje uppsatsen inte har några citat. Hon har refererat till 60 artiklar med 17 starka referenser bland de 60. En av hennes medförfattare har den lägsta Erdős nummer 3. Hennes forskarindex per december 2011 är:

h-index = 2
g-index = 2
m-kvot = 2/2=1
Erdős nummer = 3+1=4
HUB-index (per 10^2) = 11,702
ATHORITY index = 0,1061

Om ett år publicerar hon ytterligare en tidning med 20 nya referenser, så att hon nu har ett kumulativt antal av 31 starka referenser, 4 uppsatser med 2 citeringar för 2 artiklar och 0 citeringar för andra 2 artiklar. Hennes nav-auktoritetsindex förändras:

HUB-index = 12,668

ATHORITY index = 0,1061

Under ytterligare ett år ökar hennes citeringar för de tre artiklarna till 10 och hon fortsätter att ha 60 referenser med 17 starka referenser:

HUB-index = 11,568

ATHORITY index = 0,3241

Om ett annat år ökar hennes citeringar till 10 och hon skriver en annan artikel så att antalet referenser går upp till 80 (med 31 starka):

HUB-index = 12,694

AUTHORITY index = 0,3284

För att sammanfatta, observeras följande nav-auktoritetsindex för detta leksaksexempel.

Exempel	Antal citat	Antal referenser	HUB (per 10^2)	AUKTORITET
För närvarande	4	60	11,702	0,1061
Om referenserna ökar	4	80	12,668	0,1061
Om citaten ökar	10	60	11,568	0,3241
Om citat och referenser ökar	10	80	12.694	0,3284

Matlab-koden för exempel 1 och leksaksexemplen i exempel 2 bifogas som fil 1.

Fil 1. Exempel på MATLAB-kod för nav-myndighetsindex för kända forskare och leksaksexempel i exempel 1 och exempel 2.

Dessa exempel visar betydelsen av nav-myndighetsindexen i kvantitativ utvärdering av bidrag från en forskare i en komplett akademisk karriär.

Kritik

Forskarindex har begränsningar inklusive bristande noggrannhet, giltighet och tillämplighet. Även om noggrannheten hos forskarindex är tveksam på grund av skillnaden i stavningar, skillnader i parser, sökmotorer och dokumentdatabaser som underhålls av olika onlinekällor, kan det vara möjligt att lösa noggrannhetsproblemen om varje författare kunde tilldelas ett unikt ID istället för att lita på namnen för sökningar. Också varje gång dessa index rapporteras måste metoden och sökmotorerna som används nämnas för att undvika oklarheter så mycket som möjligt.

Giltigheten av forskarindex är en begränsning eftersom de inte väger fält av varierande betydelse. Till exempel, John Pople , en teoretisk kemist som har fått ett Nobelpris, klarar sig dåligt i uppsättningar av h-index.

Tillämpligheten av forskarindex har begränsningar när forskare betonar praktiska framsteg inom ett område av strävan snarare än publicering av tidningar. Det är också svårt att dokumentera verk från ett tidigare decennium som onlinedokument, och därmed minska deras online- effektfaktor . Till exempel Scopus en onlinedatabas som endast beräknar forskarindex för dokument som hittats efter 1995. Eventuella tidigare verk är inte dokumenterade eller utvärderade.

Jorge E. Hirsch föreslog att h-indexet skulle informera anställnings-, befordran-, finansierings-, anställnings-, pris- och samhällskommittéer för att fatta kloka beslut. Men på grund av sina begränsningar ses de bäst på ett balanserat sätt.