h -index
Del av en serie om |
citeringsmått |
---|
h som -indexet är ett mått på författarnivå som mäter både produktiviteten och citeringseffekten av publikationerna , ursprungligen användes för en enskild vetenskapsman eller forskare. H - indexet korrelerar med uppenbara framgångsindikatorer som att vinna Nobelpriset, att bli antagen till forskarstipendier och att inneha positioner vid toppuniversitet. Indexet är baserat på uppsättningen av forskarens mest citerade artiklar och antalet citeringar som de har fått i andra publikationer. Indexet har på senare tid tillämpats på produktiviteten och inverkan av en vetenskaplig tidskrift såväl som en grupp forskare, såsom en institution eller ett universitet eller ett land. Indexet föreslogs 2005 av Jorge E. Hirsch , en fysiker vid UC San Diego , som ett verktyg för att bestämma teoretiska fysikers relativa kvalitet och kallas ibland Hirschindex eller Hirsch-tal .
Definition och syfte
H -indexet definieras som det maximala värdet på h så att den givna författaren/tidskriften har publicerat minst h uppsatser som var och en har citerats minst h gånger . Indexet är utformat för att förbättra enklare mått som det totala antalet citeringar eller publikationer. Indexet fungerar bäst när man jämför forskare som arbetar inom samma område, eftersom citeringskonventionerna skiljer sig mycket mellan olika områden.
Beräkning
H -indexet är det största antalet h så att h artiklar har minst h citat vardera. Till exempel, om en författare har fem publikationer, med 9, 7, 6, 2 och 1 citat (ordnad från störst till minst), är författarens h-index 3, eftersom författaren har tre publikationer med 3 eller fler citat . Författaren har dock inte fyra publikationer med 4 eller fler citat.
Uppenbarligen kan en författares h -index bara vara så stort som deras antal publikationer. Till exempel kan en författare med bara en publikation ha ett maximalt h -index på 1 (om deras publikation har 1 eller fler citat). Å andra sidan skulle en författare med många publikationer, var och en med bara 1 citat, ha ett h -index på 1.
Formellt, om f är funktionen som motsvarar antalet citeringar för varje publikation, beräknar vi h -indexet enligt följande: Först ordnar vi värdena för f från det största till det lägsta värdet. Sedan letar vi efter den sista positionen där f är större än eller lika med positionen (vi kallar h denna position). Till exempel, om vi har en forskare med 5 publikationer A, B, C, D och E med 10, 8, 5, 4 respektive 3 citeringar, är h -index lika med 4 eftersom den 4:e publikationen har 4 citat och den 5:e har bara 3. Däremot, om samma publikationer har 25, 8, 5, 3 och 3 citeringar, är indexet 3 (dvs. den 3:e positionen) eftersom den fjärde uppsatsen bara har 3 citeringar.
- f (A)=10, f (B)=8, f (C)=5, f (D)=4, f (E)=3 → h -index=4
- f (A)=25, f (B )=8, f (C)=5, f (D)=3, f (E)=3 → h -index=3
Om vi har funktionen f ordnad i fallande ordning från det största värdet till det lägsta, kan vi beräkna h -indexet enligt följande:
- h -index ( f ) =
Hirsch-indexet är analogt med Eddington-talet , ett tidigare mått som användes för att utvärdera cyklister. h -index är också relaterat till Sugeno integral och Ky Fan metric . H -indexet fungerar som ett alternativ till mer traditionella tidskrifters effektfaktormått vid utvärderingen av effekten av en viss forskares arbete . Eftersom endast de mest citerade artiklarna bidrar till h -indexet är dess bestämning en enklare process. Hirsch har visat att h har ett högt prediktivt värde för huruvida en vetenskapsman har vunnit utmärkelser som medlemskap i National Academy eller Nobelpriset . h -indexet växer när citat ackumuleras och det beror därför på forskarens " akademiska ålder " .
Indata
h - indexet kan bestämmas manuellt genom att använda citeringsdatabaser eller använda automatiska verktyg. Prenumerationsbaserade databaser som Scopus och Web of Science tillhandahåller automatiserade miniräknare. Från juli 2011 Google tillhandahållit ett automatiskt beräknat h -index och i10 -index inom sin egen Google Scholar- profil. Dessutom kan specifika databaser, som INSPIRE-HEP -databasen automatiskt beräkna h -indexet för forskare som arbetar inom högenergifysik .
Varje databas kommer sannolikt att producera olika h för samma forskare, på grund av olika täckning. En detaljerad studie visade att Web of Science har stark täckning av tidskriftspublikationer, men dålig täckning av högeffektiva konferenser. Scopus har bättre täckning av konferenser, men dålig täckning av publikationer före 1996; Google Scholar har den bästa täckningen av konferenser och de flesta tidskrifter (men inte alla), men har precis som Scopus begränsad täckning av publikationer före 1990. Att utesluta konferenshandlingar är ett särskilt problem för forskare inom datavetenskap , där konferenshandlingar anses vara en viktig del av litteraturen. Google Scholar har kritiserats för att producera "fantomcitat", inklusive grå litteratur i sina citaträkningar, och för att inte följa reglerna för boolesk logik när man kombinerar söktermer. Till exempel fann Meho och Yang-studien att Google Scholar identifierade 53 % fler citeringar än Web of Science och Scopus tillsammans, men noterade att eftersom de flesta av de ytterligare citaten som rapporterats av Google Scholar var från tidskrifter med låg inverkan eller konferenshandlingar, gjorde de det inte väsentligt förändra individernas relativa rangordning. Det har föreslagits att för att hantera den ibland breda variationen i h för en enskild akademiker uppmätt över de möjliga citeringsdatabaserna, bör man anta att falska negativ i databaserna är mer problematiska än falska positiva och ta det maximala h uppmätt för en akademiker .
Exempel
Lite systematisk undersökning har gjorts om hur h -indexet beter sig över olika institutioner, nationer, tider och akademiska områden. Hirsch föreslog att, för fysiker, ett värde för h på cirka 12 kan vara typiskt för avancemang till anställning (docent) vid stora [amerikanska] forskningsuniversitet. Ett värde på cirka 18 kan innebära en full professur, 15–20 kan innebära ett stipendium i American Physical Society och 45 eller högre kan innebära medlemskap i United States National Academy of Sciences . Hirsch uppskattade att efter 20 år skulle en "framgångsrik vetenskapsman" ha ett h -index på 20, en "framstående vetenskapsman" skulle ha ett h -index på 40 och en "verkligt unik" individ skulle ha ett h -index på 60.
För de mest citerade vetenskapsmännen under perioden 1983–2002 identifierade Hirsch de tio bästa inom biovetenskaperna (i fallande h ): Solomon H. Snyder , h = 191; David Baltimore , h = 160; Robert C. Gallo , h = 154; Pierre Chambon , h = 153; Bert Vogelstein , h = 151; Salvador Moncada , h = 143; Charles A. Dinarello , h = 138; Tadamitsu Kishimoto , h = 134; Ronald M. Evans , h = 127; och Ralph L. Brinster , h = 126. Bland 36 nya kandidater i National Academy of Sciences i biologiska och biomedicinska vetenskaper 2005, var median- h -indexet 57. Hirsch noterade dock att värdena på h kommer att variera mellan olika områden.
Bland de 22 vetenskapliga disciplinerna som listas i citeringströsklarna för Essential Science Indicators [därmed uteslutande icke-vetenskapliga akademiker] har fysiken näst flest citeringar efter rymdvetenskap . Under perioden 1 januari 2000 – 28 februari 2010 var en fysiker tvungen att få 2073 citeringar för att vara bland de mest citerade 1 % av fysikerna i världen. Tröskeln för rymdvetenskap är den högsta (2236 citat), och fysik följs av klinisk medicin (1390) och molekylärbiologi & genetik (1229). De flesta discipliner, som miljö/ekologi (390), har färre forskare, färre uppsatser och färre citeringar. Därför har dessa discipliner lägre citeringströskelvärden i Essential Science Indicators, med de lägsta citeringströsklarna observerade inom samhällsvetenskap (154), datavetenskap (149) och multidisciplinär vetenskap (147).
Siffrorna är väldigt olika inom samhällsvetenskapliga discipliner: The Impact of the Social Sciences- teamet vid London School of Economics fann att samhällsvetare i Storbritannien hade lägre genomsnittliga h -index. H - indexen för ("fullständiga") professorer, baserade på Google Scholar- data varierade från 2,8 (i juridik), till 3,4 (i statsvetenskap ), 3,7 (i sociologi ), 6,5 (i geografi) och 7,6 (i ekonomi) . I genomsnitt över disciplinerna hade en professor i samhällsvetenskap ett h -index ungefär dubbelt så högt som en lektor eller en lektor, även om skillnaden var minst i geografi.
Fördelar
Hirsch avsåg att h -indexet skulle ta itu med de största nackdelarna med andra bibliometriska indikatorer. Det totala antalet artiklar mäter inte för kvaliteten på vetenskapliga publikationer. Det totala antalet citeringsmått, å andra sidan, kan påverkas kraftigt av deltagande i en enda publikation med stort inflytande (till exempel metodologiska artiklar som föreslår framgångsrika nya tekniker, metoder eller approximationer, som kan generera ett stort antal citeringar). h - indexet är avsett att samtidigt mäta kvaliteten och kvantiteten av vetenskaplig produktion.
Kritik
Det finns ett antal situationer där h kan ge vilseledande information om en vetenskapsmans produktion. Vissa av dessa misslyckanden är inte exklusiva för h -indexet utan delas snarare med andra mätvärden på författarnivå .
Felaktig framställning av data
h -indexet står inte för det typiska antalet citeringar inom olika fält . Citeringsbeteende i allmänhet påverkas av fältberoende faktorer, vilket kan ogiltigförklara jämförelser inte bara mellan discipliner utan även inom olika forskningsområden inom en disciplin. h -indexet kasserar informationen som finns i författarplacering i författarlistan, vilket inom vissa vetenskapliga områden är betydande men i andra inte . H - indexet är ett naturligt tal som minskar dess diskriminerande kraft. Ruane och Tol föreslår därför ett rationellt h -index som interpolerar mellan h och h + 1.
Benägen till manipulation
Svagheter gäller för den rent kvantitativa beräkningen av vetenskaplig eller akademisk produktion. Liksom andra mätvärden som räknar citat h -indexet manipuleras genom tvångscitering , en praxis där en redaktör för en tidskrift tvingar författare att lägga till falska citat till sina egna artiklar innan tidskriften går med på att publicera den. H -indexet kan manipuleras genom självciteringar, och om det är baserat på Google Scholar- utdata kan även datorgenererade dokument användas för det ändamålet, t.ex. med SCIgen .
Andra brister
H - indexet har i en studie visat sig ha något mindre prediktiv noggrannhet och precision än det enklare måttet på genomsnittliga citeringar per uppsats. Detta fynd motsägs dock av en annan studie av Hirsch. H -indexet ger inte ett betydligt mer exakt mått på inverkan än det totala antalet citeringar för en given forskare . I synnerhet, genom att modellera fördelningen av citat mellan tidningar som en slumpmässig heltalspartition och h -indexet som Durfee-kvadraten för partitionen, kom Yong fram till formeln , där N är det totala antalet citeringar, vilket, för matematikmedlemmar i National Academy of Sciences, visar sig ge en korrekt (med fel vanligtvis inom 10–20 procent) approximation av h -index i de flesta fall.
Alternativ och modifieringar
Olika förslag för att modifiera h -indexet för att framhäva olika egenskaper har gjorts. I takt med att varianterna har spridit sig har jämförande studier blivit möjliga som visar att de flesta förslag är starkt korrelerade med det ursprungliga h -indexet och därför i stort sett överflödiga, även om alternativa index kan vara viktiga för att välja mellan jämförbara CV:n, vilket ofta är fallet i utvärderingsprocesser. Dessa alternativa mätvärden är tillämpliga för rankningar på författarnivå och tidskriftsnivå .
Ansökningar
Index som liknar h -indexet har använts utanför författarnivåmåtten.
H -indexet har tillämpats på Internet Media , såsom YouTube- kanaler. Det definieras som antalet videor med ≥ h × 10 5 visningar. Jämfört med en videoskapares totala visningsantal, fångar h -index och g -index bättre både produktivitet och effekt i ett enda mått.
Ett successivt Hirsch-typindex för institutioner har också tagits fram. En vetenskaplig institution har ett successivt Hirsch-typ-index på i när minst i forskare från den institutionen har ett h -index på minst i .
Se även
Vidare läsning
- Alonso, S.; Cabrerizo, FJ; Herrera-Viedma, E.; Herrera, F. (2009). " h -index: En recension fokuserad i dess varianter, beräkningar och standardisering för olika vetenskapliga områden" ( PDF) . Journal of Informetrics . 3 (4): 273–89. doi : 10.1016/j.joi.2009.04.001 . hdl : 10481/64974 .
- Ball, Philip (2005). "Index syftar till rättvis ranking av forskare" . Naturen . 436 (7053): 900. Bibcode : 2005Natur.436..900B . doi : 10.1038/436900a . PMID 16107806 .
- Iglesias, Juan E.; Pecharromán, Carlos (2007). "Skalning av h -index för olika vetenskapliga ISI-fält". Scientometrik . 73 (3): 303–320. arXiv : fysik/0607224 . doi : 10.1007/s11192-007-1805-x . S2CID 17559665 .
- Kelly, CD; Jennions, MD (2006). " H- index och karriärbedömning efter siffror". Trender inom ekologi och evolution . 21 (4): 167–70. doi : 10.1016/j.tree.2006.01.005 . PMID 16701079 .
- Lehmann, S.; Jackson, AD; Lautrup, BE (2006). "Åtgärder för åtgärder". Naturen . 444 (7122): 1003–04. Bibcode : 2006Natur.444.1003L . doi : 10.1038/4441003a . PMID 17183295 . S2CID 3099364 .
- Panaretos, J.; Malesios, C. (2009). "Bedömning av vetenskaplig forskningsprestanda och effekt med enskilda index". Scientometrik . 81 (3): 635–70. arXiv : 0812.4542 . doi : 10.1007/s11192-008-2174-9 . S2CID 1957865 .
- Petersen, AM; Stanley, H. Eugene; Succi, Sauro (2011). "Statistiska regelbundenheter i forskarnas rang-citeringsprofil" . Vetenskapliga rapporter . 181 (181): 1–7. arXiv : 1103.2719 . Bibcode : 2011NatSR...1E.181P . doi : 10.1038/srep00181 . PMC 3240955 . PMID 22355696 .
- Sidiropoulos, Antonis; Katsaros, Dimitrios; Manolopoulos, Yannis (2007). "Generaliserat Hirsch h -index för att avslöja latenta fakta i citeringsnätverk". Scientometrik . 72 (2): 253–80. CiteSeerX 10.1.1.76.3617 . doi : 10.1007/s11192-007-1722-z . S2CID 14919467 .
- Soler, José M. (2007). "En rationell indikator på vetenskaplig kreativitet". Journal of Informetrics . 1 (2): 123–30. arXiv : fysik/0608006 . doi : 10.1016/j.joi.2006.10.004 . S2CID 17113647 .
- Symonds, MR; et al. (2006). Tregenza, Tom (red.). "Könsskillnader i publikationsproduktion: mot ett opartiskt mått på forskningsresultat" . PLOS ETT . 1 (1): e127. Bibcode : 2006PLoSO...1..127S . doi : 10.1371/journal.pone.0000127 . PMC 1762413 . PMID 17205131 .
- Taber, Douglass F. (2005). "Kvantifiera publiceringspåverkan". Vetenskap . 309 (5744): 2166a. doi : 10.1126/science.309.5744.2166a . PMID 16195445 . S2CID 41686509 .
- Woeinger, Gerhard J. (2008). "En axiomatisk karaktärisering av Hirsch-indexet". Matematisk samhällsvetenskap . 56 (2): 224–32. doi : 10.1016/j.mathsocsci.2008.03.001 .
externa länkar
- Google Scholar-statistik
- H -index för datavetenskap och elektronik
- H -index för ekonomer
- H -index för datavetenskapsforskare
- H - index för datavetare från Google Scholar
- H -index för astronomer