Semantisk lärd
Typ av webbplats |
Sökmotor |
---|---|
Skapad av | Allen Institute for Artificiell Intelligens |
URL | |
Lanserades | 2 november 2015 |
Semantic Scholar är ett artificiell intelligensdrivet forskningsverktyg för vetenskaplig litteratur som utvecklats vid Allen Institute for AI och släpptes offentligt i november 2015. Det använder framsteg inom naturlig språkbehandling för att tillhandahålla sammanfattningar av vetenskapliga uppsatser. Semantic Scholar-teamet forskar aktivt om användningen av artificiell intelligens i naturlig språkbehandling , maskininlärning , människa-dator-interaktion och informationssökning .
Semantic Scholar började som en databas kring ämnena datavetenskap , geovetenskap och neurovetenskap . Men 2017 började systemet inkludera biomedicinsk litteratur i sin korpus. Från och med september 2022 inkluderar de nu över 200 miljoner publikationer från alla vetenskapsområden.
Teknologi
vetenskaplig litteratur i en mening . Ett av syftena var att ta itu med utmaningen att läsa många titlar och långa sammanfattningar på mobila enheter. Den syftar också till att säkerställa att de tre miljoner vetenskapliga artiklarna som publiceras årligen når läsarna, eftersom det uppskattas att endast hälften av denna litteratur någonsin läses.
Artificiell intelligens används för att fånga essensen av ett papper, generera det genom en "abstraktiv" teknik. Projektet använder en kombination av maskininlärning , bearbetning av naturligt språk och maskinseende för att lägga till ett lager av semantisk analys till de traditionella metoderna för citeringsanalys och för att extrahera relevanta figurer, tabeller , enheter och platser från uppsatser.
I motsats till Google Scholar och PubMed är Semantic Scholar utformat för att lyfta fram de viktigaste och mest inflytelserika delarna i en uppsats. AI-tekniken är utformad för att identifiera dolda kopplingar och länkar mellan forskningsämnen. Liksom de tidigare citerade sökmotorerna utnyttjar Semantic Scholar också grafstrukturer, som inkluderar Microsoft Academic Knowledge Graph , Springer Nature's SciGraph och Semantic Scholar Corpus.
Varje papper som tillhandahålls av Semantic Scholar tilldelas en unik identifierare som kallas Semantic Scholar Corpus ID (förkortat S2CID). Följande post är ett exempel:
Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (mars 2020). "Det reproduktiva antalet covid-19 är högre jämfört med SARS coronavirus." Journal of Travel Medicine . 27 (2). doi : 10.1093/jtm/taaa021 . PMID 32052846 . S2CID 211099356 .
Semantic Scholar är gratis att använda och till skillnad från liknande sökmotorer (dvs Google Scholar ) söker inte efter material som ligger bakom en betalvägg .
En studie jämförde sökförmågan hos Semantic Scholar genom ett systematiskt tillvägagångssätt och fann att sökmotorn var 98,88 % korrekt när den försökte avslöja data. Samma studie undersökte andra Semantic Scholar-funktioner, inklusive verktyg för att kartlägga metadata samt flera citeringsverktyg.
Antal användare och publikationer
Från och med januari 2018, efter ett projekt från 2017 som lade till biomedicinska artiklar och ämnessammanfattningar, inkluderade Semantic Scholar-korpusen mer än 40 miljoner artiklar från datavetenskap och biomedicin . I mars 2018 anställdes Doug Raymond, som utvecklade maskininlärningsinitiativ för Amazon Alexa -plattformen, för att leda projektet Semantic Scholar. I augusti 2019 hade antalet inkluderade uppsatsers metadata (inte de faktiska PDF-filerna) vuxit till mer än 173 miljoner efter tillägget av Microsoft Academic Graph- posterna. År 2020 gjorde ett partnerskap mellan Semantic Scholar och University of Chicago Press Journals alla artiklar publicerade under University of Chicago Press tillgängliga i Semantic Scholar-korpusen. I slutet av 2020 hade Semantic Scholar indexerat 190 miljoner tidningar.
2020 nådde användare av Semantic Scholar sju miljoner i månaden.
Se även
- Citeringsanalys – Undersökning av frekvens, mönster och grafer för citeringar i dokument
- Citationsindex – Index över citeringar mellan publikationer
- Kunskapsutvinning – Skapande av kunskap från strukturerade och ostrukturerade källor
- Lista över akademiska databaser och sökmotorer
- Scientometrics – Studie av att mäta och analysera vetenskap, teknik och innovation