Geonamn
GeoNames (eller GeoNames.org ) är en användarredigerbar geografisk databas som är tillgänglig och tillgänglig via olika webbtjänster , under en Creative Commons attributionslicens. Projektet grundades i slutet av 2005.
Datauppsättningen GeoNames skiljer sig från, men inkluderar data från, den amerikanska regeringens liknande namngivna GEOnet Names Server .
Databas och webbtjänster
GeoNames-databasen innehåller över 25 000 000 geografiska namn motsvarande över 11 800 000 unika egenskaper. Alla funktioner är kategoriserade i en av nio funktionsklasser och ytterligare underkategoriserade i en av 645 funktionskoder. Utöver namn på platser på olika språk, lagrade data inkluderar latitud , longitud , höjd , befolkning, administrativ underavdelning och postnummer . Alla koordinater använder World Geodetic System 1984 ( WGS84 ).
Dessa data är tillgängliga gratis via ett antal webbtjänster och en daglig databasexport.
Wiki-gränssnitt
Kärnan i GeoNames databas tillhandahålls av officiella offentliga källor, vars kvalitet kan variera. Genom ett wiki- gränssnitt uppmanas användare att manuellt redigera och förbättra databasen genom att lägga till eller korrigera namn, flytta befintliga funktioner, lägga till nya funktioner etc.
Semantisk webbintegration
Varje GeoNames-funktion representeras som en webbresurs som identifieras av en stabil URI . Denna URI ger tillgång, genom innehållsförhandling , antingen till HTML-wikisidan eller till en RDF- beskrivning av funktionen, med hjälp av element från GeoNames- ontologin . Denna ontologi beskriver egenskaperna hos GeoNames med användning av Web Ontology Language , funktionsklasserna och koderna beskrivs på SKOS -språket. Genom Wikipedia-artiklars URL länkad i RDF-beskrivningarna länkas GeoNames-data till DBpedia -data och andra RDF- länkade data .
Noggrannhet och förbättringar
Som i andra crowdsourcing- scheman tillåter GeoNames redigeringsgränssnitt alla att logga in och redigera databasen, därför kan falsk information anges och sådan information kan förbli oupptäckt, särskilt för platser som inte nås ofta. Ahlers (2013) studerar dessa felaktigheter och klassificerar dem i förlust i granularitet hos koordinater (t.ex. på grund av trunkering och lågupplöst geokodning i vissa fall), felaktiga funktionskoder, nästan identiska platser och placeringen av platser utanför deras angivna länder. Att manuellt korrigera dessa felaktigheter är både tråkigt och felbenäget (på grund av databasens storlek) och kan kräva experter.
Litteraturen tillhandahåller väldigt få verk för att automatiskt lösa dem. Singh & Rafiei (2018) studerar problemet med att automatiskt upptäcka omfattningen av platser i en geografisk databas och dess tillämpningar för att identifiera inkonsekvenser och förbättra kvaliteten på databasen. Att beräkna gränsinformationen kan hjälpa till att upptäcka inkonsekvenser som nästan identiska platser och placeringen av platser som städer under fel föräldrar som provinser eller länder. Singh och Rafiei visar att gränsinformationen som erhålls i deras arbete kan flytta mer än 20 % av platserna i GeoNames till bättre positioner i den rumsliga hierarkin och noggrannheten för dessa rörelser är över 90 %.
- Ahlers, Dirk (2013), "Bedömning av noggrannheten av GeoNames gazetteer data", Proceedings of the GIR Workshop , s. 74–81, CiteSeerX 10.1.1.722.8740
- Singh, Sanket Kumar; Rafiei, Davood (2018), "Strategies for Geographical Scoping and Improving a Gazetteer", Proceedings of the Web Conference (PDF) , s. 1663–1672