Infobox
En infobox är en digital eller fysisk tabell som används för att samla in och presentera en delmängd av information om dess ämne, till exempel ett dokument . Det är ett strukturerat dokument som innehåller en uppsättning attribut-värde-par och representerar i Wikipedia en sammanfattning av information om ämnet för en artikel . På så sätt är de jämförbara med datatabeller i vissa avseenden. När den presenteras i det större dokumentet som den sammanfattar, presenteras en infobox ofta i sidofältsformat .
En infobox kan implementeras i ett annat dokument genom att transkludera den i det dokumentet och ange några eller alla attribut-värdepar som är associerade med den infoboxen, så kallad parameterisering .
Wikipedia
En infobox kan användas för att sammanfatta informationen i en artikel på Wikipedia . De används på liknande artiklar för att säkerställa konsistens i presentationen genom att använda ett gemensamt format. Ursprungligen användes infoboxar (och mallar i allmänhet) för sidlayoutsyften . En infobox kan omvandlas till en artikel genom att ange värdet för några eller alla dess parametrar . Parameternamnet som används måste vara detsamma som anges i infoboxmallen, men vilket värde som helst kan kopplas till det. Namnet avgränsas från värdet med ett likhetstecken . Parameternamnet kan ses som ett attribut för artikelns ämne.
{{Infobox tillagad mat | namn = | bild = | bildstorlek = | bildtext = | alternativt_namn = | land = | region = | skapare = | kurs = | typ = | serveras = | main_ingredient = | variationer = | kalorier = | annat = }} |
{{Infobox tillagad mat | namn = Crostata | bild = Crostata limone e zenzero 3.jpg | bildstorlek = | bildtext = Crostata med fyllning med citron ingefära | alternativt_namn = | land = [[Italien]] | region = [[Lombardia]] | skapare = | kurs = [[Dessert]] | typ = [[Tart]] | serveras = | main_ingredient = Bakverk, [[sylt]] eller [[ricotta]] , frukt | variationer = '' Crostata di frutta '' , ' ' crostata di ricotta '' , många andra söta eller salta varianter | kalorier = | annat = }} |
Infoboxen Infobox tillagad mat som används på Wikipedia matrelaterade artiklar, utan värden specificerade för dess parametrar (attribut). | Samma infobox som implementerad i artikeln crostata . Observera att värdena finns till höger om likhetstecknet (=), och att parameternamnen är desamma som i specifikationen för infoboxmallen. Värdena finns i wiki-uppmärkning : poster omslutna inom hakparenteser (t.ex. [[Tart]]) kommer att återges som en länk till respektive Wikipedia-artikel (t.ex. Tart ), och den länkade filen kommer att omvandlas till artikeln i stället för dess pålägg. |
På Wikipedia omvandlas en infobox till en artikel genom att dess namn och attribut-värdepar omsluts i en dubbel uppsättning klammerparenteser . MediaWiki- mjukvaran som Wikipedia fungerar på analyserar sedan dokumentet, för vilket infoboxen och andra mallar bearbetas av en mallprocessor . Detta är en mallmotor som producerar ett webbdokument och en stilmall som används för presentation av dokumentet. Detta gör att designen av infoboxen kan separeras från innehållet den manipulerar; det vill säga mallens design kan uppdateras utan att informationen i den påverkas, och den nya designen kommer automatiskt att spridas till alla artiklar som transkluderar infoboxen. Vanligtvis är infoboxar formaterade så att de visas i det övre högra hörnet av en Wikipedia-artikel i skrivbordsvyn, eller högst upp i mobilvyn.
Placering av en infobox inom wikitexten till en artikel är viktig för tillgängligheten . En bästa praxis är att placera dem efter disambigueringsmallar (de som leder läsarna till artiklar om ämnen med liknande namn) och underhållsmallar (som att markera en artikel som orefererad), men före allt annat innehåll .
Baeza-Yates och King säger att vissa redaktörer tycker att mallar som infoboxar är komplicerade, eftersom mallen kan dölja text om en egenskap eller resurs som redaktören vill ändra; detta förvärras av kedjade mallar, det vill säga mallar uteslutna i andra mallar.
Från och med augusti 2009 använde engelska Wikipedia cirka 3 000 infoboxmallar som tillsammans använde mer än 20 000 attribut. Sedan dess har många slagits samman, för att minska övertalighet. I juni 2013 fanns det minst 1 345 446 transklusioner av den överordnade infoboxmallen , som används av vissa, men inte alla, infoboxar, på 4 251 127 artiklar.
Namnet på en infobox är vanligtvis "Infobox [genre]"; dock kan ofta använda infoboxar tilldelas kortare namn, som "taxobox" för taxonomi.
Maskininlärning
Cirka 44,2 % av Wikipedia-artiklarna innehöll en infobox 2008, och cirka 33 % 2010. Automatiserad semantisk kunskapsextraktion med hjälp av maskininlärningsalgoritmer används för att "extrahera maskinbearbetbar information till en relativt låg komplexitetskostnad". Den låga täckningen gör det dock svårare, även om detta delvis kan övervinnas genom att komplettera artikeldata med den i kategorier där artikeln ingår. Franska Wikipedia startade projektet Infobox Version 2 i maj 2011.
Kunskaper som erhålls genom maskininlärning kan användas för att förbättra en artikel, till exempel genom att använda automatiserade programvaruförslag till redaktörer för att lägga till infoboxdata. Projektet iPopulator skapade ett system för att lägga till ett värde till en artikels infoboxparameter via en automatiserad analys av artikelns text.
DBpedia använder strukturerat innehåll extraherat från infoboxar av maskininlärningsalgoritmer för att skapa en resurs med länkad data i den semantiska webben ; det har beskrivits av Tim Berners-Lee som "en av de mer kända" komponenterna i det länkade dataprojektet.
Maskinextraktion skapar en trippel bestående av ett subjekt, predikat eller relation och objekt. Varje attribut-värdepar i infoboxen används för att skapa en RDF- sats med hjälp av en ontologi . Detta underlättas av det snävare gapet mellan Wikipedia och en ontologi än vad som finns mellan ostrukturerad eller fri text och en ontologi.
Det semantiska förhållandet mellan subjekt och objekt fastställs av predikatet. I exemplet infobox indikerar trippel ("crostata", typ, "tart") att en crostata är en typ av tårta . Artikelns ämne används som ämne, parameternamnet används som predikat och parameterns värde som objekt. Varje typ av infobox mappas till en ontologiklass och varje egenskap (parameter) i en infobox mappas till en ontologiegenskap. Dessa mappningar används när man analyserar en Wikipedia-artikel för att extrahera data.
Metadata
Genom att presentera grundfakta för en artikel i en infobox, gör det också möjligt att presentera fakta på ett maskinvänligt sätt vilket ger extra funktionalitet som när en länk till en wikipedia klistras in i ett kompatibelt program, istället för att bara själva länken är postat annan information såsom artikelbilden postas också.
Citat
Anförda verk
- Baeza-Yates, Ricardo; King, Irwin, red. (2009). Vävtjänster och människor på World Wide Web . Springer. ISBN 9783642005695 . LCCN 2009926100 .
- Broughton, John (2008-07-14). Frisör, Nan; Meyers, Peter (red.). Wikipedia – The Missing Manual . O'Reilly Media . ISBN 9780596553777 .
- Geertman, Stan; Reinhardt, Wolfgang; Toppen, Fred, red. (2011). Avancera geoinformationsvetenskap för en föränderlig värld . Föreläsningsanteckningar i geoinformation och kartografi. Vol. 1. Springer. doi : 10.1007/978-3-642-19789-5 . ISBN 9783642197888 . ISSN 1863-2246 . LCCN 2011925152 .
- Lange, Dustin; Böhm, Christoph; Naumann, Felix (2010). Extrahera strukturerad information från Wikipedia-artiklar för att fylla informationslådor . Technische Berichte des Hasso-Plattner-Instituts für Softwaresystemtechnik an der Universität Potsdam, Hasso-Plattner-Institut für Softwaresystemtechnik Potsdam . Universitätsverlag Potsdam. ISBN 9783869560816 .
- Yu, Liyang (2011). En utvecklarguide till den semantiska webben . Springer. Bibcode : 2011adgt.book.....Y . doi : 10.1007/978-3-642-15970-1 . ISBN 9783642159695 .
- Miller, Paul (2008-02-07). "Sir Tim Berners-Lee pratar med Talis om den semantiska webben" . Transkription av CastingWords. Talis Group. Arkiverad från originalet 2013-05-10 . Hämtad 2013-06-02 .
- Virvou, Maria; Matsuura, Saeko, red. (2012). Kunskapsbaserad mjukvaruteknik: Proceedings of the Tenth Joint Conference on Knowledge-Based Software Engineering . Gränser och artificiell intelligens och tillämpningar . Vol. 240. IOS Tryck. ISBN 9781614990932 . LCCN 2012943674 .
Vidare läsning
- Kiran, Kumar N.; Santosh, GSK; Varma, Vasudeva (juni 2011). "Flerspråkig dokumentklustring med Wikipedia som extern kunskap" . Multidisciplinär informationssökning . Föreläsningsanteckningar i datavetenskap. Springer Berlin Heidelberg. 6653 . doi : 10.1007/978-3-642-21353-3 . ISBN 9783642213533 . ISSN 0302-9743 . S2CID 9901886 .
- Chutiporn, Anutariya; Domingue, John, red. (2008). The Semantic Web: 3rd Asian Semantic Web Conference, ASWC 2008, Bangkok, Thailand, 8-11 december 2008. Proceedings . Föreläsningsanteckningar i datavetenskap . Vol. 5367. Springer. ISBN 9783540897033 . ISSN 0302-9743 .
- Wu, Fei; Hoffmann, Ralph; Weld, Daniel s. (2008). "Informationsextraktion från Wikipedia: flytta ner längs den långa svansen". Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining . Association for Computing Machinery : 731–739. doi : 10.1145/1401890.1401978 . ISBN 9781605581934 . S2CID 7781746 .