Informationskodningsklassificering
Information Coding Classification ( ICC ) är ett klassificeringssystem som täcker nästan alla befintliga 6500 kunskapsområden ( kunskapsdomäner) . Dess konceptualisering går utöver räckvidden för de välkända biblioteksklassificeringssystemen, såsom Dewey Decimal Classification (DDC), Universal Decimal Classification (UDC) och Library of Congress Classification (LCC), genom att även omfatta kunskapssystem som hittills inte har råd att klassificera litteratur . ICC presenterar faktiskt ett flexibelt universellt beställningssystem för både litteratur och annan information , utpekat som kunskapsfält. Ur metodisk synvinkel skiljer sig ICC från de ovan nämnda systemen på följande tre linjer:
- Dess huvudklasser är inte baserade på discipliner utan på nio levande utvecklingsstadier, så kallade ontiska nivåer.
- Den delar upp dem grovt i hierarkiska steg i ytterligare nio kategorier , vilket gör kodning av decimaltal möjlig.
- Innehållet i ett kunskapsfält öronmärks via ett digitalt positionsschema, vilket gör att det första hierarkiska steget avser de nio ontiska nivåerna (objektområden som ämneskategorier), och det andra hierarkiska steget avser nio funktionellt ordnade formkategorier.
Respektive kunskapsfält tillåter att enligt samma princip avgå till en tredje och fjärde nivå, och ännu längre till en femte och sjätte nivå. Slutligen kommer underavdelningar av kunskapsfält att behöva överensstämma med nämnda digitala positionsschema. För ett givet kunskapsfält kommer således identiska koder att markera identiska kategorier under respektive nummer i kodningssystemet. Denna mnemotekniska aspekt av systemet hjälper till att memorera och omedelbart hämta var de respektive tvärvetenskapliga och transdisciplinära områdena befinner sig.
De två första hierarkiska nivåerna kan betraktas som en topp- eller övre ontologi för ontologier och andra tillämpningar.
Villkoren för de tre första hierarkiska nivåerna angavs på tyska och engelska i Wissensorganisation. Entwicklung, Aufgabe, Anwendung, Zukunft , på s. 82 till 100. Den publicerades 2014 och finns hittills endast på tyska. Under tiden har även de franska termerna för kunskapsfälten samlats in. Kompetens för underhåll och vidareutveckling ligger hos den tyska avdelningen av International Society for Knowledge Organization ( ISKO) eV
Historisk utveckling
I slutet av 1970 föreslog Prof. Alwin Diemer, Univ. of Düsseldorf till Ingetraut Dahlberg att genomföra en filosofisk avhandling om kunskapens universella klassificeringssystem, dess ontologiska, epistemologiska och informationsteoretiska grunder . Diemer hade i åtanke ett innovativt ontologiskt tillvägagångssätt för ett sådant system baserat på hela spektrumet av väsen och i enlighet med kunskapsteoretiska krav. Det tredje kravet hade redan tagits upp på något sätt i den indiska kolonklassificeringen , men det krävde fortfarande förklaringar och tillägg. 1974 publicerades avhandlingen på tyska med titeln Grundlagen universaler Wissensordnung . Det började med konceptuella förtydliganden, och varför och hur termen "universell" var kopplad till kunskap, inklusive kunskapsfält, såsom varuvetenskap, artefakter, statistik, patent, standardisering, kommunikation, allmännyttiga tjänster et al. I kapitel 3 presenterades, analyserades och jämfördes sex universella klassificeringssystem (DDC, UDC, LCC, BC, CC och BBK).
När Dahlberg förberedde avhandlingen började Dahlberg med att utveckla det nya universella systemet genom att först plocka fram en mängd befintliga beteckningar på kunskapsfält från vilka referensverk som helst. Detta finansierades av German Documentation Society (DGD) (1971-2) under titeln Order system of knowledge fields . Dessutom undersöktes kursplanerna för tyska universitet och yrkeshögskolor för relevanta termer och dokumenterades (1975). Därefter tycktes det nödvändigt att lägga till definitioner från speciella ordböcker och uppslagsverk; Det visade sig snart att de 12 500 termerna innehöll många synonymer, så att hela samlingen kokade ner till cirka 6 500 begreppsbeteckningar (Project Logstruktur, med stöd av German Science Foundation (DFG) 1976-78).
Resultatet av detta arbete blev formuleringen av 30 avhandlingar som hamnade i 12 principer för det nya systemet, publicerade 40 år senare under. Dessa principer avser inte bara teoretiska grunder utan även struktur och andra organisatoriska aspekter av hela skalan av kunskapsfält. 1974 hade det digitala positionsschemat för fältindelning redan utvecklats för att möjliggöra klassificering av klassificeringslitteratur i den bibliografiska delen av det första numret av Journal International Classification. 1977 var hela ICC redo för presentation vid ett seminarium i Bangalore, Indien. En publikation av de tre första hierarkiska nivåerna dök dock upp först 1982. Den tillämpades på bibliografin över klassificeringssystem och synonymordboken i vol. 1 av International Classification and Indexing Bibliography; den har uppdaterats.
Styrande principer
Dessa publicerades i full längd i boken Wissensorganisation. Entwicklung, Aufgabe, Anwendung, Zukunft och artikeln Information Coding Classification. Geschichtliches, Prinzipien, Inhaltliches , därför räcker det med att bara nämna deras ämnen med några nödvändiga tillägg.
- Princip 1: Konceptteoretiska ansatser. Begrepp är innehållet i ICC, de förstås som kunskapsenheter. Ett koncepts "födelse". Var kommer egenskaperna, kunskapselementen ifrån? Hur uppstår konceptuella relationer?
- Princip 2: De fyra typerna av begreppsrelationer och deras tillämpningar.
- Princip 3: Decimaltal bildar ICC-koderna som dess universella språk.
- Princip 4: De nio ontiska nivåerna i ICC. De grupperades under tre rubriker: Prolegomena (1-3), biovetenskap (4-6) och mänsklig produktion (7-9):
- Struktur och form
- Materia och energi
- Kosmos och jorden
- Biosfär
- Antroposfären
- Sociosfär
- Materialprodukter (ekonomi och teknik)
- Intellektuella produkter (kunskap och information)
- Spirituella produkter (produkter av sinne och kultur)
- Princip 5: Kunskapsfält är strukturerade efter kategorier, baserade på de aristoteliska formkategorierna, under ett digitalt positionsschema, en slags skalningsregel för att dela in ett givet fält enligt följande:
- Allmänt område: problem, teorier, principer (axiom och struktur)
- Objektområde: objekt, slag, delar, objekts egenskaper
- Verksamhetsområde: metoder, processer, aktiviteter
- Fältegenskaper eller första karakterisering
- Personer eller sekundär karaktärisering
- Samhällen eller tertiär karakterisering
- Influenser utifrån
- Tillämpningar av fältet på andra fält
- Fältinformation och syntetiseringsuppgifter
- Det digitala positionsschemat, kallat Systematifier, har också använts för att strukturera hela systemet via kategorierna på den övre nollnivån.
Ett exempel på dess tillämpning är strukturen för klassificeringssystemet för kunskapsorganisationslitteratur Gliederung der Klassifikationsliteratur . (En förenklad version med en extra inledning ges i, s. 71)
- Princip 6: De ontiska nivåerna som beskrivs under princip 4 överensstämmer med "integrativ nivåteorin" vilket innebär att varje nivå är integrerad i den följande. Dessutom förutsätter varje kunskapsområde följande.
- Princip 7: Kombinationspotentialen för kunskapsfält (tvärvetenskap och transdisciplinaritet) bestäms av det digitala positionsschemat. (Exempel ges i, s. 103-4)
- Princip 8: Kategorierna för nollnivån är generella begrepp, deras möjliga underavdelningar kunde en gång användas för klassificerande påståenden. (Dessa underavdelningar behöver fortfarande utvecklas)
- Princip 9 och 10: Dessa hänför sig till kombinationspotentialen av klassificerande påståenden med rum- och tidsbegrepp. (Återstår att utveckla)
- Princip 11: Systemets mnemotekniska aspekt bygger på de fasta systempositionskoderna och på form- och ämneskategorierna 3x3.
- Princip 12: Kombinationen av systemposition 1, 8 och 9 gör ICC till ett självnätverkssystem som överensstämmer med den nuvarande vetenskapliga utvecklingen.
I matrisform
De två första nivåerna av ICC kan representeras av följande matris.
Den första hierarkiska nivån i de 9 ämneskategorierna är resultatet av den första vertikala arrayen under koderna 1-9. Den andra hierarkiska nivån av ämneskategorier är strukturerad av de 9 funktionellt ordnade formulärkategorierna, listade på den första horisontella raden under koderna 01-09. Vissa undantag nämns i princip 7.
Forskning
Utforskning av automatisk klassificering
För att klassificera webbdokument enligt Jens Hartmann, universitetet i Karlsruhe, har prof. Walter Koch, universitetet i Graz, undersökt i sitt Institute for Applied Information Technology Research Society (AIT) tillämpningen av ICC för att automatiskt klassificera metadata för cirka 350 000 dokument. Detta underlättades av data som genererats inom ramen för ett EU-stödt projekt " EuropeanaLocal" . För denna utforskning har tre ICC hierarkiska nivåer använts för cirka 5000 termer. Resultatet beskrivs i rapporten från Christoph Mak. Prof.Koch ansåg en klassificeringsgrad på nästan 50 % som ett bra resultat, med tanke på att endast en förkortad version av ICC hade använts. För att nå ett bättre resultat hade man behövt 1–2 år. Även ett index över alla termer med deras koder kunde uppnås under dessa utforskningar.
Datakoppling
Motiverad av arbetet i en italiensk forskargrupp i Trento med att revidera Wordnet-domänhierarkin: semantik, täckning och balansering, genom vilken DDC-koderna användes, professor Ernesto William De Luca et al. visade i en studie att användningen av ICC i sådana fall skulle kunna leda till väsentligt bättre resultat. Detta visades i två bidrag: Inkluderande kunskapsdomäner från ICC till Multilingual Lexical Linked Data Cloud (LLD) och Die Multilingual Lexical Linked Data Cloud: Eine mögliche Zugangsoptimierung? , där LLD användes i en metamodell som innehåller alla resurser med möjlighet till hämtning och navigering av data från olika aspekter. Genom detta kan det befintliga arbetet om många tusen kunskapsfält (av ICC) kombineras med Multilingual Lexical Linked Data Cloud, baserat på RDF/OWL-representation av EuroWordNet och liknande integrerade lexikaliska resurser (MultiWordNet, MEMODATA och Hamburg Metapher BD).
Semantisk webbstrukturering
I oktober 2013 undersökte datavetaren Hermann Bense, Dortmund, möjligheterna att strukturera Semanic Web med ICC-koder. Han utvecklade två tillvägagångssätt för en bildlig presentation av kunskapsfält med deras möjliga underavdelningar. En grafisk representation av de kunskapsområden som hör till de två första nivåerna finns under Ontologi4 . Införandet av den tredje hierarkiska nivån har förutsetts som nästa steg.
Några potentiella tillämpningar av ICC i dess nuvarande form
- Möjlighet att grovstrukturera dokument, speciellt litteraturförteckningar och referensverk.
- Strukturera personliga repertoarer, t.ex. en Who's Who i Who's Who i klassificering och indexering
- Stödja minnet av statistik efter kunskapsområden, t.ex. även om universitetsprofessorer, statistik över akademier, institutioner, lärare i specialpedagogik
- Förlag skulle kunna använda ICC-koder för sina produkter för att senare kunna sortera efter kunskapsområden.
- Som standardklassificering kan ICC användas i många fall, särskilt inom industri, kunskapshantering och kunskapsteknik .
- Med definitionen av alla dess termer kunde ett lexikon över kunskapsfält publiceras. Detta skulle också kunna användas för sådana lexika på andra språk.
- Som ett exempel kan ICC användas för att jämföra pågående vetenskaplig verksamhet på europeisk eller global skala.
- ICC kan också vara ett lämpligt verktyg för att växla mellan existerande universella klassificeringssystem.
- ICC kan också vara ett lämpligt "upphängningssystem" för speciella klassificeringssystem, t.ex. för speciella terminologiska konceptsystem.
- ICC i sina tre hierarkier och motsvarande förklaringar kan också användas inom högre utbildning för att ge ungdomarna en överblick över kunskapsfält och en förståelse för sambanden i hela mänsklig kunskap.
- I likhet med Unified Medical Language System (UMLS) för medicin skulle ett sådant Unified System of Knowledge Fields kunna hållas tillgängligt på många språk och på så sätt nå en global förståelse av kunskapsfält.
- Det alfabetiska indexet för alla kunskapsfältsbegrepp skulle kunna användas för jämförelser med andra sådana index för att hjälpa till att hitta de saknade fälten i de olika universella klassificeringssystemen.