Hämtning av information från människa–dator
Informationshämtning mellan människa och dator ( HCIR ) är studiet och konstruktionen av tekniker för informationsinhämtning som för in mänsklig intelligens i sökprocessen . Den kombinerar fälten människa-datorinteraktion (HCI) och informationssökning (IR) och skapar system som förbättrar sökningen genom att ta hänsyn till det mänskliga sammanhanget, eller genom en sökprocess i flera steg som ger möjlighet till mänsklig feedback.
Historia
Denna term human–computer information retrieval myntades av Gary Marchionini i en serie föreläsningar som hölls mellan 2004 och 2006. Marchioninis huvuduppsats är att "HCIR syftar till att ge människor möjlighet att utforska storskaliga informationsbaser men kräver att människor också tar ansvar för detta. kontroll genom att förbruka kognitiv och fysisk energi."
1996 och 1998 försökte ett par workshops vid University of Glasgow om informationsinhämtning och människa-datorinteraktion ta itu med överlappningen mellan dessa två områden. Marchionini noterar effekterna av World Wide Web och den plötsliga ökningen av informationskompetens – förändringar som bara var embryonala i slutet av 1990-talet.
Ett fåtal workshops har fokuserat på skärningspunkten mellan IR och HCI. Workshopen om Exploratory Search, som initierades av University of Maryland Human-Computer Interaction Lab 2005, växlar mellan Association for Computing Machinery Special Interest Group on Information Retrieval (SIGIR) och Special Interest Group on Computer-Human Interaction (CHI). Även 2005 European Science Foundation en undersökningsworkshop om informationsinhämtning i sammanhang. Sedan hölls den första workshopen om hämtning av mänsklig datorinformation 2007 på Massachusetts Institute of Technology .
Beskrivning
HCIR inkluderar olika aspekter av IR och HCI. Dessa inkluderar utforskande sökning , där användare i allmänhet kombinerar fråge- och surfstrategier för att främja lärande och undersökningar; informationsinhämtning i sammanhang (dvs. tar hänsyn till aspekter av användaren eller miljön som vanligtvis inte återspeglas i en fråga); och interaktiv informationsinhämtning, som Peter Ingwersen definierar som "de interaktiva kommunikationsprocesser som sker under hämtning av information genom att involvera alla de stora deltagarna i informationshämtning (IR), dvs användaren, mellanhanden och IR-systemet."
En viktig fråga för HCIR är att IR-system avsedda för mänskliga användare ska implementeras och utvärderas på ett sätt som speglar dessa användares behov.
De flesta moderna IR-system använder en rankad hämtningsmodell, där dokumenten poängsätts baserat på sannolikheten för dokumentets relevans för frågan. I denna modell presenterar systemet endast de högst rankade dokumenten för användaren. Dessa system utvärderas vanligtvis baserat på deras genomsnittliga precision över en uppsättning benchmarkfrågor från organisationer som Text Retrieval Conference ( TREC).
På grund av sin betoning på att använda mänsklig intelligens i informationshämtningsprocessen, kräver HCIR olika utvärderingsmodeller – en som kombinerar utvärdering av IR- och HCI-komponenterna i systemet. Ett nyckelområde för forskning inom HCIR är utvärdering av dessa system. Tidigt arbete med interaktiv informationsinhämtning, såsom Juergen Koenemann och Nicholas J. Belkins studie från 1996 av olika nivåer av interaktion för automatisk omformulering av frågor, utnyttjar standardmåtten för IR- precision och återkallelse men tillämpar dem på resultaten av flera iterationer av användare interaktion, snarare än till ett enda frågesvar. Annan HCIR-forskning, som Pia Borlunds IIR-utvärderingsmodell, tillämpar en metodik som mer påminner om HCI, med fokus på användarnas egenskaper, detaljerna i experimentell design, etc.
Mål
HCIR-forskare har lagt fram följande mål för ett system där användaren har mer kontroll över att fastställa relevanta resultat.
System bör
- inte längre bara leverera de relevanta dokumenten, utan måste också tillhandahålla semantisk information tillsammans med dessa dokument
- öka användaransvaret och kontrollen; det vill säga informationssystem kräver mänskliga intellektuella ansträngningar
- har flexibla arkitekturer så att de kan utvecklas och anpassa sig till allt mer krävande och kunniga användarbaser
- syfta till att vara en del av informationsekologin för personliga och delade minnen och verktyg snarare än diskreta fristående tjänster
- stödja hela informationens livscykel (från skapande till bevarande) snarare än bara spridnings- eller användningsfasen
- stödja inställning av slutanvändare och särskilt av informationspersonal som tillför värde till informationsresurser
- vara engagerande och rolig att använda
Kort sagt förväntas informationshämtningssystem fungera på det sätt som bra bibliotek gör. System bör hjälpa användare att överbrygga klyftan mellan data eller information (i den mycket snäva, detaljerade betydelsen av dessa termer) och kunskap (bearbetad data eller information som tillhandahåller det sammanhang som krävs för att informera nästa iteration av en informationssökningsprocess). Det vill säga, bra bibliotek tillhandahåller både den information som en kund behöver såväl som en partner i inlärningsprocessen – informationsproffsen – för att navigera i den informationen, förstå den, bevara den och omvandla den till kunskap (vilket i sin tur skapar nya , mer informerade informationsbehov).
Tekniker
Teknikerna förknippade med HCIR betonar representationer av information som använder mänsklig intelligens för att leda användaren till relevanta resultat. Dessa tekniker strävar också efter att tillåta användare att utforska och smälta datamängden utan påföljder, dvs utan att spendera onödiga kostnader för tid, musklick eller kontextförskjutning.
Många sökmotorer har funktioner som innehåller HCIR-tekniker. Stavningsförslag och automatisk omformulering av frågor ger mekanismer för att föreslå potentiella sökvägar som kan leda användaren till relevanta resultat. Dessa förslag presenteras för användaren, vilket ger användaren kontroll över val och tolkning.
Facetterad sökning gör det möjligt för användare att navigera information hierarkiskt , gå från en kategori till dess underkategorier, men välja i vilken ordning kategorierna presenteras. Detta står i kontrast till traditionella taxonomier där hierarkin av kategorier är fixerad och oföränderlig. Facetterad navigering , som taxonomisk navigering, vägleder användarna genom att visa dem tillgängliga kategorier (eller aspekter), men kräver inte att de bläddrar igenom en hierarki som kanske inte exakt passar deras behov eller sätt att tänka.
Lookahead ger en allmän metod för strafffri utforskning. Till exempel använder olika webbapplikationer AJAX för att automatiskt fylla i söktermer och föreslå populära sökningar. Ett annat vanligt exempel på framåtblick är det sätt på vilket sökmotorer kommenterar resultat med sammanfattande information om dessa resultat, inklusive både statisk information (t.ex. metadata om objekten) och "utdrag" av dokumenttext som är mest relevanta för orden i sökningen fråga.
Relevansfeedback låter användare vägleda ett IR-system genom att indikera om specifika resultat är mer eller mindre relevanta.
Sammanfattning och analys hjälper användarna att smälta resultaten som kommer tillbaka från frågan. Sammanfattningen här är avsedd att omfatta alla sätt att aggregera eller komprimera frågeresultaten till en mer mänsklig form. Facetterad sökning, som beskrivs ovan, är en sådan form av sammanfattning. En annan är klustring , som analyserar en uppsättning dokument genom att gruppera liknande eller samtidigt förekommande dokument eller termer. Clustering gör att resultaten kan delas upp i grupper av relaterade dokument. Till exempel kan en sökning efter "java" returnera kluster för Java (programmeringsspråk) , Java (ö) eller Java (kaffe) .
Visuell representation av data anses också vara en nyckelaspekt av HCIR. Representationen av sammanfattningar eller analyser kan visas som tabeller, diagram eller sammanfattningar av aggregerade data. Andra typer av informationsvisualisering som ger användare tillgång till sammanfattande vyer av sökresultat inkluderar taggmoln och trädkartläggning .
Närliggande områden
- ^ a b Marchionini, G. (2006). Toward Human-Computer Information Retrieval Bulletin, i juni/juli 2006 Bulletin of the American Society for Information Science
- ^ "Ingwersen, P. (1992). Interaktion för informationshämtning. London: Taylor Graham" . Arkiverad från originalet 2007-11-25 . Hämtad 2007-11-28 .
- ^ "Mira arbetsgrupp (1996). Utvärderingsramar för interaktiva multimediainformationshämtningstillämpningar" . Arkiverad från originalet 2008-02-01.
- ^ Grossman, D. och Frieder, O. (2004). Algoritmer och heuristik för informationssökning.
- ^ Koenemann, J. och Belkin, NJ (1996). Ett fall för interaktion: en studie av interaktiv informationsinhämtningsbeteende och effektivitet. I Proceedings of the SIGCHI Conference on Human Factors in Computing Systems: Common Ground (Vancouver, British Columbia, Kanada, 13–18 april 1996). MJ Tauber, Ed. CHI '96. ACM Press, New York, NY, 205-212
- ^ Borlund, P. (2003). IIR-utvärderingsmodellen: ett ramverk för utvärdering av interaktiva informationshämtningssystem. Information Research, 8(3), Artikel 152
- ^ White, R., Capra, R., Golovchinsky, G., Kules, B., Smith, C., och Tunkelang, D. (2013). Introduktion till specialutgåva om hämtning av information från människa-dator. Journal of Information Processing and Management 49(5), 1053-1057
- ^ Hearst, M. (1999). Användargränssnitt och visualisering, kapitel 10 i Baeza-Yates, R. och Ribeiro-Neto, B., Modern Information Retrieval.
- ^ Rocchio, J. (1971). Relevansåterkoppling vid informationssökning. I: Salton, G (red), The SMART Retrieval System.