MovieLens
Rekommendationssystem |
---|
Koncept |
Metoder och utmaningar |
Genomföranden |
Forskning |
MovieLens är ett webbaserat rekommendationssystem och en virtuell gemenskap som rekommenderar filmer för sina användare att titta på, baserat på deras filmpreferenser med hjälp av samverkansfiltrering av medlemmars filmbetyg och filmrecensioner. Den innehåller cirka 11 miljoner betyg för cirka 8500 filmer. MovieLens skapades 1997 av GroupLens Research , ett forskningslabb vid Institutionen för datavetenskap och teknik vid University of Minnesota , för att samla forskningsdata om personliga rekommendationer.
Historia
MovieLens var inte det första rekommenderade systemet skapat av GroupLens. I maj 1996 GroupLens ett kommersiellt företag kallat Net Perceptions, som betjänade kunder som inkluderade E! Online och Amazon.com . E! Online använde Net Perceptions tjänster för att skapa rekommendationssystemet för Moviefinder.com, medan Amazon.com använde företagets teknologi för att bilda sin tidiga rekommendationsmotor för konsumentköp.
När en annan webbplats för filmrekommendationer, eachmovie.org, stängdes 1997, släppte forskarna som byggde den offentligt den anonyma betygsdata som de hade samlat in för andra forskare att använda. GroupLens Research-teamet, ledd av Brent Dahlen och Jon Herlocker, använde denna datamängd för att starta en ny filmrekommendationssida, som de valde att kalla MovieLens. Sedan starten har MovieLens blivit en mycket synlig forskningsplattform: dess datafynd har presenterats i en detaljerad diskussion i en New Yorker-artikel av Malcolm Gladwell , såväl som en rapport i ett helt avsnitt av ABC Nightline. Dessutom har MovieLens-data varit avgörande för flera forskningsstudier, inklusive en samarbetsstudie mellan Carnegie Mellon University, University of Michigan, University of Minnesota och University of Pittsburgh, "Using Social Psychology to Motivate Contributions to Online Communities".
Under våren 2015 gav en sökning på "movielens" 2 750 resultat i Google Books och 7 580 i Google Scholar.
Rekommendationer
MovieLens baserar sina rekommendationer på input från användare av webbplatsen, såsom filmbetyg . Webbplatsen använder en mängd olika rekommendationsalgoritmer, inklusive samarbetsfiltreringsalgoritmer som objekt-objekt , användare-användare och reguljär SVD . Dessutom, för att lösa kallstartsproblemet för nya användare, använder MovieLens metoder för att framkalla preferenser . Systemet ber nya användare att betygsätta hur mycket de tycker om att se olika grupper av filmer (till exempel filmer med mörk humor, kontra romantiska komedier). Preferenserna som registrerats av denna undersökning gör det möjligt för systemet att göra initiala rekommendationer, även innan användaren har betygsatt ett stort antal filmer på webbplatsen.
För varje användare förutsäger MovieLens hur användaren kommer att betygsätta en given film på webbplatsen. Baserat på dessa förutspådda betyg rekommenderar systemet filmer som användaren sannolikt kommer att betygsätta högt. Webbplatsen föreslår att användarna betygsätter så många helt sedda filmer som möjligt, så att de rekommendationer som ges blir mer korrekta, eftersom systemet då skulle få ett bättre urval av användarens filmsmak. MovieLens ratingincitament är dock inte alltid särskilt effektivt, eftersom forskare fann att mer än 20 % av filmerna som listas i systemet har så få betyg att rekommenderade algoritmer inte kan göra exakta förutsägelser om huruvida prenumeranter kommer att gilla dem eller inte. Rekommendationerna om filmer kan inte innehålla några marknadsföringsvärden som kan hantera det stora antalet filmbetyg som en "frödatauppsättning".
Förutom filmrekommendationer ger MovieLens även information om enskilda filmer, till exempel listan över skådespelare och regissörer för varje film. Användare kan också skicka in och betygsätta taggar (en form av metadata , som "baserat på en bok", "för lång" eller "campy"), som kan användas för att öka filmrekommendationssystemets noggrannhet.
Reception
I september 1997 hade webbplatsen nått över 50 000 användare. När Akron Beacon Journals Paula Schleis provade webbplatsen blev hon förvånad över hur korrekt webbplatsen var när det gällde att rekommendera nya filmer för henne att titta på baserat på hennes filmsmak.
Utanför filmrekommendationerna har data från MovieLens använts av Solution by Simulation för att göra Oscarsförutsägelser.
Forskning
År 2004 utformade och testade en samarbetsstudie med forskare från Carnegie Mellon University , University of Michigan , University of Minnesota och University of Pittsburgh incitament som härrörde från de socialpsykologiska principerna för social loafing och målsättning för MovieLens-användare. Forskarna såg att underbidrag verkade vara ett problem för samhället och startade en studie för att urskilja det mest effektiva sättet att motivera användare att betygsätta och recensera fler filmer. Studien utförde två fältexperiment; en involverade e-postmeddelanden som påminde användarna om det unika med deras bidrag och de fördelar som följer av dem, och det andra gav användarna en rad individuella eller gruppmål för bidrag.
Det första experimentet, baserat på analysen av MovieLens-gemenskapens kumulativa svar, fann att användare var mer benägna att bidra till gemenskapen när de blev påminda om sin unika karaktär, vilket fick dem att tro att deras bidrag inte är dubbletter av vad andra användare kan. att förse. I motsats till forskarnas hypotes, fann de också att användare var mindre benägna att bidra när det gjordes framträdande för dem fördelen de får av betyg eller nyttan andra får när de betygsätter. Slutligen fann de inget stöd för förhållandet mellan unikhet och nytta.
Det andra experimentet fann att användare också var mer benägna att bidra när de fick specifika och utmanande mål och leddes till att tro att deras bidrag behövdes för att uppnå gruppens mål. Studien fann att i just detta sammanhang, att ge användarna mål på gruppnivå faktiskt ökade bidrag jämfört med individuella mål, där forskarna förutspådde att det omvända skulle vara sant på grund av effekterna av social loafing. Sambandet mellan målsvårighet och användarbidrag i både grupp- och individuella fall gav svaga bevis för att bortom en viss svårighetströskel sjunker prestationerna, istället för platåer som tidigare hypoteserats i Locke och Lathams målsättningsteori.
Datauppsättningar
GroupLens Research , ett forskningslaboratorium för interaktion mellan människa och dator vid University of Minnesota , tillhandahåller betygsdatauppsättningar som samlats in från MovieLens webbplats för forskningsanvändning. Den fullständiga datamängden innehåller 26 000 000 betyg och 750 000 taggapplikationer applicerade på 45 000 filmer av 270 000 användare. Den innehåller också taggenomdata med 12 miljoner relevanspoäng över 1 100 taggar (Senast uppdaterad 8/2017). Det finns många typer av forskning som utförs baserat på MovieLens-datauppsättningarna. Liu et al. använde MovieLens-datauppsättningar för att testa effektiviteten hos en förbättrad slumpmässig vandringsalgoritm genom att undertrycka inflytandet från objekt i stora grader. GroupLens har användarvillkor för datasetet och accepterar förfrågningar via internet .