Reality mining

Reality mining är insamling och analys av maskinavkänd miljödata som hänför sig till mänskligt socialt beteende , med målet att identifiera förutsägbara beteendemönster. 2008 kallade MIT Technology Review det för en av de "10 tekniker som mest sannolikt kommer att förändra vårt sätt att leva."

Reality mining studerar mänsklig interaktion baserat på användningen av trådlösa enheter som mobiltelefoner och GPS-system som ger en mer korrekt bild av vad människor gör, vart de går och med vem de kommunicerar med snarare än från mer subjektiva källor som en persons egna. konto. Reality mining är en aspekt av digital fotavtrycksanalys .

Reality Mining använder Big Data för att genomföra forskning och analysera hur människor interagerar med teknik varje dag för att bygga system som möjliggör positiv förändring från individen till det globala samhället. Reality Mining handlar också om dataavgaser .

Individuell skala (1 person)

Individer använder mobiltelefoner, surfplattor, bärbara datorer, kameror och alla enheter som är anslutna till internet för en mängd olika ändamål, och skapar därför en mängd olika data från GPS-platser till vanliga frågor på Google. Mobiltelefoner innehåller så mycket data om individen att telefoner nu kan föreslå restauranger baserat på våra sökningar, besökta platser, bokpreferenser och till och med gissa slutet på meningar vi skriver. En enkel tillämpning av Reality Mining är att lyssna på röster och förstå talmönster för att diagnostisera medicinska problem som den enkla influensan till och med tidigt debuterande Parkinsons. Kraftfullare telefoner tillåter också kalenderanpassning och händelsespårning som visar beteenden hos individer, vad som anses viktigt nog att spåra. Sociala webbplatser tillåter också forskare att se ögonblicksbilder av en persons liv genom att följa statusuppdateringar på Facebook eller tweets från Twitter. Ännu mer specifik, en ny app som heter Snapchat låter användare lägga upp videor, bilder eller till och med liveströmmar av exakt vad de gör när de gör det, starka indikatorer på beteenden och interaktioner med världen. 2004 genomförde MIT Reality Mining Project som gav 100 MIT-studenter en Nokia 6600 som spårades på en mängd olika sätt av forskarna. Cell Tower ID-nummer (ett mycket billigt och diskret sätt att mäta plats), telefonens status (laddar eller inaktiv) och all användning av telefonens applikationer (spel, webbsurfning, etc...). De fann att genom att samla in den här typen av data kunde de med hög noggrannhet förutsäga elevernas beteenden, till exempel om en av eleverna vaknade på en lördagsmorgon klockan 10, kunde undersökningarna förutsäga vad de skulle göra den dagen med hjälp av "egenbeteenden". Detta nya sätt att förstå data öppnade dörrar för ny forskning och möjligen ännu större enkätforskning med detaljerad och korrekt statistik. Det finns hundratals webbplatser som erbjuder programvara för mobiltelefoner som spårar nästan allt telefonen gör, användbart för oroliga föräldrar eller personer som vill öka sin personliga produktivitet. Dessa data laddas sedan upp till en server och kan nås när som helst.

Även om redan mycket data kan samlas in från personliga enheter, utgör de bara en del av en persons liv. Reality Miners kan också använda biometriska enheter för att mäta fysisk hälsa och aktivitet. Det finns många enheter som denna såsom Fitbit, Nike+ och Polar och Garmin GPS-klockor. Det finns till och med en app som heter Sleep Cycle för iPhone- och Android-användare som mäter sömnkvaliteten, vilket inkluderar mängden sömn och till och med optimala larminställningar. Med hjälp av denna data kan Reality Miners kanske mäta ens faktiska hälsa och processer som gör att vi kan fungera (eller dysfunktioner). Hjärtattacker har i allmänhet inga longitudinella indikatorer, men att använda all denna data eller till och med när en person ägnar sig åt Lifelogging kan skapa ett datum som är användbart för det medicinska området och spåra livsstilen för dem som genomgår hjärtinfarkt för att sedan skapa förebyggande riktlinjer. Det finns flera sätt att starta Lifelogging, till exempel har Google sin egen enhet som heter Google Glass som har en Heads-Up-Display (HUD), en mikrofon, en processor och en kamera. Dessa är alla sätt att logga information i specifika kataloger.

Community-skala (10 till 1 000 personer)

Sättet som forskare har börjat observera och registrera beteenden i stora grupper var genom att använda RFID-märken . Data registreras också på arbetsplatser med hjälp av Knowledge Management System som försöker förbättra arbetarnas produktivitet och effektivitet, även om en brist på detta är oförmågan att sammanföra de sociala och tekniska kulturerna på arbetsplatsen, vilket därför tillhandahåller ofullständiga beteendedata. Ett annat sätt att mäta större grupper av människor i ett samhälle är genom konferensdeltagande. Dessa data gör det möjligt för forskare att veta var deltagarna kommer ifrån, etnisk demografi och det faktiska antalet personer som deltar i evenemanget. Vissa konferenser använder smarta märken med fler funktioner än de vanliga RFID-märkena. Företag som Microsoft och IBM har använt dem för att registrera antalet personer de interagerar med under konferensen och låta människor svara på enkätfrågor. De smarta märkena spelar också in röstinteraktioner och när deltagare är vid vissa bås och kan till och med varna monterarbetare när vissa profiler kommer in inom ett visst område av båset. Smarta märken har uppenbara fördelar för att samla in data för verklighetsgruvarbetare. 2009 använde ett företag som heter nTag, som sedan förvärvades av Alliance Technology, nTag-teknologi som gör att användare till och med kan meddelas vem de ska prata med och som kan byta visitkort elektroniskt. En annan typ av dataverklighetsgruvarbetare letar efter är klimat- och miljöinformation. De samlar in data från stadsdelar genom att använda luftkvalitetssensorer som registrerar koldioxid och kväveoxider samt det allmänna klimatet. Information som denna kan hjälpa beslutsfattare att besluta om de ska agera eller inte eller se framsteg. Ett annat sätt att samla in data om omgivningen är genom Project Noah. Project Noah var ett försök att samla in data om typer av växtarter genom att geotagga bilder på växter och svampar som människor laddar upp, så att användare kan se vilken typ av ekosystem användare lever i. Detta hjälper skolor och elever som vill samla in data för projekt, men också för fågelskådare att veta vilken typ av fåglar som finns i området.

Stadskala (1 000 till 1 000 000 personer)

I allmänna termer för detta avsnitt definieras en stad av 1 000 till 1 000 000 personer. Ett sätt att samla in data i stadsskala är genom att samla in data om trafiken med trafiksignaler och fartkameror. Data kan också samlas in från polisrapporter och vägskannrar samt GPS från mobilapplikationer. Med hjälp av denna typ av trafikdata kan städer skapa rutter som bäst möjliggör effektiv rörelse och trafikflöde. Ett företag som heter Inrix, som startade 2010, har sammanställt data om trafik och köper data från brooperatörer och andra transportsystem. Den använder dessa data för att förutsäga trafikrutter och tid för trafikstockningar. Ett annat sätt att övervaka trafiken är genom bluetooth-teknik, vilket är en teknik som Inrix inte tar hänsyn till. University of Maryland avslutade ett projekt 2012 som visade att två Bluetooth-sensorer permanent placerade två mil från varandra kunde exakt detektera trafikhastigheter. Allt detta kombinerat kan skapas för att göra ruttförslagsalgoritmer för att hjälpa människor att ta sig till och från platser på ett effektivt sätt som dessutom kan rutten uppdatera sig själv i realtid med hjälp av denna typ av sensorer och information. Anmärkningsvärd start-up, nu ett dotterbolag till google, Waze , som också samlade in data från användare (anonymt) som rapporterade olyckor och detta spel dem i app-valutor och belöningar. För brott i stadsskala är det första sättet att samla in och se data genom historisk forskning av tidigare rapporter inom något område. Nu placerar mer komplexa algoritmer automatiskt poliser på platser med höga brottsfrekvenser innan något egentligt brott har begåtts. Sedan 2005 har Memphis Police Department använt ett program som heter Blue CRUSH (Criminal Reduction Utilization Statistical History) som använder polisrapporterna och använder värmekartor för att skilja mellan höga och låga brottsområden. Detta program uppdaterar sig själv varje vecka och gör det möjligt för polisen att ändra taktik därefter. Att använda denna typ av data kommer att tillåta polisavdelningar att interagera med samhället på ett mycket mer meningsfullt sätt, vilket också tillåter förebyggande arbete snarare än rehabiliterande arbete.

Nationell skala (1 000 000 till 100 000 000 personer)

På nationell nivå spelar regeringen en mycket större roll. Folkräkningsdata är överlägset lättast att skaffa. Många nationer offentliggör sina fynd från folkräkningen via webbplatser från vilka data kan laddas ner och visualiseras för vidare analys. "Dessutom genomför Världsbanken internationella undersökningar och sammanställer folkräkningsdata från alla deltagande nationer – en sorts one-stop-shop för information om dess medlemsländer. Dessa data är allmänt tillgängliga: de kan laddas ner och oberoende sorteras och analyseras. Viktigt! , erbjuder Världsbanken ett öppet API som gör det möjligt för programmerare att integrera olika data i mjukvaruapplikationer. Med hjälp av Världsbankens data har Google integrerat ett enkelt visualiseringsverktyg i sina sökresultat; en sökfråga på befolkningen i Botswana kommer att dra upp antalet, den daterade Världsbankens källa och en graf som visar befolkningsförändringar under decennier”. Ett annat sätt att samla in data är genom samtalsdatapost (eller samtalsdetaljregistrering) som bara är en logg över telefonsamtal och textmeddelanden med information som tid och plats för både den som ringer eller avsändaren och mottagaren. CDR:er tillåter telefonbolag att se trender inom mänsklig rörlighet. Stora dataföretag som Google, Facebook och Twitter tillåter också forskare att spåra kulturella trender och till och med när/var för tilldelning av resurser i tid för naturkatastrofer.

Global skala (100 000 000 till 7 000 000 000 personer)

Det största bekymret för världen är spridningen av sjukdomar och är en av verklighetsgruvornas bästa tillämpningar. Med globaliseringen är förmågan att resa oöverträffad jämfört med tidigare historia. FN har skapat en agenda kallad Millennium Development Goals (MDG) som är åtta mål som syftar till att förbättra världen. De samlar in befolkningsdata, det första steget för att möjliggöra policyskapande om sjukdomskontroll, nationer måste först samla in data om flygresor eftersom miljarder människor reser med flyg varje år och sjöresor. Flygresor transporterar fler människor varje år än sjötransporter, men den främsta anledningen till att samla in data om transporter är att transporter ofta bär skadedjur som bär på sjukdomar, livsmedelsburna sjukdomar och ibland invasiva arter av växter och djur. Idén att hantera och samla in verkar monumental, men Världsbanken har redan startat som hjälper statistisk programvara som MAPS som står för Marrakech Action Plan for Statistics. MAPS syftar till att slutföra sex mål, som inkluderar dessa tre;

  • Planera statistiska system och utarbeta nationella statistikutvecklingsstrategier för alla låginkomstländer
  • Att säkerställa fullt deltagande av utvecklingsländerna
  • Inrättar International Household Survey Network, en global samling hushållsbaserade socioekonomiska datamängder

För personer som reser på flyg är en datakälla International Air Transportation Association (IATA) som har samlat in data om cirka 90 % av den globala flygtrafiken på månadsbasis sedan 2000. Dessa data gjorde det möjligt för forskare och yrkesverksamma att se förmågan att sjukdom sprids från en viss plats på jorden. Fartyg bär cirka 90 % av den globala handeln; 2001 implementerades det automatiska identifieringssystemet för att registrera "sjötrafikens ankomst och färd".

Se även

Vidare läsning