Upplyftande modellering
Uplift-modellering , även känd som inkrementell modellering , sann lyftmodellering eller nettomodellering är en prediktiv modelleringsteknik som direkt modellerar den inkrementella effekten av en behandling (som en direktmarknadsföringsåtgärd) på en individs beteende.
Uplift-modellering har applikationer inom kundrelationshantering för merförsäljning, korsförsäljning och retentionsmodellering. Det har också tillämpats på politiska val och personlig medicin . Till skillnad från det relaterade konceptet Differential Prediction inom psykologi, antar Uplift Modeling en aktiv agent.
Introduktion
Uplift-modellering använder en randomiserad vetenskaplig kontroll för att inte bara mäta effektiviteten av en åtgärd utan också för att bygga en prediktiv modell som förutsäger det inkrementella svaret på åtgärden. Svaret kan vara en binär variabel (till exempel ett webbplatsbesök) eller en kontinuerlig variabel (till exempel kundintäkter). Uplift-modellering är en datautvinningsteknik som huvudsakligen har använts inom branschen för finansiella tjänster, telekommunikationer och direktmarknadsföring i detaljhandeln för att öka försäljningen , korsförsäljningen , churn och behålla aktiviteter.
Mätning av lyftning
Upplyftandet av en marknadsföringskampanj definieras vanligtvis som skillnaden i svarsfrekvens mellan en behandlad grupp och en randomiserad kontrollgrupp . Detta gör att ett marknadsföringsteam kan isolera effekten av en marknadsföringsåtgärd och mäta effektiviteten eller inte av den enskilda marknadsföringsåtgärden. Ärliga marknadsföringsteam tar bara åt sig äran för den inkrementella effekten av deras kampanj.
Men många marknadsförare definierar lyft (snarare än upplyft) som skillnaden i svarsfrekvens mellan behandling och kontroll, så upplyftsmodellering kan definieras som att förbättra (upphöja) lyft genom prediktiv modellering.
Tabellen nedan visar detaljerna för en kampanj som visar antalet svar och beräknad svarsfrekvens för en hypotetisk marknadsföringskampanj. Denna kampanj skulle definieras som en ökning av svarsfrekvensen på 5 %. Det har skapat 50 000 inkrementella svar (100 000 - 50 000).
Grupp | Antal kunder | Svar | Svarsfrekvens |
---|---|---|---|
Behandlad | 1 000 000 | 100 000 | 10 % |
Kontrollera | 1 000 000 | 50 000 | 5 % |
Traditionell responsmodellering
Traditionell responsmodellering tar vanligtvis en grupp behandlade kunder och försöker bygga en prediktiv modell som skiljer de troliga svararna från de som inte svarar genom att använda en av ett antal prediktiva modelleringstekniker . Vanligtvis skulle detta använda beslutsträd eller regressionsanalys .
Denna modell skulle bara använda de behandlade kunderna för att bygga modellen.
Däremot använder uplift-modellering både de behandlade och kontrollkunderna för att bygga en prediktiv modell som fokuserar på det inkrementella svaret. För att förstå denna typ av modell föreslås det att det finns en grundläggande segmentering som separerar kunder i följande grupper (deras namn föreslogs av N. Radcliffe och förklarades i )
- The Persuadables : kunder som bara svarar på marknadsföringsåtgärden för att de var inriktade
- The Sure Things : kunder som skulle ha svarat oavsett om de var inriktade på dem eller inte
- The Lost Causes : kunder som inte svarar oavsett om de är inriktade på dem eller inte
- Stör ej eller sovande hundar : kunder som är mindre benägna att reagera eftersom de var inriktade på
Det enda segmentet som ger verkliga inkrementella svar är Persuadables .
Uplift-modellering ger en poängteknik som kan separera kunder i grupperna som beskrivs ovan.
Traditionell responsmodellering är ofta inriktad på att Sure Things inte kan skilja dem från Persuadables .
Avkastning på investeringar
Eftersom upplyftsmodellering enbart fokuserar på inkrementella svar, ger den mycket stark avkastning på investeringsfall när den tillämpas på traditionella efterfrågegenererings- och bibehållandeaktiviteter. Till exempel, genom att endast rikta in sig på de övertygande kunderna i en utgående marknadsföringskampanj , kan kontaktkostnaderna och därmed avkastningen per utgiftsenhet förbättras dramatiskt.
Avlägsnande av negativa effekter
En av de mest effektiva användningarna av upplyftande modellering är att ta bort negativa effekter från retentionskampanjer. Både inom telekommunikations- och finansbranschen kan ofta retentionskampanjer få kunder att säga upp ett avtal eller en policy. Uplift-modellering gör att dessa kunder, Stör ej, kan tas bort från kampanjen.
Tillämpning på A/B och multivariat testning
Det är sällan så att det finns en enda behandlings- och kontrollgrupp. Ofta kan "behandlingen" vara en mängd enkla varianter av ett meddelande eller en kontaktstrategi i flera steg som klassas som en enda behandling. I fallet med A/B- eller multivariattestning kan upplyftsmodellering hjälpa till att förstå om variationerna i tester ger någon betydande ökning jämfört med andra inriktningskriterier som beteendemässiga eller demografiska indikatorer.
Historia om upplyftsmodellering
Den första uppkomsten av äkta responsmodellering verkar vara i Radcliffes och Surrys arbete.
Victor Lo publicerade också om detta ämne i The True Lift Model (2002), och senare Radcliffe igen med Using Control Groups to Target on Predicted Lift: Building and Assessing Uplift Models ( 2007).
Radcliffe tillhandahåller också ett mycket användbart avsnitt med vanliga frågor (FAQ) på sin webbplats, Scientific Marketer. Lo (2008) ger en mer allmän ram, från programdesign till prediktiv modellering till optimering, tillsammans med framtida forskningsområden.
Oberoende upplyftsmodellering har studerats av Piotr Rzepakowski. Tillsammans med Szymon Jaroszewicz anpassade han informationsteorin för att bygga flerklassiga upplyftningsbeslutsträd och publicerade uppsatsen 2010. Och senare under 2011 utökade de algoritmen till fall med flera behandlingar.
Liknande tillvägagångssätt har undersökts inom personlig medicin . Szymon Jaroszewicz och Piotr Rzepakowski (2014) designade upplyftningsmetodik för överlevnadsanalys och tillämpade den på randomiserad kontrollerad försöksanalys. Yong (2015) kombinerade en matematisk optimeringsalgoritm via dynamisk programmering med maskininlärningsmetoder för att optimalt stratifiera patienter.
Uplift-modellering är ett specialfall av det äldre psykologiska konceptet Differential Prediction. I motsats till differentiell förutsägelse förutsätter höjningsmodellering en aktiv agent och använder höjningsmåttet som ett optimeringsmått.
Uplift-modellering har nyligen utökats och införlivats i olika maskininlärningsalgoritmer , som induktiv logikprogrammering , Bayesian Network , Statistisk relationsinlärning , Support Vector Machines , Survival Analysis och Ensemble learning .
Även om upplyftsmodellering används allmänt i marknadsföringspraxis (tillsammans med politiska val), har det sällan förekommit i marknadsföringslitteraturen. Kane, Lo och Zheng (2014) publicerade en grundlig analys av tre datamängder med hjälp av flera metoder i en marknadsföringstidskrift och gav bevis för att ett nyare tillvägagångssätt (känd som Four Quadrant Method) fungerade ganska bra i praktiken. Lo och Pachamanova (2015) utökade upplyftsmodellering till föreskrivande analys för flera behandlingssituationer och föreslog algoritmer för att lösa stora deterministiska optimeringsproblem och komplexa stokastiska optimeringsproblem där uppskattningarna inte är exakta.
Ny forskning analyserar prestandan för olika toppmoderna upphöjningsmodeller i benchmarkstudier med hjälp av stora datamängder.
En detaljerad beskrivning av upplyftsmodellering, dess historia, sättet upplyftsmodeller är uppbyggda, skillnader mot klassisk modellbyggnad samt lyftspecifika utvärderingstekniker, en jämförelse av olika mjukvarulösningar och en förklaring av olika ekonomiska scenarier finns här.
Genomföranden
I Python
I R
Andra språk
- upplyftspaket för R
- JMP av SAS
- Portrait Uplift av Pitney Bowes
- Upplyftningsnod för KNIME av Dymatrix
- Uplift Modeling i Miró av Stochastic Solutions
Datauppsättningar
- Hillstrom e-postmarknadsföringsdatauppsättning
- Criteo Uplift Prediction dataset
- Lenta Uplift Modeling Dataset
- X5 RetailHero Uplift Modeling Dataset
- MegaFon Uplift Competition Dataset