Survival analysis is een wiskundige analyse die ondermeer
voorspelt wanneer een gebeurtenis (bijv. opzeggen van abonnement) gaat
plaatsvinden.
In deze blog geef ik eerst een korte uitleg van
survival analysis aan de hand van voorbeelden uit de medische wereld en
engineering. Vervolgens passeren enkele toepassingen de revue die
betrekking hebben op klantgedrag (zoals “klantbehoud” en “terugwinnen
van klanten”).
Duidelijk zal worden dat de analyse twee belangrijke vragen beantwoordt: (1) wie van de klanten gaat bepaald gedrag vertonen (bijv. opzeggen abonnement) en (2) wanneer in de loop van de tijd gaan
deze klanten dit gedrag vertonen. Door deze twee eigenschappen bewijst
survival analysis in de praktijk keer op keer haar nut bij het adequaat
reageren op klantgedrag.

Wat is survival analysis?
Survival analysis is een wiskundige methode die helpt bepalen of en wanneer
een gebeurtenis gaat plaatsvinden. Tevens gaat deze analyse na in welke
mate bepaalde factoren de timing van een gebeurtenis beïnvloeden. Het
volgende praktijkvoorbeeld maakt snel duidelijk wat de analyse doet.

Praktijkvoorbeeld
In sommige medische studies wordt
onderzocht wat het effect is van een behandeling op de
levensverwachting. Met andere woorden, beïnvloedt de behandeling hoelang
iemand leeft bij een levensbedreigende ziekte? Survival analysis is één
van de meest gebruikte methoden om aan te tonen of een behandeling
daadwerkelijk invloed heeft op de levensverwachting. Onderstaande
grafiek illustreert hoe de analyse het effect in beeld brengt van
hormonale therapie op de levensverwachting bij borstkanker*.


(klik hier voor een grotere weergave van de afbeelding)

De grafiek toont dat bij een groter aantal positieve lymfeklieren
(d.w.z. klieren die kankercellen bevatten) de levensverwachting daalt.
Maar bij eenzelfde aantal positieve lymfeklieren (bijv. 20) is de
levensverwachting groter indien hormonale therapie wordt toegepast. Dit
is te zien in de grafiek: De rode lijn (therapie) ligt boven de blauwe
(geen therapie) wat duidt op een grotere levensverwachting bij hormonale
therapie.
In dit voorbeeld maakt survival analysis dus duidelijk wat
de invloed is van factoren (therapie/aantal positieve lymfeklieren) op
de timing van een gebeurtenis (hoelang een persoon met borstkanker
overleeft).
Ook op het gebied van engineering wordt survival analysis
toegepast. Zo wordt deze analyse ondermeer gebruikt om te onderzoeken
hoe verschillende temperatuursomstandigheden de levensduur van een motor
beïnvloeden. Hierdoor kom een engineer te weten wanneer een motor het
begeeft bij een bepaalde bedrijfstemperatuur.
Maar niet alleen binnen
de medische wetenschap en engineering wordt survival analysis gebruikt,
ook op het gebied van klantgedrag levert deze analyse een significante
bijdrage.

Klantbehoud
Klanten die hun abonnement opzeggen of contract
niet verlengen gaan verloren voor een bedrijf. Ook klanten die na
verloop van tijd nooit meer bestellingen plaatsen zijn verloren klanten.
Toch
ligt thans meer en meer de nadruk op het behouden van bestaande
klanten. Daar zijn tal van redenen voor op te noemen. Vaak duurt het
bijvoorbeeld een hele poos voordat nieuwe klanten evenveel afnemen als
bestaande klanten.
Survival analysis is van belang voor bedrijven die
actief bezig zijn met klantbehoud. Deze analyse is namelijk in staat te
voorspellen wanneer bepaalde klanten het bedrijf verlaten (zogenaamde
churners). Met deze voorspellingen in de hand kan een bedrijf proactief
reageren op churners. Nog voordat churners daadwerkelijk het bedrijf
gaan verlaten worden ze (proactief) benaderd. De kunst daarbij is
toekomstige churners tijdig te belonen zodat ze toch klant blijven. Dit
kan bijvoorbeeld door ze een aanbieding te doen.

Maar waarom nu zo moeilijk doen en precies willen voorspellen wanneer
een klant het bedrijf verlaat? Waarom niet gewoon wachten tot een klant
daadwerkelijk weggaat en dan pas een aanbieding doen? Dit achteraf
reageren op churners heeft nadelen. Blattberg, Kim en Neslin (2008)
suggereren bijvoorbeeld dat pas achteraf reageren op churners een
bepaald leereffect bij deze groep tot gevolg heeft. Deze groep gaat
namelijk het verband inzien tussen beloning en churn. Om deze beloning
in de wacht te slepen zullen churners keer op keer gaan dreigen het
bedrijf te verlaten en over te stappen naar de concurrent.

Niet alleen voorspelt survival analysis wie en wanneer,
het brengt ook in kaart welke factoren een belangrijke rol spelen bij
klantbehoud. In het bovenstaande voorbeeld met borstkanker toonde de
analyse al aan hoe de levensverwachting beïnvloed werd door factoren als
(1) het aantal positieve lymfeklieren en (2) hormonale therapie.
Zo
ook kan de analyse bepalen in welke mate specifieke factoren hun
uitwerking hebben op klantbehoud. Bijvoorbeeld, voor een verzekeraar zal
de analyse duidelijk maken of een factor als “aantal aangeschafte
producten” van invloed is op klantbehoud. Daarbij wordt verondersteld
dat hoe meer verschillende verzekeringproducten lopen bij de
verzekeraar, des te groter de kans dat een klant langer blijft.
Bevestigt de analyse dit verband, dan kan een verzekeraar overwegen de
nadruk te leggen op het verkopen van meerdere producten bij één en
dezelfde klant. Immers, op die manier blijven klanten langer behouden.

Andere toepassingen van survival analysis
Survival analysis
kent buiten klantbehoud tal van andere toepassingen op het gebied van
klantgedrag. Deze analyse is nuttig als de vragen wie en wanneer kunnen worden gesteld. Bijvoorbeeld:

  • Tijd tussen aankopen – Bij herhalingsaankopen van
    hetzelfde product (bijvoorbeeld koffie) kan de tijd tussen aankopen
    worden gemodelleerd. Door de analyse wordt ondermeer duidelijk in welke
    mate factoren (zoals gezinsgrootte en prijsverschil) van invloed zijn op
    de tussenaankooptijd.
  • Heractiveren van abonnement (terugwinnen van klanten) – Bij
    het opzeggen van een abonnement kan het zijn dat een klant na verloop
    van tijd dit toch weer heractiveert. Survival analysis brengt in kaart
    welke factoren maken dat klanten na verloop van tijd hun abonnement
    heractiveren. Een bedrijf kan overwegen op deze factoren in te spelen om
    klanten snel terug te winnen.

Heterogeniteit: Verschillen tussen klantgroepen
Vaak is het
raadzaam om bij het modelleren en voorspellen van klantgedrag rekening
te houden met verschillen tussen klantgroepen (zogenaamde
heterogeniteit). Zo ook bij het toepassen van survival analysis. Nemen
we eens “heractiveren van een abonnement” onder de loep. Er zullen
klanten zijn die na verloop van tijd het abonnement daadwerkelijk
heractiveren. Maar er zal ook een groep zijn die nooit en te nimmer het
abonnement heractiveert. We kunnen dus twee groepen onderscheiden die
zich ieder verschillend gedragen in de loop van de tijd: (1)
heractiveren en (2) niet heractiveren.
Houdt survival analysis
rekening met dergelijke verschillen tussen groepen? De “traditionele”
survival analysis niet. Eén van de aannames bij deze analyse is namelijk
dat iedereen uiteindelijk een specifieke gebeurtenis zal ondergaan. Bij
“heractiveren” betekent dit dat de analyse veronderstelt dat iedere
verloren klant uiteindelijk het abonnement heractiveert. Deze aanname
klinkt niet plausibel in de oren, juist vanwege het zonet beschreven
verschil tussen de twee groepen wat betreft wel/niet heractiveren.

Mixed cure models: Modelleren van verschillen tussen klantgroepen
Recentelijk is een type survival analysis in opkomst dat wel geschikt is als het gaat om dit soort verschillen tussen groepen: Mixed Cure Model.
Simpelweg, dit model gaat uit van twee groepen die van elkaar
verschillen in gedrag. Daarbij veronderstelt het model dat één groep de
gebeurtenis zal ondergaan (wel heractiveren) terwijl de andere deze
nooit ondergaat (niet heractiveren). Tevens bepaalt het voor de eerste
groep (wel heractiveren) wanneer deze gebeurtenis gaat plaatsvinden.

Een toepassing binnen de bankwereld van het mixed cure model wordt
beschreven door Teng, Kim & Thomas (2012). Bij kredietverstrekking
bestaat de kans dat bepaalde consumenten het krediet niet aflossen
(zogenaamde defaults). Maar ook is er een groep die het krediet wél
binnen de gestelde termijn aflost. Teng en zijn collega’s wilden met het
model in kaart brengen (1) wie wel/niet tot de defaults-groep gaat
behoren en (2) hoelang duurt het voordat een default stopt met
terugbetalen.
De analyseresultaten tonen ondermeer dat factoren als
“bezit van een huis” en “hogere frequentie bij terugbetalen” resulteren
in een kleiner risico dat iemand tot de defaults-groep behoort.
Tegelijkertijd geldt voor de defaults-groep dat mensen die individueel
een lening afsluiten (single loan) een groter gevaar lopen om eerder te
stoppen met terugbetalen dan personen die gezamenlijk een lening
afsluiten (joint loan).

Naar mijn mening zijn ook op het gebied van marketing interessante
toepassingen te vinden van het mixed cure model. Maar tot op heden lijkt
dit een onontgonnen gebied. Het eerder besproken “heractiveren van
abonnement” is een kandidaat als het gaat om mogelijke toepassingen. In
die context zal het model ondermeer helder maken welke factoren bepalen
of een klant wel/niet ooit heractiveert. Hierbij kan gedacht worden aan
factoren als “aantal doorgegeven klachten tijdens abonnementsperiode”.
Wellicht is het zo dat bij meer klachten het risico stijgt dat een klant
gaat behoren tot de groep “nooit heractiveren”. Maar dit is iets waar
het mixed cure model over zal moeten beslissen.
In ieder geval zullen
de door het mixed cure model geïdentificeerde factoren van waarde zijn
bij het invullen van toekomstig klantbeleid.

Meer informatie?
Wilt u meer informatie over het toepassen van survival analysis of het mixed cure model? Neem dan contact op met Datall (tel: 06 413 00 472; email: info at datall-analyse.nl) of raadpleeg www.datall-analyse.nl.

dr.ing. Stefan Gelissen
data-analist en analyse-ontwikkelaar bij Datall

* Data is afkomstig van Peters, A., en Hothorn, T. (2012). ipred: Improved Predictors. R package version 0.8-13, URL http://cran.r-project.org/web/packages/ipred/

Gebruikte literatuur

  • Blattberg, R.C., Kim, B., & Neslin S.A. (2008). Database marketing. Springer, NewYork.
  • Teng, E.N.C., Mues, C., & Thomas, L.C. (2012). Mixture cure models in credit scoring: If and when borrowers default. European journal of operational research, 218, 132-139.