Klantsegmentatie wordt vaak toegepast door bedrijven. Het doel van
segmentatie is het opdelen van klanten in groepen, en dient om beter in
te spelen op verschillen tussen klanten. In deze blog beschrijf ik wat
mis kan gaan als segmentatie wordt uitgevoerd door de mens of computer.
Ook komt een nieuwe segmentatie-analyse van Datall aan bod die een
oplossing biedt voor problemen met bestaande analyses.

Het wat en waarom van klantsegmentatie
Klanten verschillen
van elkaar. Bij segmentatie worden klanten opgedeeld in groepen aan de
hand van deze verschillen. Als input voor segmentatie worden
klanteigenschappen genomen. Het doel is groepen zodanig samen te stellen
dat klanteigenschappen binnen een groep zoveel mogelijk overeenkomen,
terwijl de verschillen tussen segmenten zo groot mogelijk zijn.
Door
segmentatie is een bedrijf in staat klantgroepen gedifferentieerd te
benaderen, waarbij beter rekening gehouden wordt met verschillen in
eigenschappen, voorkeuren en wensen. Zodoende krijgt ieder segment een
specifieke klantbenadering wat betreft verkoopmethodiek, marketing,
productaanbod en service. Resultaat van deze gedifferentieerde benadering: meer tevreden klanten.
Het
vinden van segmenten gebeurd bij bedrijven (1) op basis van “gezond
verstand” of “onderbuikgevoel”, of (2) met behulp van een wiskundige
analyse (zogenaamde clusteranalyse) op een computer. Maar waarin
verschillen nu deze twee manieren van elkaar, en welke verdient de
voorkeur?

Zit het wel goed met dat “gezond verstand”?
Uit de
besliskunde-literatuur is bekend dat “gezond verstand” in beslis- en
beoordelingstaken niet altijd even accuraat is (voor een uitgebreid
overzicht zie Gilovich, Griffin en Kahneman 2002). In taken waarin
mensen (met name experts) wordt gevraagd voorspellingen te doen, zijn
computermodellen bijna altijd evengoed en zelfs beter. Bijvoorbeeld,
Grove en collega’s (2000) namen 136 onderzoeken onder de loep waarin
voorspellingen van experts werden vergeleken met die van
computermodellen. In slechts 8 van deze onderzoeken waren mensen beter
dan computers in het genereren van voorspellingen. Computermodellen
lijken ondermeer beter te zijn wanneer het gaat om het voorspellen van
(a) succes bij het opstarten van een bedrijf, (b) prestatiesucces van
werknemers en (c) succesvol leiderschap/management.
Bij deze
voorspellingstaken draait het dikwijls om het combineren van
verschillende eigenschappen (bijvoorbeeld leeftijd en opleidingsniveau).
Bij segmentatie is dit niet anders. In veel gevallen beschik je als
bedrijf voor iedere klant over scores op verschillende
klanteigenschappen. Dit kan informatie zijn over bijvoorbeeld
“aankoopfrequentie” of “branchetype”. Al deze gegevens tezamen zijn
meestal verzameld in een database (of CRM-systeem). Door rekening te
houden met meerdere klanteigenschappen tegelijk worden vaak de beste
segmenten gevonden.
De sterkte van computermodellen ligt erin dat zij
vaak beter dan mensen verschillende klanteigenschappen kunnen
combineren om tot de juiste interpretatie te komen. Bij segmentatie valt
het dus te betwijfelen of je als mens met “gezond verstand” of
“onderbuikgevoel” beter gaat zijn dan een computermodel.

Is mijn onderbuikgevoel dan helemaal verkeerd?
Wat in de
praktijk opvalt is dat bedrijven zich bij “onderbuikgevoel-segmentatie”
regelmatig baseren op slechts één klanteigenschap (bijvoorbeeld
“branchetype”). Daarbij is het is niet zo dat bedrijven niet op de
hoogte zijn van verschillende andere klanteigenschappen, alleen laten ze
deze buiten beschouwing bij segmentatie.
Dit richten op slechts één eigenschap lijkt trouwens veel op een verschijnsel dat optreedt bij de free sorting task in
psychologisch onderzoek. Bij deze categorisatietaak wordt personen
gevraagd verschillende objecten naar eigen inzicht te groeperen. De
objecten in dit soort taken zijn ieder beschreven aan de hand van
meerdere kenmerken. Wat vertellen de resultaten van deze
categorisatietaak? Veelal vormen personen categorieën door het
toepassen van een uni-dimensionale regel (Eysenck en Keane, 2000). Dat
wil zeggen: Categoriseren gebeurt op basis van slechts één kenmerk
(jongens bij de jongens, meisjes bij de meisjes). Dit laatste resultaat
stemt opvallend veel overeen met wat gebeurd bij
“onderbuikgevoel-segmentatie” bij bedrijven.
Helaas schuilt er een
gevaar in bij segmenteren op basis van slechts één kenmerk. Indien
alleen rekening wordt gehouden met één kenmerk, en niet met meerdere
tegelijk, dan kunnen twee nadelen optreden.

  1. Binnen één
    segmentatiegroep kunnen verschillende groepen worden onderscheiden.
    Echter, alleen door rekening te houden met meerdere klanteigenschappen
    tegelijk zullen deze verschillende groepen worden opgemerkt.
    Bijvoorbeeld, een bedrijf segmenteert haar klanten op basis van alleen
    “branchetype” en komt zodoende tot de segmenten “overheid”, “zakelijke
    dienstverlening” en “financiële dienstverlening”. Echter, na verloop van
    tijd vermoedt het bedrijf dat binnen het segment “overheid” meerdere
    groepen kunnen worden geïdentificeerd, met ieder hun eigen wensen en
    eisen wat betreft klantbenadering. Juist door geen rekening te houden
    met deze verschillende groepen binnen het segment “overheid” is een
    nadelig effect opgetreden: Een grote groep ontevreden klanten.
  2. Verschillende segmenten zoals “financiële dienstverlening” en “zakelijke
    dienstverlening” vertonen zoveel overeenkomsten op meerdere kenmerken
    dat ze eigenlijk als één groep kunnen worden gezien. Toch kiezen voor
    twee aparte klantbenaderingen resulteert in een verspilling van
    belangrijke resources (bijvoorbeeld kosten die gemoeid zijn met het
    invoeren van twee aparte marketingstrategieën en productgroepen terwijl
    maar één nodig is).

Maar wanneer gaat het mis met computermodellen?
Nu rijst de
vraag: Zit het wel altijd goed met die computermodellen? Een veel
gebruikt computermodel voor segmentatie is clusteranalyse. Maar ook aan
deze clusteranalyse kleeft een probleem. Het probleem met clusteranalyse
is namelijk hoe het omgaat met categorische variabelen. Een voorbeeld
van een categorische variabele is “branchetype” met een onderverdelingen
in “overheid”, “zakelijke dienstverlening” en “industrie”. Een
tegenhanger van dit type variabele is de numerieke variabele
(bijvoorbeeld “leeftijd”). Bij het opnemen van categorische variabelen
in een clusteranalyse (zoals het k-means/k-medoid algoritme) zie je vaak
dat deze de segmentatie sturen en domineren (Wielinga, 2007). Dit komt
erop neer dat de segmentatie-analyse voornamelijk aandacht richt op
categorische variabelen, terwijl andere (numerieke) variabelen niet of
nauwelijks worden meegenomen in het vormen van segmenten.
Het
domineren van categorische variabelen is iets waar niet alle analisten
van op de hoogte zijn wanneer ze een clusteranalyse uitvoeren. Maar de
gevolgen van deze dominerende variabelen op segmentatie zijn even funest
als bij “onderbuikgevoel-segmentatie”: De “juiste” segmenten worden
niet altijd gevonden, waardoor verschillende klantgroepen niet altijd de
juiste klantbenadering krijgen.
Eén mogelijke oplossing* voor de
dominerende variabelen is ze gewoonweg weglaten uit de analyse. Maar dit
weglaten is niet altijd even wenselijk. Daarom heeft Datall een analyse
ontwikkeld die in staat is op gepaste wijze met categorische variabelen
om te gaan. Bij deze analyse wordt een wiskundige methode toegepast
waardoor categorische variabelen niet langer de segmentatie domineren.
Een belangrijk gevolg hiervan is dat andere (numerieke) variabelen ook
invloed krijgen op de vorming van segmenten. Daardoor is deze analyse
daadwerkelijk in staat meerdere variabelen te combineren, in plaats van
zich te richten op alleen categorische variabelen. Door dit combineren
van meerdere eigenschappen wordt de kans groter dat de “juiste”
segmenten worden gevonden. Voor deze “juiste” segmenten kan een
klantbenadering worden uitgedacht waar alle klanten binnen een segment
tevreden mee zullen zijn.
Daarnaast stelt de analyse per segment een
handig profiel samen. Deze profielen geven de karakteristieke
eigenschappen per segment weer en zijn nuttig voor het uitdenken van een
doordachte klantgroepbenadering.

Meer informatie?
Wilt u meer informatie over de door
Datall ontwikkelde segmentatie-analyse? Neem dan contact op met Datall
(tel: 06 413 00 472; email: info at datall-analyse.nl) of raadpleeg www.datall-analyse.nl.

dr.ing. Stefan Gelissen
data-analist en analyse-ontwikkelaar bij Datall

*Wielinga (2007) stelt nog een andere oplossing voor, namelijk:
Bij categorische variabelen voor iedere categorie een aparte
clusteranalyse uitvoeren. Deze oplossing brengt echter ook de nodige
problemen met zich mee. Voor een toelichting van deze problemen kunt u
contact opnemen met de auteur van deze blog.

Gebruikte literatuur

  • Eysenck, M., & Keane, M., 2000. Cognitive psychology (pp. 294-295). Psychology press, East Sussex.
  • Gilovich, T., Griffin, D., & Kahneman, D. (Eds.), 2002.
    Heuristics and biases: The psychology of intuitive judgment. Cambridge
    University Press, Cambridge (UK).
  • Grove, W.M., Zald, D.H., Lebow, B.S., Snitz, & B.E., Nelson,
    C., 2000. Clinical versus mechanical prediction: a meta-analysis.
    Psychological Assessment, 12, 19-30.
  • Wielinga, D., 2007. Identifying and Overcoming Common Data
    Mining Mistakes, Paper 073-2007, SAS Global Forum: Data Mining and
    Predictive Modeling.