Winston Wolfe
4 mei 2015 — By Mathias Vermeulen

Big Data in leren? Huh? (deel 1)

Onlangs waren we in Nederland op Next Learning 2015 en daar zagen we flarden van de keynote van Viktor Mayer-Schönberger over Big Data en leren. Toeval of niet, maar het weekend daarvoor hadden we net zijn overbekende boek over het thema gelezen… Maar wat is Big Data en zullen we er binnen leren überhaupt wel iets […]

Big Data revolutieOnlangs waren we in Nederland op Next Learning 2015 en daar zagen we flarden van de keynote van Viktor Mayer-Schönberger over Big Data en leren. Toeval of niet, maar het weekend daarvoor hadden we net zijn overbekende boek over het thema gelezen… Maar wat is Big Data en zullen we er binnen leren überhaupt wel iets mee kunnen aanvangen? Wij zijn voorlopig nog niet overtuigd. Spring je even mee op de hype-trein?

 

Big Data

Een goede definitie van big data vinden is niet evident. Volgens het gerespecteerde Gartner zijn er drie voorwaarden: hoeveelheid van gegevens, diversiteit van gegevens en de snelheid waarmee gegevens binnenkomen. Het gaat met andere woorden om een datastroom die we met onze excel-sheets niet meer kunnen bolwerken. En volgens Mayer-Schönberger komt het er vooral op neer dat het binnen Big Data draait rond de toepassingen op de gegevens. Via wiskundige methodes kunnen we makkelijker waarschijnlijkheden berekenen.

 

Een voorbeeldje

Enkele jaren geleden bevond de winkelketen Target zich temidden een kleine ‘rel’, nadat een vader kwaad een winkel was binnengelopen met enkele kortingsbonnen die zijn dochter gekregen had. De bonnen hadden allen te maken met kinderkleertjes en wiegjes, terwijl de jongedame in kwestie nog een tiener was. Er ontstond wat tumult, er kwamen verontschuldigingen van Target, tot enkele dagen later de vader zelf terug contact opnam met zijn verontschuldigingen. Zijn dochter verwachtte immers effectief een kindje!

big dataHet meisje was ontmaskerd doordat Target gigantische stukken klanteninfo had gecombineerd: online-verlanglijstjes, winkelgewoontes van zwangere klanten, bepaalde andere kooppatronen, … Alles kwam (en komt nog steeds) in de Big Data blender. Uit het zwangerschapsverhaal bleek bijvoorbeeld dat zwangere vrouwen na zo’n drie maanden geurloze producten (lotion, zalf, …) aankopen. Bovendien kopen ze in de eerste twintig weken specifieke voedingssupplementen en halen ze kort voor de geboorte washandjes in huis. En zo kwamen nog een aantal patronen naar boven bij zwangere vrouwen…

Dus, van zodra Target dergelijke patronen detecteert bij vrouwelijke klanten, gaan ze uit van een mogelijke zwangerschap en kunnen ze gerichter gaan adverteren en kortingsbonnen uitdelen. Tot een vader woest de winkel binnenstormt natuurlijk.

 

Belangrijk om weten

In het ganse Big Data verhaal zijn er twee aspecten die we steeds voor ogen moeten houden. Ten eerste vertellen de data enkel maar wat. Voor de hoe en de waarom moet je nog steeds zelf gaan zorgen. Met andere woorden, big data kunnen een aantal patronen bepalen, zonder een verklarende of verduidelijkende factor.

Dat brengt ons naadloos bij het tweede aspect: causaliteit versus correlatie. Doordat Big Data enkel de wat in beeld brengen, kunnen ze onmogelijk verklarende causale verbanden blootleggen. De kracht van Big Data ligt daarentegen in het feit dat ze correlaties tussen bepaalde items kunnen gaan bepalen. Zoals zwangere vrouwen die na drie maanden geurloze shampoo kopen. Is er een causaal verband tussen zwangerschap en geurloze shampoo? Hoegenaamd (en hopelijk) niet, maar in de gigantische stroom aan gegevens merkte Target wel op dat er een correlatie bestond tussen de twee.

 

Leren? Iemand?

Dat Big Data, los van de hype die er momenteel heerst, volop hun nut kunnen hebben, staat zeer goed omschreven in het boek van Mayer-Schönberger. Maar als we even de vertaalslag naar leren maken, dan raken wij voorlopig niet verder dan de theoretische mogelijkheden. Uit een hoeveelheid gegevens van onze medewerkers bepaalde patronen gaan zoeken om voorspellend tewerk te gaan: waar ze leren, wanneer ze leren, op welke manier ze leren, … Het zou in principe allemaal moeten kunnen. Zo hebben we in het bovenstaande voorbeeldje enkele zaken gewijzigd:

“Het leerpatroon van de betrokken medewerker werd blootgelegd doordat Winston Wolfe gigantische stukken leerinfo had gecombineerd: Yammerdiscussies, e-learningmodules, activiteit op sociale media, performance reviews, leeftijd, functie, … Alles kwam (en komt nog steeds) in de big data blender. Hieruit bleek bijvoorbeeld dat nieuwe medewerkers na zo’n drie maanden e-learning links laten liggen en zich stilaan klaar voelen voor een actieve rol op Yammer. Bovendien stagneert performance bij een lage activiteit op sociale media en blijkt dat leeftijd geen invloed heeft op het tijdstip van leren. Dus, van zodra Winston Wolfe dergelijke patronen detecteert, kunnen ze gerichter gaan adviseren en begeleiden.”

dilbert big data

Leuk, uitermate boeiend, weliswaar ietwat Big Brother-achtig… Maar er gaapt volgens ons alsnog een grote kloof tussen theoretische mogelijkheden zoals hierboven en de omzetting in de praktijk, zeker binnen een discipline als Learning & Development. Maar hiervoor verwijzen we graag naar deel 2 van onze blog over Big Data en leren. Eerst moeten we nog uitdokteren waarom de B en D van Big Data telkens met een hoofdletter geschreven moeten worden.

En voor we het vergeten: May The Fourth Be With You!