FYI.

This story is over 5 years old.

Tech

Ik solliciteerde bij het onverbiddelijke algoritme van Unilever

In een klassiek sollicitatiegesprek kun je nog in discussie gaan. Een computer heeft zijn conclusie al getrokken.
Foto via Getty Images

Thank you for completing our online games. We regret to inform you that you have been unsuccessful on this occasion and have not met the desired scores in our games. We are sorry that we can't progress your application any further but competition for our Programme is intense and places are limited.

Na ronde twee van de sollicitatieprocedure voor een traineeship bij Unilever lig ik er al uit. Jammer, want ik had graag verder gekomen. Een video-interview met een algoritme? Dat zou de eerst keer worden. Ik was benieuwd of een algoritme zou kunnen bepalen of ik wel proactief genoeg was en er geen negent-tot-vijf-mentaliteit op nahield. Het mocht niet zo zijn. Computer says no.

Advertentie

Sinds twee jaar spreken sollicitanten voor een traineeship bij Unilever Nederland in de eerste drie ronden geen mensen meer. In plaats daarvan zitten ze tegenover een computerscherm. Het is de bedoeling dat dit selectieproces zorgt voor meer diversiteit. Kandidaten die vroeger niet langs de (al dan niet onbewuste) vooroordelen van de recruiter kwamen, zouden zo meer kans moeten krijgen om als trainee aan de slag te gaan. Mensen die solliciteren hoeven geen cv meer in te leveren. In ronde één vul je een aantal basisgegevens in. Heb je een master op zak? Spreek je Nederlands en Engels? Dan staat het licht op groen voor ronde twee. Met twaalf online spelletjes onderzoekt het algoritme van Pymetrics het leiderschapspotentieel van de kandidaten. Ze moeten onder andere een virtuele ballon opblazen, getallenreeksen onthouden en geld weggeven of juist afpakken. Ieder spelletje test of de kandidaat over bepaalde eigenschappen beschikt.

Jaïri Terpstra is talent advisor manager en employer branding lead Benelux bij Unilever. Ze legt uit hoe het algoritme kandidaten selecteert. "We hebben een aantal kenmerken opgesteld waaraan een leider volgens ons moet voldoen, zoals probleemoplossend vermogen, flexibiliteit en omgang met risico's. Per functie geldt een andere weging."

“Op dit moment is de accuraatheid van het algoritme 86 procent.”

Voor de functie van Future Leader Marketing, waar ik voor dit artikel voor solliciteer, is bijvoorbeeld van belang of je leert van je fouten, vertelt Terpstra. Pas je snel je gedrag aan? De score uit de spelletjes wordt door het algoritme naast de scores van twee controlegroepen gelegd. De ene groep bestaat uit aangenomen trainees en huidige senior leaders. De andere groep is een 'baseline-groep', die de uitgangswaarden voor het spel vertegenwoordigt. Het is zaak om zo dicht mogelijk bij de score van de eerste groep te komen.

Advertentie

Volgens het eigenschappenrapport dat me na afloop wordt opgestuurd, denk ik wel na nadat ik een fout maak, maar leer ik er weinig van. Mogelijk daardoor (het rapport zegt niet hoe hoog je moet scoren) mis ik het video-interview met een algoritme van Higher View. Deze software beoordeelt zowel de inhoud van het gesprek als de toon en de gelaatsuitdrukkingen van de sollicitant. Hij zou het bijvoorbeeld moeten opmerken als je vaak twijfelt of jokt. Dat gebeurt met patroonanalyse. De score van de kandidaten wordt door de computer vergeleken met de score van de huidige trainees.

"Wij weten welke potentiële antwoorden er zijn," legt Terpstra uit. "Daar koppelen we een voorspellende waarde aan. Ook aan het gedrag van de kandidaat wordt een voorspellende waarde toegekend. Na de derde ronde berekent het algoritme de kans dat de sollicitant geschikt is voor de functie." Op dit punt in de selectieprocedure is een dubbelcheck ingebouwd. Een menselijke recruiter bekijkt de video's van kandidaten met de hoogste scores. "Naarmate we de kinderziektes eruit filteren, komen de beoordelingen van de computer en de mens steeds dichter bij elkaar te liggen," zegt Terpstra. "Op dit moment is de accuraatheid van het algoritme 86 procent."

Het spelen van de spellen gaf me een gigantische adrenaline-rush. De software beloont je na iedere inspanning met een aanmoediging, zoals “Je laat je niet afleiden,” waardoor je denkt: ha, ik ga lekker!

Advertentie

Het spelen van de spellen gaf me een gigantische adrenalinerush. De software beloont je na iedere inspanning met een aanmoediging, zoals “Je laat je niet afleiden,” waardoor je denkt: ha, ik ga lekker! Wel betwijfel ik of het algoritme altijd meet wat het wil meten. Je moet bijvoorbeeld een aantal verhaaltjes lezen en dan aan de hand van een foto bepalen hoe het personage zich voelt. Volgens het eigenschappenrapport “reken ik op meer dan gezichtsuitdrukkingen om emoties te begrijpen,” maar volgens mij ben ik gewoon meer ingesteld op tekst dan op beeld. In een klassiek sollicitatiegesprek kun je over zoiets nog in discussie gaan met de recruiter. Een computer heeft zijn conclusie al getrokken.

Eén van de belangrijkste argumenten tegen sollicitatiesoftware is dat algoritmes niet zo neutraal zijn als we denken. Een recruitment-algoritme dat zoekt naar kandidaten voor een hoge functie, zou op basis van data bijvoorbeeld kunnen concluderen dat het beter naar een man kan zoeken. In het verleden zijn namelijk meer mannen dan vrouwen succesvol geweest in de functie.

“Vanzelfsprekend zijn we zelf het meest kritisch op het algoritme,” zegt Terpstra. “We doen dit juist om bias weg te halen. Het algoritme wordt voortdurend gevoed met nieuwe data. De prestaties van de huidige trainees vormen nieuwe input.”

Screenshot van een van de spelletje. Afbeelding via Pymetrics

In de Verenigde Staten en een aantal andere landen gebruikt Unilever de sollicitatiesoftware nu drie jaar. Levert het betere trainees op? Volgens Terpstra is het te vroeg om dat te zeggen. "Het zijn goede marketeers, maar of het betere leiders zijn dan voorheen? Een traineeship duurt drie jaar, dus ze zíjn nog geen leidinggevenden. Het levert in ieder geval diverse profielen op."

Advertentie

De etniciteit van de trainees in de Verenigde Staten blijkt aantoonbaar diverser dan vroeger. In Nederland is dat lastiger te meten, want onze privacywetgeving verbiedt het registeren van etniciteit door werkgevers. Wel staat vast dat er meer trainees zijn dan voorheen met een verrassende studieachtergrond. "We hadden bijvoorbeeld een goede match met een finance trainee die internationale betrekkingen heeft gestudeerd," vertelt Terpstra. "Die was er in het oude selectieproces waarschijnlijk niet doorheen gekomen."

Volgens het eigenschappenrapport “reken ik op meer dan gezichtsuitdrukkingen om emoties te begrijpen,” maar volgens mij ben ik gewoon meer ingesteld op tekst dan op beeld.

"Ontzettend gaaf" noemt ze het moment waarop de senior leaders voor het eerst kennismaken met de kandidaten. Dat gebeurt in de laatste ronde, die bij Unilever discovery centre day heet. "Onze assessoren krijgen geen cv's te zien. Er staan mensen voor hun neus die volgens de software tot het neusje van de zalm behoren. Dat vraagt om wat aanpassingen aan de kant van de assessoren."

De medewerkers moeten vertrouwen op het oordeel van een algoritme. Dat oordeel komt tot stand in een black box waar je als mens geen zicht op hebt. Daarom noemt Terpstra het interne vertrouwen in de procedure de grootste uitdaging. Ze zegt hierover: "We werken eraan. Dat doen we door zelf goed te snappen hoe het werkt en door veel uit te leggen. Bij sommige functies is het lastiger dan bij andere. Soms werkte het algoritme niet goed genoeg en moeten we het snel aanpassen. Maar per discovery centre day zien we het enthousiasme van de assessoren groeien. Diversiteit is mooi meegenomen, maar het vinden van toptalent is wat je wilt. Als dat lukt, zijn de twijfels weg."

Volg Motherboard op Facebook, Twitter en Flipboard.