Hoe zijn jouw algoritmes gevoed?

door | 27-08-2020

Stel, je organisatie werkt datacentrisch. Dan heb je een belangrijke stap gezet, maar je bent er nog niet.

Want als jij al die data wil inzetten om de klanten beter te bedienen, moet je er de juiste conclusies uit kunnen trekken. Een lastige zaak, zelfs voor geharde experts, en dus laten organisaties dat vaak over aan algoritmes. Echter, die algoritmes moet je wel voeden met de juiste datasets.

Hoe bepaal je de kans dat mensen een lening terugbetalen? Het is een vraag waar veel financiële instellingen mee worstelen, en daarom deed een Nederlandse bank een experiment.

Daar lieten ze twee systemen schaduwdraaien naast elkaar”, vertelt Lieke van Sprundel. “Aan de ene kant zat het gebruikelijke team van experts die de aanvraag beoordeelden op de gebruikelijke criteria, en aan de andere kant draaide een algoritme, dat met dezelfde criteria was gevoed. En wat bleek? Het voorspellend vermogen van dat algoritme was veel hoger.” 

Van Sprundel is Sales Director Data & Artificial Intelligence bij Microsoft, en de uitkomst komt voor haar niet als een verrassing. “Het aantal criteria bij zo’n aanvraag is gigantisch. Bovendien, het gewicht van die criteria wisselt met het soort lening dat je afsluit. Dat is zelfs voor intelligente menselijke experts veel te complex, maar een algoritme heeft hier weinig moeite mee.”
 

Grondstof

Het onderstreept volgens haar de uitdaging van deze tijd. 

“Organisaties verzamelen steeds meer data, en steeds meer zien ze die als een essentiële grondstof. Maar aan de andere kant, die data vormen niet meer dan dat: een grondstof. Wil je er gebruik van maken, dan moet je al die gegevens kunnen interpreteren. Dat zie je nu bijvoorbeeld gebeuren in ziekenhuizen. Daar stapelen de data zich op: de lichaamsfuncties als bloeddruk, en hartfunctie van de patiënt, maar ook de medicijnen die hij heeft geslikt en eerdere behandelingen die al dan niet succesvol waren. Een algoritme kan die moeiteloos met elkaar combineren, en dat is niet alles. Het is tegenwoordig zelfs in staat begrijpend te lezen, en dus werkt het zich met hoge snelheid door alle verslagen van bijvoorbeeld eerdere operaties.” 

Het klinkt ideaal, maar het kent ook een keerzijde. Organisaties moeten rekening houden met ethische uitgangspunten en voorwaarden. Wat als het algoritme ons een lening weigert, en niemand kan uitleggen waarom? Of, nog vervelender, wat als die beslissing alleen blijkt gebaseerd op onze postcode, ons opleidingsniveau of zelfs op onze huidskleur? Dat is iets wat je altijd moet voorkomen, vindt Van Sprundel, en volgens haar is dat de verantwoordelijkheid van de organisatie die het algoritme inzet. “Hoe geavanceerd de techniek ook is, de kwaliteit van het algoritme is altijd afhankelijk van de datasets waarmee je het voedt. Als die alleen maar gebaseerd zijn op de wijk waarin je woont, krijg je natuurlijk een gekleurd beeld. Dan werkt dat computerprogramma niet beter dan een mens met vooroordelen: daar heb je er weer zo een!”

Datasets

Door goede afspraken te maken en uitgangspunten te formuleren kan er goed gebruik worden gemaakt van algoritmes. “Allereerst is het heel belangrijk dat je kunt uitleggen hoe het algoritme tot zijn beslissing is gekomen. Voor een groot aantal algoritmes is dat al  mogelijk: je kunt dat visueel maken in een zogenoemde netwerkgrafiek, een soort spinnenwebje, en daarin zijn alle criteria zichtbaar. Bovendien moet zo’n algoritme altijd worden gevoed met zoveel mogelijk datasets. in het geval van die leningaanvraag: gebaseerd op het volledig aantal ondernemers in Nederland, of op meerdere beroepen, meerdere achtergronden. Dan haal je die gekleurde bril weg.”

Een laatste aandachtspunt dan: hoe zit het met de kwaliteit van die data? Volgens Van Sprundel is hier discussie over. “Natuurlijk, die kwaliteit is belangrijk, maar volgens sommige experts hoef je je daar geen zorgen over te maken. Zij adviseren om heel veel datasets te gebruiken, en zo heel veel volume te maken. De kwaliteit van die data gaat dan automatisch omhoog.”

 

 

FutureXL is trotse partner van Microsoft

Download de Brochure Digital Leadership

Lieke van Sprundel

Lieke van Sprundel is Sales Director Data & Artificial Intelligence bij Microsoft

Andere FXL Views

Vind je dit een interresant artikel?
Meld je dan nu bij ons aan en mis geen enkele FXL View meer!
Share This
X