Een kijk in het brein van zelflerende algoritmes
Waarom moeten computers leren?
Sinds het ontstaan van de vierde industriële revolutie zijn we zeer afhankelijk geworden van computers en van algoritmes, die allerlei taken uit onze handen nemen. We denken daarbij aan de verwerking van enorme hoeveelheden gegevens en aan beslissingen en voorspellingen die computers genereren op basis van deze gegevens. Wij mensen nemen misschien niet altijd de beste beslissingen en soms misschien zelfs ronduit verkeerde beslissingen, toch zijn wij in staat om verschillende resultaten tegenover elkaar af te wegen en om redeneringen en keuzes te maken rond de meeste dagelijkse situaties. Sinds onze geboorte ontwikkelen de netwerken in onze hersenen zich onafgebroken, wat we vaak als uiterst vanzelfsprekend zien. Het zijn echter deze netwerken die ons toelaten om complexe of abstracte situaties te ontwarren, zonder dat we daar uitgebreide trainingen voor moeten volgen.
Er gaat heel wat programmeerwerk aan vooraf vooraleer computers juiste beslissingen en juist advies kunnen geven. Maar niet alleen programmeerwerk, ook veel opleiding, testen, opnieuw testen, aanpassingen, nog aanpassingen enzovoort. Pas dan kunnen we erop vertrouwen. Eigenlijk kan je een computer vergelijken met een extreem langzame student. Het leerproces gaat dan misschien wel traag, maar eens ze het met een vrij grote betrouwbaarheid ‘doorhebben’, zijn computers in staat om extreme aantallen onbenoemde gegevens in een mum van tijd te verwerken, iets waar het menselijke brein nooit toe in staat zal zijn.
Artificiële intelligentie is, zoals bekend, het resultaat van uiterst ontwikkelde zelflerende systemen. De vrees dat artificiële intelligentie massaal onze jobs zal inpalmen, blijkt grotendeels ongegrond te zijn, hetgeen allesbehalve betekent dat we zelflerende computers als een zoveelste techno-hype moeten beschouwen. De meeste algoritmes achter zelflerende computers kunnen we in drie categorieën opsplitsen: gecontroleerde systemen, ongecontroleerde systemen en versterkende systemen. Hierna lees je wat elk van deze mechanismes kunnen doen.
Gecontroleerde systemen
Zoals de naam aantoont, heeft deze vorm van zelflerende computer een bepaalde controle nodig van zelflerende modellen, ook wel bots genoemd. Hiervoor moet het model “opgeleid” worden (dus gevoed worden met kennis), zodat het kan leren wat er van hem verwacht wordt. Binnen deze gecontroleerde opleiding onderscheiden we twee aparte modellen: classificatie (indeling van toegewezen gegevens) en regressie (voorspellingen van toekomstige resultaten op basis van trends in toegewezen gegevens). Beide modellen gaan uit van de kennis van de gegevens waar ze in deze gecontroleerde omgeving mee te maken hebben en het leerproces bestaat uit regelmatige testen.
Ongecontroleerd leren
In tegenstelling tot een gecontroleerd leersysteem, wordt dit systeem door niemand gecontroleerd en werkt het volledig zelfstandig. Het model, of de bot, gaat zelf op zoek naar informatie, die al dan niet zichtbaar is voor het menselijke oog of het menselijke brein. Ongecontroleerde leersystemen gaan uit van zelflerende algoritmes om conclusies of voorspellingen te maken op basis van pakketten van niet-toegewezen gegevens. De grootste sterkte van zo’n systeem is dan ook het vinden van patronen en tendensen in een reeks onbekende gegevens.
Het verschil tussen deze twee belangrijkste vormen van zelflerende systemen is dat de ongecontroleerde variant veel ingewikkelder is en (uiteraard) minder gecontroleerd. Dit komt doordat de bots weinig of geen informatie bezitten over de gegevens waar ze naar zoeken. Eigenlijk zit het verschil er dus in of ze gegevens al dan niet toewijzen.
Versterkende leersystemen
Sommige gesofisticeerde zelflerende algoritmes zijn noch gecontroleerd, noch ongecontroleerd. Het gaat om “deep learning” of versterkend leren, wat in een “agent – situatie”-omgeving werkt; wat betekent dat de agent een bepaalde situatie ontvangt. Als antwoord op deze situatie creëert de agent acties die betrekking hebben op de situatie en zo wordt er dus permanente feedback geleverd. De acties worden gestuurd op basis van beloningen. Het zorgt ervoor dat de situatie bij elke interactie versterkt wordt door de agent, aangezien het constant op zoek gaat naar “beloningen” en dus naar verbeteringen.
De grootste ontwikkelingen binnen artificiële intelligentie moeten we vandaag binnen ongecontroleerde en versterkende leersystemen zoeken. Deze twee systemen zijn in staat om onvoorspelbare patronen te ontwarren uit data, wat uiteraard handig kan zijn voor de mens. Data betekent macht, zeker in een wereld die op data draait.
Copywriter: Ina Danova & Arjan Kwakkenbos