AI goed embedden in je organisatie? Denk eens aan business rules

AI is hot. In iedere (virtuele) boardroom valt het woord regelmatig en de tijd is voorbij dat je de term eerst voluit moest schrijven om duidelijk te maken waar je het over hebt. Er zijn bovendien al duizenden kant-en-klare algoritmen die je soms gratis en soms tegen betaling kunt gebruiken. Niets staat bedrijven in de weg om een start te maken, zou je zeggen. Toch boeken lang niet alle organisaties succes met AI. Dat komt doordat de kwaliteit van de data en de context waarin de data is verzameld de kwaliteit van de AI-uitkomsten bepaalt. ‘Garbage in is garbage out’. Je zult dus een manier moeten vinden om controle te houden over de data die je gebruikt.

Bedrijven denken vaak dat een groot datakwaliteitsproject de enige manier is om controle te krijgen over de data. Zo’n project is tijdrovend en duur, en daarom beginnen velen er maar niet aan. Toch is het wel belangrijk om vooraf inzicht te hebben in niet alleen de kwaliteit van data (juistheid, compleetheid, actualiteit), maar ook in zaken als gebruikte definities, de context waarin data zijn gegenereerd en de wijze waarop data worden genoteerd (wordt bijvoorbeeld een vijf- of een zevenpuntsschaal gebruikt voor een bepaalde meting; is de temperatuur vastgelegd in Celsius of Fahrenheit?). Want als verschillende bronnen andere definities gebruiken of de data zijn verzameld in een andere context, dan heb je een enorme berg appels en peren die je niet met elkaar kunt vergelijken.

Business rules engine selecteert de geschikte data

 

Het is daarom belangrijk om AI op de juiste manier in je organisatie te embedden en helderheid te creëren over de kwaliteit van data voordat je ze gaat gebruiken in allerlei analyses. Een relatief onbekende methode om dat te doen, is het toepassen van business rules. Business rules zijn ideaal om in heldere, begrijpelijke taal te zeggen hoe de bedrijfsvoering moet gaan. Daarmee bereik je tevens een grote kwaliteit en inzichtelijkheid van de data die die bedrijfsvoering ondersteunen. Dat is de kwaliteit die je nodig hebt om AI-algoritmen succesvol toe te passen.

Voor iedere eis aan de data stel je een business rule op. Ook aan alle databronnen die je gebruikt geef je kenmerken mee: in welke context is de data verzameld? Wat bedoelen we met een bepaalde term? Welke meetmethode is gebruikt om een waarde vast te leggen? En ga zo maar door. Zodra je een AI-algoritme loslaat op de dataset, zorgt een business rules engine ervoor dat in je analyse alleen die data wordt meegenomen die aan de door jouw opgestelde business rules voldoen. Op die manier voorkom je dat je eerst een heel groot datakwaliteitsproject moet optuigen voordat je kunt starten met AI. Je gebruikt gewoon alle data die er is en de business rules engine bepaalt aan de hand van de regels die je zelf hebt opgesteld welke data wel en niet worden meegenomen in een specifieke analyse.

 

Eenduidig begrip van wat bepaalde data betekenen

Met deze methode garandeer je ook dat iedereen die iets met de data gaat doen, begrijpt wat de data betekenen. Dat ligt namelijk vast in de business rules en deze zijn opgesteld in heldere, voor iedereen begrijpelijke taal. In veel organisaties zijn er geen eenduidige datadefinities. De ene afdeling verstaat iets anders onder een term als ‘uitval’ of ‘klant’ dan een andere, waardoor je data uit verschillende systemen nooit in samenhang kunt analyseren. Leg je echter over die systemen een business rules engine, dan dwing je af dat verschillende afdelingen of gebruikers met elkaar in gesprek gaan over de betekenis van data in hun systemen. Voldoet de data aan de gestelde voorwaarden? Welke data mag wel en welke niet worden meegenomen in een analyse?

‘Business Rules engine dwingt af dat verschillende afdelingen met elkaar in gesprek gaan”.

 

Datageneuzel wegnemen

 

We verduidelijken het aan de hand van een voorbeeld. Een medisch onderzoeker wil onderzoek doen naar situaties die hartkloppingen bij patiënten uitlokken. Hij heeft toegang tot wel 30 verschillende databases met hartslagdata van geanonimiseerde patiënten: databases van IC-afdelingen, databases met data van holteranalyses (een kastje waarmee patiënten vrij kunnen rondlopen terwijl ze worden gemonitord) en ook data die mensen zelf verzamelden met een hartslagmeter. Voor deze onderzoeker is het heel belangrijk om te weten in welke context en met welk type device de data is verzameld. In business rules kan hij exact vastleggen aan welke regels data moeten voldoen om te worden meegenomen in een specifieke analyse. Hij hoeft niet vooraf alle databronnen te controleren, hij kan zich beperken tot het vastleggen van de eigenschappen van de data in de database. Als die eigenschappen voldoen aan de business rules die hij heeft opgesteld, dan worden die data meegenomen in de analyse en anders worden deze buiten beschouwing gelaten. Op die manier verkort hij de tijd die hij kwijt is met ‘datageneuzel’ aanzienlijk. Hij hoeft namelijk niet meer ieder veld apart te controleren, maar kan volstaan met het vaststellen van de betekenis van de data in een bepaalde rij of kolom en het stellen van regels. Bijvoorbeeld: als in een rij een veld leeg is, dan wordt die hele rij niet meegenomen in de analyse. Of: de waarde van dit veld mag niet hoger zijn dan x of lager dan y. Op die manier voorkomt hij dat bijvoorbeeld typefouten, zoals een komma op de verkeerde plaats, de analyse verstoren.

 

Houd het overzicht door gebruik van menselijke taal

De grote meerwaarde van deze aanpak is dat de mensen die iets met de data willen doen, zelf de eisen aan de data kunnen stellen. Voer je deze administratie in een analytics-omgeving als R, dan raken de gebruikers van de data al snel het overzicht kwijt. Want in R staat data in een vorm die geschikt is voor het algoritme. Dat is een vorm die data scientists misschien wel begrijpen, maar gebruikers niet. De gebruikers zijn echter de domeindeskundigen die moeten aangeven welke data wel of niet moeten worden meegenomen in een analyse. Het risico is dan groot dat door afstemmingsproblemen toch verkeerde data worden meegenomen, bijvoorbeeld hartslagdata van smart watches terwijl het onderzoeksdoel is om hartkloppingen bij patiënten in rust te onderzoeken.

Deze aanpak heeft een grote meerwaarde, omdat mensen die iets willen doen, zelf de eisen aan de data kunnen stellen.

 

Begin klein en ‘grow as you go

 

Een ander groot voordeel van een business rules aanpak is dat je klein kunt beginnen, met slechts een paar datatypes waar je regels voor opstelt. Je hoeft dan niet op voorhand al torenhoge investeringen te doen, maar hanteert een ‘grow as you go’-scenario. Dat is aantrekkelijk, want iedere organisatie heeft wel processen waarvan alle betrokkenen weten dat deze efficiënter of effectiever kunnen worden ingericht, maar waar niets aan gebeurt omdat de oplossing weliswaar ‘ergens in de data’ verscholen ligt, maar er geen kant-en-klare oplossing is waarmee je het antwoord boven water kunt krijgen. Denk bijvoorbeeld aan complexe spreadsheets die maar door een paar mensen echt begrepen worden, planningen van verschillende afdelingen die niet goed op elkaar worden afgestemd of beslissingen die toch steeds maar weer worden genomen op basis van onderbuikgevoelens, terwijl er in wezen data genoeg voorhanden zijn om een meer rationele beslissing te nemen. In deze situaties kun je heel klein beginnen met een business rules aanpak, met misschien maar twee of drie typen data die je in samenhang analyseert. De kans is groot dat de inzichten die je daaruit opdoet inspireren tot nieuwe analyse-ideeën, waar je weer nieuwe databronnen voor nodig hebt. Zo groeit het vanzelf, zonder dat het meteen grote investeringen vergt en je mensen volledig vrij moet maken voor dit project.

Kortom, wil je de governance op AI vanaf het begin goed inrichten en de complexiteit rondom het voeren van de administratie van data reduceren? Denk dan eens aan een business rules aanpak.

 

Dit artikel is ook gepubliceerd in AG Connect, 11-2020.

 

Over

 

HANS CANISIUS

Sinds februari 2020 CEO bij USoft en helpt organisaties bij het ontwikkelen en verbeteren van hun kernprocessen met het USoft low-code digitaliseringsplatform. Hij beschikt over 15 jaar ervaring op het snijvlak van operatie en IT bij nationale en internationale organisaties. Hans is afgestudeerd in Business Management & Technology en heeft een Master in International Business Strategy & Innovation.

 

FRANK RIJNDERS

CTO bij USoft. Met zijn 30 jaar ervaring richt hij zich met name op het combineren van verschillende low-codetechnieken en het vinden van efficiënte oplossingen voor diverse vraagstukken. Frank heeft een achtergrond in de vastestoffysica en is gepromoveerd in de fysische informatica.

Written by: Hans Canisius
CEO

Related posts