Betere uitkomsten krijgen uit AI?

Betere uitkomsten krijgen uit AI? Controleer de datakwaliteit met business rules

In welke organisatie ligt er niet ergens een plan op de plank waar de termen ‘big data’ of ‘data driven’ in voorkomen? Of het nu gaat om het targetten van nieuwe klantgroepen, predictive maintenance of process mining, uiteindelijk komt het allemaal op hetzelfde neer: je wilt data, die nu als onderdeel van het proces in één of ander systeem wordt opgeslagen, benutten om betere beslissingen te nemen.

Voorspellende waarde AI is nihil als datakwaliteit niet deugt

Veel bedrijven zien de waarde van het beter inzetten van data. Alleen blijft het te vaak bij mooie buzzwords en oneliners van CTO’s en CIO’s. En dat komt doordat het nogal een strijd is om, wanneer je met je poten in de modder staat, alle soorten data effectief bij elkaar te brengen en daarbij kwaliteit en integriteit te garanderen. Dit deel van het vakgebied is niet sexy, maar absoluut noodzakelijk. Want als je data gaat gebruiken om betere beslissingen te nemen, valt of staat de kwaliteit van de beslissing met de kwaliteit van de data.

Veel organisaties die beginnen met artificial intelligence (AI) komen erachter dat die patronen die zij in hun data ontdekken te weinig voorspellende waarde hebben omdat de onderliggende data van onvoldoende kwaliteit zijn. Of de ontwikkelde algoritmes beloven veel goeds tijdens de bouw, maar in de realiteit blijkt de data toch in kwaliteit te variëren. Immers: ‘garbage in is garbage out’. Je kunt begripsmatig nog zulke prachtige AI-algoritmen ontwikkelen, de voorspellende waarde is nihil als de datakwaliteit en data-integriteit niet deugen.

 

Datakwaliteit en data-integriteit garanderen is lastig

En die kwaliteit deugt al snel niet als data uit heterogene bronnen bij elkaar wordt gebracht. Data zijn zelden juist, volledig en actueel. Daar kom je vaak pas achter als je data uit verschillende bronnen wilt samenvoegen, want dan zie je dat de data niet consistent is. Ook gebruiken verschillende systemen vaak andere definities voor dezelfde term. In het ene systeem is een klant iemand die een factuur heeft betaald, in het andere systeem worden ook bedrijven die een opdracht hebben verstrekt, maar nog geen factuur hebben ontvangen, tot de klanten gerekend. En het derde systeem telt ook doodleuk de prospects mee.

 

Leg in business rules je datakwaliteitseisen vast

Wil je niet alleen maar leuke AI-algoritmen ontwikkelen, maar daar ook resultaten uit krijgen van een voorspelbare en bruikbare kwaliteit, dan kan een rules engine waardevol zijn. Je hebt dan een manier om data eerst op te schonen en consistent te maken in plaats van dat je enorme datakwaliteitsprojecten opzet om data in bestaande legacy-systemen op te schonen. In de business rules leg je vast aan welke eisen de data moet voldoen om te worden gebruikt voor analysedoeleinden. In deze rules engine kun je ook de AI-algoritmen integreren. Want AI-algoritmen zijn niets anders dan complexe regels die worden toegepast op een grote set data.

Nu denken veel organisaties misschien: ‘een rules engine? Die heb ik helemaal niet.’ Maar dat is geen probleem, want een rules engine inrichten is zeker niet complexer dan het werk dat traditioneel in de realisatie van informatiesystemen gaat zitten. Terwijl deze aanpak op het gebied van datakwaliteit en data-integriteit grote voordelen met zich meebrengt.

 

Hoe werkt het in de praktijk?

We beschrijven hoe het werkt aan de hand van een productiebedrijf dat wil starten met predictive maintenance. Dit bedrijf gebruikt een Enterprise Asset Management (EAM)-systeem waarmee het onderhoud op de machines wordt ingepland en geregistreerd. Als deze fabriek wil beginnen met predictive maintenance, kan het een rules engine gebruiken die zich richt op het vroegtijdiger identificeren dat een machine onderhoud nodig heeft. Dat doe je in vier stappen:

  1. Je legt in de rules engine alle regels vast rond preventief onderhoud. Bijvoorbeeld de regel dat een machine minimaal één keer per jaar wordt stilgezet voor groot onderhoud.
  2. Daarna bepaal je welke data je nodig hebt om te identificeren of een machineonderdeel al eerder onderhoud nodig heeft. Denk bijvoorbeeld aan data over de onderhoudsgeschiedenis, het aantal draaiuren van de machine sinds de laatste onderhoudsbeurt, storingen die bij dit type machine vaak voorkomen en data van sensoren (Industrial IoT) die trillingen kunnen meten of die kunnen waarnemen dat de machine meer lawaai gaat maken.
  3. Je legt in de rules engine ook business rules vast die uitdrukken welke datakwaliteit de data moet hebben om te worden gebruikt.
  4. En je voegt tot slot het algoritme dat data scientists hebben ontwikkeld toe aan je rules engine. Want een AI-algoritme is niets meer of minder dan een business rule in je rules engine.

 

Op deze manier integreer je AI op een kwalitatief hoogwaardige manier in je proces, zonder dat je een complexe integratie moet bouwen tussen je back end systeem en AI. En zonder dat je vooraf alle bronsystemen moet controleren op datakwaliteit.

Wil je meer weten over hoe je met een business rules aanpak de datakwaliteit kunt garanderen als je met AI aan de slag gaat? Neem dan contact met ons op.

Written by: USoft

Related posts

Low-code no-code day 6 oktober 2020

Low-code no-code day 6 oktober 2020

Low-code no-code day 2020: Hoe de business zelf innovatie kan versnellen   USoft is aanwezig op het low-code no-code congres op dinsdag 6 oktober 2020 van AG connect. We ontmoeten je graag!   De kansen van low-code De vraag naar IT-toepassingen vanuit de...