Bouw LLM toepassingen die kloppen voor jouw business, omdat ze geworteld zijn in jouw eigen bronnen.

Bijna elke directie heeft inmiddels een generatieve AI demo gezien. Een chatbot op de kennisbank, een Copilot die een rapport opstelt, een LLM die contracten samenvat. Indrukwekkend op het scherm. Een halfjaar later is de demo vaak verdwenen, of draait hij nog op een handvol enthousiastelingen terwijl de rest weer is teruggegaan naar Word, Outlook en de oude zoekbalk.
Wij bouwen generatieve AI oplossingen die wel doorbouwen op die eerste demo. LLM toepassingen die gekoppeld zijn aan jullie eigen documenten, processen en kennisbronnen, met antwoorden die kloppen voor jullie business. Geen losse experimenten, maar oplossingen die de business dagelijks gebruikt en die over een jaar nog steeds doen wat ze beloofden.
McKinsey rapporteert in zijn State of AI onderzoek van 2024 dat 63% van organisaties die generatieve AI gebruiken inaccuraatheid als belangrijkste risico noemen, en dat 44% van organisaties daadwerkelijk negatieve gevolgen heeft ervaren door fouten in generatieve AI output. Tegelijkertijd laat het Stanford HAI AI Index rapport van 2025 zien dat hallucinatie percentages bij toonaangevende LLM's op standaard benchmarks nog steeds tussen de 3 en 20% liggen, en bij domein specifieke vragen zoals juridische queries oplopen tot 69 tot 88%.
Voor het MT betekent dat één ding. Een LLM die op zichzelf staat, los van jullie data, levert antwoorden die overtuigend klinken en feitelijk niet kloppen. Een MT lid dat van zo'n antwoord uitgaat in een besluit, neemt een risico waarvan hij of zij niet eens weet dat het er ligt. Een klantenservice medewerker die op zo'n antwoord vertrouwt, geeft de klant verkeerde informatie en draagt het risico van een onterechte belofte met zich mee.
Het verschil tussen een generatieve AI demo en een oplossing die in productie klopt zit zelden in het model. De modellen zijn breed beschikbaar, de prijzen dalen, de capaciteiten zijn vergelijkbaar geworden. Het verschil zit in de laag eromheen. Klopt je RAG architectuur, klopt je document kwaliteit, klopt je evaluatie ritme, dan kloppen de antwoorden. Klopt die laag niet, dan krijg je overtuigende onzin op schaal. Klopt je data, dan klopt je AI.
Onze aanpak voor generatieve AI bestaat uit vier samenhangende onderdelen. Soms doen we ze allemaal, soms één. We werken vanaf dag één met jouw mensen mee en dragen kennis over, zodat jullie het straks zelf kunnen.
Retrieval augmented generation is de standaard manier om een LLM te koppelen aan jullie eigen kennis. Niet door een model bij te trainen, maar door bij elke vraag de relevante documenten op te halen en mee te geven. Wij bouwen die laag waar hij hoort: vector store met de juiste embedding strategie, chunking afgestemd op jullie documenten, retrieval kwaliteit die we meten in plaats van aannemen. Voor vendor en tooling verdieping verwijzen we naar: RAG.
Een prompt is een stuk software dat versies heeft, getest moet worden en aangepast als de wereld eromheen verandert. Geen vrijdagmiddag werk van één enthousiasteling. Wij bouwen system prompts in versiebeheer, few shot examples die zijn gevalideerd op echte business cases, en structured output zodat machines verder kunnen met het antwoord. Niet spannend, wel het verschil tussen een toepassing die afdrijft en eentje die stabiel blijft draaien.
Bij een dashboard reken je de cijfers na. Bij een LLM antwoord moet je een ander mechanisme inrichten: hallucinatie detectie, relevantie, volledigheid, kosten en drift in kwaliteit. Wij bouwen evaluatie in vanaf dag één met LLM as a judge voor schaal en human in the loop voor de spannende cases. De bredere engineering laag eronder behandelen we op: AI engineering.
Een generatieve AI oplossing begint bij de taak, niet bij het model. Welke vraag wordt vaak gesteld, welke fout mag wel en welke niet, welke kosten zijn acceptabel bij schaal? Pas als dat scherp is, kies je de architectuur en het model. Soms is de uitkomst dat een LLM het juiste antwoord is, soms dat een eenvoudige zoekfunctie meer waarde levert tegen lagere kosten. Allebei zeggen we hardop.
Generatieve AI is breed inzetbaar, maar de productie waarde concentreert zich in een handvol hoofdvormen. Kennisontsluiting via een LLM op jullie eigen documenten. Document analyse en samenvatting van contracten, offertes en rapporten. Content generatie voor productteksten, marketing of intern materiaal. Klantenservice ondersteuning waarin de LLM eerste lijn antwoorden voorbereidt voor medewerkers. En code assistentie, waar engineering teams hun productiviteit zien stijgen.
In de vier sectoren waar wij vaak werken zien we per sector eigen patronen. In e commerce wordt generatieve AI ingezet voor productdata verrijking op schaal en reply suggesties voor klantenservice. In retail voor kennisontsluiting op de winkelvloer en het samenvatten van leveranciersrapporten voor inkoop. In zakelijke dienstverlening voor offerte voorbereiding, contract analyse en kennisontsluiting op jaren aan eerder werk. In financiële dienstverlening voor KYC dossier samenstelling, eerste lijn analyse van inkomende meldingen en compliance documentatie, altijd met audit trail en menselijk toezicht.
In al deze patronen geldt hetzelfde principe. De LLM neemt het routine deel, de mens neemt het besluit dat oordeel vraagt. De business case onderaan de streep komt zelden uit één spectaculaire toepassing, vaker uit consistente afhandeling op schaal.

In de markt loopt de terminologie door elkaar. Het maakt uit voor de productie eisen, de kosten en de governance, dus even kort het verschil.
Een generatieve AI oplossing gebruikt een LLM om tekst, antwoorden of content te genereren, vaak met een mens die het resultaat beoordeelt of accepteert. De LLM doet het zware werk, de mens blijft in de lead voor het besluit.
Een AI agent gaat een stap verder. Die handelt zelfstandig in een workflow, voert taken uit in jullie systemen en koppelt het resultaat terug. Een agent kan een LLM gebruiken voor het redeneren, maar dat maakt een LLM toepassing nog geen agent. Voor agents en de productie eisen die daarbij horen verwijzen we naar: AI agents
Een chatbot tot slot beantwoordt een vraag binnen een afgebakend gesprek, vaak met vooraf gedefinieerde antwoorden of intents. Niet elke chatbot gebruikt generatieve AI, en niet elke generatieve AI toepassing is een chatbot.
Het onderscheid maakt uit, want elke vorm vraagt om eigen ontwerp keuzes en eigen controles. Wie de drie door elkaar gebruikt, betaalt voor agent discipline op een chatbot, of zet een LLM toepassing in productie zonder de kwaliteit controles die hij eigenlijk nodig heeft.
Een generatieve AI oplossing die technisch werkt maar geen business taak raakt, mislukt. Een toepassing die een business taak raakt maar geen eigenaar heeft, ook. Wij denken in alle drie tegelijk. Onze mensen schakelen tussen MT kamer en LLM ontwerp zonder dat er een vertaler tussen hoeft.
Een LLM toepassing is zo goed als de bronnen waarmee hij werkt. Een model dat op een wankele kennisbank is aangesloten, levert overtuigend klinkende fouten. Daarom investeren wij eerst in de data laag en de documentkwaliteit eronder, en dan in de generatieve AI erbovenop. Geen modellen op een wankel fundament. Klopt je data, dan klopt je AI.
Een generatieve AI oplossing die alleen wij begrijpen, is geen asset maar een afhankelijkheid. Daarom documenteren we, bouwen we transparant en dragen we het eigenaarschap over aan jouw mensen. Zodra jouw team de prompts kan onderhouden, de evaluatie kan draaien en de RAG laag kan uitbreiden, hebben wij ons werk goed gedaan.
Eerlijk antwoord: niet altijd. Door de hype om AI, loont het om kritisch te kijken naar de business case. Voor sommige vragen is een goed ingerichte zoekfunctie of een fatsoenlijk gestructureerde kennisbank goedkoper, sneller en stabieler dan een LLM toepassing. Maar in deze situaties zien we dat een generatieve AI traject wel het verschil maakt.
- Jullie hebben een chatbot of Copilot pilot gedraaid die werkte op het scherm, maar krijgt hem niet in productie of de adoptie loopt niet
- De kennisbank is rijk gevuld, maar medewerkers en klanten vinden er nauwelijks het juiste antwoord in
- Er zijn meerdere Copilot of LLM licenties uitgerold in de organisatie zonder strategische samenhang, en niemand kan precies aanwijzen wat het oplevert
- Demo's leveren antwoorden op die overtuigend klinken en bij steekproef regelmatig niet kloppen, en niemand durft de stap naar productie te zetten
- Document werk in offerte, contract, compliance of klantdossier kost teveel tijd en het routine deel kan worden weggenomen
- Een generatieve AI oplossing moet straks vallen onder AI Act eisen, en de huidige experimenten zijn niet gebouwd met die eisen in gedachten
Komt iets je bekend voor? Dan loont een gesprek waarschijnlijk de moeite.
Een Data Impact Sessie duurt 90 minuten. Geen verkooppraatje, geen powerpoint van tachtig sliders. We schuiven aan, luisteren naar wat er speelt en laten zien waar generatieve AI bij jullie het meeste verschil kan maken. We nemen je mee in onze visie op hoe je een LLM toepassing van demo naar productie brengt, met concrete voorbeelden uit jullie sector.
We geven minimaal drie aanknopingspunten:
1. Welke generatieve AI use cases bij jullie het meeste rendement opleveren, en welke beter blijven liggen
2. Of jullie kennisbronnen en data laag klaar zijn om een RAG architectuur op te zetten, of dat dat fundament eerst aandacht vraagt
3. Wat een realistische volgorde is om jullie eerste generatieve AI oplossing in productie te krijgen
Hoe het gesprek ook eindigt, je gaat met deze aanknopingspunten naar huis.
Plan een: Data Impact Sessie
We werken met gevestigde namen en groeiende bedrijven in alle sectoren. Want data is overal.












Hoe we organisaties helpen betere keuzes maken met hun data.