Large Language Models zijn overal. De druk vanuit management om "iets met AI te doen" is groot, en LLMs voelen als de meest zichtbare uiting van die AI-revolutie. Maar als automation-architect zie ik ook de nadelen van ongenuanceerde inzet: foutieve uitkomsten in kritieke processen, databeveiligingsproblemen, en enorme rekeningen bij cloudproviders. Dit artikel geeft een eerlijk beeld van wanneer LLMs waarde toevoegen — en wanneer niet.

Kernboodschap: Een LLM is geen vervanging voor een deterministisch algoritme. Het is een aanvulling voor taken waar taal, context, en nuance vereist zijn. Gebruik de juiste tool voor de juiste taak.

Wat LLMs goed kunnen — en wat niet

Geschikt voor LLM
  • Samenvatten van lange teksten of documenten
  • Classificeren van ongestructureerde tekst (e-mails, klachten)
  • Extractie van entiteiten uit vrije tekst
  • Genereren van eerste concepten (brieven, rapporten)
  • Vertalen en herschrijven van tekst
  • Beantwoorden van veelgestelde vragen via FAQ-bot
  • Sentiment-analyse van klantteksten
Niet geschikt voor LLM
  • Precieze berekeningen (gebruik een calculator)
  • Realtime datums, koersen, live informatie
  • Juridisch bindende beslissingen zonder menselijke controle
  • Taken waar 100% consistentie vereist is
  • Verwerking van gevoelige persoonsgegevens via publieke API
  • Hoge-volume transactieverwerking (te duur, te traag)

De drie meest waardevolle toepassingen in de praktijk

1. E-mail triage en classificatie

Een van de meest effectieve toepassingen die wij implementeren: automatische classificatie van inkomende e-mails. Een LLM leest de e-mail en bepaalt de categorie (klacht, vraag, bestelling, escalatie), de urgentie, en de verantwoordelijke afdeling. Bij Coolblue verwerken we zo 5.000+ mails per dag — zonder dat een medewerker de volledige mail hoeft te lezen voor de routeringsbeslissing.

Belangrijk: het LLM beslist niet over de afhandeling. Het bepaalt alleen de routing. Een medewerker handelt de daadwerkelijke mail nog steeds af, maar dan wel de juiste persoon, direct.

2. Documentextractie uit ongestructureerde bronnen

Contracten, facturen, vergunningsaanvragen — veel documenttypen hebben een vaste structuur maar worden aangeleverd in vrije tekst. Een LLM kan betrouwbaar specifieke velden extraheren (bedragen, datums, namen, referentienummers) die vervolgens worden doorgezet naar gestructureerde systemen.

De kracht: het werkt ook voor documenten die afwijken van de standaard template — iets waar traditionele OCR-modellen moeite mee hebben.

3. Eerste-concept generatie voor communicatie

Medewerkers die tientallen klantbrieven per dag schrijven, besteden veel tijd aan tekst die sterk op elkaar lijkt. Een LLM kan op basis van de zaakdetails een eerste concept genereren dat de medewerker nog controleert en aanpast. Dit halveert de schrijftijd zonder de menselijke kwaliteitscontrole te verwijderen.

De echte gevaren: wat je moet weten

Hallucinaties en de gevolgen in bedrijfsprocessen

LLMs kunnen zelfverzekerd foutieve informatie presenteren — dit wordt "hallucineren" genoemd. In een conversatiechbot is dit vervelend. In een financieel of juridisch bedrijfsproces kan het catastrofaal zijn. Stel dat een LLM een factuurbedrag verkeerd extraheert en dat bedrag wordt direct doorgeboekt zonder controle.

De oplossing: gebruik LLMs nooit als eindpunt van een kritiek proces. Bouw altijd een validatiestap in, hetzij geautomatiseerd (schema-validatie, rangecontrole) hetzij menselijk (uitzondering bij lage confidence-score).

Dataprivacy bij cloudgebaseerde LLMs

Als je een LLM-API van een externe provider (OpenAI, Anthropic, Google) aanroept met bedrijfsdata, verlaat die data jouw omgeving. Dit is een serieus AVG-risico als de data persoonsgegevens bevat. Mogelijke oplossingen:

Let op: De gratis en standaard betaalde tiers van de meeste LLM-providers gebruiken jouw data standaard voor modeltraining. Dit is niet acceptabel voor bedrijfsdata. Gebruik altijd enterprise-tier of verifieer het databeleid expliciet.

Kosten bij hoog volume

LLM-API's rekenen per token. Bij lage volumes (honderden aanroepen per dag) zijn de kosten verwaarloosbaar. Bij hoge volumes (tienduizenden aanroepen per dag) kunnen de kosten snel oplopen naar honderden euro's per maand. Bereken de kosten van tevoren op basis van het verwachte volume en vergelijk dat met de waarde die het oplevert.

Het beslismodel: LLM of deterministisch?

Stel jezelf deze vragen:

  1. Is de input gestructureerd en voorspelbaar? → Gebruik regelgebaseerde logica
  2. Is 100% nauwkeurigheid vereist zonder menselijke fallback? → Gebruik een deterministisch systeem
  3. Bevat de input vrije tekst, nuance of context? → LLM kan waarde toevoegen
  4. Is er een menselijke controle-laag aanwezig voor de output? → LLM is verantwoord in te zetten

In de praktijk is het antwoord vaak: een combinatie. Deterministische stappen voor gestructureerde verwerking, LLM alleen voor de taalcomponent, en menselijke validatie voor kritieke beslissingen. Dat is geen compromis — dat is de juiste architectuur.

Mijn advies: Begin met een pilot op een niet-kritisch process. Meet de nauwkeurigheid, de kosten, en de gebruikerstevredenheid. Schaal pas op als je data hebt. En wees eerlijk over de beperkingen — zowel intern als naar je klanten.