In het kort
- Modelbeheer (MLOps) draait om versioneren, traceren, uitrollen en monitoren — niet alleen om trainen.
- MLflow is de open-source standaard voor experiment-tracking; W&B blinkt uit in visualisatie en samenwerking.
- SageMaker en Vertex AI zijn complete cloudplatforms, maar binden je aan AWS respectievelijk Google.
- Begin klein met tracking en een modelregister; bouw governance en monitoring uit naarmate je groeit.
De meeste AI-projecten lopen niet vast op het bouwen van een model, maar op alles eromheen: welke versie draait er eigenlijk in productie, met welke data is hij getraind, en hoe weet je of hij nog goed presteert? Zonder antwoord op die vragen wordt een veelbelovend model al snel een black box die niemand durft aan te raken.
Modelbeheer — vaak MLOps genoemd — is het vakgebied dat hier grip op geeft. Deze pagina legt uit wat erbij komt kijken, waar je op let, en vergelijkt de bekendste platforms, van open-source tot complete cloudoplossingen.
Wat valt er onder modelbeheer?
Modelbeheer omvat de hele levenscyclus van een model, niet alleen de training. De kernonderdelen:
- Experiment-tracking — vastleggen welke instellingen, data en code tot welk resultaat leidden, zodat je het kunt reproduceren.
- Modelregister — een centrale plek waar modelversies staan, met status (in test, in productie, afgekeurd).
- Deployment — het model betrouwbaar uitrollen als API of batchproces, vaak geautomatiseerd.
- Monitoring — bewaken of het model in productie nog presteert, en signaleren van drift (de echte data wijkt af van de trainingsdata).
- Governance — wie mag wat, welke data is gebruikt, en voldoet het aan regels — steeds belangrijker onder de EU AI Act.
Waarom raken modellen 'stuk' in productie?
Een model dat in de test schitterde, kan in productie stilletjes verslechteren. De belangrijkste oorzaak is drift: de wereld verandert, maar het model niet. Veranderen klantgedrag, prijzen of seizoenen, dan klopt de aanname waarop het model getraind is niet meer.
Zonder monitoring merk je dat pas als het misgaat — een aanbeveling die nergens op slaat, een fraudedetectie die te veel mist. Goed modelbeheer signaleert die afwijking vroeg, zodat je op tijd kunt hertrainen. Het is het verschil tussen een model dat je vertrouwt en een dat je hoopt dat het nog werkt.
Open-source of een compleet cloudplatform?
Grofweg zijn er twee routes, en de keuze hangt af van je schaal en je cloudstrategie:
- Open-source bouwstenen (MLflow, en aanvullend Hugging Face voor modellen) — flexibel, geen leveranciersbinding, je houdt zelf de regie. Vraagt wel meer eigen werk om alles aan elkaar te knopen.
- Beheerde platforms (SageMaker, Vertex AI, Databricks) — alles geïntegreerd, van training tot deployment en monitoring. Sneller op gang, maar je raakt verbonden aan één cloud en de kosten kunnen oplopen.
Veel teams beginnen met MLflow voor tracking en een register, en groeien pas naar een volledig platform als de schaal en governance-eisen dat rechtvaardigen.
MLOps-platforms vergeleken
| Platform | Open-source | Cloud-gebonden | Sterkste punt | Beste voor | |
|---|---|---|---|---|---|
| MLflow | Ja | Nee | Tracking + modelregister | Flexibele teams | Bekijk → |
| Weights & Biases | Beperkt | Nee | Visualisatie & samenwerking | Onderzoek & R&D | Bekijk → |
| Hugging Face | Beperkt | Nee | Modellen delen & hosten | LLM's & open modellen | Bekijk → |
| Databricks | Beperkt | Beperkt | Data + ML in één | Data-zware bedrijven | Bekijk → |
| Google Vertex AI | Nee | Ja (GCP) | End-to-end op GCP | Google-cloud teams | Bekijk → |
| Amazon SageMaker | Nee | Ja (AWS) | End-to-end op AWS | AWS-cloud teams | Bekijk → |
Let op: de 'beste' keuze hangt sterk af van je bestaande cloud, schaal en governance-eisen. Veel teams combineren open-source tracking met een beheerd platform.
Modelbeheer opzetten in 4 stappen
Begin klein en bouw uit. Zo voorkom je dat je vanaf dag één een hele platforminfrastructuur moet optuigen.
Start met experiment-tracking
Leg vanaf het eerste experiment vast welke data, code en instellingen tot welk resultaat leidden. Zonder dit kun je niets reproduceren — en reproduceerbaarheid is de basis van alle modelbeheer.
Voer een modelregister in
Bewaar modelversies centraal met een duidelijke status (test, productie, afgekeurd). Zo weet iedereen welke versie waar draait, en kun je veilig terugrollen.
Automatiseer de uitrol
Maak van het uitrollen een herhaalbaar, geautomatiseerd proces in plaats van handwerk. Dat verkleint de kans op fouten en maakt een rollback eenvoudig.
Monitor en signaleer drift
Bewaak de prestaties in productie en stel waarschuwingen in voor afwijkingen. Zo merk je verslechtering vroeg en kun je op tijd hertrainen, in plaats van achteraf.
Veelgestelde vragen over ai-modelbeheer (mlops)
Wat is MLOps?
MLOps (Machine Learning Operations) is de praktijk van AI-modellen betrouwbaar bouwen, uitrollen, monitoren en onderhouden — geïnspireerd op DevOps. Het automatiseert de hele levenscyclus, zodat modellen systematisch en herhaalbaar in productie komen en blijven werken.
Het draait niet om het trainen zelf, maar om alles eromheen: welke versie draait er, met welke data is hij getraind, en presteert hij nog goed? Kerncomponenten zijn experiment-tracking, een modelregister, geautomatiseerde uitrol (CI/CD voor ML) en monitoring. Tools als MLflow ondersteunen dit.
Wat is het verschil tussen MLOps en modelbeheer?
De termen overlappen sterk en worden vaak door elkaar gebruikt. MLOps is de bredere praktijk: het hele proces van modellen bouwen, uitrollen en onderhouden. Modelbeheer benadrukt specifiek het beheren van modelversies, hun status en hun prestaties.
Zie modelbeheer als een kernonderdeel binnen MLOps — het register, de versies en de monitoring — terwijl MLOps ook training-pipelines, automatisering en infrastructuur omvat. In de praktijk maakt het onderscheid weinig uit; belangrijker is dat je grip houdt op wat er in productie draait.
Wat is model-drift en waarom is het gevaarlijk?
Drift is het stilletjes verslechteren van een model doordat de echte data afwijkt van de data waarop het is getraind. De wereld verandert — klantgedrag, prijzen, seizoenen — maar het model niet, dus de aannames kloppen niet meer.
Het gevaar zit in de onzichtbaarheid: het model 'lijkt' te werken terwijl de kwaliteit zakt. Je merkt het pas als het misgaat — een aanbeveling die nergens op slaat, een fraudedetectie die te veel mist. Monitoring signaleert die afwijking vroeg, zodat je op tijd kunt hertrainen in plaats van achteraf.
Wat is het verschil tussen MLflow en Weights & Biases?
MLflow is de open-source standaard voor experiment-tracking en een modelregister — volledig gratis onder Apache 2.0, geen leveranciersbinding, en wereldwijd door tienduizenden bedrijven gebruikt. Weights & Biases is developer-first en blinkt uit in visualisatie, samenwerking en een prettige UI.
Vuistregel: wil je een flexibele, open kern zonder vendor lock-in, dan is MLflow logisch. Zit je in onderzoek of R&D en hecht je aan sterke visualisatie en gemak, dan is W&B aantrekkelijk. Veel teams beginnen met MLflow en breiden uit naargelang hun behoefte groeit.
Wat is een modelregister?
Een centrale plek waar al je modelversies staan, elk met een duidelijke status: in test, in productie of afgekeurd. Het register volgt ook de herkomst (lineage) — welke data en code tot welk model leidden — en ondersteunt goedkeuringsstromen om een model te promoten van experiment naar productie.
Zonder register weet niemand zeker welke versie waar draait, en is veilig terugrollen lastig. Het is daarmee een fundament van modelbeheer. MLflow biedt een register als kernfunctie, en de meeste cloudplatforms hebben er een ingebouwd.
Heb ik per se een duur cloudplatform nodig voor MLOps?
Nee. Veel teams komen ver met open-source: MLflow voor tracking en een modelregister, eventueel aangevuld met Hugging Face voor modellen. Dat geeft flexibiliteit en geen leveranciersbinding.
Een compleet platform als SageMaker of Vertex AI loont vooral bij grotere schaal of strenge governance-eisen, omdat alles geïntegreerd is van training tot monitoring. Het nadeel: je raakt verbonden aan één cloud en de kosten kunnen oplopen. Veel teams beginnen open-source en groeien pas later naar een platform.
Bindt een cloudplatform me aan één leverancier?
Grotendeels wel. SageMaker is AWS, Vertex AI is Google Cloud. Dat geeft een soepele, geïntegreerde ervaring, maar overstappen wordt lastiger en duurder naarmate je er dieper in zit.
Wil je flexibel blijven, dan kiezen veel teams open-source bouwstenen als MLflow als kern, en gebruiken ze de cloud alleen voor rekenkracht. Zo houd je je tracking, register en model-artefacten portable, terwijl je toch profiteert van schaalbare infrastructuur.
Hoe monitor je een model in productie?
Je bewaakt continu of het model nog presteert zoals verwacht en stelt waarschuwingen in voor afwijkingen. Concreet houd je drie dingen in de gaten:
- Prestatie — daalt de nauwkeurigheid of stijgt het foutpercentage?
- Datadrift — wijkt de binnenkomende data af van de trainingsdata?
- Operationeel — latency, beschikbaarheid en aantal aanvragen.
Zo merk je verslechtering vroeg en kun je op tijd hertrainen in plaats van achteraf. Geautomatiseerde drift-detectie maakt het verschil tussen een prototype en een betrouwbare productiedienst.
Hoe past de EU AI Act in modelbeheer?
De AI Act stelt eisen aan documentatie, traceerbaarheid en risicobeheersing van AI-systemen, zeker bij hoog-risicotoepassingen. Goed modelbeheer — vastleggen welke data en versie is gebruikt, plus monitoring — levert precies het bewijs dat de wet vraagt.
Reproduceerbaarheid en een actueel modelregister zijn daarmee niet alleen technisch handig, maar ook een compliance-fundament. Bias-auditing en uitlegbaarheid worden in gereguleerde domeinen bovendien verplicht. Voor de bredere risico- en compliancekant zie airisicoanalyse.nl.
Hoort prompt- en modelversiebeheer bij elkaar?
Bij LLM-toepassingen wel. Niet alleen het model bepaalt het gedrag, ook de prompts — dus die wil je net zo goed versioneren, testen en monitoren. Een nieuwe promptversie kan het resultaat net zo sterk veranderen als een nieuw model.
In de praktijk beheer je ze vaak met aparte tools die elkaar aanvullen: een modelregister voor de modellen, een prompt-tool voor de prompts, en gezamenlijke observability over de hele keten. Voor het promptdeel kun je promptbeheer.nl raadplegen.