ChatGPT-5.5 versus DeepSeek V4: slimmer of zeven keer goedkoper?

🗞️ Het belangrijkste nieuws

ChatGPT-5.5 is een stuk slimmer (maar bluft er soms flink op los)

Je assistent op het werk wordt flink slimmer. OpenAI heeft GPT-5.5 uitgebracht, een model dat zelfstandig je spreadsheets kan analyseren, presentaties kan bouwen en onderzoek kan doen, zonder dat je elke stap hoeft voor te kauwen. Het is het zoveelste wapen in de steeds heviger wordende strijd over wie als eerste een volwaardige AI-kantoormedewerker levert. Maar deze slimste leerling van de klas heeft een opvallend gebrek: hij bluft er ook het hardst op los.

Wat is er aan de hand?

GPT-5.5 is de opvolger van GPT-5.4 en beschikbaar voor betalende ChatGPT-gebruikers (Plus, Pro, Business en Enterprise). De belofte: geef het een rommelige, meervoudige opdracht en het plant zelf, gebruikt hulpmiddelen, controleert zijn eigen werk en gaat door tot de klus af is.

Het model is niet in zijn eentje gelanceerd. OpenAI koppelde de release bewust aan een flinke upgrade van Codex, het codingplatform dat eerder vooral gericht was op programmeurs. Codex kan nu ook je browser bedienen, pdf's verwerken, spreadsheets en presentaties maken en zelfs software op je computer aansturen. De boodschap is duidelijk: OpenAI wil niet langer alleen de beste codingassistent leveren, maar een complete digitale collega die álles op je computer kan wat jij ook kunt.

Wat kun je ermee?

De verbetering die je als kantoorprofessional het snelst zult merken: GPT-5.5 snapt beter wat je wilt. Waar je bij eerdere versies nog precies moest uitleggen wat je bedoelde, kun je nu zeggen: “Analyseer deze verkoopcijfers en maak er een overzichtelijke presentatie van.” Het model pakt dat zelfstandig op, inclusief het opzoeken van informatie, het maken van grafieken en het structureren van het eindresultaat.

Bij OpenAI zelf gebruikt inmiddels 85 procent van de medewerkers het model wekelijks, niet alleen ontwikkelaars maar ook teams van financiën, marketing en communicatie. Het financiële team liet GPT-5.5 bijna 25.000 belastingformulieren (ruim 71.000 pagina's) verwerken, en bespaarde daarmee twee weken werk.

Daarnaast heeft OpenAI een flink verbeterde beeldgenerator meegeleverd (check hier onze hands-on recensie). Die kan nu afbeeldingen maken met leesbare tekst erin, handig voor wie snel een slide, infographic of productmock-up nodig heeft. Ethan Mollick, hoogleraar aan Wharton en auteur van het boek Co-intelligentie, testte het uitvoerig: “Een beeldgenerator die gedetailleerde tekst en afbeeldingen kan maken, kun je gebruiken voor PowerPoint-slides, productmock-ups of voorbeeldwebsites.”

Maar het gaat verder dan kantoorwerk. OpenAI heeft de vernieuwde beeldgenerator ook in Codex gestopt, waardoor het model niet alleen tekst maar ook afbeeldingen kan maken, midden in een codingproject.

Philip van YouTube-kanaal AI Explained bouwde in minder dan 24 uur een compleet avonturenspel met AI-gegenereerde illustraties, gesproken dialogen en interactief verhaal, allemaal vanuit een handvol prompts. De illustraties? Gemaakt door diezelfde beeldgenerator, zonder dat hij er apart om hoefde te vragen. Het model schakelde zelf heen en weer tussen code schrijven en plaatjes maken.

Probeer het spel hier zelf uit.

De race naar de AI-kenniswerker

Achter de technische verbeteringen schuilt een grotere ambitie. OpenAI-medeoprichter en president Greg Brockman beschreef GPT-5.5 op een persconferentie als “een stap naar een nieuwe manier van werken met computers” en herhaalde de ambitie om ChatGPT, Codex en hun AI-browser samen te smelten tot één super-app: een alleskunner die als een digitale chef-staf je hele werkdag kan overnemen.

Daarmee zet OpenAI de concurrentie onder druk. Anthropic, de maker van Claude, lanceerde onlangs nog Cowork en Mythos om dezelfde markt te veroveren. Google doet hetzelfde met Gemini. De strijd draait niet langer om welk model het slimst is op een examen, maar om wie als eerste een AI levert die echt voor je kan werken, dag in, dag uit.

En het tempo ligt hoog. Jakub Pachocki, hoofdwetenschapper van OpenAI, zei bij de lancering: “We zien behoorlijk grote verbeteringen op de korte termijn en extreem grote verbeteringen op de middellange termijn. De afgelopen twee jaar verliepen eerlijk gezegd verrassend langzaam.”

De olifant in de kamer: hallucinaties

Op een onafhankelijke kennistest van Artificial Analysis haalt GPT-5.5 de hoogste nauwkeurigheid ooit gemeten: 57 procent van de feitelijke vragen correct. Maar als het model het antwoord niet weet, verzint het in 86 procent van de gevallen een antwoord in plaats van toe te geven dat het geen antwoord heeft. Ter vergelijking: bij Claude Opus 4.7 is dat 36 procent. GPT-5.5 is de slimste leerling van de klas, maar ook veruit de grootste bluffer.

Peter Gostev, AI-onderzoeker bij Arena.ai, ontdekte een ironisch bijeffect: de Pro-versie, die langer 'nadenkt', presteert op dit punt zelfs nóg slechter. “Extra denktijd leidt er kennelijk toe dat het model de onzin beter rationaliseert in plaats van er vraagtekens bij te zetten.”

Het goede nieuws: de AI maakt zichzelf (nog) niet slimmer

Een geruststelling voor wie zich zorgen maakt over AI die uit de hand loopt: uit OpenAI's eigen veiligheidsrapport blijkt dat GPT-5.5 geen noemenswaardige kans heeft om zichzelf te verbeteren, het zogenoemde recursive self-improvement waar onderzoekers al langer voor waarschuwen. Het model kan weliswaar steeds beter programmeren en wetenschappelijk redeneren, maar het mist nog de samenhang en het doorzettingsvermogen om zichzelf structureel te upgraden. Bij interne tests van OpenAI wist het model slechts in ongeveer 6 procent van de gevallen een bug op te lossen die een mens een hele werkdag zou kosten.

Dat is goed nieuws, want het betekent dat we voorlopig niet in een scenario belanden waarin AI zichzelf in een spiraal steeds slimmer maakt zonder menselijk toezicht. Maar het feit dat OpenAI dit nu expliciet test en rapporteert, zegt ook iets: ze rekenen erop dat dit moment ooit wél komt.

Waarom is dit belangrijk?

GPT-5.5 laat zien dat AI-assistenten in een nieuw stadium komen: van hulpjes die wachten op instructies naar collega's die zelfstandig taken oppakken. Mollick vat het kernachtig samen: “Elke paar maanden verschijnt een nieuw model. Ik voer mijn tests uit en iets dat onmogelijk was, wordt makkelijk. Het patroon is in drie jaar niet veranderd, de sprongen worden alleen groter.”

Tegelijkertijd is de les helder: hoe slimmer het model, hoe overtuigender het kan bluffen. Voor presentaties maken en data samenvatten is GPT-5.5 een grote stap vooruit. Maar voor alles waar feitelijke nauwkeurigheid cruciaal is, van juridisch werk tot financiële rapportages, blijft kritisch meelezen onmisbaar.

DeepSeek V4 levert bijna dezelfde AI-kwaliteit, voor een zevende van de prijs

Nog geen dag na de lancering van GPT-5.5 dropt het Chinese AI-lab DeepSeek zijn langverwachte V4-model. De boodschap is even simpel als provocerend: waarom zou je tien keer zoveel betalen voor een marginaal verschil in kwaliteit? Een jaar na het spoetnikmoment dat de techbeurzen deed trillen, is DeepSeek terug met een vervolg dat misschien minder schokkend is, maar minstens zo belangrijk.

Wat is er aan de hand?

DeepSeek heeft twee nieuwe modellen uitgebracht: V4-Pro, het vlaggenschip, en V4-Flash, een snellere en goedkopere variant. Beide zijn open source (de bouwstenen zijn vrij beschikbaar), zodat iedereen ze kan downloaden, aanpassen en lokaal kan draaien. V4-Pro is met 1,6 biljoen parameters het grootste openbaar beschikbare AI-model ter wereld.

Het opmerkelijkste? De prijs. V4-Pro kost 3,48 dollar per miljoen gegenereerde woorden. OpenAI en Anthropic, de maker van Claude, rekenen voor vergelijkbaar werk respectievelijk 30 en 25 dollar. Dat is een factor zeven tot acht goedkoper. De Flash-variant gaat nog veel verder: 0,28 dollar per miljoen woorden, waarmee het zelfs de allergoedkoopste westerse modellen onderbiedt. En deze week kondigde DeepSeek boven op die al lage prijs nog eens 75 procent korting aan voor ontwikkelaars.

Hoe goed is het?

DeepSeek zegt zelf dat V4-Pro het beste opensourcemodel ter wereld is op het gebied van programmeren en wiskunde. Dat klinkt als marketing, maar de eerste onafhankelijke tests bevestigen het beeld: het model presteert op sommige taken vergelijkbaar met GPT-5.4 en Claude Opus 4.6. Op een belangrijke programmeertest scoort het 80,6 procent, slechts 0,2 procentpunt onder Claude Opus 4.6.

DeepSeek is wel eerlijk over de grenzen. In het eigen technisch rapport schrijft het bedrijf dat V4-Pro 'marginaal achterblijft' bij de allerbeste gesloten modellen als GPT-5.4 en Gemini 3.1 Pro, met een geschatte achterstand van drie tot zes maanden. Die transparantie is ongebruikelijk in een wereld waar elk AI-lab doorgaans beweert het beste model ooit te hebben gemaakt.

Getraind op Chinese chips

Een detail dat minstens zo belangrijk is als de prestaties: DeepSeek heeft V4 deels getraind op chips van het Chinese techbedrijf Huawei, in plaats van op de NVIDIA-chips waar vrijwel de hele westerse AI-industrie van afhankelijk is. Volgens Fortune verwacht DeepSeek de prijzen later dit jaar zelfs nog verder te verlagen, zodra Huawei de productie van zijn nieuwe Ascend 950-chips opschroeft.

Dat is geopolitiek relevant. De Verenigde Staten proberen via exportbeperkingen te voorkomen dat China toegang krijgt tot de krachtigste AI-chips. Analist Wei Sun van Counterpoint Research trekt een opvallende conclusie: “V4 zou uiteindelijk een grotere impact kunnen hebben dan R1, omdat het laat zien dat AI-systemen gebouwd en ingezet kunnen worden zónder afhankelijkheid van NVIDIA.”

Ondertussen beschuldigen zowel OpenAI als Anthropic DeepSeek ervan dat het illegaal kennis heeft 'gedestilleerd' uit hun modellen, een vorm van kopiëren. Een dag voor de lancering van V4 beschuldigde ook het Witte Huis Chinese partijen van dergelijke praktijken op industriële schaal. DeepSeek heeft niet direct gereageerd op de aantijgingen.

Kanttekeningen

V4 is uitgebracht als preview, niet als definitieve versie. Wie het model nu wil inzetten voor serieus werk, moet rekening houden met mogelijke veranderingen. Daarnaast ondersteunt V4 voorlopig alleen tekst. Afbeeldingen, audio en video, zoals GPT-5.5 en Gemini die bieden, zitten er niet in.

Waarom is dit belangrijk?

DeepSeek V4 herhaalt de boodschap van een jaar geleden, maar luider: topkwaliteit AI hoeft geen fortuin te kosten. Voor bedrijven en ontwikkelaars die niet het allernieuwste nodig hebben maar wel een scherpe prijs-kwaliteitverhouding, wordt het steeds moeilijker om de vraag te negeren: waarom betalen we eigenlijk zeven keer zoveel? Die druk voelen OpenAI, Google en Anthropic. En uiteindelijk kan die prijzenoorlog alleen maar goed nieuws zijn voor iedereen die AI wil gebruiken.

🎥 Masterclass: Microsoft Copilot

Even geen masterclass deze week in verband met de vakantie. De volgende staat gepland op donderdag 7 mei om 12:00 uur. Omdat we even de tijd hebben, zijn we benieuwd naar jullie input!

Een van de meest gestelde vragen in de chat tijdens de masterclasses gaat over Microsoft Copilot, voor veel mensen met een kantoorbaan de enige AI waar ze mee mogen werken. Wietse gaat zich erin onderdompelen en wil graag van jullie weten waar je tegenaan loopt, wat je al hebt geprobeerd en wat je wil leren.

Laat het weten via link.aireport.nl/copilot, dan duikt Wietse erin!

Gesponsord

Wil je rendement uit AI? Versnel je groei

Veel organisaties zetten AI in om kosten te besparen. Maar een selecte groep gaat verder. Zij realiseren aantoonbare groei door vooral kansen te benutten die ontstaan als sectoren naar elkaar toe bewegen. Wij onderzochten wat deze AI-leiders anders doen dan de rest.

Versnel je groei

🔮 Prompt whisperer

Zo haal je alles uit ChatGPT 5.5 (hint: less is more)

Zojuist las je over de lancering van GPT-5.5, het nieuwste en slimste model van OpenAI. Maar een slimmer model betekent niet automatisch betere resultaten. Sterker nog: als je ChatGPT op dezelfde manier blijft gebruiken als voorheen, laat je waarschijnlijk de helft van het potentieel liggen. Want GPT-5.5 luistert fundamenteel anders dan zijn voorgangers.

In deze tutorial leer je de vier belangrijkste veranderingen die je moet kennen, elk met concrete voor-en-na-voorbeelden die je direct kunt toepassen in je werk.

Wat leer je vandaag?

Waarom je oude prompts nu juist slechter kunnen werken.
De vier gouden regels voor prompts die GPT-5.5 echt begrijpen.
Kopieerbare voorbeeldprompts voor e-mails, analyses en presentaties.
Hoe je voorkomt dat ChatGPT zelfverzekerd onzin vertelt.
Eén simpele test om te zien of je prompt goed genoeg is.

Abonneer je om verder te lezen

Welke AI-tool gebruik je waarvoor? We testen ze zodat jij dat niet hoeft te doen. Eerlijke vergelijkingen, geen sponsored content.

Abonneer nu

Dit zit achter de betaalmuur:

Onafhankelijke tool-reviews en vergelijkingen
Concrete aanbevelingen: welke tool past bij welk werk
Bespaart je uren uitzoekwerk
Regelmatig bijgewerkt met nieuwe tools

ChatGPT-5.5 versus DeepSeek V4: slimmer of zeven keer goedkoper?

🗞️ Het belangrijkste nieuws

ChatGPT-5.5 is een stuk slimmer (maar bluft er soms flink op los)

Wat is er aan de hand?

Wat kun je ermee?

De race naar de AI-kenniswerker

De olifant in de kamer: hallucinaties

Het goede nieuws: de AI maakt zichzelf (nog) niet slimmer

Waarom is dit belangrijk?

DeepSeek V4 levert bijna dezelfde AI-kwaliteit, voor een zevende van de prijs

Wat is er aan de hand?

Hoe goed is het?

Getraind op Chinese chips

Kanttekeningen

Waarom is dit belangrijk?

🎥 Masterclass: Microsoft Copilot

Wil je rendement uit AI? Versnel je groei

🔮 Prompt whisperer

Zo haal je alles uit ChatGPT 5.5 (hint: less is more)

Wat leer je vandaag?

Abonneer je om verder te lezen

Dit zit achter de betaalmuur:

Jouw vaste bron voor het laatste AI-nieuws, met praktische tips om het toe te passen in je leven en werk.