AI-bedrijf Anthropic heeft met zijn testmodel Claude Mythos Preview in samenwerking met zo’n vijftig partners meer dan tienduizend beveiligingslekken gevonden in veelgebruikte software. De resultaten van Project Glasswing laten zien dat AI het vinden van kwetsbaarheden radicaal versnelt — maar het repareren ervan blijft mensenwerk. Dat spanningsveld vormt nu de grootste uitdaging voor de sector.
Anthropic heeft de eerste resultaten gepubliceerd van Project Glasswing, een initiatief waarbij het testmodel Claude Mythos Preview wordt ingezet om kwetsbaarheden te zoeken in zogenoemde systemisch belangrijke software. Aan het project nemen zo’n vijftig partners deel, waaronder Cloudflare, Palo Alto Networks en Mozilla.
Het model wordt vooralsnog alleen beschikbaar gesteld aan geselecteerde partners en overheden. Anthropic geeft aan dat het Mythos-model niet breder wordt uitgerold omdat de huidige veiligheidsbarrières in de AI-sector onvoldoende zijn om misbruik voor grootschalige schade te voorkomen.
Schaal van de vondsten
De deelnemende partijen melden dat hun tempo van het vinden van bugs met een factor tien is gestegen. Cloudflare ontdekte 2.000 kwetsbaarheden in kritieke systemen, waarvan 400 als hoog of kritiek werden beoordeeld. Mozilla vond 271 kwetsbaarheden in Firefox 150, ruim tien keer zoveel als bij eerdere tests met oudere AI-modellen.
Anthropisch scande ook meer dan duizend opensourceprojecten die het fundament vormen van het wereldwijde internet. Het model schatte dat in die codebase ruim 6.200 zware kwetsbaarheden aanwezig zijn. Na handmatige controle door onafhankelijke beveiligingsbedrijven bleek meer dan 90 procent van de meldingen te kloppen. Een van de gevonden lekken betrof wolfSSL, een cryptografische bibliotheek die op miljarden apparaten draait. Het model slaagde erin een aanvalsmethode te construeren waarmee bankcertificaten vervalst kunnen worden om nepsites te hosten.
Daarnaast meldt Anthropic dat het model bij een deelnemende bank een frauduleuze overboeking van 1,5 miljoen dollar hielp voorkomen, nadat aanvallers via een gecompromitteerd e-mailaccount en deepfake-telefoongesprekken een aanval hadden ingezet.
Herstel loopt achter op ontdekking
De snelheid van het model legt een structureel capaciteitsprobleem bloot. Het vinden van een lek duurt met AI nog slechts minuten, maar het verifiëren, rapporteren en patchen vereist nog altijd intensief handwerk. Gemiddeld duurt het momenteel twee weken om een kritiek lek te dichten.
Anthropics geeft aan dat beheerders van opensourceprojecten zijn overspoeld door AI-gegenereerde bugrapporten en bij het bedrijf hebben aangedrongen op een lager meldingstempo, omdat de capaciteit om patches te ontwikkelen ontbreekt.
De sector hanteert traditioneel een disclosure-periode van 90 dagen: een gevonden kwetsbaarheid wordt pas openbaar gemaakt als er een patch beschikbaar is, zodat aanvallers niet kunnen profiteren van bekende lekken. Het leeuwendeel van de tienduizend gevonden kwetsbaarheden is daardoor nog niet publiek. Als aanvallers met vergelijkbare modellen dezelfde lekken ontdekken voordat patches zijn uitgerold, ontstaat een aanzienlijk risico.
Defensieve tools en samenwerking
Om de verdedigers een voorsprong te geven, stelt Anthropic defensieve AI-tools beschikbaar aan geselecteerde enterprise-klanten. Het bedrijf werkt daarnaast samen met de Open Source Security Foundation om beheerders te ondersteunen bij het verwerken van het grotere volume aan bugrapporten. Anthropic roept systeembouwers en netwerkbeheerders op hun update-cycli te verkorten en netwerkinrichtingen preventief te verstevigen.