Die 360 Digital Security Group behauptet, mithilfe eines Multi-Agenten-Systems rund 1.000 Schwachstellen aufgespürt zu haben, unter anderem beim Tianfu Cup. Die Fähigkeiten sollen an Anthropics neues Modell Claude Mythos heranreichen. Doch es gibt Zweifel.
Nur wenige Wochen nach der Vorstellung von Claude Mythos meldet sich aus China ein Unternehmen zu Wort, das offenbar in einer ähnlichen Liga mitspielen will. Die 360 Digital Security Group, eine Tochter des Pekinger IT-Sicherheitsriesen Qihoo 360, reklamiert für sich KI-gestützte Fähigkeiten zur Schwachstellensuche, die in die Nähe dessen rücken, was Anthropic für sein jüngstes Frontier-Modell beschreibt. Eingeordnet hat die Behauptungen Eugenio Benincasa, ein auf China spezialisierter Cybersicherheitsforscher der ETH Zürich, in einem Beitrag für den Blog Natto Thoughts.
Anthropic hatte Anfang April erklärt, Claude Mythos habe autonom tausende Sicherheitslücken entdeckt, in manchen Fällen sogar eigenständig Exploits entwickelt und Lücken verkettet. Öffentlich verfügbar ist das Modell nicht. Im Rahmen des Project Glasswing stellt Anthropic es lediglich rund 40 ausgewählten Organisationen zur Verfügung, darunter große Technologie- und Sicherheitsfirmen. Benincasa weist darauf hin, dass bereits Behörden reagieren: US-Stellen hätten Finanzinstitute zu KI-gestützten Cyberrisiken gebrieft, während deutsche Behörden vor erheblichen Verwerfungen warnten.
KI als „Kern-Engine der Schwachstellensuche“
Im Mittelpunkt steht der Tianfu Cup, einer der bedeutendsten Hacking-Wettbewerbe des Landes. Das siegreiche Team von 360 setzte dort laut Benincasa massiv auf KI-gestützte Entdeckung und Ausnutzung von Schwachstellen. Der Teamleiter habe erklärt, KI habe sich „vom Hilfswerkzeug zur Kern-Engine der Schwachstellensuche entwickelt“. Auch das drittplatzierte Team habe ähnliche Angaben gemacht.
Technisch stützt sich 360 nach eigenen Angaben auf ein intern entwickeltes „Multi-Agent Collaborative Vulnerability Discovery System“. Dieses soll etwa die Hälfte der beim Tianfu Cup gefundenen Schwachstellen beigesteuert haben. In Summe spricht die Firma von rund 1.000 entdeckten Lücken, darunter über 50 mit hohem Schweregrad. Betroffen sein sollen unter anderem Windows, Microsoft Office, Android, OpenClaw sowie diverse IoT-Geräte.
Zweifelhafte Einzelfunde
Besonders medienwirksam ist eine als kritisch eingestufte Office-Lücke mit der Kennung CVE-2026-32190. Der KI-Agent habe sie innerhalb weniger Minuten identifiziert, obwohl die Schwachstelle angeblich etwa acht Jahre lang unentdeckt geblieben war. Bei einer zweiten Lücke im Windows-Kernel (CVE-2026-24293) schreibt Microsoft den Fund allerdings Forschern aus Taiwan und Südkorea zu. Die Darstellung von 360 wirft damit Fragen auf.
Benincasa bremst ebenfalls die Erwartungen. Die KI-Fähigkeiten von 360 seien zwar bemerkenswert, reichten aber nicht an die für Claude Mythos beschriebenen Reasoning-Fähigkeiten heran. Ein realistischerer Vergleich sei Googles Big Sleep, das einzelne Phasen der Schwachstellenanalyse beschleunigt, ohne als vollständig autonomer Agent zu agieren.
Strukturelle Vorteile für chinesische Behörden
Entscheidender als der technische Vergleich dürfte ohnehin der regulatorische Rahmen sein. Chinesische Gesetze verpflichten Unternehmen und Forscher, Schwachstellen zuerst an Behörden zu melden, bevor eine öffentliche Offenlegung zulässig wird. Elitäre Sicherheitsforschung fließt damit faktisch in staatliche Nachrichtendienstkanäle, was einen strukturellen Vorteil gegenüber den USA, Europa und anderen Demokratien bedeutet.
In diesem Zusammenhang zitiert Benincasa den 360-Vorstandschef Zhou Hongyi mit einer Aussage aus dem Jahr 2018: „Wer die Technologie der automatisierten Schwachstellensuche beherrscht, hat bei Cyberangriff und Cyberabwehr die Oberhand.“ Auch Anthropic-Chef Dario Amodei hatte eingeräumt, dass Open-Source-Modelle und chinesische Entwickler binnen sechs bis zwölf Monaten auf vergleichbarem Niveau nachziehen könnten, eine Einschätzung, die auch Forscher des Cloud-Sicherheitsanbieters Wiz teilen.
Was die realen Fähigkeiten von Mythos angeht, gibt es immerhin externe Bestätigungen. Mozilla erklärte, mithilfe des Modells über 270 Schwachstellen in Firefox identifiziert zu haben, Palo Alto Networks meldete eine deutliche Beschleunigung seiner Schwachstellensuche. Kritiker verweisen allerdings darauf, dass bislang nur wenige Dutzend öffentliche CVEs Anthropic und lediglich eine einzige explizit dem Project Glasswing zugeschrieben wurden.