Bremer24 Logo

GPT-5.5-Cyber von OpenAI überholt Claude Mythos 5

Sie befinden sich: Home > News Archiv > Software > GPT-5.5-Cyber von Op...

OpenAI rüstet sein Sicherheitsprogramm Daybreak auf. Das neue Modell GPT-5.5-Cyber findet Schwachstellen und schreibt gleich Patch-Vorschläge dazu. Im Benchmark CyberGym schiebt es sich knapp vor Claude Mythos 5 von Anthropic.

OpenAI hat sein Sicherheitsprogramm Daybreak erweitert. Im Zentrum steht ein neues Modell namens GPT-5.5-Cyber, das gezielt Sicherheitsforscher und Verteidiger unterstützen soll. Parallel bekommt der Agent Codex Security frische Funktionen, um Schwachstellen automatisch zu prüfen und zu beheben. In ersten Tests liegt diese Kombination vor Claude Mythos 5 von Anthropic.

Vom Finden zum Flicken

Schwachstellen aufspüren können KI-Werkzeuge schon länger. Der schwierige Teil kam danach: bewerten, patchen, ausrollen. Genau hier setzt OpenAI an.

GPT-5.5-Cyber liest Code tief ein, prüft Änderungen und zeichnet nach, wie ein Angriff abläuft. Das Modell schreibt Sicherheitsberichte und legt fertige Patch-Vorschläge an, die ein Mensch anschließend abnimmt. Dazu zieht es externe Quellen heran, etwa Bug-Bounty-Meldungen, Advisories und Tickets. Die Ergebnisse lassen sich in vorhandene Systeme für das Schwachstellen-Management einspeisen.

Die Zahlen zum Vorgänger Codex Security klingen groß. Seit dem Start im März hat das Werkzeug nach Angaben von OpenAI über 30 Millionen Commits in mehr als 30.000 Codebasen durchforstet. 70.000 gefundene Probleme haben menschliche Prüfer als behoben markiert, weitere 500.000 Meldungen stuft das System automatisch als gelöst ein. Wie belastbar diese automatische Einstufung ist, sagt OpenAI nicht.

Knapp vorn im eigenen Benchmark

Im Test CyberGym, den OpenAI selbst entwickelt hat, kommt GPT-5.5-Cyber auf 85,6 Prozent. Das normale GPT-5.5 schafft 81,8 Prozent. Claude Mythos 5 lag zuvor mit 83,8 Prozent an der Spitze. Diesen Platz hat OpenAI jetzt zurückgeholt.

Deutlicher wird der Abstand beim Erstellen von Exploits. Im ExploitGym erreicht das neue Modell 39,5 Prozent, GPT-5.5 nur 25,95 Prozent. Im SEC-Bench Pro stehen 69,8 gegen 63,1 Prozent.

Ein Hinweis zur Einordnung: CyberGym stammt von OpenAI selbst. Hauseigene Tests fallen für das eigene Produkt erfahrungsgemäß günstig aus, und der Vorsprung vor Claude Mythos 5 beträgt am Ende knapp zwei Prozentpunkte.

Mit Mythos 5 hatte Anthropic die Branche im Frühjahr überrascht. Inzwischen hat die Konkurrenz nachgezogen. OpenAI und Anthropic liefern sich damit in einem weiteren Feld ein enges Rennen.

Nur für geprüfte Verteidiger

GPT-5.5-Cyber gibt OpenAI nach eigener Aussage ausschließlich an verifizierte Verteidiger weiter. Dabei arbeitet das Unternehmen mit US-Stellen zusammen, darunter das Center for AI Standards and Innovation, das Office of the National Cyber Director und das Office of Science and Technology Policy.

Wer als Sicherheitsanbieter mitmachen will, kann das über das Daybreak Cyber Partner Program. Mit dabei sind unter anderem Accenture, Akamai, Cisco, Cloudflare, CrowdStrike, IBM, Palo Alto Networks, Proofpoint, SentinelOne, Wiz und Zscaler. Sie binden das Modell über ein Trusted-Access-Verfahren in ihre eigenen Produkte ein.

Patch the Planet

Zusammen mit Trail of Bits, HackerOne und Calif hat OpenAI die Initiative „Patch the Planet" gestartet. Sie soll wichtige Open-Source-Infrastruktur absichern, mit KI-Analysen und menschlichen Forschern Seite an Seite.

Auch die Zusammenarbeit mit Behörden wächst. Beteiligt sind Regierungen in Australien, Kanada, Frankreich, Deutschland, Japan und Südkorea, dazu europäische Stellen wie die EU-Cybersicherheitsagentur ENISA. Es geht um den Schutz kritischer Infrastruktur und staatlicher Netze.

Bemerkenswert ist weniger die einzelne Punktzahl als die Richtung. Sicherheits-KI verschiebt sich vom reinen Aufspüren hin zum automatischen Reparieren. Wenn Modelle bald selbst Patches schreiben, hängt der Gewinn für die Verteidigung an einer Stelle: der Qualität der menschlichen Endkontrolle.

cybergym daybreak cyber sicherheitsprogramm vorschläge mythos

Kommentar schreiben

Teilen Sie uns Ihre Meinung mit. Ihr Kommentar wird nach Pruefung veroeffentlicht.

Pflichtfelder


Neusten News in der Kategorie "Software"

• Claude Code: Quelltext durch Konfigurationsfehler öffentlich...
Eine fehlerhafte npm-Paketierung hat den kompletten Quellcode von Anth...
• Claude findet Zero-Day-Lücken in Vim, Emacs und dem Linux-Ke...
Anthropics KI-Modell Claude hat schwerwiegende Sicherheitslücken in ja...
• Euro-Office: Europa baut eigene Office-Suite gegen Microsoft...
Europäische Unternehmen entwickeln mit Euro-Office eine quelloffene Bü...
• Claude Code: 12 versteckte Einstellungen für maximale Leistu...
Claude Code kann viel mehr, als die Standardkonfiguration vermuten läs...
• Google Live Translate: Echtzeit-Dolmetscher für jeden Kopfhö...
Google macht jeden Kopfhörer zum Simultandolmetscher. Die Funktion Liv...
• Claude Chrome-Erweiterung: Sicherheitslücke erlaubte Angriff...
Eine gravierende Schwachstelle in der Claude-Erweiterung für Chrome er...
• Claude Code bekommt Auto-Modus: KI handelt jetzt eigenständi...
Anthropic spendiert Claude Code einen Auto-Modus. Die KI entscheidet s...
• Kritische Infrastruktur schützen: Warum Memory Safety jetzt ...
US-Behörden drängen auf einen Wandel: Memory-Safety-Fehler b...
• Diese 9 Jobs nimmt Ihnen ChatGPT ab produktiver in Minuten
ChatGPT erledigt heute schon zahlreiche Aufgaben, die sonst viel Zeit ...
• Update-Stillstand in Windows 11 24H2 Microsoft reagiert mit...
Microsoft reagiert auf ein kritisches Problem in Windows 11 Version 24...