Mit Claude Opus 4.7 erscheint ein Modell für den breiten Einsatz, das insbesondere im Bereich Software-Engineering und multimodaler Bildverarbeitung neue Maßstäbe setzt.
Claude Opus 4.7 von Anthropic steht zur allgemeinen Verfügbarkeit bereit. Das Modell positioniert sich als direkter Nachfolger des bisherigen Flaggschiffs Opus 4.6 und schließt die Lücke zur neuen „Mythos“-Klasse, bleibt jedoch in seinen autonomen Fähigkeiten bewusst unterhalb des Mythos-Previews, um Sicherheitsrisiken zu minimieren.
Fortschritte im Advanced Software Engineering
Der Fokus von Claude Opus 4.7 liegt auf der Bewältigung komplexer, realer Arbeitsabläufe. Insbesondere im Bereich des Advanced Software Engineering hat das Modell signifikante Fortschritte erzielt. Laut Anthropic sind die Zugewinne bei den schwierigsten Aufgaben am deutlichsten spürbar. Nutzer, die bereits in der Early-Access-Phase testen konnten, berichten von einer neuen Qualität der Autonomie.
„Opus 4.7 bewältigt komplexe, lang andauernde Aufgaben mit Gründlichkeit und Beständigkeit, achtet präzise auf Anweisungen und entwickelt Methoden, um seine eigenen Ergebnisse zu verifizieren, bevor es Rückmeldung gibt.“
Antrophic-Bericht
Dieser Aspekt der Selbstverifizierung ist ein entscheidender Fortschritt für die Zuverlässigkeit von KI-Systemen. Während Vorgängermodelle oft zu „Halluzinationen“ neigten oder Anweisungen nur oberflächlich ausführten, ist Opus 4.7 darauf getrimmt, seine eigenen Ergebnisse kritisch zu prüfen, bevor es den Abschluss einer Aufgabe meldet. Dies ermöglicht es Entwicklern, auch hochkomplexe Coding-Aufgaben, die bisher eine engmaschige Überwachung erforderten, mit größerem Vertrauen an die KI zu delegieren.
Bildverarbeitungsfähigkeit verdreifacht
Ein weiteres Highlight ist das große Upgrade der visuellen Fähigkeiten. Claude Opus 4.7 verfügt über eine substanziell bessere Bilderkennung und kann Bilder in deutlich höherer Auflösung verarbeiten. Konkret akzeptiert das Modell nun Bilder mit einer Kantenlänge von bis zu 2.576 Pixeln (ca. 3,75 Megapixel). Das ist mehr als das Dreifache der Kapazität früherer Claude-Modelle.
Diese Verbesserung der Auflösung ist kein bloßer statistischer Wert, sondern ermöglicht völlig neue Anwendungsfälle:
- Computer-Use-Agenten: KI-Assistenten können nun dichte, textlastige Screenshots mit hoher Präzision lesen.
- Datenextraktion: Komplexe Diagramme und technische Zeichnungen lassen sich detailgetreu analysieren.
- Pixel-perfektes Design: Für Frontend-Entwickler und Designer bietet das Modell eine präzisere Referenzierung von UI-Elementen.
Zusätzlich zeigt sich Opus 4.7 bei kreativen Aufgaben im professionellen Kontext geschmackvoller. Die Erstellung von Interfaces, Präsentationsfolien und Dokumenten wirkt laut ersten Testberichten hochwertiger und besser auf die Bedürfnisse moderner Arbeitsumgebungen abgestimmt.
Project Glasswing: Sicherheit vor Maximalleistung
Die Veröffentlichung steht im engen Kontext von Project Glasswing. Dabei geht es um die Balance zwischen den enormen Vorteilen und den potenziellen Risiken von KI-Modellen für die Cybersicherheit. Anthropic verfolgt hier einen vorsichtigen Ansatz: Während das Modell „Claude Mythos Preview“ (das kürzlich durch autonome Netzwerkübernahmen in Simulationen aufhorchen ließ) nur limitiert verfügbar bleibt, dient Opus 4.7 als Testfeld für neue Sicherheitsvorkehrungen. Interessanterweise hat Anthropic die Cyber-Fähigkeiten von Opus 4.7 während des Trainings gezielt nicht auf die Spitze getrieben:
„Opus 4.7 ist das erste Modell dieser Art: Seine Cyber-Fähigkeiten sind nicht so weit fortgeschritten wie die von Mythos Preview (tatsächlich haben wir während des Trainings mit Maßnahmen experimentiert, um diese Fähigkeiten gezielt zu reduzieren).“
Anthropic-Bericht
Das Modell wird mit automatisierten Schutzmechanismen ausgeliefert, die Anfragen erkennen und blockieren sollen, die auf verbotene oder hochriskante Cybersecurity-Aktivitäten hindeuten. Für Sicherheitsexperten, die Claude für legitime Zwecke wie Penetrationstests oder Schwachstellenforschung einsetzen möchten, hat Anthropic das Cyber Verification Program ins Leben gerufen.
Claude Opus 4.7: Effektiver Finanzanalyst
In den Leistungstests zeigt Opus 4.7 eine überlegene Performance gegenüber Opus 4.6, auch wenn es in der absoluten Kapazität hinter Mythos Preview zurückbleibt. In der Finance Agent Evaluation erzielte das Modell einen State-of-the-Art-Score. Interne Tests charakterisieren es als effektiven Finanzanalysten, der präzisere Modelle erstellt und professionellere Präsentationen liefert.
Besonders hervorzuheben ist das Abschneiden beim GDPval-AA-Benchmark, einer unabhängigen Evaluierung von ökonomisch wertvollem Wissen in Bereichen wie Finanzen und Recht. Hier beweist Opus 4.7, dass es bereit ist für die Anforderungen des globalen Marktes für Wissensarbeit.
Instruction Following und Memory: Ein technisches Detail mit Folgen
Ein wichtiger Hinweis für erfahrene Prompt-Engineer: Claude Opus 4.7 interpretiert Anweisungen wesentlich wörtlicher als seine Vorgänger. Das verbesserte Instruction Following führt dazu, dass Prompts, die für ältere Modelle geschrieben wurden (und die oft eine gewisse „Großzügigkeit“ bei der Interpretation einkalkulierten), nun unerwartete Ergebnisse liefern können. Anthropic rät Nutzern daher, ihre Prompt-Harnische neu zu kalibrieren, da Opus 4.7 Anweisungen nun wortgetreu umsetzt.
Auch das Gedächtnis wurde optimiert: Opus 4.7 nutzt dateisystembasierte Speicher effizienter. Es behält wichtige Informationen über lange, mehrstufige Arbeitssitzungen hinweg und benötigt dadurch bei neuen Teilaufgaben deutlich weniger einleitenden Kontext.
Keine Preissteigerung
Trotz der deutlichen Leistungssteigerung hält Anthropic an der Preisstruktur von Claude Opus 4.6 fest:
- Input-Tokens: $5 pro Million Tokens.
- Output-Tokens: $25 pro Million Tokens.
Das Modell ist ab sofort über die Claude-API (claude-opus-4-7), Amazon Bedrock, Google Clouds Vertex AI und Microsoft Foundry verfügbar. Damit sichert sich Anthropic eine breite Basis in den wichtigsten Cloud-Infrastrukturen weltweit.
Für den deutschen Mittelstand und die hiesige IT-Branche ist Claude Opus 4.7 ein Signal der Stabilität. Während Mythos Preview die technologische Speerspitze (mit all ihren regulatorischen Fragezeichen) darstellt, ist Opus 4.7 das „Arbeitstier“ für die produktive Anwendung. Die Verbesserungen im Software-Engineering und die Fähigkeit zur Selbstverifikation könnten insbesondere in Branchen mit hohem Qualitätsanspruch, wie dem deutschen Maschinenbau oder dem Finanzwesen, für eine spürbare Produktivitätssteigerung sorgen.