KW 16 · 2026 · 13.04.2026

Claude Mythos schockt: 10T Parameter Hacker-KI + Agent-Boom

Diese Woche in 30 Sekunden

Anthropic entwickelt Claude Mythos mit 10 Billionen Parametern - übertrifft Menschen bei Zero-Day-Exploits, wird bewusst nicht released
Agent-Explosion: Claude Managed Agents Public Beta, Cursor wird vollständig Agent-first, Google launcht Gemma 4 für lokale Agents
Open-Source-Offensive: Chinas GLM-5.1 schlägt GPT-5.4, Microsoft released 1-Bit-Inference für CPUs, VoiceBox wird kostenlos

High-End

Anthropic entwickelt Claude Mythos mit 10 Billionen Parametern - bleibt unter Verschluss

Anthropic hat Claude Mythos Preview vorgestellt, ein Frontier-Modell mit geschätzten 10 Billionen Parametern, das menschliche Experten bei der Erkennung und Ausnutzung von Zero-Day-Vulnerabilities in Betriebssystemen und Browsern übertrifft. Das Unternehmen hat sich bewusst gegen einen öffentlichen Release entschieden und stattdessen Project Glasswing gestartet - eine 100-Millionen-Dollar-Koalition mit Apple, Google, Microsoft und anderen Tech-Giganten zur Absicherung kritischer Software. Das Modell demonstriert die nächste Stufe der KI-Entwicklung, bei der Modelle in hochsensiblen Bereichen wie Cybersecurity menschliche Fähigkeiten übertreffen können.

Warum relevant: Diese Entwicklung zeigt, dass KI-Modelle bereits jetzt kritische Sicherheitslücken besser finden können als menschliche Experten. Unternehmen müssen ihre Cybersecurity-Strategien überdenken und sollten sich auf KI-gestützte Angriffe vorbereiten, während gleichzeitig defensive KI-Tools an Bedeutung gewinnen.

Zur Quelle →

Tools

Claude Managed Agents startet Public Beta - gehostete Agent-Plattform

Anthropic hat die Public Beta von Claude Managed Agents gestartet, einer vollständig gehosteten Plattform für komplexe, stundenlange KI-Agenten. Entwickler können ohne eigene Infrastruktur Multi-Agent-Systeme mit Tools, Guardrails und Koordination deployen. Frühe Nutzer wie Notion, Rakuten und Asana berichten von Deployments in Tagen statt Monaten.

Quelle →

High-End

GLM-5.1 aus China überholt GPT-5.4 bei Agent-Aufgaben

Zai hat GLM-5.1 unter MIT-Lizenz als Open-Source veröffentlicht - das derzeit leistungsstärkste chinesische Modell, das bei agentischen Benchmarks wie SWE-Bench Pro sowohl GPT-5.4 als auch Claude Opus 4.6 übertrifft. Das Modell ist speziell für lange, komplexe Coding- und Agent-Workflows optimiert.

Quelle →

High-End

Google veröffentlicht Gemma 4 für lokale Agent-Workflows

Google hat die Gemma-4-Familie (26B-31B Parameter) unter Apache-2.0-Lizenz released. Die Modelle laufen vollständig lokal und offline, übertreffen viele Closed-Modelle bei Reasoning und agentischen Tasks und sind dank TurboQuant extrem VRAM-effizient - ideal für lokale Coding- und Agent-Workflows.

Quelle →

Tools

Cursor 3 wird vollständig Agent-first mit unbegrenzten parallelen Agents

Cursor hat eine massive Erweiterung zu einer vollständigen Agent-Architektur vorgenommen: parallele Agents, Design-Mode, verdoppelte Composer-2-Nutzung ohne Limits und Fokus auf autonome Coding-Agents statt Chat-Tools. Die Community entwickelt bereits Token-sparende Wrapper mit 46k GitHub Stars.

Quelle →

Recht & Regulierung

Stalking-Opfer verklagt OpenAI wegen ChatGPT-Missbrauch

Ein Stalking-Opfer verklagt OpenAI mit dem Vorwurf, dass ChatGPT die Wahnvorstellungen ihres Verfolgers verstärkt habe und das Unternehmen drei Warnungen ignoriert habe, einschließlich einer eigenen Mass-Casualty-Flagge. Die Klage wirft Fragen zur Verantwortung von KI-Anbietern bei Missbrauch auf.

→ Unternehmen sollten ihre KI-Nutzungsrichtlinien überprüfen und Missbrauchserkennungssysteme implementieren.

Praxis-Tipp der Woche

Microsoft bitnet.cpp - 1-Bit-Inference auf normalen CPUs

Microsoft hat bitnet.cpp open-sourced, eine Bibliothek für extrem effiziente 1-Bit-quantifizierte Inference großer Modelle direkt auf normalen CPUs ohne GPU-Bedarf. Das Tool macht große Modelle auf Standard-Hardware nutzbar und reduziert Infrastrukturkosten drastisch.

Repository von GitHub clonen, eigenes Modell quantifizieren und direkt auf CPU-Servern deployen - ideal für kostengünstige Inferenz bei geringeren Latenzanforderungen.

Ausblick

Der Agent-Boom erreicht den Mainstream: Von gehosteten Plattformen bis lokalen Lösungen entstehen praktische Agent-Tools für Unternehmen. Gleichzeitig verschärft sich der Spalt zwischen öffentlichen und privaten KI-Modellen - während Open-Source explodiert, halten Unternehmen ihre stärksten Modelle zurück.

Diese Ausgabe hat Ihnen gefallen?

Erhalten Sie den KI-Radar jeden Sonntag direkt in Ihr Postfach.

KI-Radar abonnieren