Claude Mythos schockt: 10T Parameter Hacker-KI + Agent-Boom
- Anthropic entwickelt Claude Mythos mit 10 Billionen Parametern - übertrifft Menschen bei Zero-Day-Exploits, wird bewusst nicht released
- Agent-Explosion: Claude Managed Agents Public Beta, Cursor wird vollständig Agent-first, Google launcht Gemma 4 für lokale Agents
- Open-Source-Offensive: Chinas GLM-5.1 schlägt GPT-5.4, Microsoft released 1-Bit-Inference für CPUs, VoiceBox wird kostenlos
Anthropic entwickelt Claude Mythos mit 10 Billionen Parametern - bleibt unter Verschluss
Anthropic hat Claude Mythos Preview vorgestellt, ein Frontier-Modell mit geschätzten 10 Billionen Parametern, das menschliche Experten bei der Erkennung und Ausnutzung von Zero-Day-Vulnerabilities in Betriebssystemen und Browsern übertrifft. Das Unternehmen hat sich bewusst gegen einen öffentlichen Release entschieden und stattdessen Project Glasswing gestartet - eine 100-Millionen-Dollar-Koalition mit Apple, Google, Microsoft und anderen Tech-Giganten zur Absicherung kritischer Software. Das Modell demonstriert die nächste Stufe der KI-Entwicklung, bei der Modelle in hochsensiblen Bereichen wie Cybersecurity menschliche Fähigkeiten übertreffen können.
Claude Managed Agents startet Public Beta - gehostete Agent-Plattform
Anthropic hat die Public Beta von Claude Managed Agents gestartet, einer vollständig gehosteten Plattform für komplexe, stundenlange KI-Agenten. Entwickler können ohne eigene Infrastruktur Multi-Agent-Systeme mit Tools, Guardrails und Koordination deployen. Frühe Nutzer wie Notion, Rakuten und Asana berichten von Deployments in Tagen statt Monaten.
Quelle →GLM-5.1 aus China überholt GPT-5.4 bei Agent-Aufgaben
Zai hat GLM-5.1 unter MIT-Lizenz als Open-Source veröffentlicht - das derzeit leistungsstärkste chinesische Modell, das bei agentischen Benchmarks wie SWE-Bench Pro sowohl GPT-5.4 als auch Claude Opus 4.6 übertrifft. Das Modell ist speziell für lange, komplexe Coding- und Agent-Workflows optimiert.
Quelle →Google veröffentlicht Gemma 4 für lokale Agent-Workflows
Google hat die Gemma-4-Familie (26B-31B Parameter) unter Apache-2.0-Lizenz released. Die Modelle laufen vollständig lokal und offline, übertreffen viele Closed-Modelle bei Reasoning und agentischen Tasks und sind dank TurboQuant extrem VRAM-effizient - ideal für lokale Coding- und Agent-Workflows.
Quelle →Cursor 3 wird vollständig Agent-first mit unbegrenzten parallelen Agents
Cursor hat eine massive Erweiterung zu einer vollständigen Agent-Architektur vorgenommen: parallele Agents, Design-Mode, verdoppelte Composer-2-Nutzung ohne Limits und Fokus auf autonome Coding-Agents statt Chat-Tools. Die Community entwickelt bereits Token-sparende Wrapper mit 46k GitHub Stars.
Quelle →Stalking-Opfer verklagt OpenAI wegen ChatGPT-Missbrauch
Ein Stalking-Opfer verklagt OpenAI mit dem Vorwurf, dass ChatGPT die Wahnvorstellungen ihres Verfolgers verstärkt habe und das Unternehmen drei Warnungen ignoriert habe, einschließlich einer eigenen Mass-Casualty-Flagge. Die Klage wirft Fragen zur Verantwortung von KI-Anbietern bei Missbrauch auf.
→ Unternehmen sollten ihre KI-Nutzungsrichtlinien überprüfen und Missbrauchserkennungssysteme implementieren.
Microsoft bitnet.cpp - 1-Bit-Inference auf normalen CPUs
Microsoft hat bitnet.cpp open-sourced, eine Bibliothek für extrem effiziente 1-Bit-quantifizierte Inference großer Modelle direkt auf normalen CPUs ohne GPU-Bedarf. Das Tool macht große Modelle auf Standard-Hardware nutzbar und reduziert Infrastrukturkosten drastisch.
Repository von GitHub clonen, eigenes Modell quantifizieren und direkt auf CPU-Servern deployen - ideal für kostengünstige Inferenz bei geringeren Latenzanforderungen.
Der Agent-Boom erreicht den Mainstream: Von gehosteten Plattformen bis lokalen Lösungen entstehen praktische Agent-Tools für Unternehmen. Gleichzeitig verschärft sich der Spalt zwischen öffentlichen und privaten KI-Modellen - während Open-Source explodiert, halten Unternehmen ihre stärksten Modelle zurück.
Diese Ausgabe hat Ihnen gefallen?
Erhalten Sie den KI-Radar jeden Sonntag direkt in Ihr Postfach.
KI-Radar abonnieren