GPT-5.5 Rekord-Launch + Musk vs. Altman eskaliert vor Gericht
- GPT-5.5 verzeichnet stärksten Release aller Zeiten - API-Revenue wächst mehr als doppelt so schnell, Context Window auf 1M Tokens erweitert
- Musk vs. Altman eskaliert: Drei Tage Zeugenaussagen vor Gericht über OpenAIs angeblichen Verrat der Non-Profit-Mission
- Agent-Boom geht weiter: xAI startet Voice Cloning API, Claude erhält Push-Benachrichtigungen, Google testet neues Video-Modell Omni
GPT-5.5 bricht alle Rekorde: Explosives API-Wachstum treibt Enterprise-Boom
Nur eine Woche nach dem Launch meldet OpenAI für GPT-5.5 den stärksten Release aller Zeiten. Die API-Revenue wächst mehr als doppelt so schnell wie bei früheren Modellen, während die Codex-Sparte den Umsatz in unter sieben Tagen verdoppelt hat. Getrieben wird das Wachstum von starker Enterprise-Nachfrage nach agentischen Coding-Tools. Parallel dazu wird der Context-Window von aktuell 400K auf 1 Million Tokens erweitert, was komplexere Arbeitsabläufe und größere Code-Repositories ermöglicht. OpenAI hat zudem neue Prompting-Guidelines veröffentlicht, die zeigen, dass kürzere, outcome-orientierte Prompts bei GPT-5.5 bessere Ergebnisse liefern, da das Modell selbstständig effiziente Lösungswege wählt.
Google testet Video-Modell 'Omni' - könnte Veo deutlich übertreffen
Ein interner Leak zeigt, dass Google ein neues Video-Generierungsmodell namens 'Omni' für Gemini testet. Das Modell soll deutlich leistungsfähiger als das aktuelle Veo werden und könnte vor dem I/O-Event released werden.
Quelle →xAI startet Voice Cloning API - Custom Voices in unter 2 Minuten
xAI hat Voice Cloning über die API live geschaltet. Nutzer können eigene Stimmen in unter 2 Minuten erstellen oder aus über 80 Stimmen in 28 Sprachen wählen. Das Tool eignet sich ideal für Voice-Agents, Hörbücher oder Game-Charaktere.
Quelle →Apple nutzt Claude intern - Leak in Support-App enthüllt intensive Nutzung
Im aktuellen Apple Support-App-Update sind geleakte Claude.md-Dateien aufgetaucht, was zeigt, dass Apple-Entwickler Claude intensiv für Software-Entwicklung einsetzen. Die Claude.md-Datei mit Best Practices ist mittlerweile #1 Trending auf GitHub.
Quelle →Gemma 4 E2B: Vollständig lokaler AI-Agent läuft im Browser
Ein komplett lokaler Agent läuft mit Gemma 4 E2B und WebGPU direkt im Browser. Er durchsucht die Browsing-History, fasst Webseiten zusammen und verwaltet Tabs - alles ohne Server-Verbindung.
Quelle →Medizinische RAG-Chatbots mit kritischen Sicherheitslücken
Eine neue Studie zeigt massive Sicherheits- und Privacy-Risiken bei patient-facing RAG-Chatbots im Gesundheitswesen. Backend-Systeme werden oft ungewollt exponiert, was sensitive Patientendaten gefährdet.
→ Unternehmen sollten RAG-Systeme vor dem Produktiveinsatz intensiven Security-Audits unterziehen.
PaddleOCR - Dokumente für LLMs strukturieren
PaddleOCR ist ein leichtgewichtiges OCR-Toolkit, das PDFs und Bilder in strukturierte Daten für LLMs umwandelt. Es unterstützt über 100 Sprachen und eignet sich perfekt für Dokumenten-Workflows.
Installation via pip install paddlepaddle paddleocr, dann einfach paddleocr --image_dir ./doc --use_angle_cls true für automatische Texterkennung mit Layoutanalyse.
Der Markt konsolidiert sich um wenige dominante Player: OpenAI festigt die Führung, während chinesische Modelle wie DeepSeek-R1 als günstige Alternative wachsen. Gleichzeitig wird der Rechtsstreit zwischen Musk und Altman zur Grundsatzentscheidung über die Zukunft von OpenAI.
Diese Ausgabe hat Ihnen gefallen?
Erhalten Sie den KI-Radar jeden Sonntag direkt in Ihr Postfach.
KI-Radar abonnieren