Code-Revolution: 1000+ Tokens/s + koordinierte KI-Offensive
- OpenAI GPT-5.3-Codex-Spark macht Code-Entwicklung interaktiv: 1000+ Tokens/s Generation verwandelt Programmieren in Echtzeit-Gespräche
- Koordinierte KI-Offensive: 4 Major-Releases an einem Tag - Anthropic Claude Opus 4.6, MiniMax M2.5 für ~1$/Stunde, Zhipu GLM-5 mit 24h+ Autonomie
- OpenAI veröffentlicht erstmals größere Open-Source-Modelle: gpt-oss-120b und gpt-oss-20b auf Hugging Face verfügbar
OpenAI GPT-5.3-Codex-Spark: Code-Generation wird interaktiv wie ein Gespräch
GPT-5.3-Codex-Spark ist jetzt in Research Preview verfügbar und erreicht über 1.000 Tokens pro Sekunde auf spezieller Hardware - ein Paradigmenwechsel für Softwareentwicklung. Das Modell ist speziell für extrem schnelle Code-Iterationen optimiert und über ChatGPT Pro, eine dedizierte Codex-App, CLI und IDE-Extensions verfügbar. OpenAI bewirbt es als Lösung für wartezeitfreies Programmieren unter dem Motto 'einfach bauen'. Die Geschwindigkeit macht erstmals Code-Generation so schnell wie menschliches Lesen - damit wird Programmierung zu einem interaktiven Dialog zwischen Entwickler und KI.
Anthropic Claude Opus 4.6 mit vollständigem Safety-Report und kostenlosem Nonprofit-Zugang
Claude Opus 4.6 ist das neue Flaggschiff-Modell von Anthropic. Bemerkenswert: Anthropic hat vorsorglich einen vollständigen Sabotage-Risk-Report auf ASL-4-Niveau veröffentlicht und Nonprofits kostenlosen Zugang gewährt. Dies zeigt Anthropics proaktiven Ansatz bei KI-Sicherheit.
Quelle →MiniMax M2.5: Flaggschiff-Performance zum Zehntel des Preises
M2.5 von MiniMax soll Claude Opus 4.6-Niveau bei Coding, Agentic Workflows und Office-Aufgaben erreichen, läuft aber für nur ~1 Dollar pro Stunde kontinuierlich. Sofort verfügbar auf Fireworks, vLLM und für lokale Nutzung in FP8-Precision.
Quelle →Zhipu GLM-5: 24+ Stunden autonome Arbeit, baut kompletten Game Boy-Emulator
GLM-5 arbeitet über 24 Stunden autonom mit 700+ Tool-Calls und 800+ Context-Handoffs. Als Beweis der Fähigkeiten baut es einen kompletten Game Boy-Emulator von Grund auf. Eine Open-Weights-Version folgt bald, bereits #3 auf Design-Arena.
Quelle →GitHub startet Agentic Workflows: Automatische Issue-Triage und CI-Fixes
GitHub führt in der Tech Preview Agentic Workflows ein: Automatische Issue-Triage, CI-Fix-Vorschläge und Pull Requests werden direkt im Repository durch KI-Agents erstellt. Dies automatisiert Routine-DevOps-Aufgaben erheblich.
Quelle →Was ist ein LLM (Large Language Model)?
Ein Large Language Model (LLM) ist ein KI-System, das auf riesigen Textmengen trainiert wurde und dadurch natürliche Sprache verstehen und generieren kann. Diese Modelle lernen Muster, Zusammenhänge und Strukturen aus Milliarden von Texten - von Büchern über Websites bis zu Code-Repositories. Bekannte Beispiele sind GPT-5.3, Claude Opus oder GLM-5. LLMs funktionieren durch das Vorhersagen des nächsten Wortes (oder Tokens) in einer Sequenz, wobei sie den gesamten vorherigen Kontext berücksichtigen. Moderne LLMs können nicht nur Text verstehen und schreiben, sondern auch Code programmieren, Bilder analysieren und komplexe Aufgaben über mehrere Schritte lösen.
Die aktuellen Releases zeigen die nächste LLM-Generation: GPT-5.3-Codex-Spark erreicht 1000+ Tokens/s Generation, während GLM-5 über 24 Stunden autonom arbeitet - LLMs werden von Antwort-Generatoren zu dauerhaft aktiven Arbeitspartnern.
Anthropic Claude Skills für wiederverwendbare KI-Workflows
Anthropic hat einen 30-seitigen Guide für Claude Skills veröffentlicht - strukturierte YAML-Ordner mit Scripts und Assets, die Claude einmalig komplexe Workflows beibringen. Skills funktionieren in Claude Code, Projects und über die API und reduzieren Context-Bloat durch Progressive Disclosure massiv.
Erstelle einen Ordner mit skill.yaml (Frontmatter mit Name, Beschreibung, Parametern) plus zugehörige Scripts oder Dateien. Claude kann dann diese Skills in neuen Gesprächen direkt anwenden, ohne dass Sie jedes Mal den kompletten Workflow erklären müssen.
Die koordinierten Releases zeigen einen Wettlauf um Agent-fähige Modelle: Schnelligkeit (1000+ Tokens/s), Ausdauer (24+ Stunden) und Kosteneffizienz (~1$/Stunde) werden die Schlüsselfaktoren. Open-Source-Releases von OpenAI signalisieren eine strategische Öffnung des bisher geschlossenen Ökosystems.
Diese Ausgabe hat Ihnen gefallen?
Erhalten Sie den KI-Radar jeden Sonntag direkt in Ihr Postfach.
KI-Radar abonnieren