KW 7 · 2026 · 15.02.2026

Code-Revolution: 1000+ Tokens/s + koordinierte KI-Offensive

Diese Woche in 30 Sekunden

OpenAI GPT-5.3-Codex-Spark macht Code-Entwicklung interaktiv: 1000+ Tokens/s Generation verwandelt Programmieren in Echtzeit-Gespräche
Koordinierte KI-Offensive: 4 Major-Releases an einem Tag - Anthropic Claude Opus 4.6, MiniMax M2.5 für ~1$/Stunde, Zhipu GLM-5 mit 24h+ Autonomie
OpenAI veröffentlicht erstmals größere Open-Source-Modelle: gpt-oss-120b und gpt-oss-20b auf Hugging Face verfügbar

High-End

OpenAI GPT-5.3-Codex-Spark: Code-Generation wird interaktiv wie ein Gespräch

GPT-5.3-Codex-Spark ist jetzt in Research Preview verfügbar und erreicht über 1.000 Tokens pro Sekunde auf spezieller Hardware - ein Paradigmenwechsel für Softwareentwicklung. Das Modell ist speziell für extrem schnelle Code-Iterationen optimiert und über ChatGPT Pro, eine dedizierte Codex-App, CLI und IDE-Extensions verfügbar. OpenAI bewirbt es als Lösung für wartezeitfreies Programmieren unter dem Motto 'einfach bauen'. Die Geschwindigkeit macht erstmals Code-Generation so schnell wie menschliches Lesen - damit wird Programmierung zu einem interaktiven Dialog zwischen Entwickler und KI.

Warum relevant: Diese Geschwindigkeit verändert Softwareentwicklung fundamental: Prototyping wird minutenschnell, Entwickler können in Echtzeit experimentieren, und Code-Reviews werden zur Live-Collaboration. Deutsche Tech-Unternehmen müssen ihre Entwicklungsprozesse überdenken, da traditionelle Workflows obsolet werden könnten.

Zur Quelle →

High-End

Anthropic Claude Opus 4.6 mit vollständigem Safety-Report und kostenlosem Nonprofit-Zugang

Claude Opus 4.6 ist das neue Flaggschiff-Modell von Anthropic. Bemerkenswert: Anthropic hat vorsorglich einen vollständigen Sabotage-Risk-Report auf ASL-4-Niveau veröffentlicht und Nonprofits kostenlosen Zugang gewährt. Dies zeigt Anthropics proaktiven Ansatz bei KI-Sicherheit.

Quelle →

High-End

MiniMax M2.5: Flaggschiff-Performance zum Zehntel des Preises

M2.5 von MiniMax soll Claude Opus 4.6-Niveau bei Coding, Agentic Workflows und Office-Aufgaben erreichen, läuft aber für nur ~1 Dollar pro Stunde kontinuierlich. Sofort verfügbar auf Fireworks, vLLM und für lokale Nutzung in FP8-Precision.

Quelle →

High-End

Zhipu GLM-5: 24+ Stunden autonome Arbeit, baut kompletten Game Boy-Emulator

GLM-5 arbeitet über 24 Stunden autonom mit 700+ Tool-Calls und 800+ Context-Handoffs. Als Beweis der Fähigkeiten baut es einen kompletten Game Boy-Emulator von Grund auf. Eine Open-Weights-Version folgt bald, bereits #3 auf Design-Arena.

Quelle →

Tools

GitHub startet Agentic Workflows: Automatische Issue-Triage und CI-Fixes

GitHub führt in der Tech Preview Agentic Workflows ein: Automatische Issue-Triage, CI-Fix-Vorschläge und Pull Requests werden direkt im Repository durch KI-Agents erstellt. Dies automatisiert Routine-DevOps-Aufgaben erheblich.

Quelle →

Grundlagen

Was ist ein LLM (Large Language Model)?

Ein Large Language Model (LLM) ist ein KI-System, das auf riesigen Textmengen trainiert wurde und dadurch natürliche Sprache verstehen und generieren kann. Diese Modelle lernen Muster, Zusammenhänge und Strukturen aus Milliarden von Texten - von Büchern über Websites bis zu Code-Repositories. Bekannte Beispiele sind GPT-5.3, Claude Opus oder GLM-5. LLMs funktionieren durch das Vorhersagen des nächsten Wortes (oder Tokens) in einer Sequenz, wobei sie den gesamten vorherigen Kontext berücksichtigen. Moderne LLMs können nicht nur Text verstehen und schreiben, sondern auch Code programmieren, Bilder analysieren und komplexe Aufgaben über mehrere Schritte lösen.

Die aktuellen Releases zeigen die nächste LLM-Generation: GPT-5.3-Codex-Spark erreicht 1000+ Tokens/s Generation, während GLM-5 über 24 Stunden autonom arbeitet - LLMs werden von Antwort-Generatoren zu dauerhaft aktiven Arbeitspartnern.

Praxis-Tipp der Woche

Anthropic Claude Skills für wiederverwendbare KI-Workflows

Anthropic hat einen 30-seitigen Guide für Claude Skills veröffentlicht - strukturierte YAML-Ordner mit Scripts und Assets, die Claude einmalig komplexe Workflows beibringen. Skills funktionieren in Claude Code, Projects und über die API und reduzieren Context-Bloat durch Progressive Disclosure massiv.

Erstelle einen Ordner mit skill.yaml (Frontmatter mit Name, Beschreibung, Parametern) plus zugehörige Scripts oder Dateien. Claude kann dann diese Skills in neuen Gesprächen direkt anwenden, ohne dass Sie jedes Mal den kompletten Workflow erklären müssen.

Ausblick

Die koordinierten Releases zeigen einen Wettlauf um Agent-fähige Modelle: Schnelligkeit (1000+ Tokens/s), Ausdauer (24+ Stunden) und Kosteneffizienz (~1$/Stunde) werden die Schlüsselfaktoren. Open-Source-Releases von OpenAI signalisieren eine strategische Öffnung des bisher geschlossenen Ökosystems.

Diese Ausgabe hat Ihnen gefallen?

Erhalten Sie den KI-Radar jeden Sonntag direkt in Ihr Postfach.

KI-Radar abonnieren