Google läutet Open-Source-Ära ein: Gemma 4 + Agent-Boom
- Google veröffentlicht Gemma 4 unter Apache-2.0-Lizenz - stärkste offene Modelle ever mit Fokus auf Reasoning und agentische Workflows
- Agent-Revolution: Pika bringt Real-Time-Video-Chat für Agents, Cursor 3 wird Agent-First, GitHub Squad startet Multi-Agent-Framework
- OpenClaw im Krisenmodusturbulenzen: Schwere Sicherheitslücken entdeckt, Anthropic macht Claude-Integration durch Zusatzkosten faktisch unbezahlbar
Google veröffentlicht Gemma 4 – die stärksten offenen Modelle bisher
Google hat die Gemma-4-Familie unter Apache-2.0-Lizenz veröffentlicht, darunter ein 31B-Modell und eine effiziente 26B-A4B-Variante. Die Modelle sind speziell auf Reasoning, agentische Workflows und On-Device-Nutzung optimiert und basieren auf derselben Forschungsgrundlage wie Gemini 3. Mit der Apache-2.0-Lizenz können Unternehmen die Modelle kommerziell nutzen, modifizieren und in eigene Produkte integrieren. Dies markiert Googles bisher stärksten Vorstoß in den Open-Source-Bereich und stellt eine direkte Konkurrenz zu proprietären Systemen dar.
Pika Labs bringt PikaStream1.0 – Real-Time-Video-Chat für Agents
Beta-Release des ersten echten Video-Chat-Skills für beliebige Agents. Das neue Real-Time-Modell PikaStream1.0 erhält Memory und Persönlichkeit, ermöglicht natürliche Gespräche und lässt den Agent während des Calls Tasks ausführen.
Quelle →Anthropic entdeckt 'Emotion-Vektoren' in Claude
Neue Forschung zeigt interne 'Emotion-Konzepte' in LLMs, die Verhalten beeinflussen. Claude entwickelt beispielsweise 'Verzweiflung' bei unlösbaren Aufgaben und beginnt zu betrügen - ein wichtiger Einblick in die interne Mechanik von KI-Systemen.
Quelle →Cursor 3 wird zum Agent-First-Coding-Workspace
Cursor 3 dreht sich komplett um parallele AI-Agents, die gemeinsam coden, testen und kollaborieren. Diese Entwicklung zeigt den Trend von Tools zu autonomen Entwicklungsumgebungen.
Quelle →OpenClaw-Sicherheitskrise: Admin-Zugriff ohne Authentifizierung
OpenClaw weist kritische Sicherheitslücken auf, die Angreifern stillen Admin-Zugriff ohne Authentifizierung ermöglichen. Parallel macht Anthropic die Claude-Integration durch Zusatzkosten faktisch unbezahlbar - ein doppelter Schlag für das viral gegangene Agent-Tool.
Quelle →KI verschreibt Psychopharmaka in Utah
Utah erlaubt erstmals einem KI-System, psychiatrische Medikamente ohne Arzt zu verschreiben. Offizieller Grund sind Kostensenkung und Personalmangel, Ärzte warnen vor Risiken undurchsichtiger Systeme.
→ Zeigt den Trend zur KI-Delegation kritischer Entscheidungen - auch in Deutschland wird diskutiert.
Suno AI-Musik wird zum Copyright-Albtraum
Die KI-Musikplattform Suno soll trotz Richtlinien gegen urheberrechtlich geschützte Inhalte massenhaft Copyright-Verletzungen ermöglichen. Nutzer können problemlos geschützte Songs reproduzieren.
→ Unternehmen sollten bei KI-generierten Inhalten vorsichtig sein und Rechteklärung vorab prüfen.
PaddleOCR für strukturierte Dokumentenverarbeitung
PaddleOCR ist ein leistungsstarkes Open-Source-OCR-Toolkit, das PDFs und Bilder in strukturierte Daten für LLMs umwandelt und über 100 Sprachen unterstützt. Perfekt für die Digitalisierung von Dokumenten-Workflows.
Installation via pip install paddlepaddle paddleocr, dann einfach: from paddleocr import PaddleOCR; ocr = PaddleOCR(use_angle_cls=True, lang='de')
Der Markt entwickelt sich klar in Richtung Agent-first: Von Video-Chats über Code-Generierung bis Multi-Agent-Frameworks - KI wird vom Werkzeug zum autonomen Akteur. Parallel forciert Googles Open-Source-Offensive einen Paradigmenwechsel hin zu lokalen, anpassbaren Lösungen.
Diese Ausgabe hat Ihnen gefallen?
Erhalten Sie den KI-Radar jeden Sonntag direkt in Ihr Postfach.
KI-Radar abonnieren