LLM 0.32a0: Simon Willisons CLI-Tool erhält strukturiertes Message- und Streaming-API

ToolsGPT

CompaniesOpenAI

Warum es zählt

Entwickler können nun vorhandene Gesprächsverläufe direkt als messages=[]-Array übergeben und multi-modale Streaming-Outputs (Text, Tool-Calls, Bilder) typsicher verarbeiten — ohne SQLite-Abhängigkeit oder Workarounds.

— Lumeric Redaktion

LLM ist eine seit April 2023 von Simon Willison entwickelte Open-Source-Python-Bibliothek und CLI, die über ein Plugin-System Zugriff auf tausende Sprachmodelle bietet. Das bisherige Kernmodell — ein Text-Prompt erzeugt eine Text-Antwort — stieß zunehmend an Grenzen, da moderne Frontier-Modelle multimodale Eingaben (Bild, Audio, Video), strukturierte JSON-Ausgaben, Tool-Calls und sogar Bild-Rückgaben unterstützen. Version 0.32a0 führt zwei grundlegende API-Änderungen ein: Erstens können Eingaben nun als geordnete Sequenz von user()- und assistant()-Nachrichten übergeben werden, was das Einspeisen vorhandener Gesprächsverläufe ermöglicht und z. B. den Bau eines OpenAI-Chat-Completions-kompatiblen Endpoints deutlich vereinfacht. Zweitens werden Streaming-Antworten als typisierter Event-Stream modelliert, sodass Text-Chunks, Tool-Call-Namen, Tool-Outputs und künftig auch Bild- oder Audio-Segmente sauber unterschieden werden können. Die bisherige prompt=-Schnittstelle bleibt vollständig erhalten (backwards-compatible), wird intern jedoch auf das neue messages-Array abgebildet. Neu ist außerdem response.reply(), mit dem direkt auf eine Antwort geantwortet werden kann, ohne explizit ein Conversation-Objekt zu verwalten. Der Release trägt Alpha-Status; stabile API-Garantien gelten erst ab 0.32.0.

Was wir noch wissen

Plugin-System deckt tausende Modelle ab; bestehende Plugins bleiben durch Backwards-Compatibility weiter funktionsfähig.
Neue Builder-Funktionen llm.user() und llm.assistant() erlauben das Zusammenstellen beliebiger Gesprächsverläufe vor dem API-Call.
stream_events() liefert typisierte Events: 'text', 'tool_call_name' u. a. — geeignet für Server-seitige Tools wie OpenAIs Code Interpreter oder Anthropics Web Search.
Antworten können per response.reply() direkt fortgesetzt werden, ohne SQLite-Speicherschicht oder Conversation-Objekt.
Entwicklungsbeginn der Bibliothek war April 2023; 0.32a0 ist das bisher größte Refactoring des Kernmodells.

Quelle lesensimonwillison.net

Developer Tooling Open Source Agents

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

LLM 0.32a0: Simon Willisons CLI-Tool erhält strukturiertes Message- und Streaming-API

ToolsGPT

CompaniesOpenAI

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Plugin-System deckt tausende Modelle ab; bestehende Plugins bleiben durch Backwards-Compatibility weiter funktionsfähig.
Neue Builder-Funktionen llm.user() und llm.assistant() erlauben das Zusammenstellen beliebiger Gesprächsverläufe vor dem API-Call.
stream_events() liefert typisierte Events: 'text', 'tool_call_name' u. a. — geeignet für Server-seitige Tools wie OpenAIs Code Interpreter oder Anthropics Web Search.
Antworten können per response.reply() direkt fortgesetzt werden, ohne SQLite-Speicherschicht oder Conversation-Objekt.
Entwicklungsbeginn der Bibliothek war April 2023; 0.32a0 ist das bisher größte Refactoring des Kernmodells.

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

LLM 0.32a0: Simon Willisons CLI-Tool erhält strukturiertes Message- und Streaming-API

Frag die KI zum Artikel

Verwandte Beiträge

LLM 0.32a0: Simon Willisons CLI-Tool erhält strukturiertes Message- und Streaming-API

Frag die KI zum Artikel

Verwandte Beiträge