LLM 0.32a2: Reasoning-Tokens für GPT-5-Klasse via Responses-Endpoint
Mit llm 0.32a2 stellt Simon Willison eine neue Alpha-Version seines Kommandozeilen-Tools vor, das den Zugriff auf Large Language Models direkt aus dem Terminal heraus ermöglicht. Das zentrale neue Feature: Die meisten reasoning-fähigen OpenAI-Modelle werden nun über den Endpoint /v1/responses statt wie bisher über /v1/chat/completions angesprochen. Damit unterstützt das Tool sogenanntes „interleaved reasoning", bei dem Denkschritte auch zwischen einzelnen Tool-Calls sichtbar werden — eine Funktionalität, die speziell für Modelle der GPT-5-Klasse relevant ist. Die zusammengefassten Reasoning-Tokens erscheinen in der CLI in einer eigenen Farbe, um sie vom regulären Output zu unterscheiden. Wer diese Darstellung nicht möchte, kann sie mit dem Flag -R oder --hide-reasoning deaktivieren. Die Änderung ist unter Issue #1435 im Projekt-Repository dokumentiert. Die Alpha enthält laut Willison noch weitere nützliche Verbesserungen, die er im Kontext dieses Release-Notes-Posts jedoch nicht im Detail ausführt.
- Neuer Endpoint /v1/responses ersetzt /v1/chat/completions für reasoning-fähige OpenAI-Modelle
- Interleaved Reasoning über Tool-Calls hinweg nun für GPT-5-Klasse-Modelle möglich
- Reasoning-Tokens werden farblich abgesetzt von Standardausgabe im Terminal angezeigt
- Flags -R / --hide-reasoning ermöglichen das Ausblenden der Reasoning-Anzeige
- Änderung dokumentiert in GitHub-Issue #1435 des llm-Projekts
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
LLM 0.32a2: Reasoning-Tokens für GPT-5-Klasse via Responses-Endpoint
Mit llm 0.32a2 stellt Simon Willison eine neue Alpha-Version seines Kommandozeilen-Tools vor, das den Zugriff auf Large Language Models direkt aus dem Terminal heraus ermöglicht. Das zentrale neue Feature: Die meisten reasoning-fähigen OpenAI-Modelle werden nun über den Endpoint /v1/responses statt wie bisher über /v1/chat/completions angesprochen. Damit unterstützt das Tool sogenanntes „interleaved reasoning", bei dem Denkschritte auch zwischen einzelnen Tool-Calls sichtbar werden — eine Funktionalität, die speziell für Modelle der GPT-5-Klasse relevant ist. Die zusammengefassten Reasoning-Tokens erscheinen in der CLI in einer eigenen Farbe, um sie vom regulären Output zu unterscheiden. Wer diese Darstellung nicht möchte, kann sie mit dem Flag -R oder --hide-reasoning deaktivieren. Die Änderung ist unter Issue #1435 im Projekt-Repository dokumentiert. Die Alpha enthält laut Willison noch weitere nützliche Verbesserungen, die er im Kontext dieses Release-Notes-Posts jedoch nicht im Detail ausführt.
- Neuer Endpoint /v1/responses ersetzt /v1/chat/completions für reasoning-fähige OpenAI-Modelle
- Interleaved Reasoning über Tool-Calls hinweg nun für GPT-5-Klasse-Modelle möglich
- Reasoning-Tokens werden farblich abgesetzt von Standardausgabe im Terminal angezeigt
- Flags -R / --hide-reasoning ermöglichen das Ausblenden der Reasoning-Anzeige
- Änderung dokumentiert in GitHub-Issue #1435 des llm-Projekts
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.