ml-intern: HuggingFace-Agent-Harness jetzt mit llama.cpp und Ollama

ToolsOllama Claude Qwen Llama Hugging Face

Warum es zählt

Qwen3.6-35B-A3B kann damit end-to-end SFT-Workflows lokal auf einem Laptop orchestrieren – ohne Cloud-Kosten oder Token-Limits, rund um die Uhr.

— Lumeric Redaktion

ml-intern ist ein von HuggingFace entwickelter Agent-Harness, der eine enge Anbindung an die hauseigenen Open-Source-Bibliotheken transformers, datasets und trl sowie die Hub-Infrastruktur bietet. Der Aufbau ist bewusst schlank gehalten: im Kern Tools plus System-Prompt. Ursprünglich für Claude Opus entwickelt, wurde der Harness nun um Unterstützung für lokale Modelle via llama.cpp und Ollama erweitert. Als Demonstrationsmodell kommt Qwen3.6-35B-A3B zum Einsatz, das laut Entwickler in der Lage ist, einen vollständigen SFT-Prozess (Supervised Fine-Tuning) end-to-end zu orchestrieren – inklusive CPU/GPU-Sandboxes und Jobs auf dem HuggingFace Hub. Der Beitrag stammt von /u/lewtun, einem HuggingFace-Mitarbeiter, und wurde auf r/LocalLLaMA veröffentlicht. Das Projekt ist auf GitHub unter huggingface/ml-intern zugänglich. Besonders hervorzuheben ist die Möglichkeit, einen autonomen KI-Forscher dauerhaft auf einem Laptop laufen zu lassen, ohne an Cloud-Token-Limits zu stoßen.

Was wir noch wissen

Harness-Architektur besteht im Kern aus Tools + System-Prompt, bewusst einfach gehalten.
Ursprünglich für Claude Opus entwickelt, neu: lokale Modell-Unterstützung via llama.cpp und Ollama.
Demo zeigt Qwen3.6-35B-A3B beim vollständigen SFT-Durchlauf mit CPU/GPU-Sandboxes.
Unterstützt HuggingFace-Bibliotheken transformers, datasets, trl und Hub-Jobs.
Quellcode öffentlich verfügbar: github.com/huggingface/ml-intern

Quelle lesenreddit.com

Agents Open Source Post Training

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

ml-intern: HuggingFace-Agent-Harness jetzt mit llama.cpp und Ollama

ToolsOllama Claude Qwen Llama Hugging Face

CompaniesHugging Face

Warum es zählt

Qwen3.6-35B-A3B kann damit end-to-end SFT-Workflows lokal auf einem Laptop orchestrieren – ohne Cloud-Kosten oder Token-Limits, rund um die Uhr.

— Lumeric Redaktion

Was wir noch wissen

Harness-Architektur besteht im Kern aus Tools + System-Prompt, bewusst einfach gehalten.
Ursprünglich für Claude Opus entwickelt, neu: lokale Modell-Unterstützung via llama.cpp und Ollama.
Demo zeigt Qwen3.6-35B-A3B beim vollständigen SFT-Durchlauf mit CPU/GPU-Sandboxes.
Unterstützt HuggingFace-Bibliotheken transformers, datasets, trl und Hub-Jobs.
Quellcode öffentlich verfügbar: github.com/huggingface/ml-intern

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

ml-intern: HuggingFace-Agent-Harness jetzt mit llama.cpp und Ollama

Frag die KI zum Artikel

Verwandte Beiträge

ml-intern: HuggingFace-Agent-Harness jetzt mit llama.cpp und Ollama

Frag die KI zum Artikel

Verwandte Beiträge