ml-intern: HuggingFace-Agent-Harness jetzt mit llama.cpp und Ollama
ml-intern ist ein von HuggingFace entwickelter Agent-Harness, der eine enge Anbindung an die hauseigenen Open-Source-Bibliotheken transformers, datasets und trl sowie die Hub-Infrastruktur bietet. Der Aufbau ist bewusst schlank gehalten: im Kern Tools plus System-Prompt. Ursprünglich für Claude Opus entwickelt, wurde der Harness nun um Unterstützung für lokale Modelle via llama.cpp und Ollama erweitert. Als Demonstrationsmodell kommt Qwen3.6-35B-A3B zum Einsatz, das laut Entwickler in der Lage ist, einen vollständigen SFT-Prozess (Supervised Fine-Tuning) end-to-end zu orchestrieren – inklusive CPU/GPU-Sandboxes und Jobs auf dem HuggingFace Hub. Der Beitrag stammt von /u/lewtun, einem HuggingFace-Mitarbeiter, und wurde auf r/LocalLLaMA veröffentlicht. Das Projekt ist auf GitHub unter huggingface/ml-intern zugänglich. Besonders hervorzuheben ist die Möglichkeit, einen autonomen KI-Forscher dauerhaft auf einem Laptop laufen zu lassen, ohne an Cloud-Token-Limits zu stoßen.
- Harness-Architektur besteht im Kern aus Tools + System-Prompt, bewusst einfach gehalten.
- Ursprünglich für Claude Opus entwickelt, neu: lokale Modell-Unterstützung via llama.cpp und Ollama.
- Demo zeigt Qwen3.6-35B-A3B beim vollständigen SFT-Durchlauf mit CPU/GPU-Sandboxes.
- Unterstützt HuggingFace-Bibliotheken transformers, datasets, trl und Hub-Jobs.
- Quellcode öffentlich verfügbar: github.com/huggingface/ml-intern
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- MEINUNGreddit.com1w
Undergrad baut Research-Agent mit lokalem Qwen3.5-35B für Physics-Informed Neural Networks
- MEINUNGreddit.com2w
Qwen3.6-35B-A3B im Praxiseinsatz: Lokale LLMs als vollständige Workflow-Automatisierung
- LAUNCHreddit.com2w
lmm: CLI-Tool gegen doppelte Modell-Downloads per HF-Cache und Symlinks
- LAUNCHreddit.com2w
Hedy-App bringt vollständig offline laufende Meeting-KI auf Apple Silicon
ml-intern: HuggingFace-Agent-Harness jetzt mit llama.cpp und Ollama
ml-intern ist ein von HuggingFace entwickelter Agent-Harness, der eine enge Anbindung an die hauseigenen Open-Source-Bibliotheken transformers, datasets und trl sowie die Hub-Infrastruktur bietet. Der Aufbau ist bewusst schlank gehalten: im Kern Tools plus System-Prompt. Ursprünglich für Claude Opus entwickelt, wurde der Harness nun um Unterstützung für lokale Modelle via llama.cpp und Ollama erweitert. Als Demonstrationsmodell kommt Qwen3.6-35B-A3B zum Einsatz, das laut Entwickler in der Lage ist, einen vollständigen SFT-Prozess (Supervised Fine-Tuning) end-to-end zu orchestrieren – inklusive CPU/GPU-Sandboxes und Jobs auf dem HuggingFace Hub. Der Beitrag stammt von /u/lewtun, einem HuggingFace-Mitarbeiter, und wurde auf r/LocalLLaMA veröffentlicht. Das Projekt ist auf GitHub unter huggingface/ml-intern zugänglich. Besonders hervorzuheben ist die Möglichkeit, einen autonomen KI-Forscher dauerhaft auf einem Laptop laufen zu lassen, ohne an Cloud-Token-Limits zu stoßen.
- Harness-Architektur besteht im Kern aus Tools + System-Prompt, bewusst einfach gehalten.
- Ursprünglich für Claude Opus entwickelt, neu: lokale Modell-Unterstützung via llama.cpp und Ollama.
- Demo zeigt Qwen3.6-35B-A3B beim vollständigen SFT-Durchlauf mit CPU/GPU-Sandboxes.
- Unterstützt HuggingFace-Bibliotheken transformers, datasets, trl und Hub-Jobs.
- Quellcode öffentlich verfügbar: github.com/huggingface/ml-intern
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- MEINUNGreddit.com1w
Undergrad baut Research-Agent mit lokalem Qwen3.5-35B für Physics-Informed Neural Networks
- MEINUNGreddit.com2w
Qwen3.6-35B-A3B im Praxiseinsatz: Lokale LLMs als vollständige Workflow-Automatisierung
- LAUNCHreddit.com2w
lmm: CLI-Tool gegen doppelte Modell-Downloads per HF-Cache und Symlinks
- LAUNCHreddit.com2w
Hedy-App bringt vollständig offline laufende Meeting-KI auf Apple Silicon