AllenAI iteriert MolmoAct2: Open-Source-VLA-Modell für Robotersteuerung
AllenAI veröffentlicht unter dem Namen MolmoAct2 eine wachsende Serie von Fine-Tunes eines 5-Milliarden-Parameter-Vision-Language-Action-Modells (VLA), das speziell für die Steuerung von Robotern entwickelt wurde. Bisher erschienen sind Varianten für allgemeine Robotikaufgaben (LIBERO), interaktive Robotikszenarien (DROID), beidhändige Gelenksteuerung mit absoluter Joint-Pose-Kontrolle (BimanualYAM) sowie eine weitere Variante für SO100/SO101-Systeme. Alle Modelle werden vollständig open source bereitgestellt: Modellgewichte, vollständige Trainingsdatensätze inklusive Pretraining-Daten, Trainingscode sowie technische Paper. Das Projekt richtet sich explizit an Entwickler, die LLM-Inferenz zur Robotersteuerung einsetzen möchten. AllenAI gibt an, kontinuierlich neue Fine-Tunes auf weiteren Robotik-Datensätzen zu veröffentlichen, sodass die Modellpalette weiter wächst.
- 5B-Parameter-VLA-Modell, das Vision, Sprache und Aktion kombiniert
- Fine-Tune MolmoAct2-LIBERO: allgemeine Robotikaufgaben
- Fine-Tune MolmoAct2-DROID: interaktive Robotikszenarien
- Fine-Tunes BimanualYAM & SO100_101: absolute Joint-Pose-Kontrolle für beidhändige Systeme
- Vollständige Offenlegung: Gewichte, Pretraining-Daten, Trainingscode und technische Paper
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGhuggingface.co3w
MolmoAct2: Open-Source Aktionsmodell für Robotik mit Vision-Language-Backbone
- FORSCHUNGarxiv.org2w
Humanoid-LLA: Humanoide Roboter per Freitext-Sprache steuern
- FORSCHUNGarxiv.org2d
EXPO-FT: RL-Finetuning für VLA-Robotikmodelle in unter 20 Minuten
- FORSCHUNGarxiv.org3d
Agentic-VLA: Online-Adaption für Robotik-Modelle mit 2,4× schnellerer Konvergenz
AllenAI iteriert MolmoAct2: Open-Source-VLA-Modell für Robotersteuerung
AllenAI veröffentlicht unter dem Namen MolmoAct2 eine wachsende Serie von Fine-Tunes eines 5-Milliarden-Parameter-Vision-Language-Action-Modells (VLA), das speziell für die Steuerung von Robotern entwickelt wurde. Bisher erschienen sind Varianten für allgemeine Robotikaufgaben (LIBERO), interaktive Robotikszenarien (DROID), beidhändige Gelenksteuerung mit absoluter Joint-Pose-Kontrolle (BimanualYAM) sowie eine weitere Variante für SO100/SO101-Systeme. Alle Modelle werden vollständig open source bereitgestellt: Modellgewichte, vollständige Trainingsdatensätze inklusive Pretraining-Daten, Trainingscode sowie technische Paper. Das Projekt richtet sich explizit an Entwickler, die LLM-Inferenz zur Robotersteuerung einsetzen möchten. AllenAI gibt an, kontinuierlich neue Fine-Tunes auf weiteren Robotik-Datensätzen zu veröffentlichen, sodass die Modellpalette weiter wächst.
- 5B-Parameter-VLA-Modell, das Vision, Sprache und Aktion kombiniert
- Fine-Tune MolmoAct2-LIBERO: allgemeine Robotikaufgaben
- Fine-Tune MolmoAct2-DROID: interaktive Robotikszenarien
- Fine-Tunes BimanualYAM & SO100_101: absolute Joint-Pose-Kontrolle für beidhändige Systeme
- Vollständige Offenlegung: Gewichte, Pretraining-Daten, Trainingscode und technische Paper
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGhuggingface.co3w
MolmoAct2: Open-Source Aktionsmodell für Robotik mit Vision-Language-Backbone
- FORSCHUNGarxiv.org2w
Humanoid-LLA: Humanoide Roboter per Freitext-Sprache steuern
- FORSCHUNGarxiv.org2d
EXPO-FT: RL-Finetuning für VLA-Robotikmodelle in unter 20 Minuten
- FORSCHUNGarxiv.org3d
Agentic-VLA: Online-Adaption für Robotik-Modelle mit 2,4× schnellerer Konvergenz