wird geladen

VLM — Vision Language Model — Was ist das? · Glossar · Lumeric

Feed
Digest
Lounge
Stash
Profil

VLM — Vision Language Model

★ Begriff· Multimodal

VLM — Vision Language Model

Multimodal-Modell-Klasse mit Schwerpunkt Bild + Text. Beispiele: Llama 3.2 Vision, Qwen2-VL, InternVL. Anwendungen: OCR, Bildbeschreibung, UI-Verständnis für Computer-Use-Agents.

Verwandte Tools

Auch bekannt als

vlm · vision language model · vision-language model

Aktivität

25

Mentions in den letzten 7 Tagen

4 Wochen

⚡neu · 25×

Zuletzt erwähnt in

Moondream 3.1: Vision-Language-Modell mit 9B Params und nur 2B aktiv
2026-07-12
Write-Protected Bottleneck verhindert Symbol-Kollaps in Roboter-Weltmodellen
2026-07-10
APIVOT: VLM-Planer kombiniert Sprach- und Bildgedanken für Roboterplanung
2026-07-10
Quantisierung kleiner VLMs: Komponentenanalyse für Edge-Deployment auf Jetson
2026-07-10
Thinking-Modus schadet VLM-Kalibrierung: Chain-Entropie schlägt Antwort-Entropie
2026-07-10

Feed Digest Lounge Stash Profil