★ Begriff· Multimodal
CLIP
Contrastive Language-Image Pre-training — OpenAI-Modell (2021), das Bild und Text in einen gemeinsamen Embedding-Raum mappt. Kern-Komponente vieler Image-Generation- und Search-Pipelines.
Verwandte Tools
Auch bekannt als
contrastive language-image pre-training
Aktivität
19
Mentions in den letzten 7 Tagen
4 Wochen
⚡neu · 19×
Zuletzt erwähnt in
- VS2: Label-freies visuelles Steering mit Sparse Autoencodern für gefrorene CLIP-Modelle2026-05-28
- Repräsentations-konditionierte Diffusionsmodelle übertreffen echte Trainingsdaten auf ImageNet1002026-05-28
- DiagramBank: 57.100 wissenschaftliche Schaltdiagramme mit Dokumentkontext2026-05-28
- AREA: Attributbasiertes Class-Incremental Learning mit CLIP gegen Catastrophic Forgetting2026-05-28
- NEO-ov: Natives Vision-Language-Modell ohne modulare Komponenten2026-05-28