Caliby: Eingebettete Vektordatenbank schlägt pgvector um Faktor 4
Caliby ist ein eingebettetes Vektor-Retrieval-Framework, das gemeinsam von Sea-Land AI und dem MIT DB Group-Team um Michael Stonebraker entwickelt wurde. Der Kern ist in C++ geschrieben und wird über pybind11-Bindings in Python verfügbar gemacht. Laut den Entwicklern übertrifft Caliby pgvector in direkten Leistungsvergleichen um den Faktor 4 und schlägt FAISS in Disk-Storage-Szenarien, obwohl FAISS als reine In-Memory-Lösung gilt. Unterstützt werden drei Indexstrukturen: HNSW, DiskANN (Vamana Graph) und IVF+PQ – ausgelegt für Szenarien mit Millionen bis Zehnmillionen Vektoren. Für CPU-Beschleunigung nutzt Caliby SIMD-Instruktionen (AVX-512, AVX2, SSE) ohne externe Abhängigkeiten. Besonders für AI-Agent- und RAG-Workflows ist die native Unterstützung von Text- und Vektordaten in einem einzigen Buffer-Pool-System relevant: Metadaten, Rohtexte und Embeddings werden gemeinsam verwaltet, was das Bouncing zwischen einer Vektordatenbank und einer relationalen Datenbank entfällt. Die Motivation der Entwickler war der fehlende „DuckDB-Moment" bei Vektordatenbanken – ein leichtgewichtiges, dateibasiertes System ohne Cluster-Setup, das trotzdem Enterprise-Niveau bei der Performance erreicht.
- C++-Kern mit pybind11-Bindings; Installation via `pip install caliby`, keine externen Prozesse oder Dienste nötig
- DiskANN (Vamana Graph) ermöglicht hohe Retrieval-Performance direkt auf Disk – übertrifft laut Team In-Memory-FAISS in Disk-Szenarien
- SIMD-Beschleunigung über AVX-512, AVX2 und SSE, zero externe Abhängigkeiten
- Unified Storage: Text, Metadaten und Vektoren coexistieren im selben Buffer-Pool – kombinierte Vektor+Metadaten-Queries ohne zweites System
- Entwickelt von Sea-Land AI zusammen mit Michael Stonebreakers MIT DB Group; GitHub: github.com/zxjcarrot/caliby
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- MEINUNGmarktechpost.com2w
Neun Vektor-Datenbanken 2026 im Vergleich: Preise, Skalierung und Architektur
- LAUNCHmarktechpost.com4d
Tencent open-sourct TencentDB Agent Memory: 4-stufiges lokales Gedächtnissystem für KI-Agenten
- LAUNCHmarktechpost.com8h
pgvector als Vektor-Datenbank: Komplettguide für semantische und hybride Suche
- FORSCHUNGhuggingface.co0mo
ClawGym: Skalierbares Framework für Claw-Style Personal Agents
Caliby: Eingebettete Vektordatenbank schlägt pgvector um Faktor 4
Caliby ist ein eingebettetes Vektor-Retrieval-Framework, das gemeinsam von Sea-Land AI und dem MIT DB Group-Team um Michael Stonebraker entwickelt wurde. Der Kern ist in C++ geschrieben und wird über pybind11-Bindings in Python verfügbar gemacht. Laut den Entwicklern übertrifft Caliby pgvector in direkten Leistungsvergleichen um den Faktor 4 und schlägt FAISS in Disk-Storage-Szenarien, obwohl FAISS als reine In-Memory-Lösung gilt. Unterstützt werden drei Indexstrukturen: HNSW, DiskANN (Vamana Graph) und IVF+PQ – ausgelegt für Szenarien mit Millionen bis Zehnmillionen Vektoren. Für CPU-Beschleunigung nutzt Caliby SIMD-Instruktionen (AVX-512, AVX2, SSE) ohne externe Abhängigkeiten. Besonders für AI-Agent- und RAG-Workflows ist die native Unterstützung von Text- und Vektordaten in einem einzigen Buffer-Pool-System relevant: Metadaten, Rohtexte und Embeddings werden gemeinsam verwaltet, was das Bouncing zwischen einer Vektordatenbank und einer relationalen Datenbank entfällt. Die Motivation der Entwickler war der fehlende „DuckDB-Moment" bei Vektordatenbanken – ein leichtgewichtiges, dateibasiertes System ohne Cluster-Setup, das trotzdem Enterprise-Niveau bei der Performance erreicht.
- C++-Kern mit pybind11-Bindings; Installation via `pip install caliby`, keine externen Prozesse oder Dienste nötig
- DiskANN (Vamana Graph) ermöglicht hohe Retrieval-Performance direkt auf Disk – übertrifft laut Team In-Memory-FAISS in Disk-Szenarien
- SIMD-Beschleunigung über AVX-512, AVX2 und SSE, zero externe Abhängigkeiten
- Unified Storage: Text, Metadaten und Vektoren coexistieren im selben Buffer-Pool – kombinierte Vektor+Metadaten-Queries ohne zweites System
- Entwickelt von Sea-Land AI zusammen mit Michael Stonebreakers MIT DB Group; GitHub: github.com/zxjcarrot/caliby
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- MEINUNGmarktechpost.com2w
Neun Vektor-Datenbanken 2026 im Vergleich: Preise, Skalierung und Architektur
- LAUNCHmarktechpost.com4d
Tencent open-sourct TencentDB Agent Memory: 4-stufiges lokales Gedächtnissystem für KI-Agenten
- LAUNCHmarktechpost.com8h
pgvector als Vektor-Datenbank: Komplettguide für semantische und hybride Suche
- FORSCHUNGhuggingface.co0mo
ClawGym: Skalierbares Framework für Claw-Style Personal Agents