AIPointer v1.2.0: Open-Source Desktop-Overlay erhält Ollama-Integration
AIPointer (MIT-Lizenz, GitHub: gonemedia/aipointer) ist ein Desktop-Overlay, das per Tastendruck oder Mausgeste ein Eingabefenster direkt neben dem Cursor öffnet. Bisher wurden Anfragen ausschließlich über Cloud-Provider wie OpenRouter, Anthropic, OpenAI und Gemini abgewickelt. Mit v1.2.0 kommt Ollama als First-Class-Provider hinzu: Auto-Erkennung auf localhost:11434, Modell-Dropdown aus /api/tags, eine kombinierte Vision-und-Text-Pipeline sowie Tool-Calling für 10 eingebaute Funktionen (u. a. fetch_url, search_web, play_music, launch_app). Das Ziel ist ein Time-to-First-Token unter 2 Sekunden, gemessen gegen die Gemini 2/3 Flash Cloud-Baseline. Der Entwickler betreibt parallel das Projekt Skales, das bereits 15+ LLM-Provider inklusive Ollama, LM Studio und vLLM unterstützt – die lokale Inferenz-Infrastruktur ist daher erprobt. Neu ist die Kombination aus Vision und Tool-Calling unter dem TTFT-Budget. Gesucht werden Tester auf M1–M4-Macs (inkl. Pro/Max/Ultra), RTX-3090/4090/5090 unter Windows und Linux sowie AMD-ROCm-Setups. Empfohlene Modelle wurden im Thread auf die Qwen3.5/3.6-Familie und Qwen3.6-35B-A3B aktualisiert.
- AIPointer läuft signiert/notarisiert auf Mac, per NSIS-Installer auf Windows und als AppImage auf Linux.
- 10 eingebaute Tools: fetch_url, open_url, search_web, play_music, set_volume, copy_to_clipboard, read_clipboard, launch_app, save_document, reveal_in_finder.
- Empfohlene Vision-Modelle laut Thread: Qwen3.5/3.6-Familie und Qwen3.6-35B-A3B (ersetzen ältere Qwen2.5-VL / Llama 3.2 Vision-Empfehlungen).
- Entwickler testet selbst nur auf M1 Pro und Intel MBP 2019 – fehlende Datenpunkte: M2–M4, RTX 4090/5090, AMD ROCm, 16-GB-VRAM-Karten.
- Pro-Modell-Timeout konfigurierbar, inkl. unbegrenzte Option für große Modelle auf langsamerer Hardware.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com2d
Community-Tool will Local AI per Installer für alle zugänglich machen
- MEINUNGreddit.com2w
r/LocalLLaMA-Diskussion: Wo findet man Apps für lokale LLM-Setups?
- LAUNCHreddit.com1d
Hyvemind: Open-Source-Desktop-App kombiniert Tasks, Hivemind und Swarms für KI-gestützte Entwicklung
- MEINUNGreddit.com2w
Suche nach Open-Source-UI mit Skills-Support für lokale LLMs
AIPointer v1.2.0: Open-Source Desktop-Overlay erhält Ollama-Integration
AIPointer (MIT-Lizenz, GitHub: gonemedia/aipointer) ist ein Desktop-Overlay, das per Tastendruck oder Mausgeste ein Eingabefenster direkt neben dem Cursor öffnet. Bisher wurden Anfragen ausschließlich über Cloud-Provider wie OpenRouter, Anthropic, OpenAI und Gemini abgewickelt. Mit v1.2.0 kommt Ollama als First-Class-Provider hinzu: Auto-Erkennung auf localhost:11434, Modell-Dropdown aus /api/tags, eine kombinierte Vision-und-Text-Pipeline sowie Tool-Calling für 10 eingebaute Funktionen (u. a. fetch_url, search_web, play_music, launch_app). Das Ziel ist ein Time-to-First-Token unter 2 Sekunden, gemessen gegen die Gemini 2/3 Flash Cloud-Baseline. Der Entwickler betreibt parallel das Projekt Skales, das bereits 15+ LLM-Provider inklusive Ollama, LM Studio und vLLM unterstützt – die lokale Inferenz-Infrastruktur ist daher erprobt. Neu ist die Kombination aus Vision und Tool-Calling unter dem TTFT-Budget. Gesucht werden Tester auf M1–M4-Macs (inkl. Pro/Max/Ultra), RTX-3090/4090/5090 unter Windows und Linux sowie AMD-ROCm-Setups. Empfohlene Modelle wurden im Thread auf die Qwen3.5/3.6-Familie und Qwen3.6-35B-A3B aktualisiert.
- AIPointer läuft signiert/notarisiert auf Mac, per NSIS-Installer auf Windows und als AppImage auf Linux.
- 10 eingebaute Tools: fetch_url, open_url, search_web, play_music, set_volume, copy_to_clipboard, read_clipboard, launch_app, save_document, reveal_in_finder.
- Empfohlene Vision-Modelle laut Thread: Qwen3.5/3.6-Familie und Qwen3.6-35B-A3B (ersetzen ältere Qwen2.5-VL / Llama 3.2 Vision-Empfehlungen).
- Entwickler testet selbst nur auf M1 Pro und Intel MBP 2019 – fehlende Datenpunkte: M2–M4, RTX 4090/5090, AMD ROCm, 16-GB-VRAM-Karten.
- Pro-Modell-Timeout konfigurierbar, inkl. unbegrenzte Option für große Modelle auf langsamerer Hardware.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com2d
Community-Tool will Local AI per Installer für alle zugänglich machen
- MEINUNGreddit.com2w
r/LocalLLaMA-Diskussion: Wo findet man Apps für lokale LLM-Setups?
- LAUNCHreddit.com1d
Hyvemind: Open-Source-Desktop-App kombiniert Tasks, Hivemind und Swarms für KI-gestützte Entwicklung
- MEINUNGreddit.com2w
Suche nach Open-Source-UI mit Skills-Support für lokale LLMs