Wie Lumeric kuratiert
Transparenz ist Trust. Hier ist im Detail, wie eine Story von der Quelle bis auf eine Synthese-Page kommt — und welcher Schritt menschlich, welcher LLM-gestützt ist.
1 · Source-Tier
Über 100 Quellen sind in zwei Tiers aufgeteilt: Free (Vendor-Blogs, Aggregatoren, Press) und Pro (kuratierte Premium-Quellen mit hoher Substanz-Dichte). Die Liste ist nicht versteckt — siehe Trust-Index. Tier wird ausschliesslich redaktionell vergeben, nicht via Engagement oder Reichweite.
2 · Trust-Label pro Beitrag
Jeder Beitrag bekommt einen von sechs Labels:
- RESEARCH — Paper, Pre-Print, technischer Report (höchstes Vertrauen)
- LAUNCH — offizielle Vendor-Ankündigung von Produkt oder Feature
- BENCHMARK — quantifizierter Vergleich (eval-Score, Performance-Test)
- FUNDING— Investment-Runde, Bewertung, M&A
- OPINION — Analyse, Essay, redaktionelle Einordnung
- RUMOR — Gerücht, Twitter- Leak, unbestätigt (niedrigstes Vertrauen)
Das Label setzt der Enrichment-Schritt initial; Edge-Cases mit niedriger Confidence reviewen wir manuell.
3 · Pipeline (täglich)
- Ingest (alle 30 Min) — RSS/ API-Pull aus allen Quellen, Dedup über Embedding-Similarity
- Enrich (alle 30 Min) — Sonnet schreibt headline_de + summary + why_it_matters + topics + mentions_tools + trust_label aus dem Original-Text
- Daily Briefing (06:00 UTC) — Ranking-Algorithmus selektiert ~10 Stories nach Trust + Topic- Diversität + Recency
- Daily-Email (06:10 UTC) — Versand an Subscriber
4 · Wöchentliche Knowledge-Hubs
Jeden Montag generiert Sonnet eine State- of-Synthese pro Tool und pro Topic — basierend auf den Posts der letzten 30 Tage. Drei Sektionen: Aktueller Stand / Wichtigste Updates / Was zu erwarten. Inline-Links [Anker](post:UUID) werden technisch validiert — halluzinierte UUIDs strippen wir automatisch raus, mit Confidence-Penalty.
5 · Confidence-Score
Jede Synthese-Page zeigt einen Confidence-Score (0–100), der deterministisch aus drei Signalen berechnet wird — nicht von Sonnet selbst:
- Posts-Volumen (40%) — wie viele Quellen sprechen über das Thema
- Source-Diversität (24%) — wie viele unabhängige Quellen, nicht nur Echo-Chamber
- Trust-Mix (36%) — RESEARCH/ LAUNCH zählen mehr als RUMOR/OPINION
Pro entferntem halluziniertem Inline-Link minus 5 Punkte (max −20). Die UI rendert das als Badge: ≥75 = verifiziert, ≥50 = vorläufig, <50 = thin.
6 · Approval-Flow
- Auto-Approve nur bei Confidence ≥75 UND ≥8 referenzierten Posts
- Alle anderen Drafts gehen durch einen redaktionellen Approve- Schritt (Editorial-UI)
- Approved-Pages können manuell editiert werden, bevor sie published werden
- Idempotente Cron-Architektur: gleiche Woche wird nie doppelt synthetisiert, Editorial-Approves bleiben intakt
7 · Wo LLMs arbeiten — und wo nicht
Mit LLMs: deutsche Headlines, Summary, Why-it-matters, Topic-Tagging, Tool-Mentions-Erkennung, wöchentliche Synthesen, Übersetzung Englisch→Deutsch.
Ohne LLMs: Source-Tier- Vergabe, Confidence-Score, Approval, Korrekturen, Editorial- Standards, Trust-Index-Algorithmus.
Das eingesetzte Modell ist Anthropic Claude Sonnet 4.6 für die redaktionellen Tasks und Voyage 3.5-lite für Embeddings. Beide Provider sind in der Datenschutzerklärung als Sub-Verarbeiter aufgeführt. Keine User-Daten gehen in den Synthese-Prompt — nur der publizierte Post-Body.
Korrekturen melden
Wenn etwas falsch ist: gregor@lab336.ch. Wir korrigieren sichtbar mit Update-Hinweis statt still zu editieren.