Methodologie

Wie Lumeric kuratiert

Transparenz ist Trust. Hier ist im Detail, wie eine Story von der Quelle bis auf eine Synthese-Page kommt — und welcher Schritt menschlich, welcher LLM-gestützt ist.

1 · Source-Tier

Über 100 Quellen sind in zwei Tiers aufgeteilt: Free (Vendor-Blogs, Aggregatoren, Press) und Pro (kuratierte Premium-Quellen mit hoher Substanz-Dichte). Die Liste ist nicht versteckt — siehe Trust-Index. Tier wird ausschliesslich redaktionell vergeben, nicht via Engagement oder Reichweite.

2 · Trust-Label pro Beitrag

Jeder Beitrag bekommt einen von sechs Labels:

RESEARCH — Paper, Pre-Print, technischer Report (höchstes Vertrauen)
LAUNCH — offizielle Vendor-Ankündigung von Produkt oder Feature
BENCHMARK — quantifizierter Vergleich (eval-Score, Performance-Test)
FUNDING— Investment-Runde, Bewertung, M&A
OPINION — Analyse, Essay, redaktionelle Einordnung
RUMOR — Gerücht, Twitter- Leak, unbestätigt (niedrigstes Vertrauen)

Das Label setzt der Enrichment-Schritt initial; Edge-Cases mit niedriger Confidence reviewen wir manuell.

3 · Pipeline (täglich)

Ingest (alle 30 Min) — RSS/ API-Pull aus allen Quellen, Dedup über Embedding-Similarity
Enrich (alle 30 Min) — Sonnet schreibt headline_de + summary + why_it_matters + topics + mentions_tools + trust_label aus dem Original-Text
Daily Briefing (06:00 UTC) — Ranking-Algorithmus selektiert ~10 Stories nach Trust + Topic- Diversität + Recency
Daily-Email (06:10 UTC) — Versand an Subscriber

4 · Wöchentliche Knowledge-Hubs

Jeden Montag generiert Sonnet eine State- of-Synthese pro Tool und pro Topic — basierend auf den Posts der letzten 30 Tage. Drei Sektionen: Aktueller Stand / Wichtigste Updates / Was zu erwarten. Inline-Links [Anker](post:UUID) werden technisch validiert — halluzinierte UUIDs strippen wir automatisch raus, mit Confidence-Penalty.

5 · Confidence-Score

Jede Synthese-Page zeigt einen Confidence-Score (0–100), der deterministisch aus drei Signalen berechnet wird — nicht von Sonnet selbst:

Posts-Volumen (40%) — wie viele Quellen sprechen über das Thema
Source-Diversität (24%) — wie viele unabhängige Quellen, nicht nur Echo-Chamber
Trust-Mix (36%) — RESEARCH/ LAUNCH zählen mehr als RUMOR/OPINION

Pro entferntem halluziniertem Inline-Link minus 5 Punkte (max −20). Die UI rendert das als Badge: ≥75 = verifiziert, ≥50 = vorläufig, <50 = thin.

6 · Approval-Flow

Auto-Approve nur bei Confidence ≥75 UND ≥8 referenzierten Posts
Alle anderen Drafts gehen durch einen redaktionellen Approve- Schritt (Editorial-UI)
Approved-Pages können manuell editiert werden, bevor sie published werden
Idempotente Cron-Architektur: gleiche Woche wird nie doppelt synthetisiert, Editorial-Approves bleiben intakt

7 · Wo LLMs arbeiten — und wo nicht

Mit LLMs: deutsche Headlines, Summary, Why-it-matters, Topic-Tagging, Tool-Mentions-Erkennung, wöchentliche Synthesen, Übersetzung Englisch→Deutsch.

Ohne LLMs: Source-Tier- Vergabe, Confidence-Score, Approval, Korrekturen, Editorial- Standards, Trust-Index-Algorithmus.

Das eingesetzte Modell ist Anthropic Claude Sonnet 4.6 für die redaktionellen Tasks und Voyage 3.5-lite für Embeddings. Beide Provider sind in der Datenschutzerklärung als Sub-Verarbeiter aufgeführt. Keine User-Daten gehen in den Synthese-Prompt — nur der publizierte Post-Body.

Korrekturen melden

Wenn etwas falsch ist: gregor@lab336.ch. Wir korrigieren sichtbar mit Update-Hinweis statt still zu editieren.

2 · Trust-Label pro Beitrag

Jeder Beitrag bekommt einen von sechs Labels:

RESEARCH — Paper, Pre-Print, technischer Report (höchstes Vertrauen)

LAUNCH — offizielle Vendor-Ankündigung von Produkt oder Feature

BENCHMARK — quantifizierter Vergleich (eval-Score, Performance-Test)

FUNDING— Investment-Runde, Bewertung, M&A

OPINION — Analyse, Essay, redaktionelle Einordnung

RUMOR — Gerücht, Twitter- Leak, unbestätigt (niedrigstes Vertrauen)

Das Label setzt der Enrichment-Schritt initial; Edge-Cases mit niedriger Confidence reviewen wir manuell.

3 · Pipeline (täglich)

Ingest (alle 30 Min) — RSS/ API-Pull aus allen Quellen, Dedup über Embedding-Similarity

Enrich (alle 30 Min) — Sonnet schreibt headline_de + summary + why_it_matters + topics + mentions_tools + trust_label aus dem Original-Text

Daily Briefing (06:00 UTC) — Ranking-Algorithmus selektiert ~10 Stories nach Trust + Topic- Diversität + Recency

Daily-Email (06:10 UTC) — Versand an Subscriber

4 · Wöchentliche Knowledge-Hubs

5 · Confidence-Score

Jede Synthese-Page zeigt einen Confidence-Score (0–100), der deterministisch aus drei Signalen berechnet wird — nicht von Sonnet selbst:

Posts-Volumen (40%) — wie viele Quellen sprechen über das Thema

Source-Diversität (24%) — wie viele unabhängige Quellen, nicht nur Echo-Chamber

Trust-Mix (36%) — RESEARCH/ LAUNCH zählen mehr als RUMOR/OPINION

Pro entferntem halluziniertem Inline-Link minus 5 Punkte (max −20). Die UI rendert das als Badge: ≥75 = verifiziert, ≥50 = vorläufig, <50 = thin.

6 · Approval-Flow

Auto-Approve nur bei Confidence ≥75 UND ≥8 referenzierten Posts

Alle anderen Drafts gehen durch einen redaktionellen Approve- Schritt (Editorial-UI)

Approved-Pages können manuell editiert werden, bevor sie published werden

Idempotente Cron-Architektur: gleiche Woche wird nie doppelt synthetisiert, Editorial-Approves bleiben intakt

7 · Wo LLMs arbeiten — und wo nicht

Mit LLMs: deutsche Headlines, Summary, Why-it-matters, Topic-Tagging, Tool-Mentions-Erkennung, wöchentliche Synthesen, Übersetzung Englisch→Deutsch.

Ohne LLMs: Source-Tier- Vergabe, Confidence-Score, Approval, Korrekturen, Editorial- Standards, Trust-Index-Algorithmus.