Topic

Post-Training

50 Beiträge der letzten 90 Tage zu Post-Training — kuratiert von der Lumeric-Redaktion mit Trust-Labels und kurzem Warum-es-zählt-Block pro Story.

Top-Tools rund um Post-Training

Qwen87×GPT54×Llama37×Hugging Face31×Claude25×Modal18×

Top-Unternehmen in Post-Training

Hugging Face31×Meta AI25×

Top-Tools rund um Post-Training

Top-Unternehmen in Post-Training

Archiv

Beiträge · 50

RAG vs. Fine-Tuning: Unterschiede und Einsatzgebiete im Vergleich

Community-Experiment: Gemma4-31B auf 40,5B Parameter durch Layer-Insertion erweitert

Community-Diskussion: Praxistipps zum Fine-Tuning kleiner Sprachmodelle

Community-Projekt: Logit-Distillation statt Text-Traces für lokale Coding-Modelle

Hobby-Projekt: LLM from Scratch auf 160 GB Texten aus dem 19. Jahrhundert

GPT-5.6 Sol trainiert kleineres Luna-Modell autonom nach

Model Collapse: Vergiftet KI-generierter Content das Web-Training?

Woher kommt die Persönlichkeit einer KI – und wer löst das Problem?

Kenton Varda verhängt Moratorium gegen KI-geschriebene Commit-Beschreibungen

Hobby-Experiment: DeepSeek-Destillation in Gemma 4 26B-A4B und 12B für unter 4 Dollar

OpenAI launcht GPT-Live-1: Verbesserter Sprachmodus unterbricht weniger

Reddit-Nutzer schlägt Jacobian-bewusstes Pruning und Distillation vor

Hugging Face und Amazon SageMaker Studio mit One-Click-Integration verknüpft

Liquid AI veröffentlicht Antidoom: Open-Source-Fix für Doom-Loops in Reasoning-Modellen

NVIDIA veröffentlicht Nemotron-Labs-3-Puzzle-75B: komprimiertes Hybrid-MoE-Modell

Geschichte der Modell-Destillation: Grundlagen von 2006 bis heute

Community-Frage: Bulk-Reddit-Daten für LLM-Finetuning beschaffen

Claude-Converter v1.5.0: Fine-Tuning-Daten aus Claude Code, Codex und Pi

Community sucht optimale Stack-Kombination für FP8-Training auf SM120-GPUs

ThinkingCap-Qwen3.6-27B: gleiche Genauigkeit mit ~50% weniger Thinking-Token

Photoroom erklärt Datenstrategie für PRX-Modellreihe (Teil 4)

tftf: Ultra-leichtgewichtige Pipeline für Transformer-Modell-Manipulation ohne VRAM-Limit

Amazon schließt Mechanical Turk für Neukunden ab 30. Juli 2026

Neuere Claude-Modelle brechen Custom-Tool-Schemata öfter als ältere

Lilian Weng: Harness Engineering als Grundlage für rekursive KI-Selbstverbesserung

OpenAI Agent RFT: Reinforcement Learning für Enterprise-Finetuning im Praxiseinsatz

Fijik 2.0: Community-entwickeltes 350M-Modell unter Apache-2.0-Lizenz

Fine-tune von Gemma-4-31B für Copywriting mit +290 Elo über Basismodell

Anthropic kürzt Claude Code System-Prompt um 80 Prozent dank Fable-5-Modellen

Community-Projekt: Gemma 4 31B wird zu besserem 26B-Modell umgebaut

Entropie-basierter Ansatz verbessert kreatives Schreiben bei LLMs

Community erweitert Gemma4-31B auf 44B durch Layer-Duplikation

Startup bekämpft Groupthink-Problem bei LLMs

OpenAI plant GPT-5.6 Pro in drei Modellvarianten

Anthropic veröffentlicht Claude Sonnet 5 als günstigere Agentic-Option

Miles: PyTorch-natives Open-Source-Framework für LLM RL Post-Training

SkillOpt: Microsoft macht Agent-Skills zu trainierbaren Parametern

Warum Spezialisierung in KI-Systemen unvermeidlich ist

Norm-preserving Abliteration auf Qwen3.6-35B-A3B: 0% Refusal, Benchmarks unverändert

Sebastian Raschka veröffentlicht Buch: Build a Reasoning Model From Scratch

Base44 launcht eigenes LLM Base1 für Vibe-Coding-Plattform

Amazon destilliert Anthropic-Modelle intern zur Kostensenkung

Arena erreicht 100 Mio. USD ARR – acht Monate nach Launch

Klassisches NLP auf Kaggle: Von Bag-of-Words bis Stacking-Ensemble

Meta sperrt Claude Code und Codex für Ingenieure zum Schutz der Trainingsdaten

Abliteriertes HuiHui-Modell schlägt Vanilla Qwen3.6-35B-a3b in Mathe und Code

Target ersetzt regelbasierte Marketing-Prognosen durch LLM-Retrieval-System

MaralGPT Mythos 9B: Open-Source-Roleplay-Modell auf Qwen-3.5-Basis mit 1M-Token-Kontext

MiCA-Fine-Tuning-Methode in Hugging Face PEFT integriert

MLX LoRA Fine-Tune eines 7B-Modells auf Apple Silicon für literarischen Stil