Intern-S2-Preview: 35B wissenschaftliches Multimodal-Modell mit Task Scaling

Warum es zählt

Für AI-Builder in wissenschaftlichen Domänen bietet Intern-S2-Preview eine effiziente Alternative zu deutlich größeren Modellen – inklusive Agenten-Fähigkeiten, CoT-Kompression für schnellere Inferenz und MTP-gestütztem RL-Training, das auf 35B-Hardware realistisch betreibbar ist.

— Lumeric Redaktion

Intern-S2-Preview ist ein wissenschaftliches Multimodal-Modell mit 35 Milliarden Parametern, das vom InternLM-Team auf Basis von Qwen3.5 weiterentwickelt wurde. Kernidee ist das sogenannte „Task Scaling": Statt primär Parameter oder Datenmenge zu erhöhen, wird die Schwierigkeit, Diversität und Abdeckung wissenschaftlicher Aufgaben systematisch gesteigert – und zwar über die gesamte Trainings-Pipeline von Pre-Training bis Reinforcement Learning. Damit erreicht das Modell laut den Entwicklern auf mehreren wissenschaftlichen Kernbenchmarks eine vergleichbare Leistung wie Intern-S1-Pro, das im Trillion-Parameter-Bereich angesiedelt ist. Besonders hervorgehoben wird die Fähigkeit zur Kristallstruktur-Generierung für Materialien, was Intern-S2-Preview als erstes Open-Source-Modell dieser Klasse ausweist. Hinzu kommen verbesserte Agenten-Fähigkeiten für wissenschaftliche Workflows. Im RL-Training kommen zwei Effizienz-Techniken zum Einsatz: Shared-Weight Multi-Token Prediction (MTP) mit KL-Loss zur Reduzierung des Mismatches zwischen Training und Inferenz sowie CoT-Kompression, die kürzere Antworten bei gleichbleibender Reasoning-Qualität ermöglicht und die Token-Generierungsgeschwindigkeit erhöht.

Was wir noch wissen

Modell basiert auf continued pretraining von Qwen3.5, 35B Parameter
Erstmals Open-Source-Modell mit Kristallstruktur-Generierung (Material Science) kombiniert mit starken Allgemein-Fähigkeiten
MTP mit KL-Loss verbessert Accept Rate und Token-Geschwindigkeit bei RL-Inferenz
CoT-Kompression verkürzt Antworten ohne Leistungseinbußen beim Reasoning
Stärkt Scientific-Agent-Fähigkeiten gegenüber der Vorgängergeneration auf mehreren Benchmarks

Quelle lesenreddit.com

35B Parameter

Vergleichbar mit Intern-S1-Pro (Trillion-Scale)

Foundation Modelle Multimodal Open Source

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Intern-S2-Preview: 35B wissenschaftliches Multimodal-Modell mit Task Scaling

ToolsQwen Hugging Face

CompaniesHugging Face

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

Modell basiert auf continued pretraining von Qwen3.5, 35B Parameter
Erstmals Open-Source-Modell mit Kristallstruktur-Generierung (Material Science) kombiniert mit starken Allgemein-Fähigkeiten
MTP mit KL-Loss verbessert Accept Rate und Token-Geschwindigkeit bei RL-Inferenz
CoT-Kompression verkürzt Antworten ohne Leistungseinbußen beim Reasoning
Stärkt Scientific-Agent-Fähigkeiten gegenüber der Vorgängergeneration auf mehreren Benchmarks

35B Parameter

Vergleichbar mit Intern-S1-Pro (Trillion-Scale)

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Intern-S2-Preview: 35B wissenschaftliches Multimodal-Modell mit Task Scaling

Frag die KI zum Artikel

Verwandte Beiträge

Intern-S2-Preview: 35B wissenschaftliches Multimodal-Modell mit Task Scaling

Frag die KI zum Artikel

Verwandte Beiträge