Tencent veröffentlicht Hy-MT2: Mehrsprachige Übersetzungsmodelle in 1.8B, 7B und 30B
Tencent hat die Hy-MT2-Modellfamilie als Open-Source-Release veröffentlicht. Die Familie umfasst drei Modellgrößen – 1.8B, 7B und 30B-A3B (Mixture-of-Experts) – und richtet sich auf komplexe, praxisnahe Übersetzungsszenarien in 33 Sprachen aus. Ein Schwerpunkt liegt auf der Fähigkeit, Übersetzungsanweisungen in mehreren Sprachen zu befolgen (Instruction Following). Für On-Device-Deployment kommt die hauseigene AngelSlim-Technologie mit 1.25-Bit-Extremquantisierung zum Einsatz, die das 1.8B-Modell auf 440 MB komprimiert und die Inferenzgeschwindigkeit um den Faktor 1,5 erhöht. Laut Tencents eigenen Benchmarks schlagen die 7B- und 30B-A3B-Modelle im Fast-Thinking-Modus Open-Source-Konkurrenten wie DeepSeek-V4-Pro und Kimi K2.6, während das 1.8B-Modell kommerzielle APIs von Microsoft und Doubao übertrifft. Zusammen mit dem Modell-Release wird der Benchmark IFMTBench für Übersetzungs-Instruction-Following open-sourcet. Zudem kooperiert Tencent Hy offiziell mit WMT26 für den „Video Subtitle Translation Task" und sponsert dort Sonderpreise für Teams, die Hy-MT-Modelle einsetzen. Alle Modelle sind auf HuggingFace verfügbar, inklusive GGUF-Varianten.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHthe-decoder.com0mo
Tencents 440-MB-Modell übersetzt 33 Sprachen offline auf dem Smartphone
- FORSCHUNGarxiv.org1w
CompactQE: Übersetzungsqualität mit kleinen Open-Weight-LLMs einschätzen
- FORSCHUNGhuggingface.co1d
MobileMoE: Mixture-of-Experts für On-Device-Inferenz unter einer Milliarde Parameter
- LAUNCHmarktechpost.com0mo
IBM veröffentlicht zwei Granite Speech 4.1 2B Modelle für Enterprise-ASR
Tencent veröffentlicht Hy-MT2: Mehrsprachige Übersetzungsmodelle in 1.8B, 7B und 30B
Tencent hat die Hy-MT2-Modellfamilie als Open-Source-Release veröffentlicht. Die Familie umfasst drei Modellgrößen – 1.8B, 7B und 30B-A3B (Mixture-of-Experts) – und richtet sich auf komplexe, praxisnahe Übersetzungsszenarien in 33 Sprachen aus. Ein Schwerpunkt liegt auf der Fähigkeit, Übersetzungsanweisungen in mehreren Sprachen zu befolgen (Instruction Following). Für On-Device-Deployment kommt die hauseigene AngelSlim-Technologie mit 1.25-Bit-Extremquantisierung zum Einsatz, die das 1.8B-Modell auf 440 MB komprimiert und die Inferenzgeschwindigkeit um den Faktor 1,5 erhöht. Laut Tencents eigenen Benchmarks schlagen die 7B- und 30B-A3B-Modelle im Fast-Thinking-Modus Open-Source-Konkurrenten wie DeepSeek-V4-Pro und Kimi K2.6, während das 1.8B-Modell kommerzielle APIs von Microsoft und Doubao übertrifft. Zusammen mit dem Modell-Release wird der Benchmark IFMTBench für Übersetzungs-Instruction-Following open-sourcet. Zudem kooperiert Tencent Hy offiziell mit WMT26 für den „Video Subtitle Translation Task" und sponsert dort Sonderpreise für Teams, die Hy-MT-Modelle einsetzen. Alle Modelle sind auf HuggingFace verfügbar, inklusive GGUF-Varianten.
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHthe-decoder.com0mo
Tencents 440-MB-Modell übersetzt 33 Sprachen offline auf dem Smartphone
- FORSCHUNGarxiv.org1w
CompactQE: Übersetzungsqualität mit kleinen Open-Weight-LLMs einschätzen
- FORSCHUNGhuggingface.co1d
MobileMoE: Mixture-of-Experts für On-Device-Inferenz unter einer Milliarde Parameter
- LAUNCHmarktechpost.com0mo
IBM veröffentlicht zwei Granite Speech 4.1 2B Modelle für Enterprise-ASR