
ESMFold2: BioHub veröffentlicht Open-Source-Engine für Proteinstrukturvorhersage
Alex Rives, Head of Science bei BioHub und Leiter des von EvoScale übernommenen ESM-Teams, hat ESMFold2 zusammen mit einem Preprint und zwei MIT-lizenzierten Modellen veröffentlicht. Das Kernsystem besteht aus ESMC, einem World-Model-Transformer trainiert auf 2,8 Milliarden Proteinsequenzen, sowie ESMFold2 als Strukturvorhersage-Head. Anders als AlphaFold2 und AlphaFold3 verzichtet der Ansatz bewusst auf Multi-Sequence Alignments (MSAs) als Inductive Bias – ein Design-Entscheid, der die Generalisierung verbessert, insbesondere bei Antikörpern, für die kaum MSA-Daten existieren. BioHub veröffentlicht zudem einen Atlas von 6,8 Milliarden Proteinen und 1,1 Milliarden vorhergesagter Strukturen. Das Team berichtet State-of-the-Art-Performance bei Proteininteraktionen und präsentiert Belege, dass Inference-Time-Scaling über fünf Ziele in Krebs- und Immunologieforschung greift. Nass-Labor-Validierungen einzelner schwieriger Moleküle wurden bereits durchgeführt. Zusätzlich wurden Sparse Autoencoders (SAEs) zur mechanistischen Interpretierbarkeit der gelernten biologischen Features eingesetzt.
- ESMC als World Model auf 2,8 Mrd. Proteinsequenzen trainiert; ESMFold2 als Struktur-Head darüber
- Atlas enthält 6,8 Mrd. Proteine und 1,1 Mrd. vorhergesagte Strukturen, öffentlich zugänglich
- State-of-the-Art bei Antikörper-Interaktionen – einem therapeutisch zentralen Bereich ohne MSA-Daten
- Inference-Time-Scaling zeigt Wirkung über 5 Krebs- und Immunologie-Targets
- Sparse Autoencoders (SAEs) für mechanistische Interpretierbarkeit biologischer Modell-Features eingesetzt
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org1w
TEDBench: Neuer Großbenchmark für Proteinfaltungsklassifikation mit MiAE
- FORSCHUNGarxiv.org1w
DCFold: Proteinstruktur-Generierung mit 15-facher Inferenzbeschleunigung
- FORSCHUNGarxiv.org3w
Polyformer: Generatives Modell für thermodynamische Simulation von Proteinen
- FORSCHUNGarxiv.org1d
AIMS-Fold: Guided-Diffusion-Framework integriert XL-MS und HDX-MS für Proteinkomplex-Strukturvorhersage

ESMFold2: BioHub veröffentlicht Open-Source-Engine für Proteinstrukturvorhersage
Alex Rives, Head of Science bei BioHub und Leiter des von EvoScale übernommenen ESM-Teams, hat ESMFold2 zusammen mit einem Preprint und zwei MIT-lizenzierten Modellen veröffentlicht. Das Kernsystem besteht aus ESMC, einem World-Model-Transformer trainiert auf 2,8 Milliarden Proteinsequenzen, sowie ESMFold2 als Strukturvorhersage-Head. Anders als AlphaFold2 und AlphaFold3 verzichtet der Ansatz bewusst auf Multi-Sequence Alignments (MSAs) als Inductive Bias – ein Design-Entscheid, der die Generalisierung verbessert, insbesondere bei Antikörpern, für die kaum MSA-Daten existieren. BioHub veröffentlicht zudem einen Atlas von 6,8 Milliarden Proteinen und 1,1 Milliarden vorhergesagter Strukturen. Das Team berichtet State-of-the-Art-Performance bei Proteininteraktionen und präsentiert Belege, dass Inference-Time-Scaling über fünf Ziele in Krebs- und Immunologieforschung greift. Nass-Labor-Validierungen einzelner schwieriger Moleküle wurden bereits durchgeführt. Zusätzlich wurden Sparse Autoencoders (SAEs) zur mechanistischen Interpretierbarkeit der gelernten biologischen Features eingesetzt.
- ESMC als World Model auf 2,8 Mrd. Proteinsequenzen trainiert; ESMFold2 als Struktur-Head darüber
- Atlas enthält 6,8 Mrd. Proteine und 1,1 Mrd. vorhergesagte Strukturen, öffentlich zugänglich
- State-of-the-Art bei Antikörper-Interaktionen – einem therapeutisch zentralen Bereich ohne MSA-Daten
- Inference-Time-Scaling zeigt Wirkung über 5 Krebs- und Immunologie-Targets
- Sparse Autoencoders (SAEs) für mechanistische Interpretierbarkeit biologischer Modell-Features eingesetzt
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- FORSCHUNGarxiv.org1w
TEDBench: Neuer Großbenchmark für Proteinfaltungsklassifikation mit MiAE
- FORSCHUNGarxiv.org1w
DCFold: Proteinstruktur-Generierung mit 15-facher Inferenzbeschleunigung
- FORSCHUNGarxiv.org3w
Polyformer: Generatives Modell für thermodynamische Simulation von Proteinen
- FORSCHUNGarxiv.org1d
AIMS-Fold: Guided-Diffusion-Framework integriert XL-MS und HDX-MS für Proteinkomplex-Strukturvorhersage