Intel und AMD stellen AI Compute Extensions vor – 16x schneller als AVX10
Intel und AMD haben unter dem Dach der x86 Ecosystem Advisory Group (EAG) die AI Compute Extensions (ACE) entwickelt, um CPU-basierte KI-Verarbeitung fundamental zu verbessern und dabei historische Zersplitterung wie bei AVX-512 zu vermeiden. ACE bringt spezialisierte 2D-Tile-Register und Outer-Product-Algorithmen auf Standard-x86-Prozessoren, die bis zu 1.024 Multiplikationen pro Takt ausführen – gegenüber 64 bei klassischen AVX-Instruktionen. Das ergibt eine 16fache Steigerung der Rechenleistung gegenüber AVX10 und bringt GPU-ähnliche Tensor-Core-Funktionen direkt auf CPUs. Vollständige Rückwärtskompatibilität bleibt erhalten. Die einheitliche Norm soll PyTorch, TensorFlow, NumPy und SciPy ohne Modifikation auf Intel- und AMD-Hardware vom Laptop bis zum Servercluster laufen lassen. Hardware mit ACE-Unterstützung existiert noch nicht, aber die kooperative Entwicklung könnte CPU-basierte KI-Inferenz wirtschaftlicher und stromsparender machen als bisherige GPU-Lösungen.
- 1.024 Multiplikationen pro Taktzyklus möglich – 16x höher als mit AVX10, 64x höher als mit klassischen AVX-Instruktionen
- Einsatz von 2D-Tile-Registern und Outer-Product-Algorithmen für Matrix-Operationen direkt auf CPUs
- Einheitliches Standard-Design beider Anbieter verhindert Hardware-Fragmentierung wie bei AVX-512
- Geringere Stromaufnahme als GPUs bei leichten KI-Workloads, senkt Energiekosten in Datencentern
- Noch keine Hardware mit ACE-Unterstützung verfügbar; wird zunächst für PyTorch, TensorFlow, NumPy und SciPy implementiert
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com3w
AMD plant PCIe-GPU für Enterprise-AI statt Accelerator-Slots
- LAUNCHreddit.com3w
AMD stellt Instinct MI350P mit CDNA-4-Architektur vor
- FORSCHUNGarxiv.org2w
EULER-ADAS: Energieeffizienter SIMD-Posit-Rechenkern für Echtzeit-Fahrassistenzsysteme
- FORSCHUNGarxiv.org2w
TRAM: Gemeinsames Training von KI-Modellen und approximativen Multiplizierern spart bis 27 % Energie
Intel und AMD stellen AI Compute Extensions vor – 16x schneller als AVX10
Intel und AMD haben unter dem Dach der x86 Ecosystem Advisory Group (EAG) die AI Compute Extensions (ACE) entwickelt, um CPU-basierte KI-Verarbeitung fundamental zu verbessern und dabei historische Zersplitterung wie bei AVX-512 zu vermeiden. ACE bringt spezialisierte 2D-Tile-Register und Outer-Product-Algorithmen auf Standard-x86-Prozessoren, die bis zu 1.024 Multiplikationen pro Takt ausführen – gegenüber 64 bei klassischen AVX-Instruktionen. Das ergibt eine 16fache Steigerung der Rechenleistung gegenüber AVX10 und bringt GPU-ähnliche Tensor-Core-Funktionen direkt auf CPUs. Vollständige Rückwärtskompatibilität bleibt erhalten. Die einheitliche Norm soll PyTorch, TensorFlow, NumPy und SciPy ohne Modifikation auf Intel- und AMD-Hardware vom Laptop bis zum Servercluster laufen lassen. Hardware mit ACE-Unterstützung existiert noch nicht, aber die kooperative Entwicklung könnte CPU-basierte KI-Inferenz wirtschaftlicher und stromsparender machen als bisherige GPU-Lösungen.
- 1.024 Multiplikationen pro Taktzyklus möglich – 16x höher als mit AVX10, 64x höher als mit klassischen AVX-Instruktionen
- Einsatz von 2D-Tile-Registern und Outer-Product-Algorithmen für Matrix-Operationen direkt auf CPUs
- Einheitliches Standard-Design beider Anbieter verhindert Hardware-Fragmentierung wie bei AVX-512
- Geringere Stromaufnahme als GPUs bei leichten KI-Workloads, senkt Energiekosten in Datencentern
- Noch keine Hardware mit ACE-Unterstützung verfügbar; wird zunächst für PyTorch, TensorFlow, NumPy und SciPy implementiert
Frag die KI zum Artikel
Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.
Verwandte Beiträge
- LAUNCHreddit.com3w
AMD plant PCIe-GPU für Enterprise-AI statt Accelerator-Slots
- LAUNCHreddit.com3w
AMD stellt Instinct MI350P mit CDNA-4-Architektur vor
- FORSCHUNGarxiv.org2w
EULER-ADAS: Energieeffizienter SIMD-Posit-Rechenkern für Echtzeit-Fahrassistenzsysteme
- FORSCHUNGarxiv.org2w
TRAM: Gemeinsames Training von KI-Modellen und approximativen Multiplizierern spart bis 27 % Energie