Intel und AMD stellen AI Compute Extensions vor – 16x schneller als AVX10

CompaniesAMD

Warum es zählt

ACE ermöglicht leichte KI-Workloads auf Standard-CPUs statt teurer GPUs und senkt damit Energie- und Latenzkosten in Rechenzentren – bei gleichzeitiger Softwarekompatibilität über Intel/AMD hinweg könnten KI-Deployments künftig deutlich kostengünstiger werden.

— Lumeric Redaktion

Intel und AMD haben unter dem Dach der x86 Ecosystem Advisory Group (EAG) die AI Compute Extensions (ACE) entwickelt, um CPU-basierte KI-Verarbeitung fundamental zu verbessern und dabei historische Zersplitterung wie bei AVX-512 zu vermeiden. ACE bringt spezialisierte 2D-Tile-Register und Outer-Product-Algorithmen auf Standard-x86-Prozessoren, die bis zu 1.024 Multiplikationen pro Takt ausführen – gegenüber 64 bei klassischen AVX-Instruktionen. Das ergibt eine 16fache Steigerung der Rechenleistung gegenüber AVX10 und bringt GPU-ähnliche Tensor-Core-Funktionen direkt auf CPUs. Vollständige Rückwärtskompatibilität bleibt erhalten. Die einheitliche Norm soll PyTorch, TensorFlow, NumPy und SciPy ohne Modifikation auf Intel- und AMD-Hardware vom Laptop bis zum Servercluster laufen lassen. Hardware mit ACE-Unterstützung existiert noch nicht, aber die kooperative Entwicklung könnte CPU-basierte KI-Inferenz wirtschaftlicher und stromsparender machen als bisherige GPU-Lösungen.

Was wir noch wissen

1.024 Multiplikationen pro Taktzyklus möglich – 16x höher als mit AVX10, 64x höher als mit klassischen AVX-Instruktionen
Einsatz von 2D-Tile-Registern und Outer-Product-Algorithmen für Matrix-Operationen direkt auf CPUs
Einheitliches Standard-Design beider Anbieter verhindert Hardware-Fragmentierung wie bei AVX-512
Geringere Stromaufnahme als GPUs bei leichten KI-Workloads, senkt Energiekosten in Datencentern
Noch keine Hardware mit ACE-Unterstützung verfügbar; wird zunächst für PyTorch, TensorFlow, NumPy und SciPy implementiert

Quelle lesenreddit.com

Chips Silizium Inferenz Infra

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Intel und AMD stellen AI Compute Extensions vor – 16x schneller als AVX10

CompaniesAMD

Warum es zählt

— Lumeric Redaktion

Was wir noch wissen

1.024 Multiplikationen pro Taktzyklus möglich – 16x höher als mit AVX10, 64x höher als mit klassischen AVX-Instruktionen
Einsatz von 2D-Tile-Registern und Outer-Product-Algorithmen für Matrix-Operationen direkt auf CPUs
Einheitliches Standard-Design beider Anbieter verhindert Hardware-Fragmentierung wie bei AVX-512
Geringere Stromaufnahme als GPUs bei leichten KI-Workloads, senkt Energiekosten in Datencentern
Noch keine Hardware mit ACE-Unterstützung verfügbar; wird zunächst für PyTorch, TensorFlow, NumPy und SciPy implementiert

Frag die KI zum Artikel

Folgefragen zu Headline, Quelle und Volltext — Antwort streamt in wenigen Sekunden.

Intel und AMD stellen AI Compute Extensions vor – 16x schneller als AVX10

Frag die KI zum Artikel

Verwandte Beiträge

Intel und AMD stellen AI Compute Extensions vor – 16x schneller als AVX10

Frag die KI zum Artikel

Verwandte Beiträge