Maia 200 vylepšuje Microsoft Azure o nový inferenční křemík pro umělou inteligenci

EuroWire , SAN FRANCISCO : Společnost Microsoft 26. ledna představila Maia 200, druhou generaci svého interního akcelerátoru umělé inteligence, který byl navržen pro spouštění modelů umělé inteligence v produkčním prostředí v datových centrech Azure. Společnost uvedla, že Maia 200 je navržena pro inferenci, tedy fázi, ve které trénované modely generují odpovědi na živé požadavky, a bude použita k podpoře řady služeb umělé inteligence od Microsoftu.

Maia 200 se vyrábí 3nanometrovým procesem společnosti TSMC a obsahuje více než 140 miliard tranzistorů, uvedl Microsoft . Čipy využívají nový paměťový systém, který zahrnuje 216 gigabajtů paměti HBM3e s vysokou šířkou pásma a přibližně 272 megabajtů integrované paměti SRAM, jehož cílem je zvládat generování tokenů ve velkém měřítku a další úlohy vyžadující značné inference.

Společnost Microsoft uvedla, že Maia 200 poskytuje výkon více než 10 petaflopů s přesností na 4 bity a přibližně 5 petaflopů s přesností na 8 bitů, což jsou formáty běžně používané pro efektivní provoz moderní generativní umělé inteligence . Společnost také uvedla, že systém je navržen s výkonem 750 wattů a je postaven se škálovatelnou sítí, takže čipy lze propojit pro větší nasazení.

Společnost uvedla, že nový hardware začal být zaváděn v datovém centru Azure US Central v Iowě a další lokalita je plánována v Arizoně. Microsoft popsal Maia 200 jako svůj dosud nejefektivnější inferenční systém a oznámil 30% zlepšení výkonu na dolar ve srovnání se stávajícími inferenčními systémy.

Zaměření na inferenci umělé inteligence a nasazení Azure

Společnost Microsoft uvedla, že čip Maia 200 je určen k podpoře produktů a služeb umělé inteligence, které se spoléhají na velkoobjemové provádění modelů s nízkou latencí, včetně úloh běžících v Azure a vlastních aplikacích společnosti Microsoft. Společnost uvedla, že čip a okolní systém navrhla jako součást komplexního infrastrukturního přístupu, který zahrnuje křemík, servery, sítě a software pro nasazení modelů umělé inteligence ve velkém měřítku.

Spolu s čipem společnost Microsoft oznámila předběžný přístup k vývojářské sadě pro software Maia pro vývojáře a výzkumníky pracující na optimalizaci modelů. Společnost uvedla, že tento nástroj má pomoci týmům s kompilací a laděním modelů pro systémy založené na platformě Maia a je strukturován tak, aby zapadal do běžných pracovních postupů vývoje umělé inteligence používaných pro nasazení inference v cloudu.

Tvrzení o výkonu a podpora modelu

Společnost Microsoft uvedla, že čip Maia 200 je navržen pro spouštění rozsáhlých jazykových modelů a pokročilých systémů uvažování a že bude používán pro interní a hostované nasazení modelů v Azure. Společnost umístila čip jako akcelerátor produkční inference, čímž jej odlišuje od systémů zaměřených na trénování, které se obvykle používají k vytváření modelů před nasazením.

Společnost Microsoft urychlila práci na zakázkovém křemíku, protože rostla poptávka po výpočetních technologiích pro generativní aplikace umělé inteligence, kde náklady a dostupnost akcelerátorů mohou ovlivnit rychlost škálování služeb. Maia 200 navazuje na Maia 100, kterou Microsoft představil v roce 2023, a představuje nejnovější verzi své specializované řady akcelerátorů umělé inteligence pro inferenci v datových centrech.

Příspěvek Maia 200 vylepšuje Microsoft Azure o nový inferenční křemík pro umělou inteligenci se poprvé objevil na North Briton .

Maia 200 vylepšuje Microsoft Azure o nový inferenční křemík pro umělou inteligenci

Počet patentových přihlášek v Rakousku v roce 2025 prudce vzrostl

Agentury OSN zavádějí chartu pro veřejné digitální vzdělávání

WIPO spouští výměnu informací o duševním vlastnictví s využitím umělé inteligence

BMW spouští pilotní projekt humanoidního robota v závodě v Lipsku

Dohoda o Indii a Finsku se zaměřuje na čistou energii 6G s umělou inteligencí a kvantové propojení

Evropský parlament vypíná vestavěnou umělou inteligenci na oficiálních zařízeních

Emise v systému EU ETS prodlužují pokles s 1,3% poklesem v roce 2025

Moskva otevírá T2 na rekordní trase městské tramvaje

Evropská pšenice klesá již třetí den kvůli nadbytku nabídky

Ruská studie zjistila, že sloučeniny ze smrku zpomalují srážení krve.

Spojené království čeká nejteplejší den roku 2026, než se prudce ochladí.

WHO vyzývá k celosvětové podpoře vědy u příležitosti Světového dne zdraví

Systém vstupu a výstupu do EU bude plně spuštěn 10. dubna.

Havárie lodi s migranty u italského pobřeží si vyžádala 71 pohřešovaných.

Podnikání

Emise v systému EU ETS prodlužují pokles s 1,3% poklesem v roce 2025

Evropská pšenice klesá již třetí den kvůli nadbytku nabídky

OPEC+ potvrdil květnový nárůst dodávek ropy o 206 000 barelů denně

Zprávy

Moskva otevírá T2 na rekordní trase městské tramvaje

Spojené království čeká nejteplejší den roku 2026, než se prudce ochladí.

Havárie lodi s migranty u italského pobřeží si vyžádala 71 pohřešovaných.

Technologie

Počet patentových přihlášek v Rakousku v roce 2025 prudce vzrostl

Agentury OSN zavádějí chartu pro veřejné digitální vzdělávání

WIPO spouští výměnu informací o duševním vlastnictví s využitím umělé inteligence

Maia 200 vylepšuje Microsoft Azure o nový inferenční křemík pro umělou inteligenci

Související příspěvky