FuriosaAI představuje server NXT RNGD pro energeticky úspornou AI inferenci

FuriosaAI představuje server NXT RNGD pro energeticky úspornou AI inferenci

Jihokorejský startup FuriosaAI uvedl server NXT RNGD určený pro nasazení v datových centrech, soukromých cloudech i on-premise prostředích. Novinka reaguje na rostoucí poptávku po výpočetním výkonu pro AI inference a zároveň na problémy spojené s vysokou spotřebou energie a náklady na chlazení.

Server NXT RNGD je vybaven osmi akceleračními kartami RNGD a ve standardním 4U provedení nabízí výkon až čtyři petaflopy v režimu FP8. K dispozici má 384 GB paměti HBM3 s propustností 12 Tb/s. Každý čip RNGD, vyráběný 5nm technologií TSMC, dosahuje výkonu 512 teraflopů FP8 při TDP 150 W a využívá architekturu Tensor Contraction Processor.

Ve srovnání s běžnými GPU řešeními, jako je Nvidia DGX H100 s maximální spotřebou 10,2 kW, má NXT RNGD výrazně nižší energetické nároky – typicky kolem 3 kW. Datové centrum s výkonem 15 kW na stojan tak může provozovat až pět těchto serverů, zatímco u systému Nvidia pouze jeden. Díky vzduchovému chlazení je možné zařízení integrovat i do běžné infrastruktury, která tvoří přes 80 % současných datových center.

Podle údajů LG AI Research poskytuje infrastruktura s čipy RNGD při běhu modelu EXAONE LLM až 2,25násobný výkon na watt a generuje 3,75násobně více tokenů než srovnatelná GPU řešení při stejných energetických limitech.

FuriosaAI byla založena v roce 2017 v Soulu a dosud získala zhruba 115 milionů dolarů na rozvoj svých čipů. Letos startup odmítl akviziční nabídku společnosti Meta v hodnotě 800 milionů dolarů, aby si udržel nezávislost.

Server NXT RNGD je zatím dostupný k testovacím účelům, přičemž komerční uvedení na trh se očekává na začátku roku 2026.

Zdroj: Data Center Dynamics

 

 

Související články

Leave a Comment