AI zvyšuje nároky na chlazení DC

AI DC

Fyzikální zákony mohou být někdy nepříjemné a využívání umělé inteligence (AI) je toho dobrým příkladem. Maximální počet výpočetních operací, které lze zpracovat za jednu kilowatthodinu stanovuje Landauerův zákon, který určuje teoreticky nejmenší množství energie nutné k provedení výpočetní operace.

Aplikace AI mají obvykle velmi vysoké nároky na výpočetní výkon, což také znamená, že výpočetní jednotky budou generovat více tepla, čímž porostou nároky na chlazení. Některé aplikace AI mohou mít dokonce takové nároky, že to předčí možnosti systému chlazení stávajících zařízení a tento trend bude velmi pravděpodobně pokračovat. Stále více podniků začíná v poslední době využívat nějaké aplikace AI – za poslední čtyři roky vzrostl počet implementací aplikací AI čtyřikrát – což ovšem také přináší problémy s chlazením hardwaru, na kterém aplikace AI běží.

První řešení je cloud

Prvním řešení, které každého instinktivně napadne, je veřejný cloud, což je sice pochopitelné, ale ne vždy optimální řešení. Velcí poskytovatelé cloudových služeb jako Amazon, Apple či Google nabízejí řešení, která si dnes mohou dovolit i menší podniky a vyřešení problému s chlazení je jen dalším bonusem. Nicméně cloud i přes všechny své výhody má také některé nevýhody. Někteří IT odborníci se stále obávají ukládání důvěrných dat mimo fyzickou lokalitu podniku a také potenciálních problémů při výpadku cloudu nebo ztrátě připojení ke cloudu. K nejzávažnějším problémům však patří latence a náklady.

Některé aplikace AI, jako rozpoznávání obličeje na letištích, by měly běžet lokálně, protože doba potřebná k odeslání dat do centrálního cloudu by mohla ohrozit celkovou výkonnost aplikace. A i když se tato aplikace může jevit jako ojedinělý případ použití, podle IBM: „organizace, které získávají z dat největší hodnotu, realizují správu dat a platformy AI co nejblíže místa, kde se data nacházejí.“

I v případě aplikací s nižšími nároky na latenci zůstává otázka nákladů. Například Michael Dell, předseda a CEO Dell Technologies, dlouhodobě zastává názor, že veřejný cloud není vhodný pro předvídatelné pracovní zatížení (tj. není zde vyžadována flexibilita). Pronájem cloudového serveru bude téměř vždy dražší než vlastnictví infrastruktury, říká Dell, takže pokud je vyžadována flexibilita cloudu, největší finanční smysl má z dlouhodobého hlediska vlastní infrastruktura v areálu podniku nebo v rámci kolokace. Jednoduše řečeno, vaše vlastní datové centrum vás vyjde levněji. To samozřejmě za předpokladu, že podniky budují moderní infrastrukturu a datové centrum budou skutečně efektivně využívat.

Požadavky na AI

Pokud využití veřejného cloudu není vhodné nebo dostačující, co je potřeba, aby podnik sám provozoval AI? Pro některé jednodušší aplikace mohou postačovat procesory, ale pro pokročilejší systémy jsou vhodnější GPU, ASIC a FPGA.

Přechod na AI obvykle znamená, že společnosti, který využívají stojany s integrovaným chlazením s kapacitou až 7 KW, se musí připravit na chlazení s kapacitou nejméně 30 kW a často až 50 kW na stojan. Zde je třeba poznamenat, že chlazení pomocí ventilátorů ztrácí účinnost někde okolo 15 kW. Google například zjistil, že jejich stávající systém chlazení nestačí chladit Tensor Flow 3.0, který generuje nadměrné množství tepla a lze předpokládat, že další organizace budou mít stejný problém.

Zřejmým řešením je kapalinové chlazení, které se široce nepoužívá od dob sálových počítačů o velikosti místnosti nebo příležitostného přetaktování. Byly vyvinuty některé „plug and play“ chladicí systémy, které podnikům pomáhají modernizovat stávající datová centra podle potřeby bez významných dopadů na zařízení. Podle predikcí analytické společnosti Gartner až 30 % datových center již brzy nebude možné ekonomicky provozovat, takže podniky s vysokými ambicemi v oblasti využívání AI budou hledat komplexnější řešení, aby dosáhly efektivity zdrojů a nákladů.

Vlastní areál nebo kolokace

To nás přivádí zpět k dlouhodobé otázce využít „vlastní areál nebo kolokaci“. AI sice staví problém do trochu jiného světla, ale firemní rozhodování bude záviset i na mnoha známých faktorech.

Faktory týkající se volby vlastního areálu budou zahrnovat náklady a odborné znalosti k dovybavení nebo výstavbě datového centra, které bude splňovat požadavky na provoz aplikací AI. Po letech katastrofických předpovědí ze strany některých rádoby odborníků, že „místní datová centra jsou již mrtvá“, mohou být CIO celkem překvapeni, když budou muset začít hledat kapitál na výstavbu místního datového centra.

Problémem však je, že chybí osvědčené postupy v oblasti kapalinového chlazení a infrastruktury AI obecně, což ztěžuje plánování a náročnější projekty. Současné postupy vychází ze specializovaných návrhů pro účely velkých cloudových poskytovatelů, které pro podniky nemusí být vždy vhodné.

Zajímavou alternativu mezi místním datovým centrem a veřejným cloudem nabízí kolokace, protože ponechává organizacím vlastnictví dat a hardwaru, přičemž o starost zařízení přenechají odborníkům. Úspora nákladů díky sdílení prostoru a internetového připojení s dalšími nájemci může být velmi atraktivní. Navíc velcí poskytovatelé kolokačních služeb jsou motivováni k otestování a brzkému zavádění inovativních technologií, včetně kapalinového chlazení, a to i při omezené účinnosti. Z toho pak mohou podniky dobře profitovat, aniž by samy riskovaly nasazení nevyzkoušené technologie.

Hlavní bariérou kolokace pro AI je však bohužel stejná, jako v případě veřejného cloudu, a to je latence. Pro některé aplikace AI prostě jiná možnost nežli místní datové centrum neexistuje. I když jsou organizace dnes zvyklé načítat velké soubory dat do analytických aplikací, skutečná umělá inteligence bude zahrnovat proměnlivé datové struktury pro podporu neuronových sítí. V případech, kdy je místně generováno velké množství dat, které je třeba okamžitě zpracovat, nemusí být ani kolokace vhodným řešením.

Pro AI neexistuje jedno univerzální řešení, které by vyhovovalo všech organizacím. Většina menších společností a společností, které mají o AI pouze okrajový zájem, bude i nadále používat cloud. Naopak pro organizace, které chtějí aplikace AI široce využívat, může vlastnictví infrastruktury v mnoha případech přinášet provozní i nákladové výhody. Hlavní faktory pro volbu mezi místním datovým centrem a kolokací jsou pak náklady, odbornost a latence.

Michael Cantor, Park Place Technologies

LITERATURA

[1] http://energy.mit.edu/news/energy-efficient-computing/
[2] https://www.gartner.com/en/doc/3746424-100-data-and-analytics-predictions-through-2021

Zdroj: EnterpriseAI

Související články

Leave a Comment