IBM oznámila dva nové čipy zaměřené na umělou inteligenci pro své mainframy Z-systémů. Na akci Hot Chips 2024 tento týden v Kalifornii Big Blue odhalila architektonické detaily pro nadcházející procesor Telum II a akcelerátorové čipy Spyre.
„Nové technologie jsou navrženy tak, aby významně rozšířily kapacitu zpracování v rámci příští generace mainframových systémů IBM Z, což pomáhá urychlit použití tradičních AI modelů a velkých jazykových AI modelů současně prostřednictvím nové metody AI,“ uvedla společnost.
Navržený pro napájení systémů IBM Z, nový čip Telum II nabízí zvýšenou frekvenci, kapacitu paměti, 40procentní nárůst cache a integrované jádro AI akcelerátoru, stejně jako koherentně připojenou jednotku pro zpracování dat (DPU) oproti první generaci čipu Telum.
Každý Telum II obsahuje osm jader běžících na 5,5 GHz, s 36 MB L2 cache na jádro, což činí celkem 360 MB. Virtuální úroveň-4 cache o kapacitě 2,88 GB na procesorovou zásuvku poskytuje 40procentní nárůst oproti předchozí generaci.
Každý Spyre obsahuje až 1 TB paměti, je navržen tak, aby pracoval v tandemu na osmi kartách běžné IO zásuvky a je navržen tak, aby spotřeboval maximálně 75 W na kartu. Každý čip bude mít 32 výpočetních jader podporujících datové typy int4, int8, fp8 a fp16.
Nový procesor by měl podporovat podniková výpočetní řešení pro LLM, obsluhující složité transakční potřeby průmyslu. DPU je navržena tak, aby urychlila složité IO protokoly pro sítě a úložiště na mainframu. Každý akcelerátorový čip Spyre je připojen prostřednictvím 75wattového PCIe adaptéru a je založen na technologii vyvinuté ve spolupráci s IBM Research.
Oba čipy budou vyráběny společností Samsung Foundry, dlouholetým výrobním partnerem IBM, na 5nm procesním uzlu. Oba Telum a Spyre by měly být k dispozici příští rok.
„Naše robustní, vícegenerační roadmapa nás staví do pozice, abychom zůstali před křivkou technologických trendů, včetně rostoucích požadavků AI,“ řekla Tina Tarquinio, viceprezidentka pro produktový management, IBM Z a LinuxONE. „Procesor Telum II a akcelerátor Spyre jsou navrženy tak, aby poskytovaly vysoce výkonná, zabezpečená a energeticky úspornější podniková výpočetní řešení. Po letech vývoje budou tyto inovace představeny v naší příští generaci platformy IBM Z, aby klienti mohli využívat LLM a generativní AI ve velkém měřítku.“
IBM uvedla, že systém vybavený klastrem Spyre by mohl využívat mnohem složitější AI modely k identifikaci složitých vzorců podvodů, které by méně sofistikovaný model mohl přehlédnout.
Společnost oznámila původní čip Telum v roce 2021. V roce 2022 uvedla na trh svůj nejnovější mainframe a první s vybavením čipem Telum, z16.
Zdroj: