Zvláštní zpráva vypracovaná Úřadem generálního inspektora NASA (OIG) zjistila, že mise vesmírné agentury jsou omezovány nedostatečnými zdroji špičkových počítačů (HEC).
Podle auditu, o kterém jako první informoval The Register, jsou superpočítače NASA pro její úkoly nedostačující, přičemž její systémy z velké části spoléhají na CPU.
NASA má v současné době pět systémů HEC umístěných v zařízení NASA Advanced Supercomputing (NAS) v Ames v Kalifornii a v NASA Center for Climate Simulation (NCCS) v Goddardu v Marylandu. Patří mezi ně 13,12 petaflops Aitken, 8,32 petaflops Electra, 8,1 petaflops Discover, 7,09 petaflopů Pleiades a 154,8 teraflopů Endeavour.
Přestože byl Aitken použit pro podporu programu Artemis NASA, zpráva zjistila, že stroje jsou téměř výhradně poháněny starými CPU, přičemž superpočítače v zařízení NAS běží na 18 000 CPU, ale pouze na 48 GPU. Podle zprávy mají systémy v NCCS ještě méně GPU.
Pro srovnání, současný rychlejší superpočítač na světě, Frontier, má 37 888 GPU.
Zpráva také uvádí, že zdroje HEC NASA jsou přetížené, což znamená, že ředitelství misí požaduje více výpočetního času, než může stávající kapacita poskytnout.
V důsledku toho se týmy NASA často uchýlily k nákupu vlastních zdrojů HEC, aby dodržely termíny, přičemž zpráva uvádí příklad týmu Space Launch System, který ročně investuje asi 250 000 dolarů do nákupu a místní správy svých vlastních clusterů HEC, místo aby čekal na stávající dostupnost zdrojů HEC.
„NASA také postrádá komplexní strategii pro to, kdy použít aktiva HEC v místě, oproti tomu, kdy využít možnosti cloud computingu – nebo široké pochopení důsledků nákladů pro každou volbu,“ stojí ve zprávě. „Zúčastněné strany nám řekly, že ačkoli vědí, že NASA má možnosti cloud computingu HEC, váhali je použít kvůli neznámým plánovacím postupům nebo předpokládali vyšší náklady.“
OIG navrhla vesmírné agentuře několik doporučení, která zahrnovala vytvoření týmu výkonného vedení, který by pomohl přemístit zdroje HEC NASA tak, aby odpovídaly „specializovaným potřebám agentury“.
Bylo učiněno osm dalších doporučení, jako je identifikace technologických mezer nezbytných pro splnění současných a budoucích potřeb a strategických technologických a vědeckých požadavků, vypracování strategie pro zlepšení stanovování priorit a alokace aktiv HEC, a implementace klasifikačního označení HEC pro identifikaci aktiv HEC.
Zpráva byla uzavřena konstatováním, že vedení NASA souhlasilo s doporučením vytvořit tým výkonného vedení HEC a částečně souhlasilo s těmito osmi doporučeními.
OIG požádala agenturu o pravidelné aktualizace, aby mohla sledovat pokrok směrem k implementaci a lépe porozumět plánovaným akcím NASA k řešení problémů nastíněných ve zprávě.
Zdroj: datacenterdynamics.com
Foto: NASA/Aitken supercomputer module