Nvidia se svým softwarem TensorRT-LLM a H200 nastavuje rekordy ve srovnávání výkonu

Nvidia H200 Tensor GPU

Nvidia stanovila nové rekordy ve srovnávání výkonu MLPerf na svém GPU H200 Tensor Core a softwaru TensorRT-LLM. MLPerf Inference je srovnávací sada, která měří inferenční výkon napříč případy použití hloubkového učení. Do nejnovější verze sady benchmarkingu – MLPerf v4 – byly přidány dvě nové pracovní zátěže, které představují případy použití generativní umělé inteligence: benchmark velkého jazykového modelu (LLM) založený na Meta’s Llama 2 70B a test založený na převodu textu na obrázek na Stable Diffusion XL. Nvidia nastavila výkonové rekordy u obou nových pracovních zátěží a poskytuje nejvyšší výkon napříč…

Číst dále...