
Олимпиада компьютеров: кто вырвался вперёд в борьбе за лидерство
Мир машинного обучения развивается настолько быстро, что методы его оценки едва поспевают за прогрессом. Одним из ключевых ориентиров в этой сфере стал конкурс MLPerf, который проходит дважды в год и часто называется "Олимпийскими играми ИИ". В этот раз организаторы представили сразу три новых бенчмарка, отражающих самые свежие направления в индустрии.
Масштаб и новые модели
С ростом интереса к искусственному интеллекту размеры моделей стремительно увеличиваются, и даже специалисты признают, что следить за прогрессом становится непросто.
"В последнее время очень трудно отслеживать всё, что происходит в этой области. Модели становятся всё больше, и за последние два раунда мы представили самые крупные из всех", — отметил инженер AMD Миро Ходак.
Главным сюрпризом стал тест на основе DeepSeek R1 671B — модели рассуждения, которая в полтора раза превышает предыдущий рекорд по числу параметров. Такие модели имитируют процесс последовательных размышлений и требуют значительно больше ресурсов, но при этом дают более точные ответы, особенно в науке, математике и программировании.
В противоположность этому добавили и минимальный бенчмарк — Llama3.1-8B, востребованный для задач с низкой задержкой: от резюмирования текстов до edge-приложений.
Таким образом, сейчас в MLPerf четыре эталона на основе LLM:
-
Llama3.1-8B (новый минимальный),
-
Llama2-70B,
-
Llama3.1-403B (добавлен ранее),
-
DeepSeek R1 671B (новый максимальный).
Ещё один тест связан с моделью Whisper-large-v3, что отражает рост популярности голосовых интерфейсов и "умных" устройств.
Кто участвовал
В соревнованиях традиционно приняли участие крупнейшие игроки рынка: Nvidia, AMD, Intel и Arm.
-
Nvidia продемонстрировала новый GPU Blackwell Ultra, встроенный в модуль GB300.
-
AMD представила свежие ускорители MI325X и MI355X.
-
Intel впервые вышла на поле GPU с серией Intel Arc Pro, параллельно показав возможности инференса и на CPU Xeon.
Все эти компании играют ключевую роль в развитии аппаратного обеспечения для искусственного интеллекта. Их участие в MLPerf позволяет сравнить подходы разных производителей: от безусловного доминирования Nvidia на рынке GPU до стремительного прогресса AMD и первых шагов Intel в области графических ускорителей для ИИ. Благодаря такому многообразию решений конкурс отражает реальную конкуренцию и динамику индустрии, показывая, кто и в каком направлении двигается быстрее остальных.
Закрытая и открытая категории
MLPerf делится на две основные категории:
-
Закрытая — где архитектуру моделей менять нельзя.
-
Открытая — допускаются модификации и оптимизации.
Именно закрытая серверная категория считается основной мерой сравнения, так как демонстрирует "чистую" производительность оборудования.
Лидерство Nvidia
Ожидаемо, Nvidia показала лучшие результаты на всех ключевых тестах. Blackwell Ultra стал новым стандартом производительности.
Его преимущества:
-
увеличенная память,
-
ускоренные attention-слои,
-
на 50% больше вычислений ИИ,
-
более быстрая память и соединения.
Дополнительный рывок обеспечили две технологии:
-
NVFP4 — новый формат чисел, который сохраняет точность уровня BF16, но требует меньше вычислений.
-
Разделённый инференс — распределение этапов prefill и generation между разными группами GPU. Это дало до 50% прироста скорости.
В совокупности эти улучшения позволили Nvidia не просто сохранить лидерство, но и значительно увеличить отрыв от конкурентов. Blackwell Ultra фактически задаёт новый ориентир для всей отрасли: теперь разработчики могут запускать модели с сотнями миллиардов параметров быстрее и эффективнее, чем когда-либо прежде. Это особенно важно для центров обработки данных и облачных сервисов, где каждая секунда инференса и каждый ватт энергопотребления имеют значение.
Прорыв AMD
AMD сделала заметный шаг вперёд. В закрытой категории их MI325X по ряду тестов показал результаты, сопоставимые с Nvidia H200. А в открытой — новый MI355X, представленный в июле, продемонстрировал рост в 2,7 раза по сравнению с предшественником на тесте Llama2-70B.
Особое внимание привлекла первая в истории MLPerf гибридная подача, когда MI300X и MI325X работали вместе для одного инференса. Это важный шаг: новые поколения GPU появляются каждый год, но старые остаются в дата-центрах, и возможность их совместного использования открывает дорогу к более гибким системам.
Intel и её первые шаги в GPU
Intel долго утверждала, что GPU не обязательны для машинного обучения, делая ставку на CPU. Действительно, их Xeon смог соперничать с Nvidia L4 в задачах object detection, но уступил в рекомендательных системах.
Новостью стало то, что Intel впервые представила свой GPU в MLPerf. Участвовал MaxSun Intel Arc Pro B60 Dual 48G Turbo — два графических процессора и 48 ГБ памяти.
Результаты:
-
сопоставим с Nvidia L40S в малом LLM-тесте,
-
уступает в более крупных моделях, например, Llama2-70B.
Для Intel это первый серьёзный шаг в направлении, где пока лидируют Nvidia и AMD.
MLPerf вновь подтвердил: рынок машинного обучения движется вперёд стремительными темпами. Nvidia сохраняет лидерство, AMD вплотную наступает на пятки, а Intel только начинает строить своё присутствие в мире GPU для ИИ.
Добавление новых бенчмарков — от "гиганта" DeepSeek R1 до компактной Llama3.1-8B — отражает реальную картину: индустрии нужны как сверхмощные модели для науки, так и лёгкие решения для мобильных и прикладных задач.