Как выбрать GPU для задач машинного обучения: NVIDIA, AMD или отечественные решения
Графические процессоры стали сердцем современного искусственного интеллекта. Именно они превращают обучение нейросетей из многомесячного ожидания в процесс, занимающий часы или даже минуты. В 2025–2026 годах рынок GPU для машинного обучения кардинально изменился: появились новые архитектуры NVIDIA и AMD, а на российском рынке — альтернативные решения, которые могут стать реальной заменой западным вендорам.
Как выбрать GPU для ML-задач и не прогадать? Давайте разбираться.
Почему GPU — это ключ к ИИ
История современного ИИ неразрывно связана с эволюцией графических процессоров. Ещё в конце 2000-х годов исследователи обнаружили, что способность GPU выполнять тысячи параллельных операций идеально подходит для обучения глубоких нейросетей. С тех пор каждый новый скачок в развитии ИИ подкреплялся более мощными и специализированными GPU.
Ключевые метрики при выборе GPU для ML:
- Вычислительная мощность (TFLOPs) — определяет скорость обучения.
- Тензорные ядра — специализированные блоки, ускоряющие матричные умножения.
- Пропускная способность памяти — определяет, как быстро GPU может подавать данные в вычислительные ядра.
- Объём видеопамяти (VRAM) — критичен для больших моделей.
- Энергопотребление (TDP) — влияет на требования к охлаждению и питанию.
NVIDIA: абсолютный лидер и его преимущества
NVIDIA остаётся бесспорным лидером в задачах ИИ, машинного обучения и HPC. В 2025–2026 годах компания представила архитектуру Blackwell, которая пришла на смену Hopper.
Ключевые модели NVIDIA для ML в 2026 году:
| Модель | Архитектура | VRAM | Пропускная способность | TDP | Особенности |
|---|---|---|---|---|---|
| NVIDIA H100 | Hopper | 80 ГБ HBM2e | 3,35 ТБ/с | 700 Вт | Флагман для LLM и AI, Transformer Engine для FP8/FP16 |
| NVIDIA H200 | Hopper | 141 ГБ HBM3e | 4,8 ТБ/с | 700 Вт | Первый GPU с HBM3e, значительно быстрее для инференса LLM |
| NVIDIA B200 | Blackwell | 192 ГБ HBM3e | 8,0 ТБ/с | 1000 Вт | Флагман нового поколения, два кристалла GB100, 9 000 TFLOPS BF16 |
| NVIDIA RTX PRO 6000 | Blackwell | 96 ГБ GDDR7 | — | ~600 Вт | 24 064 ядра CUDA, 4000 AI TOPS, поддержка ECC |
| NVIDIA RTX 5090 | Blackwell | 32 ГБ GDDR7 | — | ~575 Вт | Флагманская потребительская карта для разработки и дообучения |
H200 использует тот же кристалл GH100, что и H100, но заменяет HBM2e на HBM3e, почти удваивая пропускную способность памяти и расширяя объём с 80 до 141 ГБ. Это делает H200 значительно более производительным для инференса больших языковых моделей, где пропускная способность памяти является основным узким местом.
B200 — это революционный скачок. Он объединяет два кристалла GB100 с помощью передовой упаковки TSMC CoWoS-L, фактически удваивая вычислительную плотность в одном корпусе. При 1000 Вт TDP и 192 ГБ HBM3e B200 является самым требовательным GPU, который NVIDIA когда-либо выпускала. В бенчмарках MLPerf B200 показывает примерно вдвое большую производительность на обучении LLM по сравнению с H200. Платформа HGX B200 на базе восьми GPU обеспечивает до 1,44 ТБ памяти и 144 петафлопс AI-производительности.
Главное преимущество NVIDIA — экосистема CUDA. Более 4 миллионов разработчиков используют CUDA для работы с PyTorch, TensorFlow и другими фреймворками. Это означает, что любая новая модель или библиотека выходят с оптимизациями под NVIDIA в первую очередь.
AMD: догоняющий с большим потенциалом
Долгое время AMD считалась «почти лидером», но в 2026 году ситуация кардинально изменилась. На MLPerf Training 6.0 AMD показала впечатляющие результаты на архитектуре CDNA 4 с GPU Instinct MI350X и MI355X.
Ключевые характеристики AMD Instinct MI350 Series:
- Техпроцесс 3 нм и 185 миллиардов транзисторов
- 288 ГБ HBM3E-памяти — больше, чем у NVIDIA B200 (192 ГБ)
- До 10 PF MXFP4-производительности
- Поддержка моделей до 520 миллиардов параметров на одном GPU
В MLPerf Training 6.0 AMD впервые использовала собственный фреймворк Primus для обучения LLM и впервые представила результаты на нескольких узлах — критический шаг к крупномасштабному обучению.
На тесте Llama 2-70B (LoRA-дообучение) AMD Instinct MI355X показала 3,5-кратный прирост производительности по сравнению с предыдущим поколением MI300X. В этом же тесте NVIDIA B200 показала 9,85 минут, а AMD MI355X — 10,18 минут. Разрыв между лидером и догоняющим сократился до минимальных значений в истории.
Сильные стороны AMD:
- Больший объём памяти (288 ГБ против 192 ГБ у B200)
- Лучшее соотношение цены и производительности в сценариях инференса
- Экосистема ROCm становится всё более зрелой
- Через инструмент HIP можно адаптировать CUDA-код
В чём AMD пока уступает: программная совместимость всё ещё не на уровне NVIDIA, а в некоторых сценариях NVIDIA опережает AMD в 2–3 раза. Однако для задач инференса и развёртывания AMD может быть более выгодным решением.
NVIDIA vs AMD: итоговое сравнение
| Критерий | NVIDIA | AMD |
|---|---|---|
| Производительность (MLPerf) | Лидер, B200 — ~2× H200 | Догоняет, MI355X — 10,18 мин на Llama 2-70B |
| Объём памяти | До 192 ГБ (B200) | До 288 ГБ (MI355X) |
| Экосистема | CUDA — 4+ млн разработчиков | ROCm — развивается, есть Primus и HIP |
| Совместимость | Все фреймворки из коробки | Требует доработок, но прогресс очевиден |
| Лучшие сценарии | Обучение, HPC, плотность вычислений | Инференс, стоимость токена, гибкость |
Российские решения: есть ли альтернатива?
В условиях ограничений на поставки NVIDIA и роста сроков поставок вопрос импортозамещения встаёт остро. По данным исследования, только 9% российских организаций обеспечены вычислительной инфраструктурой для ИИ. В коммерческих ЦОД России установлено чуть более 10 тыс. GPU для ИИ, и ещё около 8 тыс. — на локальных площадках.
Основным барьером поставщики GPU-услуг считают санкционные ограничения и проблемы с импортом (26,1%). При этом отечественных замен NVIDIA и AMD не существует и вряд ли появится в обозримом будущем — проблема не в инженерных компетенциях, а в технологических процессах производства: современные GPU требуют 3–7-нанометровых техпроцессов.
1. Китайские альтернативы (протестированы МФТИ)
Институт искусственного интеллекта МФТИ провёл масштабное исследование альтернативных GPU. Тестировались карты китайских производителей Moore Threads (модель S4000) и MetaX (модель C500).
Характеристики Moore Threads S4000:
- 48 ГБ памяти
- Пропускная способность до 768 ГБ/с
- 128 тензорных блоков
- Фирменная связка для многокарточных конфигураций
Характеристики MetaX C500:
- Ускоритель для обучения и GPGPU-задач
- Около 15 TFLOPS FP32
- Инструменты для упрощения переноса кода
Результаты тестов МФТИ:
- Стабильный запуск популярных языковых моделей (LLM)
- Корректная работа современных фреймворков
- Предсказуемая производительность
- В отдельных типах вычислений показатели достигли или превзошли NVIDIA A100
- Устойчивость при длительных нагрузках
Карты S4000 и C500 могут применяться в широком спектре сценариев без потери функциональности.
На базе результатов МФТИ запустил Центр компетенций, который призван помочь бизнесу в построении инфраструктуры, независимой от решений NVIDIA.
2. Российские платформы и сборки
Delta Computers в мае 2026 года представила обновление GPGPU-платформы Delta Sprut XL. Решение способно поддерживать до 24 акселераторов NVIDIA H200 или RTX PRO 6000 в одной системе с общей памятью. Платформа создана для развертывания инференса и обучения LLM, а также для высокопроизводительных вычислений (HPC).
Как отметил основатель Delta Computers Андрей Чернышев: «Конфигурация обновленной платформы Delta Sprut XL позволяет объединять множество акселераторов в одной машине. Мы предоставляем заказчикам возможность обучать большие языковые модели, не упираясь в жесткий дефицит и ограничения на поставки систем DGX на базе NVIDIA B200/B300».
Компания RDW Computers в феврале 2026 года вывела на рынок GPU-сервер серии «Хибины» G312 — компактное 3U-решение для задач ИИ, машинного обучения и высокопроизводительных вычислений.
На конференции ЦИПР-2026 был анонсирован российский процессор Baikal-AI-E1000 — для периферийных устройств с энергопотреблением не более 30 Вт и тактовой частотой до 2 ГГц. Baikal Electronics также обещает к 2030 году выпустить отечественные ИИ-чипы, совместимые с NVIDIA CUDA.
Крупные игроки тоже ищут альтернативы. ВТБ в марте 2026 года провёл тестирование китайских GPU, которые показали стабильную производительность и высокую степень совместимости с существующими ИТ-системами. Сбербанк планирует использовать китайские чипы для своей флагманской AI-модели GigaChat.
Как выбрать GPU: пошаговый план
Шаг 1. Определите тип задач
| Сценарий | Рекомендация |
|---|---|
| Обучение больших LLM (70B+ параметров) | NVIDIA H100/H200/B200 или AMD MI350X/MI355X |
| Дообучение и тонкая настройка | RTX 4090 (24 ГБ) или RTX 5090 (32 ГБ) |
| Инференс и развёртывание | AMD (выгоднее по стоимости токена) или RTX PRO 6000 |
| Начальные эксперименты | RTX 4060 Ti (16 ГБ) или несколько RTX 5060 Ti |
Шаг 2. Оцените бюджет
- До 150 000 руб. — карты с 16 ГБ (например, RTX 4060 Ti)
- До 500 000 руб. — RTX 4090 (24 ГБ) или RTX 5090 (32 ГБ)
- До 2 000 000 руб. — RTX PRO 6000 (96 ГБ) или несколько RTX 4090
- Без ограничений — серверные решения NVIDIA H100/H200/B200 или AMD MI350
Шаг 3. Учтите импортозамещение
Если доступ к NVIDIA ограничен, рассмотрите:
- Китайские аналоги (Moore Threads S4000, MetaX C500) — протестированы МФТИ, работают стабильно
- Российские платформы — Delta Sprut XL (до 24 H200/RTX PRO 6000), серверы RDW Computers
Шаг 4. Проверьте инфраструктуру
- Убедитесь, что система охлаждения справится с TDP (у H100/H200 — 700 Вт, у B200 — 1000 Вт)
- Проверьте совместимость с вашим ПО (CUDA для NVIDIA, ROCm для AMD)
- Для B200 потребуется SXM6 форм-фактор и более сложная печатная плата (24–32+ слоёв против 16–20 у H100/H200)
А что дальше?
Рынок GPU для машинного обучения в 2026 году предлагает больше выбора, чем когда-либо. NVIDIA остаётся лидером, но AMD стремительно сокращает отрыв. В России появляются реальные альтернативы — от китайских решений, протестированных МФТИ, до собственных платформ от Delta Computers и RDW Computers.
Однако важно понимать: полностью импортозаместить решения NVIDIA в ближайшие годы не удастся — проблема в технологических процессах производства. Но постепенное расширение парка с использованием доступных альтернатив — это реалистичная стратегия.
Главный вывод: не существует одного «правильного» GPU — есть правильный GPU под ваши задачи, бюджет и доступность на рынке.
Нужна помощь с подбором GPU для ваших задач? Свяжитесь с нами — мы поможем выбрать оптимальную конфигурацию под ваш бюджет и требования.

