29.05.2026 ИИ для бизнеса 3 мин чтения

AI-инфраструктура 2026: NVIDIA Blackwell, гонка GPU и дата-центры на $100 млрд

Microsoft в 2026 году тратит $80 миллиардов только на AI-инфраструктуру — дата-центры, GPU, сети. Google: $70 миллиардов. Amazon: $50 миллиардов. Это больше, чем ВВП многих стран, потраченное за один год на вычислительные мощности для AI. Мир строит беспрецедентную инфраструктуру — и NVIDIA контролирует этот поток как никто раньше.

Кейс 1. NVIDIA Blackwell — новое поколение AI-вычислений

Blackwell Architecture (2024–2026)

NVIDIA GB200 NVL72 (Blackwell Ultra):

Производительность: >1 000 TOPS (triллион операций/сек) для FP8
vs Hopper (H100): в 4× быстрее для LLM inference
vs H100 для training: в 2.5× быстрее при том же потреблении

Кто купил в 2025–2026:

Microsoft: >1 миллиона GPU (Blackwell + Hopper) в дата-центрах
Google: собственные TPU + крупные закупки Blackwell
Meta: >600 000 H100/Blackwell для Llama + AI Research
CoreWeave: облачный провайдер построил бизнес на перепродаже NVIDIA мощностей

Стоимость:

H100: $25 000–30 000 за GPU
Blackwell GB200: $40 000–70 000 за GPU (NVL72 rack = $3+ миллиона)
NVIDIA выручка 2025: >$100 миллиардов (рекорд, AI chips — >80%)

Кейс 2. Гонка альтернативных чипов — AMD, Intel, Google

AMD MI300X и MI325X

AMD пытается отобрать долю у NVIDIA:

MI300X: 192 GB HBM3 памяти (vs H100 с 80 GB) — для очень больших моделей
Meta + Microsoft: закупили MI300X для снижения зависимости от NVIDIA
ML Performance: 85–90% от H100 по основным задачам
Цена: 20–25% дешевле H100 → экономия при масштабе

Intel Gaudi 3 (2025):

Intel пытается войти в AI-рынок
Adoption: пока ограниченный — AWS использует в Inferentia для inference
Gap: значительно отстаёт от NVIDIA и AMD

Google TPU v5:

Только внутреннее использование Google
Обучение Gemini: полностью на TPU v5
Эффективность: превосходит NVIDIA для специфических Google задач

Кейс 3. Дата-центры 2026 — ядерная энергия и охлаждение

Почему AI дата-центры требуют ядерной энергии

Потребление GPU дата-центра:

1 NVIDIA GB200 rack: 120 кВт (vs 15 кВт для standard server rack)
1 000 стоек: 120 МВт — как небольшой город
Microsoft Stargate (проект с OpenAI, Texas): >1 ГВт целевая мощность

Ядерная энергия + AI дата-центры:

Microsoft: купила долю в Constellation Energy → возобновление Three Mile Island
Google: подписала контракт с Kairos Power на SMR к 2030
Amazon AWS: контракт на покупку энергии от атомных SMR

Охлаждение — новая проблема:

Liquid cooling: стандарт для Blackwell (не воздушное)
Immersion cooling: чипы погружаются в диэлектрическую жидкость
Data centers в холодных регионах: Исландия, Сибирь, Канада — природное охлаждение

Кейс 4. Россия — AI-инфраструктура в условиях санкций

Что происходит

Проблема доступа к GPU:

NVIDIA H100/A100: под экспортным контролем США (с 2022)
AMD: аналогично
Параллельный импорт: возможен, но дорог и рискован

Что доступно:

NVIDIA A100/H100: через третьи страны (Турция, ОАЭ, Армения) — есть прецеденты
Huawei Ascend 910C: официально доступен → ограниченная производительность
Intel Gaudi: потенциально доступен

Отечественные решения:

«Байкал Электроникс»: процессоры общего назначения, не специализированные AI-чипы
«Элвис»: нейропроцессор Elcore-50 — узко применимый
Яндекс: разрабатывает собственный AI-процессор (детали засекречены)

Инициатива «Росэлектроника»:

Разработка отечественного NPU (Neural Processing Unit)
Горизонт: 2027–2028 коммерческий образец
Реализм: значительное отставание от мировых лидеров

Выход для российских AI-компаний:

Облачный AI: через Yandex Cloud, Sber Cloud (используют доступные мощности)
Inference оптимизация: работать с тем что есть эффективнее
DeepSeek-подход: эффективность алгоритмов важнее raw compute

Кейс 5. Стоимость AI-вычислений для бизнеса в 2026

Как изменились цены за 2 года

API стоимость (трансформация 2024→2026):

| Модель | 2024 ($/1M tokens) | 2026 ($/1M tokens) | |---|---|---| | GPT-4o Input | $10 | $2.50 | | Claude 3.5 Input | $3 | $0.80 | | Gemini 1.5 Pro | $3.50 | $1.25 | | DeepSeek V3 | — | $0.14 |

Цены упали в 4–10× за 2 года. Тренд продолжится.

Практическое следствие:

2024: обработать 1 миллион документов через AI = $10 000
2026: те же документы = $250–1 000
Бизнес-модели которые были «слишком дорогими» в 2024 — теперь рентабельны

Что это значит для стратегии:

Не экономьте на AI-задачах: цены снижаются, а задачи растут
Инвестируйте в качество промптов: плохой промпт дёшев, но даёт плохой результат
Self-hosting (Llama 4): только для specific privacy требований, не для экономии

Источники: NVIDIA Q1 2026 Earnings, Microsoft FY2026 AI Infrastructure Announcement, Google Cloud TPU v5 documentation, AMD MI300X performance benchmarks.