AI-инфраструктура 2026: NVIDIA Blackwell, гонка GPU и дата-центры на $100 млрд
Microsoft в 2026 году тратит $80 миллиардов только на AI-инфраструктуру — дата-центры, GPU, сети. Google: $70 миллиардов. Amazon: $50 миллиардов. Это больше, чем ВВП многих стран, потраченное за один год на вычислительные мощности для AI. Мир строит беспрецедентную инфраструктуру — и NVIDIA контролирует этот поток как никто раньше.
Кейс 1. NVIDIA Blackwell — новое поколение AI-вычислений
Blackwell Architecture (2024–2026)
NVIDIA GB200 NVL72 (Blackwell Ultra):
- Производительность: >1 000 TOPS (triллион операций/сек) для FP8
- vs Hopper (H100): в 4× быстрее для LLM inference
- vs H100 для training: в 2.5× быстрее при том же потреблении
Кто купил в 2025–2026:
- Microsoft: >1 миллиона GPU (Blackwell + Hopper) в дата-центрах
- Google: собственные TPU + крупные закупки Blackwell
- Meta: >600 000 H100/Blackwell для Llama + AI Research
- CoreWeave: облачный провайдер построил бизнес на перепродаже NVIDIA мощностей
Стоимость:
- H100: $25 000–30 000 за GPU
- Blackwell GB200: $40 000–70 000 за GPU (NVL72 rack = $3+ миллиона)
- NVIDIA выручка 2025: >$100 миллиардов (рекорд, AI chips — >80%)
Кейс 2. Гонка альтернативных чипов — AMD, Intel, Google
AMD MI300X и MI325X
AMD пытается отобрать долю у NVIDIA:
- MI300X: 192 GB HBM3 памяти (vs H100 с 80 GB) — для очень больших моделей
- Meta + Microsoft: закупили MI300X для снижения зависимости от NVIDIA
- ML Performance: 85–90% от H100 по основным задачам
- Цена: 20–25% дешевле H100 → экономия при масштабе
Intel Gaudi 3 (2025):
- Intel пытается войти в AI-рынок
- Adoption: пока ограниченный — AWS использует в Inferentia для inference
- Gap: значительно отстаёт от NVIDIA и AMD
Google TPU v5:
- Только внутреннее использование Google
- Обучение Gemini: полностью на TPU v5
- Эффективность: превосходит NVIDIA для специфических Google задач
Кейс 3. Дата-центры 2026 — ядерная энергия и охлаждение
Почему AI дата-центры требуют ядерной энергии
Потребление GPU дата-центра:
- 1 NVIDIA GB200 rack: 120 кВт (vs 15 кВт для standard server rack)
- 1 000 стоек: 120 МВт — как небольшой город
- Microsoft Stargate (проект с OpenAI, Texas): >1 ГВт целевая мощность
Ядерная энергия + AI дата-центры:
- Microsoft: купила долю в Constellation Energy → возобновление Three Mile Island
- Google: подписала контракт с Kairos Power на SMR к 2030
- Amazon AWS: контракт на покупку энергии от атомных SMR
Охлаждение — новая проблема:
- Liquid cooling: стандарт для Blackwell (не воздушное)
- Immersion cooling: чипы погружаются в диэлектрическую жидкость
- Data centers в холодных регионах: Исландия, Сибирь, Канада — природное охлаждение
Кейс 4. Россия — AI-инфраструктура в условиях санкций
Что происходит
Проблема доступа к GPU:
- NVIDIA H100/A100: под экспортным контролем США (с 2022)
- AMD: аналогично
- Параллельный импорт: возможен, но дорог и рискован
Что доступно:
- NVIDIA A100/H100: через третьи страны (Турция, ОАЭ, Армения) — есть прецеденты
- Huawei Ascend 910C: официально доступен → ограниченная производительность
- Intel Gaudi: потенциально доступен
Отечественные решения:
- «Байкал Электроникс»: процессоры общего назначения, не специализированные AI-чипы
- «Элвис»: нейропроцессор Elcore-50 — узко применимый
- Яндекс: разрабатывает собственный AI-процессор (детали засекречены)
Инициатива «Росэлектроника»:
- Разработка отечественного NPU (Neural Processing Unit)
- Горизонт: 2027–2028 коммерческий образец
- Реализм: значительное отставание от мировых лидеров
Выход для российских AI-компаний:
- Облачный AI: через Yandex Cloud, Sber Cloud (используют доступные мощности)
- Inference оптимизация: работать с тем что есть эффективнее
- DeepSeek-подход: эффективность алгоритмов важнее raw compute
Кейс 5. Стоимость AI-вычислений для бизнеса в 2026
Как изменились цены за 2 года
API стоимость (трансформация 2024→2026):
| Модель | 2024 ($/1M tokens) | 2026 ($/1M tokens) | |---|---|---| | GPT-4o Input | $10 | $2.50 | | Claude 3.5 Input | $3 | $0.80 | | Gemini 1.5 Pro | $3.50 | $1.25 | | DeepSeek V3 | — | $0.14 |
Цены упали в 4–10× за 2 года. Тренд продолжится.
Практическое следствие:
- 2024: обработать 1 миллион документов через AI = $10 000
- 2026: те же документы = $250–1 000
- Бизнес-модели которые были «слишком дорогими» в 2024 — теперь рентабельны
Что это значит для стратегии:
- Не экономьте на AI-задачах: цены снижаются, а задачи растут
- Инвестируйте в качество промптов: плохой промпт дёшев, но даёт плохой результат
- Self-hosting (Llama 4): только для specific privacy требований, не для экономии
Источники: NVIDIA Q1 2026 Earnings, Microsoft FY2026 AI Infrastructure Announcement, Google Cloud TPU v5 documentation, AMD MI300X performance benchmarks.
Планы ИИ-внедрения по вашей сфере
Готовые 5-шаговые планы внедрения ИИ — по вашей нише:
Или по вашей профессии:
Попробуйте Мелион бесплатно
14 дней полного доступа. CRM + ИИ-команда + автообзвон.
Начать бесплатно