"NVIDIAのBlackwell：H100との本当の差はどこか"

## 背景

2024年末から2025年にかけて、NVIDIAはBlackwellアーキテクチャを搭載したGPU群を本格投入した。GB200、B100、B200といったラインナップが登場し、クラウドプロバイダーや研究機関の間で「H100からの移行タイミング」が大きな関心事になっている。

だが、スペック表の数字だけを見て「Blackwellのほうが速い」と判断するのは早計だ。本当の差はどこにあるのか——アーキテクチャの構造から読み解く。

## H100との設計思想の違い

H100（Hopperアーキテクチャ）は、**トランスフォーマーモデルの学習と推論の両立**を念頭に設計された。Tensor Coreの第4世代、FP8精度のサポートが大きな特徴だった。

Blackwellが変えたのは**スケールの単位**だ。GB200 NVL72では、72基のGPUが1つの巨大なメモリプールとして振る舞う。従来の「GPU間通信のボトルネック」を構造的に解消しようという設計思想である。

これは単なる性能向上ではなく、「大規模LLM推論のコスト構造を変える」という目標から逆算した設計だ。

## 数字で見る

| 指標 | H100 SXM | B200 SXM |
|------|----------|----------|
| FP8学習性能 | 約2,000 TFLOPS | 約4,500 TFLOPS |
| HBM容量 | 80GB | 192GB |
| メモリ帯域幅 | 3.35 TB/s | 8.0 TB/s |
| TDP | 700W | 1,000W |

性能が倍以上になる一方、消費電力も約40%増加している。データセンターの電力インフラへの要求が高まるという副作用は無視できない。

## 本当に重要なのはNVLink Switchだ

Blackwellの真の差別化要因はGPUコア単体ではなく、**NVLink Switch（Quantum-X800）との組み合わせ**にある。

従来のNVIDIA構成では、GPU間通信がボトルネックになりやすかった。GB200 NVL72では、72基のGPUが全対全で高帯域通信できるアーキテクチャを実現しており、推論時の「モデル並列化」コストが大幅に下がる。

つまり、Blackwellの優位性は**大規模推論タスク**において最も顕著に現れる。学習用途での差はH100比で約2倍程度だが、推論では最大で30倍のコスト改善が報告されている（NVIDIA発表、2024年）。

## 日本市場への影響

日本では、SB（ソフトバンク）グループ、富士通、NTTが大規模なGPUクラスターへの投資を進めている。Blackwellへの移行はこれらの企業の意思決定にも影響する。

特に、電力消費の増大は日本のデータセンター事業者にとって切実な問題だ。国内の電力供給制約を考えると、「性能最大化」よりも「ワット当たり性能」の観点でBlackwellを評価する必要がある。

## まとめ

NVIDIAのBlackwellは、H100の延長線上ではなく**推論コスト構造の変革**を目指した設計だ。単純なスペック比較ではなく、ワークロードの特性（学習 vs 推論）と電力インフラの制約を踏まえた上で移行判断をすべきだろう。

"NVIDIAのBlackwell：H100との本当の差はどこか"

// COMMENTS

ON THIS PAGE