NVIDIA Blackwell: 新しいアーキテクチャは AI セグメントに革命を起こす準備をしている

NVIDIA が公式に発表新世代アーキテクチャ、または待望のブラックウェル。 NVIDIA Blackwell GPU は、同じダイ上に 2 つの統合 GPU を備えた NVIDIA の MCM 設計を初めて導入したものです。
GDC 2024 の段階から、ジェンセンフアン氏は、人工知能に役立つ新しいチップに付随するすべてのニュースを明らかにしました。詳細を一緒に調べてみましょう。

最高のテクノロジー

新しい NVIDIA Blackwell アーキテクチャによってもたらされたすべての革新を要約するのは簡単な作業ではありません。」世界で最も強力なチップ」と黄自身が定義したように、トランジスタは2,080億個(1 日あたり 104 個)、生産日TSMCの4NPノード単一の統合 GPU で 10 TB/秒のチップ間リンクを開発するように特別にカスタマイズされています。
第 2 世代の Transformer Engine は、NVIDIA TensorRT-LLM および NeMo Megatron フレームワークに組み込まれた新しいマイクロテンソルスケーリングサポートおよび管理アルゴリズムを搭載しており、2 倍の計算能力と 4 ビット浮動小数点での新しい推論機能を備えたモデルを実現できます。。
第 5 世代 NVLink は、GPU あたり 1.8 TB/秒の双方向転送速度で AI モデルのパフォーマンスを高速化し、最も複雑な LLM システムのシームレスな通信を保証します。
RAS Engine は、信頼性とメンテナンスの概念に革命をもたらします。Blackwell アーキテクチャは、AI ベースの予防メンテナンスを活用するオンチップソリューションを提供し、安定性を向上させ、長期間にわたって持続するワークロードであってもレベルのパフォーマンスを保証します。
Secure AI は、高レベルのプライバシーを確保する必要がある業界にとって重要な新しい暗号化プロトコルのサポートを提供します。
最後に、解凍エンジンは、データ分析とデータサイエンスのパフォーマンスを最大化する専用の解凍エンジンです。

Hopper GPU と比較して、NVIDIA Blackwell は 1,280 億個多くのトランジスタを提供し、AI パフォーマンスが 5 倍向上しています。FP6 で 20 ペタフロップスダイあたりのメモリ密度は 4 倍になります。 GPU は、事実上世界最速のメモリソリューションによってサポートされています。8192 ビットバスインターフェイスで 8 TB/秒、最大 192 GB の HBM3e メモリ。

2024 年に予定されている最初の Blackwell GPU は、B100～B200、Superchip プラットフォームを含むさまざまなソリューションを対象としており、合計 160 個の SM で 20,480 コア、TDP はそれぞれ 700W と 1200W です。 NVIDIA は AI 市場を決定する準備をしており、ゲーム専用の次世代ビデオカードに関するニュースを知るのが待ちきれません。