AMD Instinct MI300A

トップ
プロセッサ x86・ARM
AMD Instinct MI300A

プロセッサ x86・ARM

Zen4 コアアーキテクチャ
Accelerated Processing Unit

CPU up to 24 cores

AMD Instinct MI300A は、AI や HPCでの処理を強化するよう設計されており x86プロセッサと AMD Instinct アクセラレータ、HBM3 メモリを 1つのパッケージに統合した APU（アクセラレーテッドプロセッシングユニット）です。CPU と GPU がメモリアドレス空間を共有し内部インターコネクトの帯域を圧迫せず高性能化を実現しており、電力効率の高いチップレットテクノロジによる高度なパッケージングが特徴です。

CPU仕様

AMD EPYC CPU Architecture	Zen 4
CPU コア	24
CPU ピークエンジンクロック	3700 MHz

GPU仕様

GPU アーキテクチャ	CDNA3
Lithography	TSMC 5nm \| 6nm FinFET
ストリーミングプロセッサ	14,592
マトリックスコア	912
演算ユニット	228
ピーク時エンジンクロック	2100 MHz
8 ビット精度 (FP8) ピーク性能 (E5M2、E4M3)	1.96 PFLOPs
構造スパース性を持つ 8 ビット精度 (FP8) ピーク性能 (E5M2、E4M3)	3.92 PFLOPs
半精度 (FP16) ピーク性能	980.6 TFLOPs
構造スパース性を持つ半精度 (FP16) ピーク性能	1.96 PFLOPs
単精度 (TF32 マトリックス) ピーク性能	490.3 TFLOPs
構造スパース性を持つ単精度 (TF32) ピーク性能	980.6 TFLOPs
単精度マトリックス (FP32) ピーク性能	122.6 TFLOPs
倍精度マトリックス (FP64) ピーク性能	122.6 TFLOPs
単精度 (FP32) ピーク性能	122.6 TFLOPs
倍精度 (FP64) ピーク性能	61.3 TFLOPs
INT8 のピーク性能	1.96 POPs
構造スパース性を持つ INT8 ピーク性能	3.92 POPs
bfloat16 ピーク性能	980.6 TFLOPs
構造スパース性を持つ bfloat16 ピーク性能	1.96 PFLOPs
トランジスタ数	146 Billion

Memory仕様

ラストレベルキャッシュ (LLC)	256 MB
専用メモリサイズ	128 GB
専用メモリタイプ	HBM3
Infinity Cache	Yes
メモリインターフェイス	8192ビット
メモリクロック	5.2 GHz
ピークメモリ帯域幅	5.3 TB/s
メモリ ECC サポート	〇 (フルチップ)

その他仕様

GPU フォームファクター	APU SH5 ソケット
バスタイプ	PCIe 5.0 x16
Infinity Fabric Links	8
Infinity Fabric リンクピーク帯域幅	128 GB/s
TDP	550W \| 760W Peak

AMD CDNA 3 アーキテクチャ

AMD CDNA 3 は、AMD Instinct MI300 シリーズアクセラレータの基盤となる演算専用アーキテクチャです。データ移動のオーバーヘッドを削減し電力効率を高めるよう設計されたチップレットテクノロジによる高度なパッケージングが特徴です。

White Paper

AMD ROCm ソフトウェア

AMD CDNA アーキテクチャは AMD Instinct アクセラレータをターゲットとする AI および HPC ソリューション開発のためのプログラミングモデルやツール、コンパイラやライブラリ、ランタイムの幅広いセットを含むオープンソフトウェアスタックである AMD ROCm によってサポートされています。

最適化された GPU ソフトウェアスタック

AMD ROCm は、オープンソフトウェアスタックです。低レベルのカーネルからエンドユーザーアプリケーションに至るまで、GPU プログラミングを可能するドライバーや開発ツール、API が揃っています。ROCm は生成 AI および HPC アプリケーションに対して最適化されており既存のコードも簡単に ROCm に移行できます。