PRODUCT

NVIDIA RTX 4000 Ada

Ada Lovelace Architecture
Design and Simulations

  • 20GB GDDR6 Memory
  • MPC 130W

NVIDIA RTX™ 4000 Ada は、プロフェッショナル向けの最も強力な性能を発揮するシングルスロット GPUです。スピードと電力効率が格段に向上し、要求の厳しいクリエイティブ、デザイン、エンジニアリングのワークフローにワークステーションで取り組むことができます。最新世代の RT コア、Tensor コア、CUDA コアを 20GB のグラフィックス メモリと統合した RTX 4000 は、プロフェッショナルユーザの強い味方になります。

Ada Lovelace アーキテクチャ

Ada Lovelace アーキテクチャベース CUDAコア

単精度浮動小数点 (FP32) 演算を前世代の 1.5 倍高速化したことで、デスクトップにおける複雑な 3D のコンピューター支援設計 (CAD) とコンピューター支援エンジニアリング (CAE) などのグラフィックスやシミュレーションのワークフローのパフォーマンスを大幅に向上しました。

第 3世代 RTコア

前世代と比較して 2倍以上のスループットを提供する第 3世代 RTコアにより、動画コンテンツのフォトリアルなレンダリング、アーキテクチャデザインの評価、製品デザインの仮想プロトタイプといったワークロードで大幅な高速化を実現します。このテクノロジにより、レイトレーシング使用のモーション ブラー レンダリングも高速化するため、ビジュアル精度が向上します。

第4世代 Tensorコア

第 4世代の Tensorコアは前世代の 4倍以上の AIコンピューティングパフォーマンスを提供します。これらの Tensorコアは、FP8精度データ型の高速化をサポートし、独立した浮動小数点と整数のデータパスを提供し、浮動小数点と整数の混合計算の実行を高速化します。

20GB GPUメモリ

20GB GDDR6メモリを搭載した RTX 4000は、データサイエンティスト、エンジニア、クリエイティブなプロフェッショナル向けに、レンダリング、データサイエンス、シミュレーションなどの膨大なモデル、データセット、ワークロードを使用する作業に必要な大容量メモリを提供します。

AV1 エンコーダー

AV1エンコーディングと共に第 8世代の専用ハードウェア エンコーダー (NVENC)を備えたことで、ストリーマー、配信者、ビデオ会議の新しい可能性を解き放ちます。H.264よりも 40%効率的で、1080pでストリーミングしているユーザーは、同じビットレートと品質で実行しながら、ストリーミングの解像度を 1440pまで上げることができます。

パフォーマンス

グラフィックス

3840×2160 resolution, SPECviewperf 2020 geomean test.

レンダリング

1920×1080 resolution, Arnold v6.0.2 Sol scene.

生成 AI

Image generation tested at 512×512 using Stable Diffusion webUI v1.3.1.

推論

TensorRT ResNet-50 V1.5 Inference, precision: mixed.

Omniverse

Measured performance: NVIDIA Omniverse performance for real-time rendering at 4K with NVIDIA DLSS 3.

RTX 4000 Ada / RTX 6000 Ada 仕様比較

RTX 4000 Ada RTX 6000 Ada
Architecture Ada Lovelace Ada Lovelace
CUDA Cores 6,144 18,176
Gen4 Tensor Cores 192 568
Gen3 RT Cores 48 142
Single-Precision Performance 26.7 TFLOPS*

91.1 TFLOPS*

Tensor Performance 327.6 TFLOPS** 1457.0 TFLOPS**
VRAM 20GB GDDR6 48GB GDDR6
Memory Band Width 360GB/s 768 GB/s
Memory Interface 160 bit 384 bit
NVLink No No
Graphics Bus PCIe Gen4 x 16 PCIe Gen4 x 16
Output DP x4 DP x4
TDP 130W 300W

* GPU ブースト クロックに基づくピーク レート。
** スパース性を使用した実効 FP8 テラ FLOPS (TFLOPS)。

弊社では、科学技術計算や解析などの各種アプリケーションについて動作検証を行い、
すべてのセットアップをおこなっております。
お客様が必要とされる環境にあわせた最適なシステム構成をご提案いたします。