RTX 5090 を筆頭に、待望の NVIDIA の新しい Blackwell 世代が登場しました。しかし、本当にすべての期待に応えられるのでしょうか?テストで答えてください。
特に消費量の削減に注力した 40 世代を経て、NVIDIA が現代の人工知能計算の主力アーキテクチャである Blackwell をベースにした新しい 50 シリーズで再び攻撃を仕掛ける時が来ました。転換期にそれをきっぱりと証明することが期待されていました。 NVIDIA は、この新しい魅力的な B2B 市場を支持してビデオ ゲームを放棄したわけではありません。この新シリーズもサイン入りDLSS 4の登場、インターネット上で人々の話題を集め続けている一連のテクノロジー…しかし、実際には何なのでしょうか?
ラ RTX 5090、お財布以外には何の犠牲も払わないグラフィックス カードは、依然としてこれらすべての分野における NVIDIA のノウハウを最もよく表しています。したがって、今こそフル稼働させて、その可能性を最大限に引き出すときです。これが私たちのテストの目標です。
価格と在庫状況
ここでテストしている RTX 5090 Founder's Edition は、2025 年 1 月 30 日からフランスで発売される予定です。推奨価格は2349ユーロです。ASUS や MSI などのメーカーも、同様のパフォーマンスで異なるデザインのこのバリアントを独自に提供していることに注意してください。
NVIDIA GeForce RTX 5090 | |
---|---|
GPU | ブラックウェル |
グラビア | 4nm |
CUDA ハート | 21760 |
RT フロップス | 318 フロップス |
テンソルTOP | 3352 あなたはトップスを持っています |
GDDRメモリ | 32 ゴー GDDR7 |
メモリバス | 512ビット |
4090と比べると大幅な価格上昇です前世代のものは、発売時に 1949 ユーロで販売されました。妥協のないグラフィック カードの相当な価格: 90 年代は一般人向けではなく、銀行口座よりも FPS カウンターに目を向ける最も裕福な人々向けに作られました。そして、このセグメントに競争相手が存在しない場合、NVIDIA は、価格を支払う買い手が存在する限り、価格を自由に設定します。
RTX 5090 のテスト構成は次のとおりです。
- CM : ROG Strix X870-I ゲーミング WiFi
- CPU:AMD Ryzen 9 9800x3D
- 冷却: Corsair iCue H100i RGB Elite
- RAM : 2×16 Go Corsair Vengeance DDR5-6000 MHz
- SSD : MSI スペース M580 PCIe 5.0 2 に
- 電源: Corsair SF1000L 80 Plus ゴールド
こちらもお読みください –Nvidia GeForce RTX 4090 レビュー: まさにモンスターです!
デザイン、消費、暖房
今年の最大の変更点は、前世代と比較して、RTX 5090 は、3 つまたは 4 つのスロットを必要とする設計から 2 スロットの設計に移行します。はい、このすべてのパワーが、「スモール フォーム ファクター」を意味する SFF と呼ばれる構成に保持できるボディに収められています。それは単純に印象的なエンジニアリングです。エンジニアリングに関して言えば、熱設計も完全に見直され、スルーエアフローとデバイスの底部に配置された 2 つのファンが採用されました。この点については、NVIDIA の伝統に戻ります。
私たちのテストでは、RTX 5090 Founder's Edition はアイドル時に 36°C に留まるだけなので、これはうまくいきます。全負荷時は最大 74°C まで上昇します。ただし注意してください。新しい超高速 GDDR7 メモリは前世代よりもはるかに発熱する傾向があり、すぐに 88°C まで上昇します。机上では何も心配する必要はありませんが、これはこの新世代の注目すべき特徴です。
最も重要なのは、最終的にはその消費です。発表された575Wでは、RTX 5090 は、当時の RTX 4090 よりも 125W 多く (+28%) 消費します。アダプターは付属していますが、最低 1000 W の電源が推奨され、16 ピンの電源ポートが必要です。 Blackwell チップは CUDA コアの数を 16,384 から 21,760 (+33%) に増やしており、これらの新しい小さなコアはすべて十分な性能を備えている必要があります。誤解しないでください。この 2 つの関係を追跡するのはそれほど簡単ではありませんが、これについては後で説明します。
試合中、40人が自分自身を抑える方法を知っていたことに注意してください。RTX 5090 は、最も要求の厳しいエクスペリエンスでも 480 ~ 550 W の間で十分に性能を発揮します。一方で、22W でのアイドル状態でも平静を保つ方法を知っています。 NVIDIA が効率化の道を歩み続けることを望んでいれば、この第 50 世代は、電力を送るために消費することをためらわないカードを備えた、いわば「以前の標準」に戻ります。この 5090 ファウンダーズ エディションは、特に、1 秒あたり 100 フレームを超えるスイングを強いられる急性の場合に、不快なコイル鳴きを発する傾向があります。
NVIDIA が安心させたい点: この問題は少数のプレスコピーにのみ関係しているようですが、これは、激しい衝撃があった場合の退去時に保証の対象となります。コイル鳴きの問題はアップデートによって解決される可能性もあります。 NVIDIA チームがこの問題に取り組んでいます。
創造的な計算と人工知能
ビデオ ゲームの測定と DLSS 4 の説明に入る前に、私たちのクリエイティブな友人たちを見てみましょう。結局のところ、RTX 4090 は、大規模な人工知能の計算や、オーディオビジュアル制作のためのレンダリング能力の向上から恩恵を受ける可能性のある中小企業を対象としています。 RTX 5090 には 3 つの最新世代 NVENC エンコーダーが統合されており、もちろん AV1 と互換性があり、より現実に近い色を実現する 4:2:2 の写真とビデオのパフォーマンスに重点を置いていることに注意してください。
写真とビデオの制作の分野では、最初の結果は…落胆するものでした。写真部分については、Adobe Photoshop と Lightroom Classic の最新バージョンでテストしましたが、実際には何も変わりません。ポケットチーフの中には、RTX 5090、4090、および RX 7900 XTX は、基本的に同じパフォーマンスを提供します。関係が完全に変わるのはビデオ部分です。一方、RTX 5090 は、AMD の製品と互角だった前世代と比較して 18% 高いパフォーマンスを提供します。 DaVinci Resolve では、本質的に同じ観察結果が得られましたが、9.8% のわずかな増加であり、RX 7900 XTX のスコアがはるかに低かったのとは対照的です。
やはり展開が一番いいのは3D作品かもしれません。ここ、モンスターシーンの Blender レンダリングの効率が 25% 向上しました、Junkshop が 30% の増加を示し、Classroom が 23% の増加を示した場合。このテストでは一般的に不利な AMD カードは、比較するとさらに不利です。
人工知能の計算はこの世代において非常に重要ですが、これについてはまた改めて説明します。しかし、NVIDIA カードに最高の結果をもたらす TensorRT を最大限に活用するためにテスト ツールが更新されなかった場合、WindowsML スコアはすでに Float 32 での推論計算が 22 上昇していることを示す良い指標となります。 % であり、整数についてもほぼ同様のスコアを持ちます。 +36% という最大の進化を記録したのは Float16 です。これらのカード専用に作られた TensorRT をまだ使用していないことを考慮すると、ここに記録されている開発状況はすでに満足のいくものです。
ただし、RTX 5090 は、NVIDIA によってパフォーマンスとレンダリング品質のバランスが最も優れていると判断された FP4 計算に焦点を当てていることにも注意する必要があります。ベンチマーク ツールではまだカードを相互に適切に比較できませんが、この機会に開発された FLUX.1 での画像生成は TensorRT で 1024 ピクセルに対してわずか 3.945 秒で完了することに注意してください。印象的な。
4K および 1440p VS RTX 4090 での測定
まず理論的なベンチマークから始めましょう。3DMark テスト。このために、DirectX 12 Ultimate とそのレイ トレーシング機能を最大限に活用するように設計されたベンチマークである Speed Way と、最新テクノロジーの純粋なラスタライズ パフォーマンスに焦点を当てた Steel Nomad を選択しました。非常に強力なカードを現代的に比較するには十分です。
階段を登ると、ほぼ同等です!RTX 5090 は、RTX 4090 と比較して 43% のパフォーマンス向上を記録します。Speed Way ベンチマークでは、この世代のレイ トレーシング コアの大きな進化を証明する傾向があります。 Steel Nomad では、パフォーマンスが 55% 向上したこともわかり、NVIDIA のラスター パフォーマンスへの注目に関する議論に終止符が打たれる可能性があります。理論上、この発展は驚異的であるように思えます。
ゲーム内でテストするために、10 タイトルを使用しました。
- アラン ウェイク 2
- バルダーズゲート 3
- 黒神話悟空
- サイバーパンク 2077
- フライト シミュレーター 2024
- ホグワーツの遺産
- ホライゾン・フォービドゥン・ウェスト
- インディ・ジョーンズとエンシェント・サークル
- マーベルライバルズ
- ラチェットとクランクが離れてしまう
これらのゲームさまざまな理由で選ばれました。Alan Wake 2、Black Myth Wukong、Cyberpunk 2077 などの一部のゲームでは、最新のグラフィックス カードでも限界に達します。 Marvel Rivals のような他のゲームは、現代の競争力のあるゲームの良い指標となります。しかし何よりも、これらすべてのタイトルは、DLSS と FSR の両方のテクノロジの大部分と互換性があります。これらの比較では、最小公倍数が選択されることに注意してください。ゲームが DLSS フレーム生成をサポートしているが、FSR3 フレーム生成をサポートしていない場合、測定は同じ比較基準で単純な DLSS/FSR で行われます。レイ トレーシングは、パス トレーシングが利用可能な場合、または同化された場合に、常に限界まで押し上げられます。
アラン ウェイク 2
Remedy の最新タイトルは、すべてのグラフィックス カードを限界に陥れ、今後もその傾向は続きます。レイ トレーシングを有効にした 4k では、パフォーマンスの向上は 9.9% と非常に小さく見えますが、1440p では変化しません。最大の違いが見られるのは純粋なラスタライズであり、パフォーマンスが 4K で 26%、1440p で 21% 向上しました。
ただし、DLSS2 がパフォーマンス モードでアクティブ化されると、差は広がり、新しい Tensor コアがその役割を果たしていることがわかります。 RT を使用した 4K では +19.5%、RT を使用した 1440p では +22% ですが、ラスター上の違いはそれほど明白ではなく、1440p では +4.2%、4K では +16% にすぎません。 CPUは少し安心したようです。
バルダーズゲート 3
Baldur's Gate 3 では、1440p での 29% と比較して 4K でのパフォーマンスが 35% 向上していることがわかります。パフォーマンス モードで DLSS 2 を有効にすると、このカードは、RTX 4090 がそれに非常に近づいたときの 1440p での平均 400 FPS をはるかに上回りました。
黒神話悟空
Alan Wake 2 は少し遅いように見えましたが、ここでの展開はより明白です。レイトレーシングを使用した 4K で +33%、1440p で +24%。純粋なラスター化では、この関係は逆転します。4K では確かに +24% ですが、1440p ではわずか 6% 増加するだけです。
フレーム生成 x2 を有効にすると、本質的に同じ違いが見られます。
サイバーパンク 2077
Cyberpunk 2077 では、この傾向が確認されています。RT を使用した 4K でのパフォーマンスは +44%、1440p では +36% です。従来のラスターでは、4K で +54%、1440p で +25% という素晴らしい開発が依然として行われています。
Frame gen x1 を有効にした DLSS3 ではパフォーマンスの向上が緩やかになり、その差は定義に応じて約 30% になります。
フライト シミュレーター 2024
CPU 負荷が非常に高いゲームである Flight Simulator 2024 は、RTX 5090 を軽くかじることを忘れません。ここでは、パフォーマンス モードで DLSS を使用しない場合、4K で 22.6%、1440p で 34.2% パフォーマンスが向上しました。 DLSS を使用すると、1440p の 7.4% と比較して 4K では 15% 向上します。
ホグワーツの遺産
Hogwarts Legacy は、私たちが選んだゲームの中で最も奇妙なゲームです。レイ トレーシングを有効にした 4K では、エキサイティング以上の崇高な 36% 向上したパフォーマンスが得られます。しかし、1440p では、進化はわずか 2% に低下します。この動作はレイ トレーシングなしの 1440p でも見られ、RTX 4090 と 5090 は本質的に引き分けであり、1% 高い低値を維持する RTX 5090 が有利です。ホグワーツ レガシーが新世代の魅力を最大限に引き出すことができるのは、まさに 4K です。
しかし、最も奇妙なのは、DLSS 2 をパフォーマンス モードでアクティブ化すると、実際には戦闘が行われなくなることです。どちらのカードも基本的に同じ性能を持っています。この動作は私たちを当惑させ、この新世代のメリットを適切に享受するにはゲームを大幅に更新する必要があると考えさせます。ドライバー側で解決しない限り。
ホライゾン・フォービドゥン・ウェスト
パフォーマンス モードで DLSS3 を有効にすると、4K で +21%、1440p で +14%、+23/26% になります。世代から世代への高貴な進化は注目に値しますが、爽快ではありません。
インディ・ジョーンズとエンシェント・サークル
これは、最新のアクセス可能なテクノロジーのみを使用することを選択したゲームであり、したがって、これは私たちが最も期待していた部分です。期待を裏切りません。4K でパッチ トレースを有効にするとパフォーマンスが 32.9% 向上し、1440p では 24.4% も向上しました。パス トレースを使用しない場合でも、両方の定義でパフォーマンスが 16 ~ 20% 向上する権利があります。
このゲームでは Frame Gen がまだ不安定であるため、パフォーマンス モードで DLSS 2 に焦点を当てることにしました。これは、基本的に DLSS 2 なしで観察されたのと同じ展開に従います。
マーベルライバルズ
Marvel Rivals はおそらく私たちのセレクションの中で最も分析しやすいです: 基本的にずっと +30%!
ラチェットとクランクが離れてしまう
4K のレイ トレーシングでは +25%、1440p では +20%。もう一度言いますが、ラスタライゼーションに関しては、進化が少し明確ではありません。4K では +15%、1440p では 13% です。
パフォーマンス モードで DLSS 3 を有効にすると、差はさらに広がります。 RT を使用した 4K では、1440p の場合の 31.8% と比較して、パフォーマンスが 32.8% 向上します。 4K および 1440p でのレイトレーシングなしの場合は基本的に同じですが、変更は 30% を超えます。
新しい RTX および DLSS 4 テクノロジー
ニューラル シェーダー、NVIDIA による真の革命
現在、これらの生のパフォーマンス測定値が DLSS 2 または 3 上にあります。そしてRTX 5090が表す未来があります。NVIDIA にとって、第 50 世代は単なる新しいカードではなく、3D レンダリングと人工知能が混在する新時代の到来を告げるものです。以前は、メーカーの人工知能が「ポストプロダクションで」アクティブ化されていたことを理解してください。たとえば、DLSS 2 は、1080p 画像が作成されるのを待ってから、アクティブ化して 1440p または 4K に「増やす」ようにしていました。 NVIDIA が推進する「ニューラル レンダリング」の原理は、人工知能が「生産フェーズ」でも稼働するようになるというものです。
たとえば、次のようなテクノロジーRTX ニューラル テクスチャ圧縮は、AI 計算を使用してテクスチャを圧縮して再作成します。これにより、RTX ニューラル マテリアルがこの原理を利用して、逆に AI を使用して追加のプロパティを計算することでマルチレイヤー テクスチャのレンダリングが向上し、VRAM が大幅に解放されます。同じ精神に基づいた他の多くの機能が現在利用可能であり、CUDA コアと RT コアのコンピューティング機能だけでなく、Tensor コアも使用します。
こちらもお読みください –DLSS: ビデオ ゲームに革命をもたらしている Nvidia テクノロジーについてすべてを理解する
したがって、1 つだけ理解してください。NVIDIA がその賭けに成功した場合、AI 部分の能力は、将来ビデオ ゲームにとって純粋なグラフィックス能力と同じくらい重要になるでしょう。ただし、重要な点が 1 つあるので注意してください。インターネットからデータを盗んで世界の電力消費を大幅に増加させている画像生成エンジンと同じように AI を考えないでください。ここで、計算はゲームが直接提供するデータからグラフィックス カード上でローカルに行われます。これは、ゲームが PC ごとに異なる可能性がないことも意味します。最終的にはすべてが同じアセットに基づいています。それは人工知能によって「拡張」されただけです。さて…これらのテクノロジーを最大限に活用したゲームは、RTX 5090の発売からは外れています。
本当に改善された治療法?
人工知能の貢献について話す前に、まず、より伝統的だが劣らず優れたテクノロジーについて話しましょう。RTX メガ ジオメトリ。現在、数百万の三角形にモデルを構築する Unreal Engine の Nanite のようなシステムを使用するごく最近のゲームでは、レイ トレーシングの計算が非常に高価になります。現在のプロファイルでは、レイの通過が三角形ごとに計算されるため、膨大な計算負荷が発生し、開発者はレイ トレーシングの計算において最も品質の低いモデルのみに集中する必要がありました。
RTX Mega Geometry を使用して、NVIDIA はこのタイプの操作を最適化しました。三角形のパックごとに計算を行うことで、計算をさらに加速します。これらの葉のテクノロジーを統合した最初のゲームである Alan Wake 2 のようなタイトルのレンダリングを改善するには十分です。ビフォー/アフターは、結果がどのように劇的に変化し、より正確になったかを示しています。
しかし、本当の目新しさは、すべての RTX カードに共通する最大の進歩である DLSS 4 の側に見られます。CNN 機械学習モデルの通過です。これらのことを詳しく説明するために頭を麻痺させることなく、NVIDIA が画像を改善するために使用する AI にコンテキストと並列処理の概念が追加され、それが何を想定しているのかをより明確に認識できるようになったということだけを知っておいてください。表示/強化します。しかも、これには大幅なパフォーマンスコストがかかりません。
例で見るとわかりやすいです。 Alan Wake 2 では、CNN 版 DLSS の欠陥が再び完璧に表示されます。ここでスイープした葉をレンダリングすると、不要なピクセル跡が発生し、下にあるテクスチャが歪みますが、DLSS の Transform バージョンでは完全に消えます。小さな革命。
そして最後に、マルチフレーム生成があります。40 シリーズ カードに物理的に統合された OFA はなくなり、このモデルは非常に強力になったため、OFA の助けを必要とせず、ゲームの最終レンダリング用に最大 3 つの追加フレーム (任意) を作成することもできます。人工知能によって作成された 3 つの新しいフレームを作成するためのコンテキストとして機能するフレームが「自然に」作成されます。ただし、コンテキストとゲームの動きの中で一貫性を保つ必要があるという難しいタスクがあります。ただし、次の点に注意してください。このテクノロジーは依然として独占的です50 シリーズでも、各カードに正しく統合されて機能するにはハードウェア要素が必要です。これは、レンダリング パイプラインでフレームを表示する順序とリズムを制御するフリップ メータリング専用のチップです。
レースの結果は?フレームレートは +198.2% 増加し、模範的な流動性を実現します。しかし、この偉業を達成するには、人工知能によって作成された画像が従来の 3D レンダリングによって作成された画像と同等の品質でなければなりません。アラン ウェイク 2 では AI が作成したフレームを見つけることができなかったので、ここでゲームを変更する必要があります。ドラゴンエイジ・ザ・ヴェールガードさらに、特に激しい戦闘シーンにもかかわらず。の側にありますスター・ウォーズの無法者たちAI によってマルチ フレーム生成のために作成されたフレームに適用された Transformer モデルの残骸をついに見ることができました。
フレームごとに見ると、人工知能側の動作計算エラーのように、特定のオブジェクトの輪郭がオブジェクト自体よりわずかに速く前方に移動しているのが見えることがあります。このエラーは、複雑な照明領域で非常にわずかに動くキャラクターの周囲で最もよく見られます。ステーク…それは単に知覚できないだけです。また、DLSS 4 に適用される Transformer テクノロジーはまだ初期段階にあるため、それはまばゆいばかりです。マルチ フレームの生成には禁断の黒魔術の効果がありますが、ビデオ ゲームのレンダリングに AI が関与し得る貢献を明確に証明しています。
そして、このすべての遅延はどうなるのでしょうか?
いわゆる「フェイクフレーム」をめぐる大論争このようなテクノロジーの使用によって引き起こされる待ち時間の観点からも見られます。確かに、人工知能によって作成されたフレームは、世界を支配するビデオ ゲームのロジック、つまり仮想空間内で私たちが実行するインタラクションから逃れています。わかりやすくするために、格闘ゲームを例に考えてみましょう。彼らの前提は、適切なタイミングで右ボタンを押してコンボを実行することに基づいています。コンボとは、一連のヒットが互いに打ち消し合い、完全な一連の攻撃を形成するものです。ストリートファイターのロジックがこれを決定するために、60 FPS に設定されます。それ以降、各攻撃はこのロジックを参照します。60 フレーム中 6 番目のフレームで大拳の後に中足を押すと、コンボが継続します。押すのが早すぎたり遅すぎたりすると、コンボは失敗します。
ほとんどのビデオ ゲームは同じ原理に従いますが、そのロジックはマシン上のゲームのパフォーマンスに適応します。フレーム数が多いほど、ゲーム ロジックがアクションに速く反応します。これが、Counter Strike、Valorant、さらには Apex Legends などの対戦型ゲームが、高いリフレッシュ レートから多大な恩恵を受ける理由です。ゲームのロジックは、正しい場所でショットをしたかどうかに応じて、はるかに効率的に計算できます。このアクションとリアクションの間のギャップを「レイテンシー」と呼びます。
さて…マルチフレーム生成を使用して、Marvel Rivals のような対戦型ゲームのシステム レイテンシーを測定してみましょう。
マーベルライバルズ | PCの遅延 | |
---|---|---|
4K/ウルトラ/DLSS 4 パフォーマンス | サンフレーム生成 | 13ミリ秒 |
フレーム生成×2 | 18ミリ秒 | |
フレーム生成 x3 | 19ミリ秒 | |
フレーム生成 x4 | 21ミリ秒 | |
4K/ウルトラ/DLSSオフ | サンフレーム生成 | 19ミリ秒 |
1080p/ウルトラ/DLSSオフ | サンフレーム生成 | 17ミリ秒 |
4K では、パフォーマンス モードの DLSS モードは、4K にアップスケールされたゲームの 1080p レンダリングから開始されます。また、ゲーム ロジックは 1080p に基づいて計算され、DLSS の使用によって残りのレンダリングが削減されるため、さらに最適化されます。 DLSS を使用しない場合、ゲームの遅延はフレーム生成 x3 の DLSS モード 4 と同等になります。 DLSS を使用しない場合、パフォーマンス モードで DLSS 4 を使用する場合、1080p は 4K よりも遅延が高くなります。
「はい、ただし、この方法で測定されたシステム遅延は、必ずしも入力遅延に変換されるわけではありません。」非常に良い点です。LDAT も画面に貼り付けました。これにより、クリックからフラッシュまで、画面上のフォトンの変換の遅延を、毎回平均 100 ショット測定して、一般に入力遅延と呼ばれます。プロゲーマーが使用するのと同じ、240Hz の 4K ディスプレイ、VRR (G-Sync) 対応。
モード | 測定されたレイテンシ |
---|---|
1080p DLSS オフ | 34.9ミリ秒 |
4K DLSS オフ | 33.3ミリ秒 |
4K DLSS4 パフォーマンス MFG xO | 22.2ミリ秒 |
4K DLSS4 Perf MFG x4 | 33.1ミリ秒 |
まったく異なるテスト、同様の結論: 最高レベルのマルチ フレーム生成は、DLSS がない場合やスケーリングの基礎となる定義上でゲーム内で感じられるのと同じ遅延に対応します。したがって、いつものように、本当に重要なのは、ゲームのロジックがスムーズに実行できるように、ベースとしてかなり満足のいく平均 FPS レベルを持つことです。
アラン ウェイク 2 | PCの遅延 | |
---|---|---|
4K/ウルトラ/DLSS 4 パフォーマンス | サンフレーム生成 | 33ミリ秒 |
フレーム生成×2 | 42ミリ秒 | |
フレーム生成 x3 | 44ミリ秒 | |
フレーム生成 x4 | 47ミリ秒 | |
4K/ウルトラ/DLSSオフ | サンフレーム生成 | 74ミリ秒 |
1080p/ウルトラ/DLSSオフ | サンフレーム生成 | 28ミリ秒 |
最後に、好奇心旺盛な方のために、ベース FPS が 4K で 100 FPS 未満である Alan Wake 2 のシングルプレイヤー ゲーム エクスペリエンスに関する同じ表を示します。この例は、非常に要求の厳しいゲームで測定できた中で最も重いものです。そして、これをさらに最適化するために NVIDIA Reflex 2 とその Frame Warp が動作しているのをまだ見ていません…