<ruby id="6g0kr"><small id="6g0kr"></small></ruby>
  • <dd id="6g0kr"></dd><ruby id="6g0kr"><small id="6g0kr"></small></ruby>

    成人特级av手机在线观看_亚洲图色成人_91精品伊人久久大香线蕉_亚洲,欧美精品._男女无遮挡免费网站观看_国产精品成人在线_国产在线精品亚洲第一网站_国产欧美日韩一区二区三

    DLSS 4重塑游戲體驗 七彩虹 iGame GeForce RTX 5090 D Advanced 32GB首測    

    顯卡 01-26 11:23:13 81 0

    大家好,我是黃昏百分百,很榮幸再次獲得英偉達(dá)與七彩虹的聯(lián)合邀請,參與到全新NVIDIA GeForce RTX 5090 D顯卡的首發(fā)測評中,這次我拿到的是七彩虹 iGame GeForce RTX 5090 D Advanced 32GB,之前已經(jīng)為大家做了顯卡的開箱部分,而今天我終于可以與各位分享這款顯卡點亮后的首發(fā)測評了,今天就讓我們一起看一看,全新一代Blackwell架構(gòu)的旗艦顯卡RTX 5090 D的表現(xiàn)到底如何,提升有多大。

    那么廢話不再多說,我們開車吧。

    Blackwell 架構(gòu)優(yōu)勢分析

    新架構(gòu),新制程

    ▲NVIDIA Blackwell架構(gòu)作為 GeForce RTX 50 系列顯卡的核心,必須要放在最前面說。Blackwell架構(gòu)基于英偉達(dá)專門定制的臺積電 4NP 工藝制造,晶體管數(shù)量從上一代的 760億個激增至 2080 億個,是目前世界上工藝最精湛的 GPU 架構(gòu)。

    ▲我們來看在英偉達(dá)設(shè)計Blackwell架構(gòu)時的目的,最重要第一條便是優(yōu)化全新的神經(jīng)工作任務(wù),其次才是降低內(nèi)存路徑,提高能效等等,可見英偉達(dá)對神經(jīng)渲染技術(shù)的重視程度,那么我們就從其架構(gòu)上來看一下,全新Blackwell架構(gòu)的顯卡是如何強化顯卡的神經(jīng)渲染能力的吧。

    ▲從圖靈架構(gòu)開始,英偉達(dá)開始采用多單元流處理器 (Streaming Multiprocessor,SM)架構(gòu)以執(zhí)行光線追蹤等運算工作,然后到安培架構(gòu)、Ada架構(gòu),再到現(xiàn)如今的Blackwell架構(gòu),其

    在從圖中可以看出,SM布局基本與上代保持一致,不過在配置與功能上,每一代都有非常明顯的進(jìn)步。在GB202芯片組中,共有192 個SM,而每個SM包含128個CUDA核心。

    ▲而本代SM中最核心的變化,是其內(nèi)所有的的CUDA核心既可以運算FP32數(shù)據(jù)類型,又可以運算INT 32數(shù)據(jù)類型,這意味著相較于Ada架構(gòu),Blackwell架構(gòu)的INT32運算能力得到了翻倍增強,當(dāng)然,每一個時鐘期間,一個CUDA只能運算一種數(shù)據(jù)類型。

    另外,第四代光追核心取代了之前的第三代光追核心,擁有4紋理核心,256KB注冊文件空間,128KB L1共享內(nèi)存的第五代Tensor核心也取代了第四代Tensor核心。

    NVIDIA還改進(jìn)了SM中的著色器渲染管道,將不同的渲染類型分配給Tensor 核心與Shader 核心,以便進(jìn)一步提升著色器與張量核心的運算效率,NVIDIA將其稱作RTX Neural Shaders(神經(jīng)網(wǎng)絡(luò)著色器),得益于此,Blackwell架構(gòu)的著色器渲染效率是Ada架構(gòu)的兩倍

    總的來說,Ada架構(gòu)的SM是為標(biāo)準(zhǔn)著色器進(jìn)行設(shè)計與優(yōu)化的,而Blackwell架構(gòu)的SM則是為了神經(jīng)著色器而設(shè)計和優(yōu)化的。

    ▲而每兩個SM組成一個紋理處理集群(Texture Processing Clusters,TPCs),再由多個TPC組成一個圖形處理集群(Graphics Processing Clusters,GPCs)。

    ▲而Blackwell架構(gòu)的GPU則是由多個GPC組成的,以一個完整的GB 202芯片為例,其擁有12個GPC,96個TPC,192個SM,24576個 CUDA核心,192個光追核心以及Tensor核心與紋理單元各768個。

    全新GDDR7 顯存,速度更快,能效比更高

    ▲而除了GPU之外,顯存也是影響一款顯卡性能強大與否的重要因素,NVIDIA在顯存方面的不懈努力也肉眼可見,在安培架構(gòu)RTX 3090首發(fā)的時候,NVIDIA便首次使用了采用PAM4 信號傳輸(4 個級別,每個周期提供 2 位)的GDDR6X顯存,使得顯存?zhèn)鬏斔俾蚀蠓嵘@卡的游戲性能與AI性能也隨之大幅提升。但是伴隨性能提升而來的則是顯存的耗電與發(fā)熱顯著增加,這點相信使用過RTX 3090、RTX 3080的朋友們應(yīng)該還有印象。

    ▲而本次Blackwell架構(gòu)顯卡中,NVIDIA則首次使用了GDDR7顯存,其采用了PAM3 信號傳輸(3 個級別,每個周期提供 1.5 位),配合著創(chuàng)新的pin 編碼方案,GDDR7 能夠?qū)崿F(xiàn)顯著增強的信噪比(SNR),并使得最小I/O通道數(shù)量得到了翻倍。

    再配合著重新設(shè)計的時鐘架構(gòu)和增強的 I/O 訓(xùn)練,GDDR7 提供了更高的帶寬,同時提升了顯存的能效比。

    支持FP4,大幅降低模型體積,提高運算效率

    ▲在2022年以StableDiffusion為代表的生成式AI普及后,AI運算對顯卡的計算量與數(shù)據(jù)儲存能力的需求呈現(xiàn)爆炸式的增長,而得益于全新的第五代Tensor核心,Blackwell架構(gòu)顯卡可以處理FP4數(shù)據(jù)類型,F(xiàn)P4 提供了一種較低的量化方法,類似于文件壓縮,該方法能夠顯著減小模型大小,讓AI運算對顯存的要求更低,效率自然也大幅提升。

    NVIDIA官方給出了例子:

    在Black Forest Labs(黑暗森林實驗室)的 FLUX.dev模型中,如果使用FP16數(shù)據(jù)類型,那么模型需要占用23GB的顯存,只有像RTX 4090 D、RTX 5090 D這樣的頂級顯卡才能有運行,而如果使用FP4數(shù)據(jù)類型,那么只需要不到10個GB的顯存空間,這樣就可以有更多型號的顯卡可以運行此模型了。同時,使用FP4的RTX 50系顯卡的AIGC速度,也獲得了極大的提升。

    第四代RT核心,全新引擎提升光追效率

    ▲Blackwell的第四代光追核心包含Box Intersection Engine(箱體交集引擎)、Triangle Cluster Intersection Engine(三角形群集交集引擎)、Linear Swept Spheres(線性掃描球體),Opacity Micromap Engine(不透明度微觀映射引擎)與Triangle Cluster Compression Engine(三角形群集壓縮引擎)這五種引擎。

    其中,Box Intersection Engine、Triangle Cluster Intersection Engine與Opacity Micromap Engine在上一代Ada架構(gòu)上均有應(yīng)用,我在RTX 4090的首發(fā)測評中也有詳細(xì)介紹,有興趣的可以去看,這里我們重點講一下Linear Swept Spheres與Triangle Cluster Compression Engine。

    ▲毛發(fā)是渲染中的一大難點,為了模擬出頭發(fā)曲線與直線的形態(tài),傳統(tǒng)渲染方式使用單面為三角形的棱柱,這樣便需要非常多的三角形來增加畫面的精確性,模擬出一個男性的頭發(fā)大約需要6百萬個三角形,十分占用顯卡資源。

    ▲而全新的Linear Swept Spheres(線性掃描球體)模型則使用兩個球體來定位頭發(fā)的位置,球體不僅更適應(yīng)頭發(fā)的形狀,也降低了三倍的數(shù)據(jù)量,換言之,使用Linear Swept Spheres能大幅降低顯存使用率,進(jìn)而提升游戲的幀率表現(xiàn)。

    Neural Rendering(神經(jīng)網(wǎng)絡(luò)渲染)

    Neural Rendering(神經(jīng)渲染)是一種結(jié)合深度學(xué)習(xí)與圖形技術(shù)的創(chuàng)新方法,能夠高效、靈活地生成高質(zhì)量圖像。它借助深度學(xué)習(xí)模型模擬渲染過程,通過AI技術(shù)合成著色、紋理和光影效果,從而創(chuàng)造出逼真的圖像。與傳統(tǒng)依賴物理規(guī)律和數(shù)學(xué)模型的確定性渲染算法不同,神經(jīng)渲染無需精確描述場景中的幾何、材質(zhì)和光照等細(xì)節(jié),而是通過學(xué)習(xí)海量數(shù)據(jù)來模擬渲染效果。

    ▲英偉達(dá)在15日的活動現(xiàn)場演示了龍模型,其便是采用神經(jīng)網(wǎng)絡(luò)進(jìn)行實時渲染產(chǎn)生的,從我的實拍照片上大家便可看到,整個畫面完全達(dá)到了影視級的效果,且?guī)室脖容^高,可見AI對生產(chǎn)力方面的明顯提升。

    而從這張照片上,我們便可以看到要渲染出這條龍,到底需要多少的多邊形,正是得益于RTX Mega Geometry技術(shù),RTX 5090 D才能夠渲染出如此復(fù)雜的模型。

    ▲另外,神經(jīng)網(wǎng)絡(luò)渲染還擁有諸如RTX Neural Materal(RTX 神經(jīng)材質(zhì))技術(shù),比如活動現(xiàn)場演示的《Zorah》Demo中,左側(cè)為標(biāo)準(zhǔn)材質(zhì)渲染而出,占用47MB的顯存,而右側(cè)為使用RTX 神經(jīng)材質(zhì)技術(shù)進(jìn)行渲染,僅占用16MB 顯存。同時,右側(cè)照片中寶石的貓眼效果更加明顯,這是因為神經(jīng)材質(zhì)技術(shù)能夠根本更好的還原出光線在照射到寶石上后的鏡面反射、漫反射、散射等效果;同時,右側(cè)桌面與臺座上金屬的老化效果,也比左側(cè)標(biāo)準(zhǔn)材質(zhì)渲染的更加真實,有機會大家可以去體驗一下這個Demo,真的是效果提升明顯。

    DLSS 4 多幀生成,引領(lǐng)時代的游戲革命

    ▲終于講到大家最關(guān)心的DLSS 4了,它最直觀的提升,自然就是這個多幀生成技術(shù),目前每個實際渲染的幀可通過AI生成額外的3幀,大幅提升游戲的流暢度。

    ▲另外,DLSS技術(shù)還可通過 Super Resolution超分辨率技術(shù),進(jìn)一步降低實際渲染畫面時顯卡的壓力,比如顯卡在輸出4K分辨率的游戲畫面的時候,便可使用原生渲染方式,先渲染一幅1080P分辨率的畫面,再由 Super Resolution超分辨率技術(shù)將其提升至4K分辨率,然后再由多幀生成技術(shù),最多生成出3個額外的幀。

    因此,由GPU實際渲染的工作量僅為輸出畫面的1/16,而其余的15/16均由AI進(jìn)行生成,進(jìn)而大幅降低了高分辨率、高幀率游戲下,顯卡的壓力。

    ▲我們來看NVIDIA官方給的RTX 5090在不同版本DLSS下的游戲幀率表現(xiàn),在4K分辨率下,未開啟DLSS時,游戲幀率為27 FPS,PC延遲為71ms,而在開啟DLSS 2、DLSS 3.5、DLSS 4后,游戲幀率分別為71 FPS、140 FPS、248 FPS,且延遲均為34 ms左右。

    同時,DLSS 4所渲染出的畫面,相較于前代DLSS甚至相較于原生渲染時,其細(xì)節(jié)都有明顯的提升,大家可以注意外賣盒子上的褶皺,DLSS 4所渲染的畫面明顯細(xì)節(jié)更加豐富。

    因此,我們可以得出結(jié)論,在4K分辨率,最高光線追蹤畫質(zhì)下,DLSS 4技術(shù)能提供高達(dá)8倍以上的幀率提升,同時還能使得電腦延遲減半,進(jìn)而大幅提升玩家的游戲體驗。

    ▲DLSS 4多幀生成技術(shù)嚴(yán)重依賴Blackwell架構(gòu)CPU中的張量運算核心等專有部分,所以其目前為RTX50系獨占。DLSS Mutil Frame Generation 潛在多幀生成技術(shù)與DLSS Ray Reconstrucion 光線重構(gòu)技術(shù)、DLSS Super Resolution 超分辨率技術(shù)與Deep Learning Anti-Aliasing 深度學(xué)習(xí)抗鋸齒技術(shù)共同構(gòu)建了DLSS 4。

    ▲除了潛在多幀生成技術(shù)之外,NVIDIA 還在DLSS 4中將之前的CNN Model改為了更為先進(jìn)的Transformer Model,在使用DLSS 2與DLSS 3上的CNN卷積神經(jīng)網(wǎng)絡(luò)是將本地像素數(shù)據(jù)聚合在一起,并以一個樹形結(jié)構(gòu)進(jìn)行分組分析,其計算效率已經(jīng)很高,游戲畫質(zhì)提升很明顯。

    ▲而最新使用的Transformer Model中,如何使用與分析數(shù)據(jù)這件事,將由數(shù)據(jù)本身進(jìn)行驅(qū)動,神經(jīng)網(wǎng)絡(luò)上將會集中注意力在更有趣的數(shù)據(jù)特點上,從而做出更好的決策。DLSS 4正式引入了Transformer Model,NVIDIA增加了模型的大小,在更大的數(shù)據(jù)集上進(jìn)行訓(xùn)練,并且記住在訓(xùn)練期間的更多案例,因此,DLSS 4的計算效率高的令人難以置信。

    ▲Transformer Model其能夠參考2倍的參數(shù),并提供4倍的計算量,進(jìn)而提供更為令人驚訝的畫面質(zhì)量,尤其在光線重構(gòu)與超分辨率技術(shù)的提升尤為明顯。

    ▲比如在照明環(huán)境很差的場景中,Transformer Model的光線重構(gòu)功能在處理網(wǎng)格狀柵欄的細(xì)節(jié)處理的穩(wěn)定度表現(xiàn)就要優(yōu)秀,畫面明顯更加清晰,沒有了糊的感覺。

    ▲而在Transformer Model在超分辨率方面,也證明了其有更好的穩(wěn)定性,更少的鬼影,更高的運動細(xì)節(jié)。

    ▲為了處理非常復(fù)雜的多幀生成過程,Blackwell架構(gòu)的GPU采用了全新的硬件AI Management Processor,它可以將幀同步的邏輯轉(zhuǎn)移到顯示引擎上,能使GPU更加精確的管理顯示的時序。

    得益于全新的Blackwell架構(gòu),DLSS 4在部分場景下幀率提升高達(dá)八倍,相較于DLSS 3,幀生成到多幀生成的速率也提升了1.7倍。

    另外,顯卡同時處理語言模型與游戲引擎?zhèn)魅隚PU的數(shù)據(jù)時,可以更高效的分別RT 核心、CUDA 核心、Tensor核心間的工作負(fù)載與工作優(yōu)先級,進(jìn)而提升顯卡的整體效率。

    ▲在RTX 50系顯卡解禁的當(dāng)天,便會有75款游戲在RTX50發(fā)售時即支持DLSS 4,這是一個極其夸張的數(shù)字,所以大家完全不用擔(dān)心買了新顯卡,卻沒有游戲支持DLSS 4。

    iGame GeForce RTX 5090 D Advanced 32GB外觀與參數(shù)

    ▲說到這里,我們就該正式介紹一下本次測評的iGame GeForce RTX 5090 D Advanced 32GB了,之前已經(jīng)做過開箱內(nèi)容,所以本次只是簡單介紹一下。

    ▲七彩虹iGame GeForce RTX 50 系 Advanced 顯卡依舊采用經(jīng)典的三風(fēng)扇設(shè)計, 在設(shè)計上,本代產(chǎn)品引入了更多的圓角和曲線元素,環(huán)繞著三個風(fēng)扇的裝飾的靈感來之莫比烏斯環(huán)。

    ▲補上之前開箱時想發(fā)而不能發(fā)的上機燈效圖,七彩虹iGame Advanced 顯卡一直十分適合豎裝,能最大限度的發(fā)揮其燈效優(yōu)勢,尤其這代的透光材質(zhì),更是讓其燈效得到巨幅進(jìn)步。

    ▲緊接著,我們正式介紹一下本次測評的iGame GeForce RTX 5090 D Advanced 32GB的詳細(xì)參數(shù):它共有用21760個CUDA核心,總共擁有2375 AI TOPS的算力,其基礎(chǔ)核心頻率為2017MHz,按下一鍵超頻按鈕后,其頻率可飆升至2407MHz,顯卡配備了32GB的GDDR7顯存,顯存位寬高達(dá)512bit,顯存帶寬高達(dá)1792GB/s,簡而言之,配置十分奢華。

    ▲從這張圖上可以看到,本代iGame GeForce RTX 5090 D Advanced 32GB無論從CUDA數(shù)量上,還是顯存容量版本上,都是質(zhì)的飛躍,3E2GB、GDDR7這些強大配置,都堆在了RTX 5090 D這款旗艦顯卡上,讓人不禁好奇,它到底有多強大。

    ▲最后再介紹一下本次的測評平臺,本次我依舊使用了intel的酷睿Ultra 9 285K進(jìn)行測試,配合與顯卡同品牌的七彩虹iGame Z890 Vulcan X V20主板,七彩虹不僅顯卡異常強大,其主板這些年來的進(jìn)步也十分神速,這款主板的發(fā)布會我也去了,它真心是一款十分出色全面的主板,且BIOS功能上也非常完善了,個人起來很放心。

    同時,為了保證游戲中,諸如Direct Storage等功能的流暢運行,并保證生產(chǎn)力測試部分內(nèi)存的充足,本次選擇了PCIe 5.0的SSD固態(tài)硬盤與32GBx2的大容量內(nèi)存。

    最后,為了保證供電與CPU散熱能力的充足,本次選用了1200W的大功率白金全模組電源,與公認(rèn)強大的360水冷,顯示器方面也使用了4K高刷的AOC AGON AG276UX。

    這部分我將放在文末進(jìn)行介紹,首先讓我們開始顯卡的性能測試。

    七彩虹 iGame GeForce RTX 5090 D Advanced 32GB DLSS 4 性能測試

    終于到了最激動人心的性能測試的環(huán)節(jié),首先自然是對DLSS 4性能測試了,目前能夠測試的還基本上是媒體體驗版的軟件與游戲,支持DLSS 4的正式版游戲需要在顯卡測試解禁后更新,所以本次能夠測試DLSS 4的游戲不算很多,首先是3DMark的DLSS 4測試。

    3DMark DLSS功能測試

    在3DMark DLSS 功能測試1.5版本中,已經(jīng)提供了對NVIDIA DLSS 4技術(shù)的支持,其中Frame Generation的2x意味著通過AI額外生成1幀,而3x意味著額外生成2幀,4x意味著額外生成3幀。這里,我將盡可能測試更多的模式,來看一看DLSS 4對幀率的提升有多明顯。

    首先,在4K分辨率下,開啟DLSS 4 性能模式,并選擇4倍幀生成,在DLSS 關(guān)閉時,七彩虹 iGame GeForce RTX 5090 D Advanced 32GB能夠提供75.68 FPS的平均幀率,而在開啟DLSS 4后,iGame GeForce RTX 5090 D Advanced 32GB能夠提供381.55 FPS的平均幀率,是未開啟DLSS時的5倍,當(dāng)然,這并不是意味著DLSS 4技術(shù)通過AI為每個實際渲染幀額外生產(chǎn)了4幀,而是其超分辨率技術(shù)降低了顯卡的渲染壓力,使其有能力實際渲染出更多的幀,再結(jié)合AI幀生產(chǎn)技術(shù),二者強強聯(lián)合,才帶來這種幀率5倍的提升。

    除此之外,我還分別測試了DLSS 4性能模式 2x,DLSS 4性能模式 3x的幀率,得益于本代Blackwell 架構(gòu)顯卡性能的提升,即使是DLSS 4性能模式 2x,也就是只插入一幀的情況下,RTX 5090 D依舊能夠提供233 FPS的平均幀率,基本上也能跑滿目前最高端的電競顯示器了。

    因此,我有了一個大膽的想法,之前我們使用4K分辨率的時候,都是開啟DLSS性能模式,而現(xiàn)在有了1幀能夠AI生成3幀的2025年,我們完全可以使用更高的渲染率,比如DLSS 4平衡模式、質(zhì)量模式、甚至DLAA 深度學(xué)習(xí)抗鋸齒配合幀生成來提供更為優(yōu)秀的畫質(zhì)。經(jīng)過我的實測,即使在DLAA 100%原生渲染的情況下,RTX 5090 D配合 4x級別的幀生成,依舊能夠提供217 FPS的平均幀率,這么高的幀率,對于不強求時時刻刻跑滿4K 240Hz顯示器的朋友來說,也非常夠用了。

    可以說,DLSS 4的多幀生成技術(shù)讓玩家能夠有機會同時享受到更好的畫質(zhì)與更高的幀率,實在是太棒了。

    你以為這就結(jié)束了?并沒有,我還測試了RTX 5090 D在8K分辨率下的表現(xiàn),在DLSS 4 超級性能模式與 4x幀生成的情況下,iGame GeForce RTX 5090 D Advanced 32GB可以提供217.45 FPS的高幀率,讓8K游戲真真正正的走近玩家視野,富哥完全可以買4款4K 240Hz刷新率的QD-OLED顯示器,拼接成一塊8K 240Hz的超大顯示器,把顯卡的4個視頻輸出接口全用上。

    《賽博朋克 2077》Benchmark

    緊接著我們用實際游戲來體驗一下DLSS 4的表現(xiàn),第一款游戲是《賽博朋克 2077》,這款游戲一直緊跟顯示技術(shù)最前沿,當(dāng)時首測RTX 40系顯卡的時候,它便是最早支持DLSS 3潛在幀生成技術(shù)的游戲之一,而后的DLSS 3.5光線重建它也最早支持,而現(xiàn)在RTX 50系顯卡首發(fā),它又當(dāng)之無愧的成為了最早支持DLSS 4多幀生成技術(shù)的游戲大作之一。

    在測試中,首先我們按照絕大多數(shù)玩家?guī)蕿橥醯哪甏?,我們以幀率提升最明顯的DLSS 4,幀生成4x 模式測試4K分辨率、光線追蹤:超速畫質(zhì),其平均幀率為257 FPS,已經(jīng)超過了目前高端的4K 240Hz高端電競顯示器的最大刷新率,這一次是顯卡顯示技術(shù)跑過了顯示器的刷新率了。

    我分別測試了關(guān)閉DLSS、DLSS性能模式+幀生成2x、DLSS性能模式+幀生成3x、DLSS性能模式+幀生成4x的表現(xiàn),即使在DLSS 4性能模式 2x下,F(xiàn)PS依舊有148 FPS, 搭配主流的4K 144Hz顯示器輕輕松松。

    雖然顯卡的平均幀率非常高,但我們還是要把注意力放在游戲的整體流暢度上,也就是我們常提的1% Low FPS,畢竟最復(fù)雜的場景,往往也是決定游戲勝負(fù)的場景。NVIDIA提出了新的計量方法,被稱作1% Low (MsBetweenDisplayChange) ,從上圖可以得知,傳統(tǒng)的1% Low (MsBetweenPresents) 統(tǒng)計的是CPU向渲染隊列中幀數(shù),但實際上,這個幀數(shù)據(jù)需要經(jīng)過下渲染隊列、GPU渲染、整合等一系列流程的等待,如果此時游戲畫面與此幀相差甚遠(yuǎn),那么這個幀只能被拋棄,玩家并不能看到這一幀,讓CPU白做無用功。

    而得益于AMP芯片等Blackwell架構(gòu)的一系列優(yōu)化,RTX 50系顯卡能夠大幅提升從CPU渲染幀到實際輸出到屏幕上幀率的達(dá)成度,進(jìn)而大幅提升有意義的1% Low(MsBetweenDisplayChange) 。

    這里我做了剛才《賽博朋克 2077》Benchmark 前300幀的生成情況,橙色為實際渲染到屏幕上的每幀之間的間隔,而藍(lán)色則為CPU渲染出每一幀之間的間隔,可以看到,橙色曲線的波動明顯比藍(lán)色曲線波動小,而在這次測試中,本電腦 的1% Low (MsBetweenDisplayChange)

    為136 FPS,而1% Low (MsBetweenPresents) 卻只有 58FPS,因此我們可以得出結(jié)論,RTX 50系顯卡能夠大幅提升實際游玩中的實際1% Low幀,讓游戲體驗更加絲滑。

    另外,我還記錄了預(yù)設(shè)光線追蹤:超級畫質(zhì)下,七彩虹 iGame GeForce RTX 5090 D Advanced 32GB在4K原生分辨率、DLSS關(guān)閉時與開啟DLSS 幀生成4x時的游戲游戲幀率:

    原生分辨率、DLSS關(guān)閉時,iGame GeForce RTX 5090 D Advanced 32GB可提供33 FPS的平均幀率,屬于可以體驗劇情的級別,而在開啟DLSS 4 幀生成4x時,游戲幀率暴漲至257 FPS,性能提升近8倍。

    同時,開啟DLSS 4 幀生成4x后,游戲的1% Low FPS也由開啟前的25 FPS提升到了136 FPS,提升了近5.5倍。

    同時,開啟DLSS 4后,游戲的平均PC延遲也由開啟前的58ms下降到了37ms,下降了約三分之一。

    雖然DLSS技術(shù)能夠大幅提升游戲幀率,但是一直有玩家糾結(jié)開啟DLSS,尤其是開啟超分辨率技術(shù)是否會使得畫面變差,至少在RTX 50系,我敢說絕大多數(shù)場景下,開啟DLSS技術(shù)不僅不會使畫面變差,甚至還會讓畫面變得好。為了證明這一點,NVIDIA專門推出了畫質(zhì)比較工具ICAT,不僅能夠比較圖片的畫質(zhì),甚至能夠同時加載兩段游戲錄屏進(jìn)行直接比較,上面是NVIDIA官方給的測試場景,我有樣學(xué)樣,在多次Benchmark中,分別測試了開啟DLSS前后的游戲視頻,以及使用傳統(tǒng)CNN Model與使用Transformer Model時的游戲視頻,我們來比較一下畫面的差異。

    左側(cè)為DLSS開啟后的畫面,右側(cè)為原生畫面,肉眼可見左側(cè)畫面明顯更銳利清晰。

    尤其在細(xì)節(jié)上,比如這個猴子旗子,左側(cè)的字體與團(tuán)明顯更加銳化可分辨,而右側(cè)原生分辨率下字體已經(jīng)明顯糊了,很難分辨上面寫了什么。

    同樣的,LED燈與其下方的墻磚縫隙,也都是開啟DLSS后效果更好,尤其墻磚縫隙,辨別起來明顯比原生渲染要好很多。

    鐵欄桿的處理上,開啟DLSS后也比開啟前效果好很多,金屬光澤更加明顯,上方鐵絲網(wǎng)的細(xì)節(jié)處理也更加優(yōu)秀。

    最后,遠(yuǎn)處樓房的窗戶,也在開啟DLSS 4后變得更加清晰可辨認(rèn),畫質(zhì)更勝一籌。

    緊接著,我還比較了全新Transformer Model與之前的CNN Model的畫質(zhì)差異,二者都要比原生渲染好,不過在細(xì)節(jié)上,還是Transformer Model略勝一籌。

    比如依舊是這個墻面,左右兩側(cè)的墻磚紋理都清晰可見,不過明顯左側(cè)Transformer Model的墻面的漫反射更為充分,把酒吧那種使人沉醉迷離的氣氛一下就烘托出來了。

    最后我們再來看一下這扇門,因為其上有波紋形的柱狀紋理,所以反射光線會非常復(fù)雜,但是門上的紋路并不會因為光照而看不清,相信憑借各位的生活常識,應(yīng)該一下就知道Transformer Model的光線重構(gòu)功能在處理這種暗光、復(fù)雜場景的能力,是明顯好于CNN Model的。

    尤其我在英偉達(dá)的活動現(xiàn)場,肉眼比較兩臺顯示器的畫面,DLSS 4所提供的畫質(zhì)完全能夠做到真假難辨,甚至青出于藍(lán),因此,我在這里還是勸各位放心大膽的開啟DLSS 功能,體驗更順滑的游戲體驗吧。

    《霍格沃茲之遺》

    《霍格沃茲之遺》可能是《哈利波特》粉絲這些年能玩到還原度最高的游戲了,這款游戲的媒體版本中,也將DLSS 4多幀生成放入了UI中,進(jìn)度很快。

    我依舊測試了DLSS 4性能模式開啟前后,各種設(shè)置下顯卡的表現(xiàn),其中原生分辨率下游戲幀率為101 FPS,DLSS 4幀生成4x開啟后,游戲幀率達(dá)到了425,流暢度提升了4倍以上。

    同時,1% Low FPS也由78 FPS上升到了239 FPS,提升了3倍左右。

    最后,開啟DLSS 4后,游戲的平均PC延遲也有一定的下降,總體而言,表現(xiàn)很好。

    《龍騰世紀(jì)》&《漫威爭鋒》

    將有75款游戲在Day 0便支持DLSS 4技術(shù),當(dāng)然,對于將DLSS 4的開關(guān)集成到游戲的UI中并正確運行還是需要一定時間打磨的,所以NVIDIA直接在其新版的驅(qū)動管理軟件NVIDIA App中增加了DLSS Overrides開關(guān),玩家可以直接在此軟件中開啟DLSS 4并調(diào)整其各項參數(shù),比如《龍騰世紀(jì)》&《漫威爭鋒》。

    在NVIDIA APP中的圖形-程序頁面,可以找到各款游戲與應(yīng)用,進(jìn)行優(yōu)化,比如開啟多倍幀率生成,調(diào)整DLSS所使用的模型,甚至如果游戲并不支持DLAA與超級性能模式,也可在NVIDIA APP中強制開啟。

    首先我們測試一下《龍騰世紀(jì)》的幀率表現(xiàn),原生分辨率下,游戲幀率80 FPS,1% Low FPS為64 FPS,開啟DLSS 4 幀生成4x后,游戲幀率上升到了335 FPS,1% Low 幀也達(dá)到了247 FPS,因此,如果使用4K 240Hz顯示器的朋友,完全可以開啟垂直同步與幀率鎖定,達(dá)到最流暢的240 FPS游戲體驗。

    同時原生分辨率與開啟DLSS 4 幀生成4x時,游戲的平均PC延遲都為31ms,因此我們可得知DLSS并不會導(dǎo)致游戲的延遲。

    因為NVIDIA APP能夠強制開啟超級性能模式,我這里便強制開啟了,然后比較了CNN Model與Transformer Model下的畫質(zhì)差異,可見Transformer Model的畫面明顯細(xì)節(jié)更明顯,右上角雨布的材質(zhì)渲染差異尤為明顯。

    《漫威爭鋒》同樣可在NVIDIA APP中開啟DLSS 4多幀生成,我在訓(xùn)練場環(huán)境下同樣測試了開啟DLSS 4前后的游戲幀率表現(xiàn)。

    七彩虹 iGame GeForce RTX 5090 D Advanced 32GB在原生分辨率下可提供110 FPS的幀率表現(xiàn),其1% Low FPS為82 FPS,而開啟DLSS 4 4x幀生成后,游戲幀率達(dá)到了438 FPS,1% Low FPS也高達(dá)193 FPS,對于電競網(wǎng)游來說很高了。

    同時,開啟DLSS前后,游戲的平均PC延遲變化不大,僅由20ms上升到了23ms。

    至此,我們可以得出一個結(jié)論,DLSS 4能夠大幅提升游戲幀率,且其性能的大幅提升還能讓我們考慮開啟DLAA或者DLSS 畫質(zhì)模式下暢玩3A大作,且多幀生成并不會對電腦游戲延遲造成明顯負(fù)面影響,哪怕是電競玩家也可以安心開啟。

    七彩虹 iGame GeForce RTX 5090 D Advanced 32GB 常規(guī)游戲性能測試

    聊完了DLSS 4,我們再拿暫不支持DLSS 4的軟件與游戲,測試一下七彩虹 iGame GeForce RTX 5090 D Advanced 32GB這款顯卡,當(dāng)然,其中很多游戲在不久的將來就會支持DLSS 4了,只是目前我們只用其正式版本中支持最高的DLSS版本來測。

    3DMark Time Spy & Time Spy Extreme

    3D MARK Time Spy是一個DirectX 12 基準(zhǔn)測試,支持原生新的API 功能,如異步計算,顯式多顯卡適配器技術(shù)和多線程,而其Extreme版本則是將分辨率提升至4K。

    ▲本電腦的3D MARK Time Spy得分為38149分,其中顯卡得分45810分。

    ▲而在4K分辨率的3D MARK Time Spy Extreme中,本電腦得分22669分,其中顯卡得分25341分。

    ▲因為與前代顯卡的測試平臺有大幅變化,所以本次只做顯卡得分的比較,可以看到七彩虹 iGame GeForce RTX 5090 D Advanced 32GB的3D MARK Time Spy Extreme顯卡得分是RTX 4090的1.26倍。

    3D Mark Fire Strike & 3D Mark Fire Strike Ultra

    ▲本電腦的3D MARK Fire Strike得分為46767分,其中顯卡得分63863分。

    ▲而在4K分辨率的3D MARK Fire Strike Ultra中,本電腦得分30347分,其中顯卡得分32046分。

    七彩虹 iGame GeForce RTX 5090 D Advanced 32GB 的3D MARK Fire Strike Ultra顯卡得分是RTX 4090的1.25倍。

    3D MARK Steel Nomad & Speed Way

    而在3D Mark專為測試顯卡性能而提供的Steel Nomad 與 Speed Way測試中,七彩虹 iGame GeForce RTX 5090 D Advanced 32GB得分分別為14172與14410,顯卡測試幀率均在140 FPS左右。

    《黑神話:悟空》 Benchmark

    ▲其余游戲可以合在一起做一張圖,不過作為國產(chǎn)游戲之光,《黑神話:悟空》必須單獨拿出來說,在4K影視級畫質(zhì)+超高光追的情況下,七彩虹 iGame GeForce RTX 5090 D Advanced 32GB在DLSS 3 性能模式下可提供133 FPS的平均幀率。而且這款游戲很快便會支持DLSS 4技術(shù),我在NVIDIA的活動現(xiàn)場已經(jīng)搶鮮體驗過了,表現(xiàn)實在是太優(yōu)秀了。

    其余游戲幀率表現(xiàn)

    ▲我還另外測試了其余8款游戲,均為4K最高畫質(zhì),支持DLSS的話則使用最新版本DLSS性能模式,可見絕大多數(shù)游戲都能提供240 FPS以上的幀率,即使是對顯卡壓力極大又不支持DLSS 幀生成的《地鐵:離去》加強版也有134 FPS的幀率,可以說,擁有七彩虹 iGame GeForce RTX 5090 D Advanced 32GB,基本可以暢玩市面上所有的3A大作了。

    七彩虹 iGame GeForce RTX 5090 D Advanced 32GB AI與生產(chǎn)力測試

    Al lmage Generation Benchmark

    首先,我們進(jìn)行AIGC性能測試,使用的是Procyon的Al lmage Generation Demo for NVIDlA,模型為Flux1DEV_ONNX。

    ▲在使用FP8數(shù)據(jù)結(jié)構(gòu)時,七彩虹 iGame GeForce RTX 5090 D Advanced 32GB生成單個圖片所需時間為6.617s,而使用FP4數(shù)據(jù)結(jié)構(gòu)時,所需時間為3.931s,用時下降了40%。

    ▲同時,在測試的過程中,如果我們打開資源管理器,可以看到使用FP8數(shù)據(jù)結(jié)構(gòu)時,顯卡的顯存占用高達(dá)26.4GB,如此大的占用,即使是RTX 4090 D都無法勝任,而使用了FP4數(shù)據(jù)結(jié)構(gòu)時,顯存占用了下降到了21.7 GB,顯存占用量下降了約18%。

    因此,Blackwell架構(gòu)的顯卡使用FP4數(shù)據(jù)結(jié)構(gòu),會極大增強電腦的整體AI運算效率。

    AI Text Generation Benchmark

    ▲而在AI Text Generation Benchmark中,七彩虹 iGame GeForce RTX 5090 D Advanced 32GB在PHI 3.5、MISTRAL 7B、LLAMA 3.1、LLAMA 2這4個大語言模型下的得分分別為5590、6070、6378、6471,因為這個Benchmark太新了,我手頭沒有任何的對照數(shù)據(jù),所以這里只能羅列數(shù)據(jù),未來有更多的顯卡測試得分后再與各位分享。

    Blender Benchmark

    Blender是一款開源 3D 創(chuàng)建套件。它支持3D 建模、動畫、視頻編輯等諸多功能,同時支持NVIDIA RTX 渲染OptiX AI 降噪,而Blender Open Data Benchmark將進(jìn)行monster、junkshop、classroom三個場景的渲染測試。

    ▲七彩虹 iGame GeForce RTX 5090 D Advanced 32GB在monster、junkshop、classroom三個場景得分分別為7291,3861,3609分。

    ▲同樣的,我放上RTX 3090 Ti、RTX 4090的測試得分做對比,可見七彩虹 iGame GeForce RTX 5090 D Advanced 32GB渲染能力大概是RTX 4090的140%左右,提升還是很明顯的。

    V-Ray 6 Benchmark

    ▲最后我們測試了七彩虹 iGame GeForce RTX 5090 D Advanced 32GB的V-Ray 6 GPU RTX得分為15143分,之前測試RTX 4090的時候使用的還是V-Ray 5 Benchmark,二者得分不相同,這里只能給一個參考:RTX 4080 SUPER的V-Ray 6 GPU RTX得分為7142分,本次把這個得分放在這里,等后續(xù)測試其他顯卡的時候,我們再來詳細(xì)建立參考系。

    iGame Center功能簡介

    文末這里簡單介紹一下全新的iGame Center軟件,它不僅可以調(diào)整硬件燈效,快捷的進(jìn)行硬件超頻,還可以為Vulcan系列顯卡(包括之前幾代Vulcan火神顯卡)的LCD屏定制輸出圖案,且不只是靜態(tài)圖片,gif動圖同樣可以完美顯示。

    總結(jié)

    好了,以上便是本次測評的全部內(nèi)容了,總結(jié)一下,NVIDIA GeForce RTX 5090 D 是目前最強高端的游戲顯卡,在DLSS 4與神經(jīng)網(wǎng)絡(luò)渲染的加持下,可以輕松跑滿4K 240Hz的顯示器,甚至可以嘗試開8K分辨率進(jìn)行游玩。

    同時,NVIDIA 首次將32GB大容量GDDR7顯存裝備到 Geforce 系列顯卡中,在配合RTX 5090 D強大的AI運算能力,無論創(chuàng)作AIGC內(nèi)存還是訓(xùn)練大語言模型,再或者用于渲染視頻、動畫,它都可以說是游刃有余。

    七彩虹作為顯卡銷量第一的品牌,在性能,設(shè)計,做工上一直在精益求精。本次測試的七彩虹 iGame GeForce RTX 5090 D Advanced 32GB 是iGame系列的次旗艦,做工用料上都十分考究優(yōu)秀,尤其是本次的半透明設(shè)計,更是十分出彩,個人非常喜歡,目前已經(jīng)有搞一個豎裝機箱,將其放在桌面上炫耀的想法了。

    七彩虹全系列iGame GeForce RTX 5090 D 將于1月30日在各大電商平臺預(yù)售,同日我也會為大家?guī)鞷TX 5080顯卡的首發(fā)測評,關(guān)注我,獲取第一時間的更新。另外,別走開,我們一起來看一看本次測評所使用的其它硬件。

    本次測試其它硬件簡介

    CPU+主板:intel 酷睿 Ultra9 285K+七彩虹 iGame Z890 Vulcan X V20

    本次測試,我決定使用intel 酷睿 Ultra9 285K來進(jìn)行測試,這款U的性能我就不過多提及了,目前仍是intel的旗艦CPU。而且畢竟估計這次測試,使用AMD平臺的人會比較多,Intel平臺的性能表現(xiàn)反而更具有參考性,為此,我選擇了同樣是七彩虹高端電競子品牌的旗艦主板七彩虹 iGame Z890 Vulcan X V20,這是七彩虹的iGame Vulcan主板的誠意力作,為了讓這款主板能夠盡善盡美,七彩虹甚至在Z790主板的技術(shù)末期,專門出了一款與此主板外觀一致的 iGame Z790 Vulcan為這款主板“打樣”,可見其對這款主板有多么上心。

    這款主板采用了20+1+1+1相供電,105A旗艦級DrMOS、片式聚合電容與服務(wù)器級8層低損耗板材,電氣性能極為優(yōu)秀,可以為intel 酷睿 Ultra9 285K提供充足而穩(wěn)定的供電。

    同時,這款火神主板主板搭載了PCIe 5.0x16顯卡接口與PCIe 5.0x4 SSD固態(tài)硬盤接口,完全能夠釋放出高端硬件的潛力。

    最后,包括USB 4、WiFi 7、5G有線網(wǎng)口等高端主流接口在這款主板上也都有實裝,可以說從內(nèi)到外,擴展性極強。

    最后,有句話叫做士別三日,當(dāng)刮目相看,七彩虹主板的BIOS在這幾年的勵精圖治后,主要功能已經(jīng)與御三家的相差不大,完全值得正視了,這里我必須要手動給七彩虹的BIOS團(tuán)隊點贊。

    內(nèi)存:宏碁掠奪者 Hera 影鋒 6000 32GBx2

    本次測試包含一定的生產(chǎn)力部分與AI部分測試,系統(tǒng)內(nèi)存最小需要64GB,因此,我選擇了宏碁掠奪者 Hera 影鋒 6000 32GBx2,它采用特挑SK海力士A-Die顆粒,雙面結(jié)構(gòu),每面16GB內(nèi)存顆粒。

    作為生產(chǎn)力工具使用,最重要的是穩(wěn)定性,尤其是內(nèi)存雙面都有顆粒的時候,散熱壓力會大幅加大,為此,宏碁掠奪者 Hera 影鋒采用了霜鏡散熱裝甲,單側(cè)裝甲厚度達(dá)2mm,X型設(shè)計大幅強化氣流傳導(dǎo),使得內(nèi)存擁有強勁的散熱性能,保障其能夠持久、穩(wěn)定運行。

    而在燈效方面,宏碁掠奪者 Hera 影鋒配備了綴影RGB模組,擁有8個獨立燈光區(qū)域,支持1680萬色ARGB,燈效明亮,顏色過渡自然,放在機箱中絕對是畫龍點睛版的點綴。

    SSD: 佰維X570 Pro 2TB PCIe 5.0 SSD

    固態(tài)硬盤方面選擇了國產(chǎn)大廠佰維全新推出的X570 Pro 2TB,手頭剛好也要測這個SSD的測評,這次就拿來用了,它選用了全新一代6nm制程主控,溫度控制能力強勁,其采用了DRAM獨立緩存芯片設(shè)計+SLC模擬緩存技術(shù),性能表現(xiàn)十分優(yōu)秀。

    官方標(biāo)稱其順序讀取14000 MB/s,順序?qū)懭?3000MB/s,我在AMD X870主板上已經(jīng)實測全部達(dá)標(biāo),可以說它跑滿了PCIe 5.0x4的總帶寬,是一款教科書級別的PCIe 5.0 SSD。

    另外,佰維還開發(fā)了集性能測試、固件升級、系統(tǒng)遷移等多個常用功能于一體的SSD管理軟件,這點是國產(chǎn)品牌很少想到去做的,佰維絕對是走在最前沿的國產(chǎn)存儲品牌,這點還是要手動點贊的。

    電源:安耐美 PX1200W白金全模組電源

    ▲安耐美 PX1200W白金全模組電源采用了其家族統(tǒng)一的黑色磨砂外觀,其上用白色的粗大字體印刷了品牌和型號,辨識度極強,而且它是一款獲得了80 PLUS白金認(rèn)證的旗艦級電源,能效表現(xiàn)極為優(yōu)秀。

    ▲安耐美 PX1200W電源的供電接口豐富充足,擁有235%的瞬時峰值功率,高于ATX 3 Intel電源標(biāo)準(zhǔn)200%的要求,同時擁有原生的12V-2x6接口,可以為本次測評的RTX 5090 D與RTX 4090 D等上代旗艦顯卡提供充足、穩(wěn)定的供電。

    ▲另外,我之前拆解過同系列的安耐美 PX1000W,其內(nèi)部布局工整,做工精細(xì),規(guī)規(guī)矩矩。空間利用非常高效,整體布局并不擁擠,為不同元器件提供了充足的散熱空間。通過拆解可以看到電源與宣稱的一樣,采用主動式PFC+全橋LLC以及同步整流+DC-DC的高端主流方案,電源內(nèi)部也預(yù)留了足夠的散熱空間,這次要測新顯卡,就不拆了。

    ▲從電源銘牌處可以確認(rèn),安耐美 PX1200W電源符合ATX 3.1規(guī)范,可12V輸出最大電流100A(1200W),可以滿足高端CPU與旗艦顯卡的供電需求。

    ▲這款電源還配備了135mm的雙滾珠風(fēng)扇,不僅支持智能啟停,更擁有逆轉(zhuǎn)彈塵功能,可以反向出風(fēng),吹出電源內(nèi)部灰塵,提升電源的散熱效果與使用壽命,使其更為經(jīng)久耐用。

    最后,這款電源使用了全日系電容,10年質(zhì)保,買來放心,用著安心。


    DLSS 4重塑游戲體驗 七彩虹 iGame GeForce RTX 5090 D Advanced 32GB首測   
    廣告聲明:文中若存在對外跳轉(zhuǎn)的鏈接(涵蓋商品鏈接、超鏈接、二維碼等各類形式),其目的在于為您呈上更多與內(nèi)容相關(guān)的產(chǎn)品信息,助您迅速甄別。但我們不對其做任何明示或暗示的保證,煩請您謹(jǐn)慎參考,依據(jù)自身的需求與判斷來做出決策。

    18
    LV18爐火純青
    0 爆料
    163 原創(chuàng)
    7 評論
    網(wǎng)友評論
    涟源市| 麟游县| 涡阳县| 西昌市| 武乡县| 蒲江县| 石棉县| 雅安市| 赤水市| 平舆县| 和龙市| 阿勒泰市| 确山县| 东城区| 垫江县| 司法| 香河县| 靖安县| 安化县| 嫩江县| 南华县| 宿州市| 庆城县| 通化县| 山东| 无为县| 花莲市| 英吉沙县| 博罗县| 汝州市| 阿拉善左旗| 肇源县| 如皋市| 光山县| 梅州市| 霍州市| 合江县| 无棣县| 灵石县| 宝丰县| 镇江市|