DLSS 3與AI讓使用體驗(yàn)成倍提升:英偉達(dá)GeForce RTX 4070顯卡首發(fā)評(píng)測(cè)
白貓 / 2023-04-12 21:00105295不知不覺,英偉達(dá)的RTX 40系顯卡已經(jīng)推出超過半年的時(shí)間,在這半年內(nèi),英偉達(dá)憑借像GeForce RTX 4090這樣的旗艦顯卡牢牢占據(jù)了高端顯卡市場(chǎng),可以說幾乎無敵手,同時(shí)更是憑借DLSS 3等新一代特效讓顯卡面對(duì)光線追蹤也絲毫不怵。不過之前發(fā)布的顯卡都是面向高端以及旗艦消費(fèi)群體,而對(duì)于偏向主流的消費(fèi)群體,他們的預(yù)算似乎不能滿足GeForce RTX 4090這樣的顯卡,因此像RTX 4070這樣的主流偏上的顯卡便是為他們所打造,實(shí)現(xiàn)2K光追游戲超過100幀速率游玩的愿望。

這半年以來,除了像游戲場(chǎng)景之外,AIGC的火爆程度遠(yuǎn)超人們的想象,而利用GPU強(qiáng)大的算力實(shí)現(xiàn)AIGC成為了新用途,自然基于最新架構(gòu)的RTX 4070顯卡在AI創(chuàng)作上也更加出色,比如說AI創(chuàng)作性能能夠比RTX 3070 Ti提升大約40%的幅度,將會(huì)成為創(chuàng)作者手中的一張神卡。那么這塊顯卡的實(shí)際表現(xiàn)究竟如何呢?我們一起來看下。
架構(gòu)說明

對(duì)于RTX 40系顯卡來說,想要滿足包括AI創(chuàng)作以及DLSS 3等特效的實(shí)現(xiàn),就不得不說Ada Lovelace架構(gòu),而這也是RTX 40系顯卡的核心所在。相比較目前的安培架構(gòu)Ada Lovelace架構(gòu)在性能上有著巨大的飛躍,比如說流式多處理器的著色能力高達(dá)83TFLOPS,吞吐量是上代的2倍,第三代RT Cores 的有效光線追蹤計(jì)算能力最高可以達(dá)到191TFLOPS,是上代的2.8倍,第四代 Tensor Cores則新增了FP8張量引擎,張量計(jì)算達(dá)到了1.32PTLOPs,和上一代相比更是提升了整整五倍。也正是因?yàn)橛辛巳绱藦?qiáng)大的算力,無論是游戲玩家還是創(chuàng)作者都可以借助RTX 40系顯卡實(shí)現(xiàn)更加高效的創(chuàng)作效率。
硬件光流加速器
今年RTX 40系顯卡最大的特點(diǎn)就是采用了全新的DLSS 3技術(shù),能夠有效地提升游戲在開啟光追等重壓環(huán)境下的幀率表現(xiàn)。

硬件光流加速器的原理就是提取其中的圖像光流信息,同時(shí)參考游戲引擎中的運(yùn)動(dòng)矢量信息借助AI生成新的中間幀,借助插幀以及超分辨率,讓RTX 40系顯卡只要傳統(tǒng)1/8的渲染量即可實(shí)現(xiàn)幾乎相同的畫面輸出。目前DLSS 3僅為RTX 40系顯卡所獨(dú)享,同時(shí)也是RTX 40系顯卡的一項(xiàng)殺手锏。

在顯卡規(guī)格上,NVIDIA GeForce RTX 4070顯卡搭載的是AD104-250核心,擁有5888顆流處理器,36MB的L2高速緩存容量,184個(gè)TMUS,64個(gè)ROPS以及46個(gè)光追單元,除此之外NVIDIA GeForce RTX 4070顯卡的基準(zhǔn)頻率為1920MHz,Boost頻率為2475MHz,而FP32單精度算力為29TFLOPS。
顯存上采用的是GDDR6X顯存,顯存容量為12GB,192bit的顯存位寬,顯存速率為21Gbps,總共擁有504GB/s顯存位寬,另外官方給這款顯卡的TDP為200W,當(dāng)然實(shí)際測(cè)試的功耗有高有低。
外觀
我們這一次拿到的是英偉達(dá)NVIDIA GeForce RTX 4070 Founders Edition也就是大家所稱的公版顯卡。

毫無疑問在見慣了NVIDIA GeForce RTX 4090 Founders Edition這樣的龐然大物之后,NVIDIA GeForce RTX 4070 Founders Edition顯然小巧了很多,而且卡槽也變成了傳統(tǒng)的雙槽顯卡,這對(duì)于使用ITX機(jī)箱的消費(fèi)者來說顯然是一個(gè)天大的好消息。

除此之外,NVIDIA GeForce RTX 4070 Founders Edition也和上一代的RTX 3070公版顯卡相差不大,在供電上繼續(xù)采用12+4Pin的接口,當(dāng)然相比較之前的80和90,官方給的轉(zhuǎn)接線為雙8Pin轉(zhuǎn)12+4Pin,而RTX 4080、RTX 4090等顯卡則是三8Pin轉(zhuǎn)12+4Pin。

而顯卡的擴(kuò)展接口基本上算是標(biāo)準(zhǔn)接口,包括一個(gè)HDMI 2.1以及3個(gè)DP 1.4接口,基本能夠滿足發(fā)燒友的使用。應(yīng)該來說相比較RTX 4080以及RTX 4090,NVIDIA GeForce RTX 4070 Founders Edition的外觀還是跟RTX 30系公版顯卡差不多,沒有那種太過于驚艷的感覺,算是中規(guī)中矩吧。
測(cè)試平臺(tái)

測(cè)試平臺(tái)跟以前也大差不差,我們選擇Intel Core i9-1900K處理器作為這一次測(cè)試的CPU,此外主板采用了ROG的Z790 Hero主板,內(nèi)存則是科賦DDR5 6200內(nèi)存,總?cè)萘窟_(dá)到了32GB,除此之外,我們也選用了WD_BLACK SN850X PCIe 4.0 SSD,事實(shí)上這套系統(tǒng)應(yīng)對(duì)RTX 4090也是綽綽有余,更不用說RTX 4070顯卡。本次測(cè)試基于微軟Windows 11 22H2系統(tǒng),采用的是Game Ready 531.42測(cè)試版驅(qū)動(dòng),未來顯卡的性能將會(huì)隨著驅(qū)動(dòng)的完善而有所提升。
性能測(cè)試
理論性能
首先自然是理論測(cè)試,而理論測(cè)試的首選軟件當(dāng)然是最為著名的3DMark,包括借助FireStrike、TimeSpy以及Royal Port分別測(cè)試顯卡在DX11、DX12以及光追性能,而與NVIDIA GeForce RTX 4070 Founders Edition做對(duì)比的則是NVIDIA GeForce RTX 3070 Ti顯卡。

通過3DMark的測(cè)試可以看到,在傳統(tǒng)的光珊化測(cè)試中,NVIDIA GeForce RTX 4070 Founders Edition顯卡的理論性能比NVIDIA GeForce RTX 3070 Ti高出15%左右,似乎不是很高,事實(shí)上從FP32便可以看出,NVIDIA GeForce RTX 4070 Founders Edition的光柵化成績(jī)提升不是很明顯。而光追測(cè)試中,NVIDIA GeForce RTX 4070 Founders Edition顯卡的領(lǐng)先幅度可以達(dá)到25%。
實(shí)際游戲測(cè)試
DLSS 3測(cè)試
當(dāng)然如今的光追特效越來越擬真,對(duì)于顯卡要求也越來越高,對(duì)此像英偉達(dá)這樣的廠商便推出了DLSS等特效,借助AI來協(xié)助顯卡在游戲中取得更高的性能表現(xiàn)。當(dāng)然經(jīng)過不斷的迭代發(fā)展,目前的DLSS已經(jīng)相當(dāng)?shù)爻墒欤⑶規(guī)缀跛兄髁鞯挠螒蚨紩?huì)支持DLSS特效,同時(shí)RTX 4070顯卡借助Ada架構(gòu)還可以支持DLSS 3。那么RTX 4070顯卡借助DLSS,能夠在游戲中取得多少的性能表現(xiàn)呢?

在基于DLSS的測(cè)試中,由于除了FP32單精度性能之外,更加重要的便是Tensor Core的性能,自然在游戲表現(xiàn)中能夠取得更加出色的成績(jī)。而我們也可以看到支持DLSS 3的RTX 4070在游戲表現(xiàn)中顯然要比RTX 3070 Ti更加出色,部分游戲的領(lǐng)先幅度也更大。
光柵化游戲測(cè)試


除了光追游戲之外,傳統(tǒng)的光柵化游戲仍然占據(jù)主流,當(dāng)然相比較光追游戲,光柵化游戲的性能基本上就是考察FP32的性能。可以看到在光柵化游戲中,NVIDIA GeForce RTX 4070 Founders Edition顯卡的性能實(shí)際上跟3DMark的測(cè)試差不多,與RTX 3070 Ti之間的性能相差幅度也就在10-15%上下,而《荒野大鏢客2:救贖》的領(lǐng)先幅度更是不到10%。
溫度和功耗
除了游戲性能更加出色之外,Ada架構(gòu)帶來的優(yōu)勢(shì)還在于驚艷的能效,也就是說在提供更加出色的圖形性能之外,在溫度和能耗上的表現(xiàn)也更加地出色。我們自然也測(cè)試了在不同條件下的溫度能耗的表現(xiàn),通過FrameView進(jìn)行記錄。

通過對(duì)于3DMark以及《賽博朋克 2077》的性能測(cè)試可以看到,NVIDIA GeForce RTX 4070 Founders Edition顯卡的領(lǐng)先幅度可以說相當(dāng)?shù)鼐薮螅念I(lǐng)先幅度在80W左右,而溫度也可以領(lǐng)先8攝氏度,顯然這跟高能效比的核心有很大的關(guān)系,除此之外,廠商對(duì)于散熱器散熱性能的冗余也導(dǎo)致實(shí)際溫度表現(xiàn)比預(yù)期的更加出色。
生產(chǎn)力測(cè)試
如果說2K游戲只是這塊顯卡的一部分的話,那么從去年年底開始爆火的AIGC則組成了NVIDIA GeForce RTX 4070 Founders Edition顯卡的另一部分,如果說過去的生產(chǎn)力僅僅指的是傳統(tǒng)的利用GPU算力從事的視頻渲染等任務(wù),那么新一代的生產(chǎn)力就應(yīng)該是借助AI來協(xié)助用戶創(chuàng)造更大的工作價(jià)值。因此目前越來越多的AIGC創(chuàng)作軟件營(yíng)運(yùn)而生,從而讓英偉達(dá)的AI性能有的放矢。其中包括Stable Diffusion、RTX視頻超分辨率等應(yīng)用場(chǎng)景。
Stable Diffusion
Stable Diffusion是一款非常受歡迎的開源圖像生成模型,可以借助擴(kuò)散模型生成海量的圖片,極大地減輕了畫家的作圖時(shí)間,從而提升效率。當(dāng)然早期的AI作圖還相當(dāng)?shù)刂赡郏霈F(xiàn)大量不符合構(gòu)造的圖片,不過如今隨著模型的不斷優(yōu)化,AI作圖也日漸成熟,從而制造出符合大家審美需求的圖片,而Stable Diffusion模型目前基本上僅支持CUDA,因?yàn)橐渤蔀榱擞ミ_(dá)顯卡的專屬。

在這里我選擇了Stable Diffusion GRisk GUI進(jìn)行測(cè)試,事實(shí)上想要實(shí)現(xiàn)AI畫圖也不是一件難事。比如說你需要增加眾多的特征參數(shù),來讓你的圖片滿足你的需求。而這也是目前比較火熱的一個(gè)職業(yè),參數(shù)指定師。當(dāng)設(shè)定了海量的參數(shù)之后,按下Render,隨后圖片就開始生成。

可以看到的是在AI合成圖片的過程中,GPU基本上都是處于100%的狀態(tài),此外得益于出色的AI性能,實(shí)際上RTX4070只要10余秒便可以作出一副完整的圖片,以滿足你的需求,對(duì)于繪畫一竅不通的用戶來說,借助Stable Diffusion模型打造的繪畫圖軟件無疑是一種超級(jí)神器。
RTX視頻超分辨率
我們?cè)诳匆曨l的時(shí)候,尤其是在線視頻,經(jīng)常會(huì)出現(xiàn)畫面不清晰的時(shí)候,特別是片源清晰度過低,導(dǎo)致用戶的觀影體驗(yàn)受到極大的影響,過去消費(fèi)者面對(duì)這種方法顯然束手無策,不過現(xiàn)在用戶可以借助顯卡實(shí)現(xiàn)畫面的優(yōu)化,從而提升你的觀影體驗(yàn)。比如說英偉達(dá)在RTX顯卡上實(shí)裝了RTX視頻增強(qiáng)。

在安裝了最新的驅(qū)動(dòng)之后,你可以在英偉達(dá)的視頻設(shè)置中找到RTX視頻增強(qiáng),可以選擇超分辨率,從而讓顯卡實(shí)現(xiàn)視頻的清晰化,其中4檔的效果最為出色。

如果你開啟了超分特效之后,通過Chrome收看Youtube、bilibili等主流視頻網(wǎng)站的視頻,那么英偉達(dá)的顯卡就會(huì)自動(dòng)運(yùn)算,通過超分來讓視頻更加清晰,從而讓視頻顯示更多的細(xì)節(jié),當(dāng)然打開超分之后,顯卡的負(fù)載也一下子達(dá)到了50%左右。

通過對(duì)比可以看到,在開啟RTX視頻增強(qiáng)之后,F1賽車的畫面更加地平滑,鋸齒也得到了有效地緩解,字體也更加清晰,只是這種畫面上的區(qū)別基本上需要通過暫停畫面才可以直觀地感受到,對(duì)于收看直播尤其是體育類直播的觀眾來說,RTX視頻增強(qiáng)只能稱得上是錦上添花。


除了在線視頻網(wǎng)站之外,你也可以通過本地視頻播放軟件來使用RTX視頻增強(qiáng)功能,比如說最新版本的VLC軟件就可以支持RTX視頻增強(qiáng),當(dāng)然與視頻在線播放相差不大,視頻的畫面表現(xiàn)略有提升,代價(jià)就是需要花費(fèi)30-50%左右的GPU資源。
AV1視頻編碼

目前直播的分辨率越來越高,傳統(tǒng)的H265編碼已經(jīng)不能滿足日益龐大的數(shù)據(jù)傳輸,此時(shí)AV1編碼應(yīng)運(yùn)而生,逐漸開始被主流的影像制作工作室所接受。相比較H265,AV1編碼能夠保持畫面幾乎不變的情況下,讓視頻的碼率有所下降,同時(shí)大幅減少視頻的體積。目前在達(dá)芬奇18等主流視頻制作軟件中均已增加了對(duì)于AV1編碼的支持。

不過對(duì)于國(guó)內(nèi)用戶來說,目前大紅大紫的剪映也實(shí)現(xiàn)對(duì)于AV1視頻編碼的支持,對(duì)于剪輯小白來說也更加友好。


我們也使用剪映輸出一段4K視頻,根據(jù)剪映預(yù)估的大小,基于AV1編碼下的視頻體積為385M,而基于H264下的視頻體積為513M。當(dāng)然兩個(gè)視頻實(shí)際文件大小均有所提升。通過實(shí)際文件對(duì)比,AV1下的編碼體積大約是H264的77%,實(shí)際畫面也沒有幾乎沒有什么損失,對(duì)于減少視頻大小還是很有用的。
總結(jié)

毫無疑問作為一款承上啟下的中高端顯卡,NVIDIA GeForce RTX 4070 Founders Edition顯卡的實(shí)際表現(xiàn)還是讓人感到滿意的。盡管在傳統(tǒng)的光柵化游戲上,相比較上一代性能提升不是很明顯,但是在光追游戲以及DLSS特效加持下,NVIDIA GeForce RTX 4070 Founders Edition顯卡的表現(xiàn)就遠(yuǎn)超上代RTX 3070 Ti,此外英偉達(dá)也多次強(qiáng)調(diào)這款顯卡主要面向的消費(fèi)群體是2K分辨率的用戶,那么開啟DLSS之后,這款顯卡也能在獲得超過100幀的成績(jī),對(duì)于購(gòu)買了高刷的消費(fèi)者來說是一個(gè)福音。并且在提供更高性能的同時(shí),顯卡的功耗以及溫度也讓人十分地滿意。

我們也看到,如今大紅大紫的AIGC對(duì)于顯卡的AI性能提出了更高的要求,而AI性能的飛躍也是RTX 40系顯卡的另外一個(gè)亮點(diǎn),借助強(qiáng)大的AI性能表現(xiàn),用戶的工作效率也得到了巨大的飛躍,從而讓效益更高。
此外在AI軟件中,毫無疑問英偉達(dá)占據(jù)了絕大部分的市場(chǎng)份額,這也是未來NVIDIA GeForce RTX 4070 Founders Edition顯卡以及英偉達(dá)所擁有的巨大優(yōu)勢(shì),畢竟AI屬于專業(yè)計(jì)算領(lǐng)域,對(duì)RTX 40系顯卡來說也有著更加廣闊的發(fā)展空間。對(duì)于游戲玩家來說,NVIDIA GeForce RTX 4070 Founders Edition顯卡顯然是全新的萬元裝機(jī)的首選,畢竟借助DLSS 3等各種黑科技,在2K分辨率下可以獲得超100幀的速率,對(duì)于擁有RTX 2070 SUPER顯卡的消息來說是一個(gè)相當(dāng)不錯(cuò)的更新?lián)Q代的選擇。
DLSS 3與AI讓使用體驗(yàn)成倍提升:英偉達(dá)GeForce RTX 4070顯卡首發(fā)評(píng)測(cè)


滬公網(wǎng)安備 31010702005758號(hào)
發(fā)表評(píng)論注冊(cè)|登錄