在CES 2025上,列显英偉達發布基於Blackwell架構的卡或GeForce RTX 50係列消費級顯卡。同時還帶來了DLSS 4,有新英伟具備多幀生成功能,提升在每個傳統渲染的不排幀之間生成多達三個額外的幀,也是除支持自2020年發布DLSS 2.0以來對其AI模型的最大升級,DLSS光線重建、生成DLSS超分辨率和DLAA將由Transformer模型驅動,列显這是卡或Transformer模型首次在圖形領域的實時應用。
在CES 2025期間,有新英伟Digital Foundry采訪了英偉達應用深度學習研究副總裁Bryan Catanzaro,提升討論了DLSS 4的不排發布及在超分辨率、光線重建和幀生成等多方麵的除支持改進。
DLSS Transformer模型取代了之前DLSS使用卷積神經網絡(CNN),生成用於超分辨率和光線重建,列显變得更加智能,實現了對場景的更深層次理解,從而生成提供更高穩定性、減少鬼影、運動細節更多以及場景邊緣更平滑的像素。同時英偉達也對幀生成進行了大幅度修改,放棄了以前基於光流加速器的模型。
Bryan Catanzaro表示,當打造DLSS 3時,為了通過硬件加速來計算光流,但是沒有足夠的Tensor Core,也缺乏足夠好的算法,還沒有開發出一個能夠在Tensor Core運行的實時光流算法來滿足預期的計算量。光流加速器最初用於DLSS 3幀生成式有意義的,但是像光流這樣的算法的任何硬件實現的困難之處在於很難改進,直到采用完全基於人工智能的解決方案來替代,就像DLSS 4所做的那樣。
DLSS 4的幀生成功能更依賴於Tensor Core,但是使用了更少的顯存,效率也更高。當被問及新技術是否可以移植到GeForce RTX 30係列等舊硬件時,Bryan Catanzaro沒有否定這個可能性,認為主要是優化和工程的問題,另外還有最終的用戶體驗。
當GeForce RTX 40係列推出幀生成功能時,Bryan Catanzaro曾解釋為什麽是新款GPU獨占,主要原因是有更好的光流硬件加速器,理論上上一代顯卡也能支持,但是改進可能不會那麽大。隨著新機製不再依賴光流硬件加速器,似乎又開啟了另一扇大門,然而新的幀生成功能對Tensor Core要求更高,但是舊的GPU架構配備的Tensor Core性能沒那麽好,不知道英偉達會如何實現這一目標。
此外,Bryan Catanzaro還強調了更新後Flip Metering與CPU解耦的重要性,這也是幀率提升的關鍵之一。