NVIDIA GeForce RTX 30的RTX IO让硬碟资料直送显示卡

欧博官网 2周前 (09-12) 新闻动态 7 0

在GeForce RTX 30系列显示卡发表之后,NVIDIA也额外举办了技术研讨会,就让我们一起看看这些应用于新显示卡的技术。在系列文章的第1篇中,笔者将说明RTX IO的运作概念以及所能带来的优势。

ADVERTISEMENT

减缓处理器IO瓶颈

简单地说,RTX IO就是DirectStorage在NVIDIA显示卡的实作,我们先前已经在GeForce RTX 30系列显示卡发表会的文章中,提到RTX IO的技术概念,并在另一篇文章介绍了Microsoft DirectStorage API的特色,建议读者可以先阅读下列2篇文章。

延伸阅读:
NVIDIA新品终于亮相,GeFocre RTX 3090多项全新黑科技技术公开
Microsoft说明DirectStorage特色,看懂GeForce 30系列RTX IO技术有何优势

随着现在游戏画质不断提升,解析度也逐步从1080p推向4K甚至8K,因此开发者往往需要准备解析度更高的材质贴图,并在画面上使用更多使用贴图,以绘制更加逼真的游戏画面。这除了增加显示卡绘图方面的运算负载、显示记忆体使用量之外,也会因为系统需要更频繁读取容量庞大的贴图,进而增加储存装置的工作负担。

在过去游戏解析度比较低的时期,贴图的总容量并不会太大,存取效能为50MB/s的传统硬碟可能就足以应付游戏需求。然而随着显示卡的效能不断提升,能够绘制更细腻的3D图像的同时,使用的贴图也随之增加,对于储存装置效能的需求也越来越高,甚至超过SATA或是PCIe Gen3介面固态硬碟的频宽。

《末日之战》需占用10GB储存空间,当时已经是「重量级」的游戏,而现在的游戏动辄超过100GB。另一方面储存装置的存取效能传统硬碟的100MB/s,成长到SATA固态硬碟的500MB/s、PCIe Gen3固态硬碟的3,500MB/s,到了PCIe Gen4固态硬碟甚至冲上7,000MB/s。

大幅提升游戏载入速度

为了增加读取贴图的效率,将资料压缩便成为解决方法之一。若从频宽为7GB/s的PCIe Gen4介面固态硬碟读取压缩贴图档案的话,解压缩后大概等同于具有12GB/s的读取效能,但这将占用约24个处理器核心的资源,将造成另一个严重的效能瓶颈。

RTX IO的2大优势是能让显示卡直接读取储存在固态硬碟中的资料,并在在显示卡上进行解压缩。相较于传统作法需要

1. 透过处理器安排读取伫列
2. 将资料读取至主记忆体
3. 透过处理器解压缩
4. 将资料传送至显示记忆体

而RTX IO则只需

1. 透过处理器安排读取伫列
2. 直接资料读取至显示记忆体
3. 透过显示卡解压缩

两者相比,可以发现传统做法相当耗费系统资源,而RTX IO不但仅需使用大约0.5个处理器核心资源(安排读取伫列占用资源极低,仅需1个执行绪即可),还可省下反复传输资料所耗费的时间。另一方面Microsoft DirectX Developer Blog的《DirectStorage is coming to PC》一文也指出,「DirectStorage能够支援当下以及未来的解压缩技术」,言下之意除了代表DirectStorage能够支援多种解压缩演算法之外,也暗示了可能可以使用其他厂商的软、硬体解压缩方案。

NVIDIA技术行销经理苏家兴在回复笔者的问题中提到,在RTX IO进行解压缩的过程中,大约只会占用1组SM(Streaming Multiprocessor)的运算资源。虽然还是会占用到显示卡的资源,但只会对效能造成些许影响(笔者注:若考量到GeForce RTX 3080总共具有68组SM,只占用1组真的对效能的冲击有限),相较之下若以纯粹以处理器进行解压缩,推估需要占用24个处理器核心,可能已经超过许多电脑所能负荷,因此使用显示卡进行解压缩有其实用价值。

最基本读取材质贴图的方式,就是让处理器将未压缩的资料读到主记忆体,然后在传送至显示记忆体,过程中充满不同的效能瓶颈。

这种方式虽然不需花费额外运算资源,但整体传输效能受到储存装置频宽限制。

若改为读取压缩资料,则多了处理器需进行解压缩的步骤,过程中需将资料从主记忆体读出,解压缩后写回主记忆体,最后才传送至显示记忆体。

这样虽然可以增加资料吞吐量,但也需要花费大量处理器资源进行解压缩。

RTX IO则是可以直接将资料送进显示记忆体。

RTX IO也能将解压缩的工作负载转移至显示卡,如此一来大概只需花费0.5个处理器核心与1组SM的资源。

让游戏读取更快、画面更赞

RTX IO的优势之一,就是能大幅缩短游戏的读取时间,虽然目前市面上还没有实际支援RTX IO或DirectStorage的游戏,但NVIDIA已经在Marbles at Night技术展示中导入RTX IO。

在使用传统硬碟搭配无压缩资料的情况下,读取时间长达62.13秒,若改为NVMe固态硬碟搭配压缩资料,读取时间则可缩短至5.25秒,而使用RTX IO搭配NVMe固态硬碟与压缩资料,则可再缩短至1.62秒,可见RTX IO对读取时间的最佳化有莫大帮助。

另一方面,RTX IO也能让无缝开放世界游戏更快速地读取材质贴图,进而让开发者能在游戏中安排更细腻的贴图,以发挥提升游戏画质的效果,这点也是《DirectStorage is coming to PC》一文提到DirectStorage的附加效果之一。

对于这点苏家兴也在回复笔者的过程中,透露或许未来游戏开发者会在开发过程中准备支援与关闭RTX IO的版本,若玩家的电脑支援RTX IO,则会读取更大量的材质贴图,提供玩家更逼真的视觉体验。

▲Marbles at Night技术展示范例程式是Marbles的升级版,加入了更多光源变化,并导入多项GeForce RTX 30系列显示卡的新技术。

RTX IO能大幅缩短Marbles at Night的读取时间。(官方在研讨会中使用的投影片包含动态影片,但提供给笔者的档案却只有静态图片,请见谅)

与使用传统硬碟搭配无压缩资料相比,RTX IO能将读取时间从62.13秒缩短至1.62秒。

RTX IO除了可以缩短,也能让开发者在游戏中使用更大量的材质贴图,达到提升游戏画质的效果。

目前RTX IO与DirectStorage都还处于相当初期的开发阶段,尚无游戏导入这项技术,而Microsoft预计到2021年才会将PC版DirectStorage开发者预览版交至游戏开发者手中,想要抢先体验这类技术的玩家,可能需要先在Xbox Series X主机上闻香。

弹出式视窗、网址双斜线、咖啡胶囊......这些「遗害万年」的产品,他们的发明人怎么看?

并不是所有的发明都是为世界带来好事,有些发明家会因为自己的发明被后人误用而后悔。最有名的就是发明原子弹的欧本海默。除此之外,其实还有弹出式视窗、网址的双斜线、咖啡胶囊等等产品的发明人,他们就跟你一样痛恨自己的发明。 发明家和科学研究工作者对他们的发明感到后悔的情形,其实并不罕见。虽然爱因斯坦并未直接参与原子弹的研制,但他认为自己是始作俑者,并对此深感后悔。许多科技诞生之初是为了造福人类,然而,让发明者痛心不已的是,这些技术会慢慢变质,没有让这个世界变得更美好,甚至可能让世界变得更糟糕,本文的10个发明人就十分后悔自己的发明。 1、 J. 罗伯特·欧本海默:原子弹 J. 罗伯特·欧本海默作为二战期间洛斯阿拉莫斯实验室的主任,被认为是原子弹的创造者。 尽

Allbet声明:该文看法仅代表作者自己,与本平台无关。转载请注明:NVIDIA GeForce RTX 30的RTX IO让硬碟资料直送显示卡

网友评论

  • (*)

最新评论

站点信息

  • 文章总数:1771
  • 页面总数:1
  • 分类总数:6
  • 标签总数:1007
  • 评论总数:386
  • 浏览总数:208246