嗨玩手游网

微软DirectX12更新可让CPU和GPU同时访问显存,提升游戏帧率

IT之家 4 月 1 日消息,微软于近日宣布了新的 DirectX12 GPU 优化更新,引入名为 GPU Upload Heaps 的技术。该技术配合 Resizable-BAR,能够让 CPU 和 GPU 同时访问 VRAM 显存。

本次更新可以提高 DX12 游戏帧率,降低系统内存占用,并避免了将数据从 CPU 复制到 GPU 的需要。感兴趣的IT之家网友可以通过升级 Agility SDK,获得本次 DX12 更新。

DX12 本次更新可以减少数据的传输,CPU 不再需要在系统 RAM 和 GPU 显存上保留数据副本,因此显著降低游戏内存和 CPU 占用。

IT之家从报道中获悉、在 531.41 及更高版本英伟达 Game Ready and Studio 驱动、31.0.101.4255 或更新版本的英特尔驱动已经支持该新特性。而在 AMD GPU,开发人员必须咨询他们的 AMD 联盟经理以获得支持的驱动程序。

渲染输出等到秃?看完NVIDIA STUDIO实测你可能有救了

随着5G时代来临,数字内容也呈现出爆炸式增长的趋势。据统计,在国内每分钟有10000个视频上传到各个网站,而在这背后有着超过3000万的内容创作者,在UI/UE设计、商业广告设计、互联网视频制作、影视设计和游戏制作等领域为大家带来了各种各样的创意内容。随着需求的增大,创作者对PC硬件的需求也越来越高,性能和效率成为创作者们关注的重点,那么针对这些需求,具体该怎么选择呢?下面我们一起来看看。

选CPU还是GPU,这是一个不得不说的事

提到设计类专业软件的需求,大家很容易就想到了CPU。在大家之前的观念里,后期渲染中,CPU才是主力,GPU的帮助很小,特别是游戏显卡,似乎是可有可无的东西。在很早 以前,这种观念似乎是对的。但是现在,却应该得到修正,而这一切,需要从CPU和GPU的工作方式谈起,由于太过复杂,我们在这里就简单的讲讲。

GPU与CPU两者之间的不同,体现在他们处理任务的不同方式上。CPU由专为串行任务而优化的核心组成,GPU则是由数以千计的更小、更高效的核心组成的大规模并行架构(专为同时处理多重任务而设计)。因此,在并行处理特定数据的时候,GPU要比CPU高效很多。

那既然GPU效率高,为什么还是需要CPU来干这事呢?CPU生来就是为了解决复杂的通用计算问题,而早期GPU因为指令集有限和浮点小数支持度的问题,在通用计算方面限制较多。在离线渲染中,算法复杂,并行计算难度较大,更适合CPU工作。而实时渲染中,渲染器逻辑得到简化,加上渲染器算法的不断迭代,所以能够适应GPU的工作模式。另外,早期的GPU并没有通用计算架构也是一大问题。

CPU基于低延迟设计

GPU基于大吞吐量设计

而现在这一切都得到了改善,随着游戏市场需求的牵引,GPU的性能得到了极大的提升,GPU也支持越来越复杂的运算,可编程性和功能得到了极大的扩展,单精度浮点处理能力也得到了极大的增强。目前主流的GPU都采用了统一架构单元,大大的扩展了应用范围。以NVIDIA显卡为例,其搭载了CUDA通用并行计算架构,该架构让GPU可以参与解决复杂的计算问题,同时开发起来难度也不算太大。

所以,现在已经从单纯的CPU计算时始逐渐转向GPU辅助CPU计算的时代。GPU在3D渲染、视频压缩编码、图像处理、流体力学等方面的作用越来越大。

除了游戏,图灵架构也为创作者而生

根据调查报告显示,在性能、可靠性、价格、应用兼容性和品牌这五个维度中,性能是影响创作者购买决策的首要因素,可靠性位列其后。而创作者计划升级的主要组件里面,GPU和内存则位列前两位。GPU已经越来越受到创作者的重视,因为在处理器性能相同的情况下,GPU可以有效的加速专业软件的工作效率,让应用工具更加易用。

选择苹果电脑,在坊间曾经是创作者的首选,而现在创作者却开始逐渐离开苹果,选择传统的WINDOWS PC。这除了相关专业应用软件在WINDOWS上的迭代速度越来越快,还有一个很大的因素就是传统PC在硬件的选择上更加灵活,显卡的搭配更加丰富。通过NVIDIA显卡的CUDA架构,创作者可以更快的渲染和导出作品,提升工作效率。

NVIDIA全新一代图灵架构GPU,除了拥有优秀的游戏性能,在专业创作领域也有不小的提升。其搭载的硬件级实时光线追踪RT Cores,不但在游戏中可以实现更丰富的光线追踪特效,其提供的高达每秒百亿级的光线计算能力,还能支持专业应用软件中的光线追踪效果渲染,从而真实的重现光线、材质阴影和反射,让艺术家们可在更短时间内获得更优质的渲染效果,从而创作出更能鼓舞人心的艺术作品。

对于创作者来说,完成一件创意内容的设计制作,通常只有20%的时间用于创意,80%的时间会浪费在重复操作上,极大的浪费了时间。而搭载图灵架构的NVIDIA RTX显卡拥有新一代RTX 张量计算核心,能够为人工智能推理提供高达10倍的计算能力(相比上一代)。

在填充像素、提升分辨率、照片增强、颜色匹配、人脸标记等耗时和重复性的任务都可以经由专业软件交给人工智能来处理,帮助创作者节省宝贵时间,专注于创作。

随着松下视频机S1H的发布,视频微单也从4K跨越到了6K,6K视频编辑给整机性能带来了更大的压力。对于更专业的创作者来说,RED RAW格式的素材一定不会陌生,大量的原始图像信息带来了极大的计算量,在过去,它需要工作站级的高配置才能满足剪辑的要求,而在NVIDIA RTX显卡的帮助下,在REDCINE-X PRO中可以利用GPU进行加速实时回放和预览高分辨视频,让个人电脑也能剪辑8K RED RAW素材,极大的提升了工作效率,降低成本。

NVIDIA STUDIO驱动,创意工作性能与可靠的保障

有了强劲的硬件,自然还需要适配的软件来发挥效能。今年3月,NVIDIA为创作者特别提供了NVIDIA Creator Ready驱动,现在已经迭代完善成为了全新的NVIDIA Studio驱动,为使用创意应用程序的艺术家、创作者和 3D 开发者提供最佳性能和可靠性。Studio Driver 针对多应用程序创作者工作流程进行了广泛的测试,并针对 Adobe、Autodesk 等顶级创意应用程序的多个版本进行了测试,带来工作室级别的性能和可靠性。

这些创作者熟悉的应用都是支持NVIDIA GPU加速的

NVIDIA Studio驱动还为旗下消费级显卡包括GeForce及TITAN产品线带来了30位(10bit)色彩的支持,让图像显示不会出现因色彩深度低导致的色彩断层,图像色彩显示更加平滑。随着目前越来越多的显示器面板由8bit跨越到10bit,创作者可以使用NVIDIA Studio驱动获得更加优秀和准确的色彩显示效果。

在GeForce Experience可以进行选择

与Game Ready驱动每2-3周更新一次的频率不同,NVIDIA Studio驱动的更新周期没有这么频繁,因为对创作者来说稳定性是除开性能又一个重要的部分,再加上创作软件的更新周期本就不频繁,而NVIDIA Studio驱动程序的更新也就保持与这些软件的版本和功能更新频率一致。目前创作者可以通过NVIDIA官网直接下载Studio驱动,也可以通过也可以通过GeForce Experience选择“驱动程序”选项卡中的Studio驱动程序选项进行下载。

效率惊人,NVIDIO Studio性能实测

目前绝大部分主流的创意应用都支持NVIDIA GPU加速。所以大家一定很好奇GPU加速下的效率问题。所以我们也进行了实测。处理器配置方面选择Intel桌面级旗舰酷睿i9 9900K,显卡选用了华硕电竞特工系列Dual GeForce RTX 2080 SUPER EVO OC 版 8GB GDDR6 显卡,更大的显存和高达3072个CUDA核心可以带来更高的效率提升。

华硕DUAL-RTX2080S-O8G-EVO

测试平台

CPU:Intel 酷睿i9-9900K

内存:美商海盗船复仇者 8GB DDR4 3200MHz × 2

主板:华硕 ROG MAXIMUS XI HERO

硬盘:西部数据Black NVMe SN700 SSD 1TB

显卡:华硕DUAL-RTX2080S-O8G-EVO

电源:航嘉MVP K850

操作系统:Windows10 64bit 1903 专业版

显示驱动:NVIDIA Studio Driver 431.86

测试软件我们选择目前主流的针对3D动画制作Blender Cycles、视频剪辑Adobe Premiere Pro CC、图像处理Adobe Photoshop CC和RED RAW编辑REDCINE-X PRO。

Premiere Pro可以在项目中选择使用GPU进行渲染加速

测试方法和成绩如下(单位:秒,数字越低越好):

Blender Cycles渲染引擎测试采用Blender 2.8beta版,采用Cycles渲染引擎用GPU和CPU分别渲染一段官方DEMO,记录渲染时间。我们可以看到,使用CPU渲染所消耗的时间是GPU加速渲染时间的2.5倍以上。测试时使用的Demo渲染量并不算太大,如果是一个完整的项目工程,超过2.5倍的渲染时间就很恐怖了。

Adobe Photoshop CC测试将一个17000×12000像素的多图层文件(PSD大小1GB左右)从120DPI提高到400DPI,采样方式为自动,分别开启GPU加速和关闭GPU加速,记录渲染时间。在GPU加速开启的情况下,这个操作仅用了一分钟左右就完成操作,而GPU加速关闭的情况下,这个操作耗时接近6分钟,差距接近6倍。

Adobe Premiere Pro CC选用一个视频项目片段进行渲染导出,项目采用松下GH5S拍摄的V-LOG模式60fps/80M码率的4K视频素材,包含众多特效和音效,输出编码采用H.264,预设高质量4K,记录导出时间。在开启GPU加速的情况下,仅使用2分钟就完成了视频导出,而关闭GPU加速仅使用CPU进行处理,则花去了16分钟。由于测试只使用该项目中的一小截片段,时间的差距看似能够接受,如果放大到整个项目,带来的就是小时级的差距。对于需要快速输出的场景来说,这个差距无疑是非常巨大的。

REDCINE-X PRO采用官方8K视频DEMO,记录GPU加速开启和关闭时的视频回放流畅度。在测试中可以明显的看到8K视频单纯使用CPU进行软解码的效率非常低下,有着明显的卡顿和丢帧,给编辑带来非常大的困扰,需要切换到1/8渲染才可以获得流畅的操作体验,但画质降低太多。而在开启GPU加速后,100%渲染的情况下回放解码就可以做到流畅,毫无卡顿,画面清晰,编辑起来更加得心应手。

由于NVIDIA STUDIO支持的专业应用软件众多,我们也无法对其进行一一测试。不过根据视频编辑的提供的信息,C4D在使用在支持GPU渲染的Octane后,相比自带的CPU渲染器拥有了更快的速度,更优秀的渲染效果。而NVIDIA也和MAYA合作推出了Arnold渲染器的GPU版本,相比CPU版本拥有高达十倍以上的渲染效率提升,非常优秀。

总结:加速创意工作,NVIDIA STUDIO值得选择

随着数字内容数量的大幅增长,创作者的地位越来越重要,而创作者PC也成为细分市场中一个不可忽视的存在。在NVIDIA RTX GPU和NVIDIA Studio Driver的帮助下,创作者可以获得更加强悍的性能,GPU参与渲染运算可以是在后期渲染,也可以是在实时预览中,可以说是全面参与专业应用软件的计算流程。

相较单纯的处理器渲染,GPU加速拥有更加出众的应用程序性能,能够极大的减少等待时间,带来更高效的工作效率,从灵感到创作,一气呵成。作为一名创作者的你,在选购电脑的时候,不妨加入一块像华硕DUAL-RTX2080S-O8G-EVO这样强劲的NVIDIA RTX显卡,让效率更高,让创意不再等待。

小狮子最喜欢的鸡腿 分割线

NVIDIA、Intel发布新显卡驱动,可适配Win11系统

Win11系统正式版可能至少要到今年10月份才会发布,目前玩家只能用上预览版。当然兵马未动粮草先行,虽说Win11正式版没发布,但是各家厂商对其的支持已经越来越到位了。

上周,英特尔发布了一个新版的显卡驱动,从官方层面支持Win11系统。现在,英伟达也发布了新的GeForce 471.41驱动,支持WDDM 3.0和Win11。据英伟达官方的说法,这个新驱动属于“Windows 11-ready”,使用Win11的Insider用户可以下载升级该驱动。NVIDIA公司也表示,GeForce Game Ready和Studio版本的470驱动后,就已经开始引入对Windows 11的支持。相信不久之后,AMD的显卡驱动也会跟上对Win11的支持。

此外,对于游戏应用,Win11系统支持自动HDR以及DirectStorage等特性,比如自动HDR可以让本身只支持SDR的DirectX 11和DirectX 12游戏,全自动地通过HDR来提升的色彩和亮度。只要玩家拥有合适的显示器,老游戏也会通过HDR得到明显的视觉提升,这可以给PC带来更好的游戏体验。显卡驱动已经支持意味着等到Win11正式版推出之后,PC游戏玩家就能马上体验到Win11带来的全新游戏体验。

·END·

更多资讯
游戏推荐
更多+