nvidia的rtx 3000系列GPU：以下是新功能

在2020年9月1日，NVIDIA公布了其新的游戏GPU系列：基于其安培架构的RTX3000系列。我们将讨论什么是新的，人工智能驱动的软件，以及所有的细节，使这一代人真的很棒。...

在2020年9月1日，NVIDIA公布了其新的游戏GPU系列：基于其安培架构的RTX3000系列。我们将讨论什么是新的，人工智能驱动的软件，以及所有的细节，使这一代人真的很棒。

满足rtx 3000系列GPU

NVIDIA的主要宣布是其闪亮的新GPU，都建立在一个定制的8纳米**工艺，并带来了在光栅化和光线跟踪性能的主要提高。

在低端的阵容，有rtx3070，这是在499美元。这是一个有点昂贵的最便宜的卡推出的NVIDIA在最初的公告，但它是一个绝对偷一旦你知道，它击败了现有的RTX2080TI，一个顶级的线卡，经常零售价超过1400美元。然而，在NVIDIA宣布这一消息后，第三方拍卖价格有所下降，其中大量在eBay上以低于600美元的价格被抢购一空。

目前还没有可靠的基准出来的公告，所以它是不是真的卡客观上“更好”比2080TI，或者英伟达是扭曲了营销一点。正在运行的基准测试是4K的，而且很可能开启了RTX，这可能会使差距看起来比纯光栅化游戏中的差距更大，因为基于安培的3000系列在光线跟踪方面的表现将是图灵的两倍以上。但是，由于光线追踪现在已经不再对性能造成太大影响，而且在最新一代的游戏机中也得到了支持，因此它的一个主要卖点是以几乎三分之一的价格运行速度达到上一代旗舰产品的速度。

目前还不清楚价格是否会保持这样。第三方设计通常会在标价上增加至少50美元，而且随着需求量的增加，到2020年10月它的售价会达到600美元也就不足为奇了。

略高于这一点是RTX3080为699美元，这应该是两倍于RTX2080的速度，并在约25-30%的速度比3080。

然后，在顶端，新的旗舰是rtx3090，这是滑稽的巨大。英伟达对此非常清楚，并将其称为“BFGPU”，该公司称其代表“大型凶猛GPU”

NVIDIA没有展示任何直接的性能指标，但该公司展示了它以每秒60帧的速度运行8K游戏，这给人留下了深刻的印象。诚然，NVIDIA几乎肯定是在使用DLSS来达到这个目标，但8K游戏就是8K游戏。

当然，最终会有一个3060，和更多的预算为导向的卡的其他变化，但那些通常会在以后。

要真正冷却的东西，英伟达需要一个改版冷却器的设计。3080的额定功率为320瓦，这是相当高的，所以英伟达选择了双风扇设计，但不是两个风扇都放在底部，英伟达把风扇放在顶端的地方，背板通常去。风扇将空气向上引导至CPU冷却器和机箱顶部。

从一个案例中不良气流对性能的影响程度来看，这是非常合理的。然而，电路板是非常狭窄，因为这将有可能影响第三方销售价格。

dlss：软件优势

光线追踪并不是这些新卡的唯一优点。真的，这是一个有点黑客的RTX2000系列和3000系列是不是在做实际的光线跟踪更好，相比老一代的卡。在Blender这样的3D软件中，光线跟踪一个完整的场景通常每帧需要几秒钟甚至几分钟，所以用不到10毫秒的时间强行跟踪是不可能的。

当然，有专门的硬件来运行光线计算，称为RT内核，但在很大程度上，NVIDIA选择了一种不同的方法。NVIDIA改进了去噪算法，允许gpu渲染一个非常便宜的看起来很糟糕的单通道，并通过人工智能魔术将其变成一个游戏玩家想要看到的东西。当与传统的光栅化技术相结合时，光线跟踪效果增强了它带来的愉悦体验。

然而，为了快速实现这一点，NVIDIA增加了一种称为张量核的人工智能专用处理核。这些程序处理了运行机器学习模型所需的所有数学，而且速度非常快。他们完全改变了人工智能在云服务器领域的游戏规则，因为人工智能被许多公司广泛使用。

除去噪外，游戏玩家使用张量核的主要用途被称为DLSS，或deep learning super sampling。它采用低质量的框架，并将其升级到完全的本地质量。这基本上意味着你可以在观看4K图片的同时使用1080p的帧速率进行游戏。

这也有助于光线跟踪性能相当多的基准PCMag显示RTX2080超级运行控制在超高质量，与所有光线跟踪设置曲柄到最大值。在4K，它挣扎只有19 FPS，但与DLSS上，它得到了更好的54 FPS。DLSS是NVIDIA的免费性能，由图灵和安培上的张量核实现。任何游戏，支持它，是GPU有限的可以看到严重的加速只是从软件本身。

DLSS并不是什么新功能，两年前rtx2000系列推出时，它就作为一项功能发布了。当时，支持它的游戏很少，因为它需要NVIDIA为每一款游戏训练和调整机器学习模型。

然而，在那个时候，NVIDIA已经完全重写了它，称之为新版本dlss2.0。它是一个通用的API，这意味着任何开发人员都可以实现它，而且它已经被大多数主要版本所采用。与TAA类似，它从上一帧获取运动矢量数据，而不是处理一帧。结果比DLSS1.0更清晰，在某些情况下，甚至比本机分辨率看起来更好更清晰，因此没有太多理由不启用它。

在完全切换场景时有一个问题，如在剪切场景中，DLSS2.0必须在等待运动矢量数据时以50%的质量渲染第一帧。这可能导致质量在几毫秒内出现微小下降。但是，99%的你所看到的一切都会被正确地渲染，而大多数人在实践中并没有注意到这一点。

相关：什么是NVIDIA DLSS，它将如何使光线跟踪更快？

安培架构：专为人工智能设计

安培很快。速度非常快，特别是在人工智能计算方面。RT核心比图灵快1.7x，新的张量核比图灵快2.7x。两者的结合是光线跟踪性能的真正一代飞跃。

今年5月早些时候，NVIDIA发布了amperea100 GPU，这是一款专为运行AI而设计的数据中心GPU。有了它，他们详细说明了是什么让安培更快。对于数据中心和高性能计算工作负载，安培通常比图灵快1.7倍左右。对于人工智能训练来说，速度要快6倍。

随着安培，NVIDIA正在使用一种新的数字格式，旨在取代工业标准的“浮点32”，或FP32，在一些工作负载。在引擎盖下，计算机处理的每个数字都会占用内存中预定义的位数，无论是8位、16位、32位、64位，甚至更大。更大的数字更难处理，所以如果你能用更小的尺寸，你就不会那么难处理了。

FP32存储一个32位的十进制数，它使用8位表示数字的范围（可以是多大或多小），23位表示精度。NVIDIA的说法是，这23个精度位对于许多人工智能工作负载来说并不完全是必需的，你可以从其中的10个中得到类似的结果和更好的性能。将大小减少到19位，而不是32位，在许多计算中会产生很大的差异。

这种新格式称为TensorFloat32，A100中的TensorCore经过优化，可以处理这种大小怪异的格式。这是，在模具收缩和核心数量增加的基础上，他们如何在人工智能训练中获得6倍的巨大加速。

在新的数字格式之上，Ampere在特定的计算中，如FP32和FP64，性能得到了极大的提高。对于外行来说，这些并不能直接转化为更多的FPS，但它们是使其在张量运算中整体速度快近三倍的一部分。

然后，为了进一步加快计算速度，他们引入了细粒度结构化稀疏性的概念，这对于一个非常简单的概念来说是一个非常花哨的词。神经网络处理大量的数字，称为权重，影响最终的输出。要处理的数字越多，速度就越慢。

然而，并非所有这些数字都有用。其中一些实际上只是零，基本上可以扔掉，这导致了大规模的加速时，你可以在同一时间处理更多的数字。稀疏性本质上压缩了数字，这就减少了计算的工作量。新的“稀疏张量核”是用来处理压缩数据的。

尽管有这些变化，NVIDIA说这不应该明显影响训练模型的准确性。

对于最小的数字格式之一的稀疏INT8计算，单个A100GPU的峰值性能超过1.25petaflops，这是一个惊人的高数字。当然，这只是在处理一种特定的数字时，但它仍然令人印象深刻。

发表于 2021-04-01 17:41
阅读 ( 81 )
分类：互联网

你可能感兴趣的文章

nvidia的rtx gpu系列：实时光线跟踪如何改变游戏

今年早些时候，Nvidia推出了新的图形处理单元（gpu）系列，新名称为RTX。这是早期GTX系列GPU的升级，但品牌并不是唯一的改变。 ...

发布于 2021-03-22 20:02
阅读 ( 267 )

nvidia终于在CES2021上发布了RTX3060GPU

Nvidia已经透露了geforcertx3060，下一个图形卡加入其打破纪录的GPU行列。游戏玩家和普通消费者都急切地等待着宣布什么将成为Nvidia当前GPU一代的入门级选项。 ...

发布于 2021-03-28 06:07
阅读 ( 278 )

为什么nvidia的30系列GPU比amd更好

Nvidia是图形卡开发中两个值得信赖的名字之一。你要么有一个Nvidia的GPU，或者你选择了AMD的GPU。取决于你问谁，Nvidia总是稍微领先于AMD的GPU。更快、更大、更强、更具创新性。 ...

发布于 2021-03-30 08:36
阅读 ( 254 )

实时光线追踪对今天的游戏玩家意味着什么？

实时光线跟踪几十年来一直是一个遥远的梦想，现在NVIDIA的rtx20系列图形硬件将最终实现它。但这意味着什么，它是所有的炒作吗？为什么实时光线跟踪很酷光线跟踪是渲染灯光和阴影效果的更好方法。利用这项技术，图形...

发布于 2021-04-05 01:03
阅读 ( 170 )

今天我学习了nvidia的rtx语音工程在旧的gtx图形卡

Nvidia的RTX语音功能，消除了背景噪音，否则会通过您的麦克风推出昂贵的RTX显卡独家。我的同事泰勒·莱尔斯（Taylor Lyles）在2020年9月曾写道，公司在2020年9月对RTX语音软件进行了修补，使其能够在较旧的GeForce GTX、Quadro或Titan品...

发布于 2021-04-15 19:41
阅读 ( 84 )

amd将智能存取存储器的帧速率提升到Ryzen3000处理器

...置信的难以在零售业找到，因为他们首次亮相。但对于Nvidia和Intel来说，这是一个很容易的销售机会，他们在一月份宣布，他们将采用可调整大小的BAR，最初支持Nvidia的rtx3000系列笔记本电脑gpu，后来在与AMD和第11代和第10代Intel c...

发布于 2021-04-16 00:21
阅读 ( 190 )

nvidia的329美元rtx3060图形卡将于2月25日上市

我们已经知道Nvidia正在生产一款售价329美元的rtx3060图形卡，今天，该公司宣布将从2月25日开始在零售商处生产rtx3000系列中最实惠的GPU。零售商将于美国东部时间上午9点/下午12点开始为rtx3060下订单。Nvidia告诉Verge，它不会生产rtx...

发布于 2021-04-16 11:05
阅读 ( 174 )

nvidia说它不会削弱现有GPU的以太坊挖掘性能

今天上午，Nvidia宣布，它将人为地降低其即将推出的329美元GeForce RTX 3060图形卡的性能，当涉及到一个具体的任务：以太坊加密货币挖掘。尽管这条消息听起来很奇怪，但对一些游戏玩家来说却是音乐——由于GPU的严重短缺，这...

发布于 2021-04-16 12:53
阅读 ( 140 )

nvidia将于1月12日推出RTX3000笔记本电脑GPU

Nvidia已经开始调侃其RTX 3000系列笔记本电脑的推出。GPU厂商将于明天为CES举办一场虚拟新闻发布会，外界普遍预计将推出RTX 3000系列GPU的移动版。一个新的调侃视频包含了一个非常清晰的提示笔记本电脑，以及一些其他的公告，Nv...

发布于 2021-04-16 17:09
阅读 ( 156 )

1月26日，英伟达将推出RTX3080笔记本电脑

在推出用于台式PC的RTX3000系列GPU不到六个月后，Nvidia将RTX3060、RTX3070和RTX3080引入游戏笔记本电脑。由于新的安培架构，Nvidia有望在这里获得巨大的能效提升，同时与之前的rtx2000系列笔记本电脑相比，它的性能也有了明显的改进...

发布于 2021-04-16 17:43
阅读 ( 218 )