碾压泰坦，24GB显存能8K60帧的RTX3090，有多强？

近日，Nvidia发布了搭载安培架构和三星8nm制程工艺的RTX 30系显卡。作为发布会的压轴好戏，被称为“Big Ferocious GPU”（BigFXXXingGun？）的RTX 3090可以说是出尽了风头：24GB显存，280亿个晶体管，35.7T浮点运算，第一款8K游戏显卡……一系列的繁杂名号，只为了证明一件事，RTX3090是精锐之中的精锐。

不过3090到底是不是精锐，确实需要好好探讨一下。虽然它代表目前30系显卡的最高点，但是他跟TitanRTX这样的巅峰相比，表现如何？3090又没有690那样的双芯架构，凭什么他可以拥有“90”这样特殊的名号？

既然这样，那就要扒一下硬件指标，在发布会的狂欢之后，好好论证一下3090的地位。

如何评价一个显卡的性能？可能要看功耗，可能要看主频，可能要看显存。

那我们就来比较一下：3090功耗为350W，比TitanRTX高了70W。不过3090的主频才1.7Ghz，比TitanRTX的1.77Ghz低。如果比较显存来看，二者都是24G显存，光从数量上看似乎是平手。套用《邪不压正》的一句台词：“都是一个师傅教的，破不了招啊！”

既然这些硬件指标都不好比较，我们就要比较显卡的核心——CUDA核心数目。对于游戏玩家而言，核心数目就是游戏性能。晶体管越多，核心数目越多，游戏性能越好。3090的CUDA核心数目为10496，而TitanRTX的核心数目为4608。3090核心是Titan的两倍还多，可以说是稳胜。

但是由于30系采用了全新的安培架构，CUDA计算方式由之前的一个FP64变成了2个FP32。数量直接翻倍之后，单纯比大小好像还不公平。但是就算按照Titan的算法，RTX3090的5248个CUDA核心也要比Titan多了13.8%。

3090带来的优势，不光是核心数目的变化，还有价格的直线下降：TitanRTX发售价为2500美元，而更加专业的Tesla V100更是上万美金起步，相比起这两个让人望尘莫及的价格。3090真正的诠释了什么叫物美价廉。

前两年提到显卡，玩家的惯性思考往往是打游戏、当矿机，但是Nvidia也在大力推广自己的AI和机器学习领域的相关业务。Titan系列虽然光打游戏有点屈才，但在各种深度学习研究中，Titan因为足够大的显存，已经变成了深度学习运算工具的首选。

3090带来了全新的架构，优于Titan的硬件指标，以及更加合理的价格。因此3090可以说直击目标用户的需求，是真正的“新一代旗舰”。第一个问题回答完了，那么3090凭什么要挂上“90”的名号呢？

这要从Nvidia对“90”的定义说起：提到90系，大家往往想到GTX 690 “战术核显卡”。除了玩烂梗之外，690的这个名号主要是由于过于丧心病狂的设计：690显卡直接搭载2颗GK104核心，相当于把当时的两个680直接堆到一起，性能爆炸的同时，单卡功耗也超过了300W。

曾经网上对GTX690的调侃

很多人认为看到590、690、790的双核心设计，就认为“90”系就一定是双核心代表。但是“90”这个代号更多的是代表Nvidia对于性能的极端追求，而双显卡只是达到性能的手段而已。

还是以690为例，虽然“一人开机，全家跳闸”。但是双核心的极端操作，带来的是当时最为强悍的性能。就算放到现在，GTX690的性能还是会比GTX980高上半头，甚至可以和10系显卡比一比。

由于双核心的功耗和散热，3090并没有像前辈一样成为“战术核显卡”。但是逐步成熟的光线追踪技术，更为先进的制程工艺和全新安培架构，让3090获得了“核弹级性能”。

由于20系显卡只能使用台积电的12nm制程工艺，采用图灵架构的2080Ti显卡，芯片面积居高不下不说，当时的价格也是1080Ti的两倍以上。对于当时只有几款游戏支持的光线追踪技术而言，花这么多钱，结果就为了玩几个开RTX就掉帧的游戏实在没有必要。

到了3090这一代，英伟达采用了三星的8nm制程工艺。虽然没有达到7nm的级别，但是英伟达可以放心大胆的缩小芯片面积，进一步降低成本。别看3090跟TitanRTX相比打了六折，但是考虑到全面优化的设计，以及24GB的超大显存，老黄可以放心大胆的运用独家刀法。

硬件产业是经历不断的失败之后才会获得辉煌的：经历了功败垂成的图灵架构，价格上万的Volta专业系列以及让人失望的“黄氏刀法”后。英伟达终于用自己在硬件行业的经验，更加优化的架构，全面升级的8nm工艺，为大家带来了价格合理，性能惊艳的RTX 3090。

9月是开学季，也是就业季。不论是哪一个，都代表着对未来的关键选择。黄仁勋手中的RTX 3090，已经开启了充满自信的未来，现在就想问大家一句话：”“香吗？”。