近日,Nvidia发布了搭载安培架构和三星8nm制程工艺的RTX 30系显卡。作为发布会的压轴好戏,被称为“Big Ferocious GPU”(BigFXXXingGun?)的RTX 3090可以说是出尽了风头:24GB显存,280亿个晶体管,35.7T浮点运算,第一款8K游戏显卡……一系列的繁杂名号,只为了证明一件事,RTX3090是精锐之中的精锐。
不过3090到底是不是精锐,确实需要好好探讨一下。虽然它代表目前30系显卡的最高点,但是他跟TitanRTX这样的巅峰相比,表现如何?3090又没有690那样的双芯架构,凭什么他可以拥有“90”这样特殊的名号?
既然这样,那就要扒一下硬件指标,在发布会的狂欢之后,好好论证一下3090的地位。
如何评价一个显卡的性能?可能要看功耗,可能要看主频,可能要看显存。
那我们就来比较一下:3090功耗为350W,比TitanRTX高了70W。不过3090的主频才1.7Ghz,比TitanRTX的1.77Ghz低。如果比较显存来看,二者都是24G显存,光从数量上看似乎是平手。套用《邪不压正》的一句台词:“都是一个师傅教的,破不了招啊!”
既然这些硬件指标都不好比较,我们就要比较显卡的核心——CUDA核心数目。对于游戏玩家而言,核心数目就是游戏性能。晶体管越多,核心数目越多,游戏性能越好。3090的CUDA核心数目为10496,而TitanRTX的核心数目为4608。3090核心是Titan的两倍还多,可以说是稳胜。
但是由于30系采用了全新的安培架构,CUDA计算方式由之前的一个FP64变成了2个FP32。数量直接翻倍之后,单纯比大小好像还不公平。但是就算按照Titan的算法,RTX3090的5248个CUDA核心也要比Titan多了13.8%。
3090带来的优势,不光是核心数目的变化,还有价格的直线下降:TitanRTX发售价为2500美元,而更加专业的Tesla V100更是上万美金起步,相比起这两个让人望尘莫及的价格。3090真正的诠释了什么叫物美价廉。
前两年提到显卡,玩家的惯性思考往往是打游戏、当矿机,但是Nvidia也在大力推广自己的AI和机器学习领域的相关业务。Titan系列虽然光打游戏有点屈才,但在各种深度学习研究中,Titan因为足够大的显存,已经变成了深度学习运算工具的首选。
3090带来了全新的架构,优于Titan的硬件指标,以及更加合理的价格。因此3090可以说直击目标用户的需求,是真正的“新一代旗舰”。第一个问题回答完了,那么3090凭什么要挂上“90”的名号呢?
这要从Nvidia对“90”的定义说起:提到90系,大家往往想到GTX 690 “战术核显卡”。除了玩烂梗之外,690的这个名号主要是由于过于丧心病狂的设计:690显卡直接搭载2颗GK104核心,相当于把当时的两个680直接堆到一起,性能爆炸的同时,单卡功耗也超过了300W。
曾经网上对GTX690的调侃
很多人认为看到590、690、790的双核心设计,就认为“90”系就一定是双核心代表。但是“90”这个代号更多的是代表Nvidia对于性能的极端追求,而双显卡只是达到性能的手段而已。
还是以690为例,虽然“一人开机,全家跳闸”。但是双核心的极端操作,带来的是当时最为强悍的性能。就算放到现在,GTX690的性能还是会比GTX980高上半头,甚至可以和10系显卡比一比。
由于双核心的功耗和散热,3090并没有像前辈一样成为“战术核显卡”。但是逐步成熟的光线追踪技术,更为先进的制程工艺和全新安培架构,让3090获得了“核弹级性能”。
由于20系显卡只能使用台积电的12nm制程工艺,采用图灵架构的2080Ti显卡,芯片面积居高不下不说,当时的价格也是1080Ti的两倍以上。对于当时只有几款游戏支持的光线追踪技术而言,花这么多钱,结果就为了玩几个开RTX就掉帧的游戏实在没有必要。
到了3090这一代,英伟达采用了三星的8nm制程工艺。虽然没有达到7nm的级别,但是英伟达可以放心大胆的缩小芯片面积,进一步降低成本。别看3090跟TitanRTX相比打了六折,但是考虑到全面优化的设计,以及24GB的超大显存,老黄可以放心大胆的运用独家刀法。
硬件产业是经历不断的失败之后才会获得辉煌的:经历了功败垂成的图灵架构,价格上万的Volta专业系列以及让人失望的“黄氏刀法”后。英伟达终于用自己在硬件行业的经验,更加优化的架构,全面升级的8nm工艺,为大家带来了价格合理,性能惊艳的RTX 3090。
9月是开学季,也是就业季。不论是哪一个,都代表着对未来的关键选择。黄仁勋手中的RTX 3090,已经开启了充满自信的未来,现在就想问大家一句话:”“香吗?”。