优惠头条

神秘的国产显卡,是真技术还是行为艺术?

电子数码

2022-11-23

酷玩实验室作品

俞守伟信号酷玩实验室

微信id: coollabs

不久前,一家名为“摩尔线程”的厂商宣布,其首款游戏显卡MTTS80将在双11开始限量销售。

与行业霸主Nvidia、AMD不同,摩尔线程是国内新的GPU厂商。从性能参数表来看,MTTS80甚至可以和RTX30系列显卡角力。

国产显卡真的要从此崛起了吗?

但很快,就有热心网友扒出了一些技术细节:

摩尔线程可能会直接购买一家名为Imagination的芯片ip厂商的技术授权,在此基础上自己做GPU。自研程度不高。还有一个证据就是这个显卡的驱动只有DX9,能支持的游戏很少。都是近10年前的老游戏,现在主流游戏都到了DX11甚至DX12。

有点像武侠小说里外功强内功弱的部分主体玩家。一旦他们遇到一个内外兼修的大师,只会被吊死。

神奇的还在后头。虽然在电商平台开始预售,但是这种预售是有限的。你得去摩尔线程的官方媒体填个表申请一个叫必买码的东西才能下单。

结果显卡上架了,很多人要求的购买码还没搞定,也不知道官方的限制是多少。这就像春运中买火车票一样难。

更让人哭笑不得的是官方售价2999,大家都觉得略贵。反应后发现产品说明的灰色小字写着这个显卡还是绑定一个主板出售的。

截至11月16日,我还没有看到任何媒体发布这款显卡的真机评测。总之,经过一系列的拼图,MTTS80发布了,但并没有完全发布。很难不让人怀疑其中有什么猫腻。

经过一番搜寻,我找到了一些线索。

摩尔发布会的焦点是一款名为“MT-肖春”的GPU芯片。MTT-S80显卡只是基于它的一个产品,更重要的是一个通用GPU——MTTS3000。

它的受众不是广大追求4K60帧、特效、追光的游戏玩家,而是那些壁垒很高的AI、数据中心企业用户。

所以作为官方游戏显卡,MTTS80处境尴尬,连首发都如此仓促,更像是先取一个洞的行为艺术。

中国的游戏玩家什么时候才能用上靠谱的国产显卡?现在国内的GPU厂商都在做什么?中国的GPU芯片应该如何自研?

你好,我是雨果。今天我们就来聊聊国产GPU的现在和未来。

01

一般来说,GPU是指用来渲染游戏画面的显卡。

因为CPU负责整个计算机系统的控制,就像医生一样,可以处理复杂大问题,但是面对大量独立的简单计算,也就是大规模并行计算,速度就不行了。与其这样,不如找一大群中学生。

如今,屏幕上的3D物体在计算机中全部由三角形组成,成千上万个不规则的三角形坐标需要进行大量的并行计算来变换和渲染图形,从而确定屏幕上的每个像素应该如何显示。所以单靠CPU是无法让大型3D游戏流畅运行的。

3D游戏早期,电脑需要带图像加速卡,英伟达看到了机会。基于图形加速卡,它开发了一个专注于并行计算的GPU,内部有大量的计算单元,可以同时进行大量的并行计算。

全球首款GPU是英伟达的GeForce256,可以说是划时代的产品。老黄和英伟达也是从那时起占据了显卡行业第一的位置,然后AMD在激烈的竞争中被杀了出来,和英伟达一分为二。

随着显卡技术的发展,图形渲染逐渐形成了一套处理线路:用点形成曲面、几何变换、光栅化、像素着色……这个过程通常被称为“渲染流水线”。

开发者都希望使用显卡实现更炫酷的视觉效果,所以需要架构师开放管道中一些节点的权限,能够独立编程。Nvidia引以为傲的CUDA核心就是这种设计思想,将可以独立编程的节点放入通用并行计算池中进行计算。

这些架构完成后,GPU的格局就打开了。

因为除了游戏图形渲染,还有很多其他领域会用到大规模并行计算,比如加密货币挖掘,以及目前已经渗透到各行各业的AI计算。做这些事情并不需要“渲染管道”的其他功能,显然浪费了GPU服务游戏的能力。

因此,为了进一步加强并行计算能力,各大厂商开始开发一种不需要图形渲染的通用GPU(GPGPU),NVIDIA和AMD就是其中的佼佼者。

比如英伟达的H100,每秒可以实现3.2亿次浮点数运算(3.2petaFLOPS FP8)。毕竟本质是并行计算,强者总是强者。

图形渲染和通用并行计算可能有一天会融合在一起,但目前仍属于两条轨道。

对于中国来说,数据中心、AI、自动驾驶等应用近年来越来越普及,国内厂商的积累和精力投入有限。一是以Nvidia和AMD为主的游戏显卡放在次要位置,更多的是扔在通用GPU上。

渲染显卡优先考虑汽车、飞机、工厂,这些对渲染性能的要求没那么高,但应用更广泛。相比之下,高性能游戏显卡的需求较低。

吸取了早年被美国芯片技术封杀的教训,国产GPU R&D和量产已经进行了一段时间。

果不其然,今年10月,美国再次升级对中国芯片的管控,禁止销售高性能通用GPU,TSMC的代工厂也受到约束。

虽然对美国的这种愈演愈烈的行为有所预测,但国内的一些厂商还是被抓住了。

一款名为富弼科技的7nm通用GPU已经准备在TSMC量产,但是因为参数中的传输速率刚好超过新规中600GB/s的阈值,所以直接停产。富弼科技不得不主动降低业绩,直到现在也没有恢复生产。

前景不明导致公司本月裁员三分之一,这对国产GPU是一个严重的打击。

美国在这次芯片控制升级中的意图很明显,就是为了打击中国AI的发展。

十月,是艾画让专业画师和吃瓜人直呼“卧槽”!上一次芯片法案逼着中国芯片生产,这次又堵住了AI发展的上限。下一步是什么?有没有可能连玩家视为珍宝的游戏显卡都会遭殃?

其实这种可能性不低。无论是图形渲染卡还是通用GPU,在未来都会有无限的应用,甚至关系到国家信息化水平和国防安全。

我们可以想象,在10年的时间里,元宇宙的虚拟世界将开始形成,并成为每个人工作、生活和娱乐的基础设施。刷新率16K、120Hz的单目VR头显将成为我们与虚拟世界交互的媒介,AI将构建大量虚拟内容,扮演交互NPC的角色。

要支撑如此庞大的虚拟世界的外部和内部,图形渲染和AI训练推理必不可少。届时,图形渲染卡将变得和CPU、通用GPU一样重要。我不需要告诉你,面对这个主宰了一个时代的伟大机遇,美国会怎么做。

即使10年后的未来不是超宇宙,新技术的发展也一定离不开GPU。那时候我们可能还在用落后两三代的芯片,再次被踢下一代的列车,最后在各个领域被对方更高一级的AI算力打败。

所以不管是高性能GPU,CPU,NPU,自主设计,量产都是我们要过的劫,会下地狱的那种。

02

在芯片制造中,高精度工艺,尤其是EUV光刻机的长期问题是众所周知的。

但是芯片尤其是高性能芯片的设计难度和高精工艺一样,CPU和GPU的架构完全不同。CPU设计的非常流畅,并不代表GPU也可以做同样的事情。

例如,苹果和英特尔在GPU研发方面被击败。苹果以后再说。Intel在台式电脑CPU领域可以说是老大哥了,但是自家的Arc显卡就没那么顺畅了。在性能上无法与a卡和n卡同时期的产品抗衡,显卡驱动问题频发。直到现在,还是有bug。是不是有点像摩尔线?

经过30多年的发展,芯片领域分工明确。能设计芯片不等于能生产芯片,反之亦然。就连设计本身也被细分成不同的工作,能设计和制作两者兼得的公司少之又少。甚至设计已经细分到很多领域,比如EDA、IP、芯片设计等等。

如果是交错的,属于是。

EDA是指电子设计自动化软件,用于完成功能设计、综合、验证、布局、布线等。超大规模集成电路芯片。在芯片设计上有点类似于Photoshop和3DMax。

芯片的本质是由晶体管开关组成的逻辑电路,如两个输入为1输出为1的与门,两个输入为0输出为0的或门,输入输出相反的非门。这些简单逻辑运算的排列组合,使芯片具备了计算能力和功能。但是芯片里有上亿个晶体管,这么复杂的结构靠工程师的手是不现实的。

如果把芯片设计比作做饭,EDA就相当于厨房的灶台,否则只能钻木取火。

为了进一步提高设计效率,工程师们还设计了一个可以复用的小模块,即IP核,类似于我们通常所说的IP。一些实现特定功能的部分可以用现成的IP核来实现。

所以芯片设计师在开发新机型的时候,会先从ip厂商那里购买自己需要的IP核,不用从头开始。这就是摩尔过程所做的。

IP授权也有不同的级别,软核只提供代码,实核提供门级社交和验证,硬核提供物理版图甚至模拟验证,可以直接由代工厂生产。越往高处走,系统越稳定,开发难度越小,但可扩展性越低。

IP就像是做菜的食材供应商,不然我们要做菜就得自己种菜。而且,这家供应商还提供了不同加工程度的贴心食材。可以买一整块牛肉(软芯),切成条状调味。也可以买切好的牛肉片或者牛肋排(实心)。甚至可以买秘制的牛筋(硬核)加调料腌制,放锅里炸一下就可以吃了。

当然,买一块预制好的牛肋排是做不出整块牛排的,但是对烹饪要求很低。

有了灶台和食材,至于做菜是暗的还是满汉全席,就看厨师的厨具和厨艺了,这是芯片的具体设计。

这是一套系统工程,从最初的市场需求分析、架构设计、性能、功耗评估、软硬件功能的代码级实现、仿真验证,到部分生产端版图和布线的物理设计和验证、OEM制作样片和测试样片、产品外观和公告,最后是量产阶段。

每一步都像是烹饪过程中的每一步,食材的处理,刀工的切工,厨具的选择,烹饪温度的控制,调味,雕刻,摆盘。即使是同一个菜谱,不同水平的厨师做出来的味道也可能大相径庭。

江湖人称英伟达的黄仁勋为“皮中刀”,说他“善用刀”,能准确把握各显卡的性能差异,满足不同消费能力的玩家,就像一个优秀的厨师能准确掌控每一位客人的口味。

EDA、IP、芯片设计三足鼎立,不同厂商各有各的一面。

ARM几乎垄断了移动CPU的设计,AMD和Nvidia在GPU上有绝对主导权,Synopsys和Candence都是EDA和IP,Nvidia会买前者的IP授权。

EDA、IP、设计、制作也是相辅相成,共同进步的。

EDA可以帮助工程师提高设计效率,设计的反馈也可以帮助EDA更好地优化和更新软件。从芯片产业生态形成的初期,这些领域就已经由简单到复杂,经验和技术的不断积累,形成了今天美国芯片的垄断地位,没有谁也玩不了。

比如前面提到的苹果的例子,不同于PC,手机的芯片采用了一种SoC(SyestemonChip)的设计思路,即将CPU、GPU、NPU都集成在一个封装中。2017年之前,iPhone上的GPU是用英国公司Imagination的IP授权购买的,也就是视频开头疑似授权给Moore Thread的厂商。

国内很多GPU厂商也是先购买了Imagination的IP授权,开始了自研之路,也埋下了不确定因素。

03

但如开头所说,购买现成IP的自研含金量有多高?要看国内厂家买的是原料还是加工过的“现成菜”。

一方面,通过软核授权发展高度自研是非常困难的。除了硬件,还需要重写配套的软件,这在国内是稀缺的,以至于目前在售的国产图形渲染卡的优化水平并不乐观。

如摩尔线,成立不到两年就卖出去了,大概率偏爱预制菜,味道可想而知。想在这个基础上搞出点独特的东西,还要看IP厂商能给多少技术支持。

以Imagination为例,它是第一个在移动GPU上实现实时光线追踪的厂商,擅长在性能和功耗之间做权衡,在IP厂商中也是排名靠前的。

如果说台式PC的三大芯片是英伟达、英特尔和AMD,那么移动PC的三大芯片就是ARM、高通和Imagination。

但苹果一直有一颗开发自己GPU的心,于是悄悄从Imagination挖来了很多工程师,并在2017年宣布终止与Imagination的合作,两年内拿出自己的GPU。

这一跳真的让Imagination苦不堪言,因为它当时和苹果合作了十年,超过一半的收入来自苹果,被深度绑定。合同终止,人才流失后,市值大降。

此时,中资公司凯桥资本投资收购,将想象力从泥潭中拯救出来。通过一些操作,绕过了美国的监管,希望能弥补国内GPU行业的短板。才让想象力全力支持国产厂商。

但后来,情况的变化远远超出了芯片行业本身的市场逻辑。

2020年4月,原本有4名来自中国的董事加入Imagination的董事会,但这一计划受到了英国政府的干预,称该公司仍然属于英国,没有办法在公司中担任领导。一些高级官员辞职,称他们“不想成为中国政府控制的公司的一部分,这会损害公司在美国的合作业务”。

今年Imagination在中国市场的营收只有总营收的10%,实在让人待不住。

更让人觉得离谱的是,就在被苹果抛弃三年后,Imagination重新与苹果签订了IP授权协议。

这就像被高富帅·渣男抛弃,在她绝望的时候被中国资助的白衣骑士收留。可是女主不懂得知恩图报,反而对着中国这边的白衣骑士大喊大叫,这样不行,那样也不行。反过来,她对渣男唯唯诺诺,更可气的是,她终于言归于好。

这个白衣骑士当可以说是相当胆小。

当原本的利益纠葛变成复杂的商业博弈,再加上国家意志的政治角力,这波收购是否有助于国产GPU的发展,就是一个问号。

更令人担忧的是,如果国内大部分厂商都在购买自主研发空间不大的“预制菜”IP,不仅对技术的发展没有任何好处,还会导致国内厂商的内卷化和急功近利。为了抢占市场,他们会开发一些完全没有实际价值的GPU产品。

从已经销售的国产GPU表现来看,虽然一般GPU不是普通人能接触到的,但是从消费级显卡的角度来看,大部分产品其实并没有达到用户的预期,只是为了抢占国内市场或者其他商业和资本方面的考虑,不得不销售不成熟的产品。

怎么说呢?虽然杀人,但是面对越来越紧张的芯片市场,只能说是厂商的无奈之举。

毕竟,无论是苹果还是英特尔,在一个美丽的国度积累了30多年的芯片产业,对GPU自研都感到如此尴尬。现在的国产GPU,就像一个没有高手带就被推进厨房的菜鸟。东拼西凑的菜谱,改不了也不敢改。它只能用老旧的厨具和很少的食材小心翼翼地积累经验,还得时不时地被坑。但不管怎样,这个简陋的厨房是搭建起来的。

毕竟有总比没有好。

在GPU R&D这条路上,国产厂商注定要经历一些磨难,走一些弯路,但我相信未来肯定是光明的。

早些年,别说CPU和显卡,我们连内存、硬盘、主板都生产不出来。但是经过不断的努力和尝试,现在这些设备已经可以被国产替代了。这种情况下,从通用GPU开始,再到图形渲染卡,再到14nm、7nm、5nm甚至3nm芯片的量产,最终会有摆脱美国限制的一天。

面包牛奶就有了,因为全力发展国产GPU的天时、地利、人和都来了。

首先,美国科技脱钩,芯片禁令加剧,国内业界必须放弃一切幻想,做好战斗准备。这难道不是大力发展芯片的最好时机吗?这是“一天中的时间”。

目前国内GPU厂商的主要定位是面向AI和数据中心的通用GPU。随着AI和云计算的发展,未来需求只会增加很多。再加上一些28nm芯片订单,国产GPU厂商的日子会越来越好。这就是“地缘优势”。

现在研究国产GPU的主力军不仅仅是一个有激情的门外汉。他们的主要创始人大多在NVIDIA或者AMD这样的一线厂商都有过优秀的履历,有的甚至身居要职,打下了良好的基础。这就是“人和”。

当大海到达无边无际的天空,山爬到山顶,我就是顶峰!

为了逆境生存,国产显卡和国产游戏的命运其实很相似,唇齿相依。

早些年,国产游戏差点被盗版、舆论和政策毁掉。然而,很难依靠一群不忍心向命运屈服的游戏创作者,凭着不断磨练的技术和坚定的意志,在世界上站稳脚跟。在这个过程中,无数有情的厂商和游戏创作者化为时代的眼泪,但后来者以此为梯,成就了今天的国产游戏。

《传奇之剑3》、《永不抢劫》、《戴森球体计划》、《原神》……事实证明,越是国产游戏被全世界玩家所熟知,甚至可以成为文化输出的有利阵地。以后甚至还会出《黑色神话:悟空》,和国外3A大作刚好正面。我不敢说国产游戏从此崛起,但至少我们走出了自己的路。

而这可能就是国产芯片最终要走的路。只是这条路可能会更长更曲折,但我相信我们可以也必须义无反顾地走下去。

酷玩实验室完成和编辑

始于微信微信官方账号:酷玩实验室(ID: coollabs)

如需转载,请后台留言。