当前位置 > 散户吧 > 股市动态 > 个股分析 > 被榨干的AI算力,谁将成为解药?

被榨干的AI算力,谁将成为解药?

发布时间:2023-04-20 18:31来源:全球财经散户吧字号:

  大模型这股热风,已经吹到了上游算力

本文来自散户吧WWW.SANHUBA.COM

  随着百度、腾讯、阿里等纷纷拿出相关技术布局以及底层设施储备,为中国的CHATGPT奋力一战,密集上线的大模型面临着巨大的算力需求,“算力从何而来”的问题随之搬上台面。 本文来自散户吧WWW.SANHUBA.COM

  一方面,算力昂贵。以ChatGPT为例,支撑其算力至少需要上万颗英伟达的GPU A100,单次模型训练成本超过1200万美元。 本文来自散户吧WWW.SANHUBA.COM

  另一方面,算力有限。今年4月5日,Open AI就因需求量过大为由关闭过ChatGPT Plus的付费渠道,这意味着仅发布几个月,OpenAI就曾面临算力缺口。

本文来自散户吧WWW.SANHUBA.COM

  那么问题就来了,GPU烧钱且有限的算力现况,对于大模型来说是否就是最优解? 本文来自散户吧WWW.SANHUBA.COM

  “蹭”大模型和AIGC的热度,业内也涌现技术及方案的“混战”。国内外云计算大厂发力自研芯片和软硬件系统优化、二级市场CPO(共封装光学)概念股一路飙升、存算跳出来说是“突破困境的清晰路线”、量子计算更是被认为“最具潜力的破局者”。 本文来自散户吧WWW.SANHUBA.COM

  在投算力未来上,投资人也开始兵分几路,有人坚定烧GPU、有人开始刷起模型训练优化的项目,更有投资过存算、Chiplet的VC计划在赛道内寻找更优的投资标的,还有投资量子计算的机构在期待从底层到上层的一场算力革命的大爆发。 本文来自散户吧WWW.SANHUBA.COM

  俨然,这场“算力军备竞赛”在一级市场,已经暗潮涌动。

本文来自散户吧WWW.SANHUBA.COM

  国产GPU:以量取胜

本文来自散户吧WWW.SANHUBA.COM

  大模型的发展有算法、算力、数据三大重要因素。

本文来自散户吧WWW.SANHUBA.COM

  算力是大模型训练的重要能量引擎,也是目前国内发展大模型产业的一大壁垒。芯片能力直接影响着高算力训练效果和速度,故而高端GPU芯片的数量多少,成为业内判断企业大模型能力的重要指标。 本文来自散户吧WWW.SANHUBA.COM

  然而,对于国内大模型玩家而言,高端GPU芯片面临着进口受限的问题,已经由“买不买得起”变为“用不用得上”。据此前媒体报道,国内云厂商主要采用的是英伟达的中低端性能产品,譬如GPU A800。 本文来自散户吧WWW.SANHUBA.COM

  在国外芯片能否撑起大模型的算力需求疑问下,一众GPU国产厂商也在抓住国产替代的契机。

本文来自散户吧WWW.SANHUBA.COM

  但是,国内GPU芯片的云端训练公司如壁仞科技(通用GPU芯片BR100)、天数智芯(“智铠100”)、寒武纪(行情688256,诊股)(云端推理思元270)的产品虽在多媒体和图形处理的单精度浮点计算FP32的理论指标上做得不错,但没有处理FP64的能力。

本文来自散户吧WWW.SANHUBA.COM

  而大模型训练需要处理高颗粒度的信息,对云端训练芯片的芯片处理信息的精细度和算力速度要求更高,在超算领域,双精度浮点计算能力FP64是进行高算力计算的硬性指标。 本文来自散户吧WWW.SANHUBA.COM

  英伟达的A100就同时具备上述两类能力。

本文来自散户吧WWW.SANHUBA.COM

  根据公开消息,目前国内唯一支持FP64双精度浮点运算的只有海光推出的DCU(协处理器),但是它的性能只有A100的60%左右。

本文来自散户吧WWW.SANHUBA.COM

  对此,戈壁创投VP俞悦坦言,虽然目前烧GPU是最为现实的方案,但就国内GPU厂商的角度,还需要更多时间去追赶。 本文来自散户吧WWW.SANHUBA.COM

  普华资本合伙人蒋纯则认为,技术差距是一方面,还有一方面是美国卡脖子的问题,这就要求国内企业想做高端GPU芯片,要有能力走出一条从设备到材料,完全国产化的道路。如果做不到,就只能退而求其次。 本文来自散户吧WWW.SANHUBA.COM

  但这样的国产GPU对于大模型是否就无用了?不然。 本文来自散户吧WWW.SANHUBA.COM

  蒋纯进一步解释,国产GPU即便做不出最强大,但也能做出目前所需要的产品,只是更多是以低端的GPU去追赶和堆叠,让一堆GPU通过优化和协调来协同作用,即以量取胜、再去组合模拟优化的路径。

本文来自散户吧WWW.SANHUBA.COM

  值得注意的是,GPU越堆越多,内部管理的难度也就越大,故而提高GPU并行运行的资源利用率,做模型推理/训练优化的项目也开始在VC圈开始涌现,成为了一线投资人研究的方向之一。 本文来自散户吧WWW.SANHUBA.COM

  但就蒋纯来说,这类项目虽然有价值,也是个不错的方向,但并不足以戳中他的心巴。他坦言,有时候有价值的事不一定有好的商业模式。 本文来自散户吧WWW.SANHUBA.COM

  “就系统来说,阿里、华为等大厂一定比小公司有优势。因为技术从大环境里磨练出来,最后应用到大环境里。创业公司独立做,大公司一上来就学走了,要不就是技术卖给大厂。” 本文来自散户吧WWW.SANHUBA.COM

  而就GPU芯片而言,大厂又未必有绝对优势,反倒给了创业公司机会。

本文来自散户吧WWW.SANHUBA.COM

  他表示,虽然大厂有资金、场景,但存在一个老问题,就是以部门形式来做,无法做到创业公司all in的 “疯狂”。而芯片有知识产权以及商业壁垒,创业公司有能力将芯片卖给大厂。

本文来自散户吧WWW.SANHUBA.COM

  GPU“防守”,存算“包抄” 本文来自散户吧WWW.SANHUBA.COM

  值得注意的是,烧GPU,并非长久之策。

本文来自散户吧WWW.SANHUBA.COM

  动辄几亿算力投入的模型训练阶段只是开始,模型推理应用阶段算力成本更是可能高达百亿级别。大算力之下,背后的功耗更是惊人。

本文来自散户吧WWW.SANHUBA.COM

(小编:财神)

专家一览机构一览行业一览