(原标题:将英伟达拉下马,芯片公司出招)
若是您但愿不错常常碰面,接待标星储藏哦~
着手:内容编译自IEEE,谢谢。
很难夸大英伟达在AI界限的主导地位。竖立于1993年的英伟达最初在个东谈主计算机图形处理单元(GPU)界限崭露头角。但是,是公司的AI芯片,而非PC图形硬件,股东英伟达置身全球最有价值公司之列。事实证明,英伟达的GPU在AI方面也阐扬出色。因此,其股价自2020岁首以来如故增长了15倍以上,收入从2019财年约120亿好意思元跃升至2024年的600亿好意思元;这家AI巨头的最先芯片如沙漠中的水一样稀缺且备受追捧。
"获取GPU对AI盘问东谈主员来说如故成了巨大的担忧,以至于他们每天齐在想考这个问题。因为莫得它们,即使领有最佳的模子,他们也无法尽情阐明,”谷歌DeepMind的AI数据细腻东谈主詹妮弗·普伦德基(Jennifer Prendki)暗意。普伦德基依赖英伟达的程度较少,因为谷歌领有我方的AI基础措施。但其他科技巨头,如微软和亚马逊,是英伟达最大的客户之一,并络续以极快的速率购买其GPU。据新闻报谈,好意思国司法部正在就英伟达芯片分派和获取问题进行反把持侦查。
英伟达在AI界限的主导地位,与机器学习的爆发一样,是最近的征象。但这种告捷源自公司数十年来的发愤,旨在将GPU建造为除渲染图形外对其他任务也有效的通用计算硬件。这一发愤不仅包括公司GPU架构的演变,后者当今领有好像加快AI使命负载的“张量中枢”,还包括其软件平台CUDA,这为开发东谈主员欺诈硬件上风提供了援救。
“他们确保每个从大学毕业的计算机科学专科学生齐掌抓了CUDA编程,”Moor Insights & Strategy的数据中心首席分析师Matt Kimball说。“他们提供器用和培训,并在盘问上干预了无数资金。”
CUDA于2006年发布,匡助开发东谈主员使用英伟达GPU的繁密中枢。这在加快高度并行的计算任务(包括当代生成式AI)方面至关紧要。英伟达在建造CUDA生态系统上的告捷使其硬件成为AI开发的最小阻力旅途。诚然英伟达芯片供不应求,但比AI硬件更难找到的,可能是训导丰富的AI开发东谈主员——而许多开发东谈主员齐熟悉CUDA。
这给了英伟达一条深厚且平常的护城河来保护其业务,但这并不虞味着它贫乏准备垂死的竞争敌手,这些敌手的策略各不相通。诚然像AMD和英特尔这么的老牌公司正在试图使用他们我方的GPU来挑战英伟达,但像Cerebras和SambaNova这么的初创公司如故开发出好像显耀提高生成式AI闇练和推理效用的更始芯片架构。它们是最有可能挑战英伟达的竞争敌手。
AMD:另一位GPU制造商
上风:AMD的GPU是劝服力澈底的英伟达替代品
颓势:软件生态系统无法与英伟达的CUDA相抗衡
在图形芯片界限,AMD与英伟达的战争已不息了近二十年。这是一场未必抗争衡的竞争。在图形处理方面,AMD的GPU在销售和心智占有率上很少打败英伟达。但是,AMD的硬件有其上风。公司的平常GPU家具组合涵盖了从札记本电脑的集成图形到领有1500亿个晶体管的AI专用数据中心GPU。该公司还早期援救并遴选了高带宽内存(HBM),这是如今全球最先进GPU所必需的一种内存表情。
“若是你看硬件……它与英伟达比拟并不忘形,”Kimball说谈,他指的是AMD的Instinct MI325X,这是一款英伟达H100的竞争敌手。“AMD在这款芯片的操办上作念得超越出色。”
MI325X霸术于本年年底推出,领有朝上1500亿个晶体管和288GB的高带宽内存,尽管其在实质应用中的阐扬尚待考证。MI325X的前身MI300X赢得了微软的好评,微软使用包括MI300X在内的AMD硬件来处理部分ChatGPT 3.5和4的做事。Meta和戴尔也部署了MI300X,Meta在其最新的谣言语模子Llama 3.1的部分开发中使用了这些芯片。
AMD仍有一个攻击需要克服:软件。AMD提供了一个开源平台ROCm来匡助开发东谈主员为其GPU编程,但它的东谈主气不如CUDA。AMD意志到了这一时弊,并在2024年7月首肯收购欧洲最大的独到AI实验室Silo AI,该实验室在使用ROCm和AMD硬件进行大范围AI闇练方面有训导。AMD还霸术收购ZT Systems,一家在数据中心基础措施方面领有专长的公司,以匡助AMD更好地为部署其硬件的客户做事。打造一个好像与CUDA匹敌的敌手绝非易事,但AMD正在任重道远。
英特尔:软件告捷
上风:Gaudi 3 AI加快器阐扬强劲
颓势:下一款大AI芯片要到2025年底才会推出
英特尔的挑战与AMD相背。英特尔艰巨英伟达的CUDA和AMD的ROCm的胜仗匹配家具,但其于2018年推出了一个开源融合编程平台OneAPI。与CUDA和ROCm不同,OneAPI涵盖多个类别的硬件,包括CPU、GPU和FPGA。因此,它不错匡助开发东谈主员在职何英特尔硬件上加快AI任务(以过甚他任务)。
另一方面,硬件是一个时弊,至少与 Nvidia 和 AMD 比拟是如斯。英特尔的 Gaudi AI 加快器是英特尔2019 年收购 AI 硬件初创公司 Habana Labs的恶果,取得了进展,最新的Gaudi 3 的性能可与 Nvidia 的 H100 相比好意思。
但是,目下尚不明晰英特尔的下一代硬件版块究竟会是什么阵势,这引起了一些担忧。Moor Insights & Strategy 创举东谈主帕特里克·穆尔黑德 (Patrick Moorhead ) 暗意:“Gaudi 3 超越矫健。”但他暗意,放置 2024 年 7 月,“还莫得 Gaudi 4”。
相背,英特尔霸术转向一款齐人攫金的芯片,代号为 Falcon Shores,该芯片遴选基于区块的模块化架构,结合了英特尔x 86 CPU 内核和 Xe GPU 内核;后者是英特尔最近进军图形硬件界限的一部分。不外,英特尔尚未显露计议 Falcon Shores 架构和性能的详备信息,预测要到 2025 年底才会发布。
Cerebras:越大越好
优点:晶圆级芯片每颗芯片提供矫健的性能和内存
错误:由于尺寸和资本,应用界限有限
不错笃信的是,AMD和Intel是Nvidia最具信得过度的挑战者。它们在操办告捷芯片和构建编程平台方面有着悠久的历史。但在范围较小、未训导证的玩家中,有一个脱颖而出:Cerebras。
这家公司专注于超等计算机的AI,于2019年推出了Wafer Scale Engine,这是一块巨大的晶圆级硅片,领有1.2万亿个晶体管。最新版块Wafer Scale Engine 3将这一数字擢升到了4万亿个晶体管。行为比较,Nvidia最新最大的GPU——B200,"仅"领有2080亿个晶体管。Cerebras围绕这个晶圆级怪物构建的计算机CS-3,恰是Condor Galaxy 3的中枢,该超等计算机将由64台CS-3构成,处理高达8 exaflop的AI计算任务。G42,一家总部位于阿布扎比的企业集团,霸术使用该系统闇练改日的前沿大型话语模子。
“这有点偏向于特定的应用,而不是通用型的,”Bernstein Research的高档分析师Stacy Rasgon说。“并不是每个东谈主齐会购买这些计算机。但他们有一些客户,比如好意思国国防部和Condor Galaxy 3超等计算机。”
Cerebras的WSC-3在大多数情况下不会挑战Nvidia、AMD或Intel的硬件;它太大、太崇高、太专科化了。但它可能在超等计算机界限为Cerebras提供独特上风,因为莫得其他公司操办晶圆范围的芯片。
SambaNova:
为Transformer而生的变形架构
优点:可设置的架构有助于开发东谈主员优化AI模子的效用
错误:硬件还需要证明对世界商场的计议性
竖立于2017年的SambaNova是另一家欺诈非传统芯片架构科罚AI闇练问题的芯片操办公司。其旗舰家具SN40L遴选公司所谓的“可重构数据流架构”,由存储器和计算资源的模块构成。这些模块之间的结合不错凭证需要进行为态诊治,杠杆比例以促进大型神经汇聚的数据快速传输。
Prendki以为,这种可定制的硅片在闇练大型话语模子时可能会超越有效,因为AI开发东谈主员不错凭证不同的模子来优化硬件。莫得其他公司提供这么的功能。
SambaNova还通过其配套的软件栈SambaFlow取得了告捷。Moorhead说:“在基础措施层面,SambaNova的平台阐扬出色。”SambaFlow不错分析机器学习模子,并匡助开发东谈主员再行设置SN40L以加快模子的性能。诚然SambaNova还有许多要证明的场所,但其客户包括软银和模拟器件公司。
Groq:专注于功能
优点:出色的AI推感性能
错误:目下仅限于推理当用
另一家在AI硬件上有独特更始的公司是Groq。Groq的策略是邃密结合内存和计算资源,以加快大型话语模子对辅导的反映速率。
“他们的架构超越扎眼内存。内存与处理器邃密耦合。你需要更多的节点,但每个token的价钱和性能险些苟且,”Moorhead说谈。“token”是模子处理的基本数据单元;在大型话语模子中,时常是一个词或部分词。更令东谈主印象久了的是,Groq的芯片——话语处理单元推理引擎——遴选的是GlobalFoundries的14纳米时刻,而这如故是比用于制造Nvidia H100的台积电时刻逾期几代的工艺。
2023年7月,Groq展示了其芯片的推理速率,运转Meta的Llama 3 80亿参数大型话语模子时,每秒朝上1250个token。这一阐扬以致朝上了SambaNova的演示,其推理速率朝上每秒1000个token。
高通:功耗至上
优点:平常的AI功能芯片组合
错误:贫乏用于AI闇练的大型前沿芯片
高通以Snapdragon系统级芯片知名,这款芯片为诸如三星Galaxy S24 Ultra和OnePlus 12等流行的安卓手机提供能源。高通是一家不错与AMD、Intel和Nvidia抗衡的巨头。
但与这些竞争敌手不同,高通将其AI策略更多地聚首在特定任务的AI推理和能效上。AI基准组织MLCommons的创举成员、AI优化公司Krai的CEO Anton Lokhmotov暗意,高通在枢纽的基准测试中显耀提高了其Qualcomm Cloud AI 100做事器的推聪敏商。在ResNet-50图像分类基准测试中,这些做事器的性能从180样本/瓦擢升至240样本/瓦,使用的硬件基本保持不变。
在开荒上处理土产货AI任务而无需结合到云霄的高效AI推理亦然一个上风,Lokhmotov说。一个典型例子是微软的Copilot Plus PC。微软和高通与戴尔、惠普和期许等札记本制造商配合,首批配备高通芯片的Copilot Plus札记本电脑已于7月上市。高通还在智高东谈主机和平板电脑商场占据强地面位,其Snapdragon芯片为三星、OnePlus和摩托罗拉等开荒提供能源。
高通如故AI驾驶辅助和自动驾驶平台的主要玩家。2024岁首,当代旗下的Mobius部门晓喻与高通配合,使用Snapdragon Ride平台——该平台是Nvidia Drive平台的竞争敌手——用于高档驾驶辅助系统。
超大范围数据中心:
为功耗定制智能
优点:垂直整合有助于操办
错误:超大范围数据中心可能会优先得志本身需乞降使用
超大范围数据中心(Hyperscalers)——那些部署硬件范围庞大的云计算巨头——与“大科技”同义。亚马逊、苹果、谷歌、Meta和微软齐但愿尽快部署AI硬件,既用于本身使用,也为其云计算客户做事。为加快这一进度,他们齐在里面操办芯片。
谷歌比竞争敌手更早投资于AI处理器:该公司于2015岁首次晓喻的Tensor Processing Units(TPU)如今接济着其大部分AI基础措施。第六代TPU Trillium于2023年5月晓喻,并成为谷歌AI超等计算机的一部分,这是一项针对公司处理AI任务的云做事。
Prendki说,谷歌的TPU为公司在追求AI契机时提供了上风。“我很运道,无谓牵挂讨论芯片从那儿来,”她说。但是,TPU的使用并莫得完全排斥供应焦虑,因为谷歌的不同部门仍然需要分享资源。
谷歌如故不再零丁。亚马逊领有两款自研芯片,Trainium用于闇练,Inferentia用于推理。微软领有Maia,Meta领有MTIA,而据传苹果也在开发处理其云基础措施中AI任务的硅片。
这些超大范围数据中心的芯片并未胜仗与Nvidia竞争,因为他们不向客户销售硬件,但他们照实通过云做事提供硬件拜谒,比如谷歌的AI超等计算机、亚马逊的AWS和微软的Azure。在许厚情况下,超大范围数据中心提供的做事既运转在自家硬件上,也运转在Nvidia、AMD和Intel的硬件上;而微软则被以为是Nvidia的最大客户。
中国芯片:不细成见改日
另一类竞争者的降生并非源自时刻需求,而是地缘政事践诺。好意思国对AI硬件出口的抑止肃除了芯片制造商向中国公司出售最新、最矫健的芯片。行为回答,中国公司正在操办自有AI芯片。
国内科技巨头所推出的加快器是Nvidia H100的替代品,但是,代工场的产量问题据称抑止了供应,此外,巨头还在销售“AI一体机”科罚决策,旨在为中国企业提供土产货化的AI基础措施。
为了绕过好意思国的出口料理法则,中国行业可能会转向替代时刻。举例,中国盘问东谈主员在光子芯片方面取得了进展,这种芯片欺诈光而不是电荷来进行计算。“光束的上风在于你不错让两束光交叉,”Prendki说谈。“因此,它减少了在硅芯片上时常碰到的抑止,不行交叉旅途。你不错使电路更复杂,且资本更低。”诚然光子芯片仍处于超越早期的阶段,但中国的投资可能会加快其发展。
更多空间
昭彰,Nvidia 并不艰巨竞争敌手。一样昭彰的是,在改日几年内,莫得一家竞争敌手好像挑战 Nvidia,更别说打败它了。本文华访的悉数东谈主齐首肯,Nvidia 目下占据着无与伦比的主导地位,但这并不虞味着它将永恒排挤竞争敌手。
“听着,商场需要弃取,”Moorhead 说。“若是到 2026 年,我无法设想 AMD 的商场份额会低于 10% 或 20%,英特尔亦然如斯。时常,商场可爱三家公司,而咱们有三个合理的竞争敌手。”Kimball 暗意,与此同期,超大范围公司可能会挑战 Nvidia,因为他们将更多的 AI 做事飘浮到里面硬件上。
然后还有不细目身分。Cerebras、SambaNova 和 Groq 是繁密初创公司中的杰出人物,它们但愿通过新颖的科罚决策蚕食 Nvidia 的商场份额。此外,还突出十家其他公司加入其中,包括 d-Matrix、Untether、Tenstorrent和Etched,它们齐寄但愿于针对生成式 AI 优化的新芯片架构。这些初创公司中可能有许多会失败,但也许下一个 Nvidia 会从幸存者中脱颖而出。
https://spectrum.ieee.org/nvidia-ai
半导体佳构公众号保举
专注半导体界限更多原创内容
矜恤全球半导体产业动向与趋势
*免责声明:本文由作家原创。著作内容系作家个东谈主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或援救,若是有任何异议,接待计议半导体行业不雅察。
今天是《半导体行业不雅察》为您分享的第3888内容,接待矜恤。
『半导体第一垂直媒体』
及时 专科 原创 深度
公众号ID:icbank
可爱咱们的内容就点“在看”分享给小伙伴哦