将英伟达拉下马，芯片公司出招

你的位置：保宇优配 > 恒指期货交易 > 将英伟达拉下马，芯片公司出招

将英伟达拉下马，芯片公司出招

发布日期：2024-09-18 07:20 点击次数：91

（原标题：将英伟达拉下马，芯片公司出招）

若是您但愿不错常常碰面，接待标星储藏哦~

着手：内容编译自IEEE，谢谢。

很难夸大英伟达在AI界限的主导地位。竖立于1993年的英伟达最初在个东谈主计算机图形处理单元（GPU）界限崭露头角。但是，是公司的AI芯片，而非PC图形硬件，股东英伟达置身全球最有价值公司之列。事实证明，英伟达的GPU在AI方面也阐扬出色。因此，其股价自2020岁首以来如故增长了15倍以上，收入从2019财年约120亿好意思元跃升至2024年的600亿好意思元；这家AI巨头的最先芯片如沙漠中的水一样稀缺且备受追捧。

"获取GPU对AI盘问东谈主员来说如故成了巨大的担忧，以至于他们每天齐在想考这个问题。因为莫得它们，即使领有最佳的模子，他们也无法尽情阐明，”谷歌DeepMind的AI数据细腻东谈主詹妮弗·普伦德基（Jennifer Prendki）暗意。普伦德基依赖英伟达的程度较少，因为谷歌领有我方的AI基础措施。但其他科技巨头，如微软和亚马逊，是英伟达最大的客户之一，并络续以极快的速率购买其GPU。据新闻报谈，好意思国司法部正在就英伟达芯片分派和获取问题进行反把持侦查。

英伟达在AI界限的主导地位，与机器学习的爆发一样，是最近的征象。但这种告捷源自公司数十年来的发愤，旨在将GPU建造为除渲染图形外对其他任务也有效的通用计算硬件。这一发愤不仅包括公司GPU架构的演变，后者当今领有好像加快AI使命负载的“张量中枢”，还包括其软件平台CUDA，这为开发东谈主员欺诈硬件上风提供了援救。

“他们确保每个从大学毕业的计算机科学专科学生齐掌抓了CUDA编程，”Moor Insights & Strategy的数据中心首席分析师Matt Kimball说。“他们提供器用和培训，并在盘问上干预了无数资金。”

CUDA于2006年发布，匡助开发东谈主员使用英伟达GPU的繁密中枢。这在加快高度并行的计算任务（包括当代生成式AI）方面至关紧要。英伟达在建造CUDA生态系统上的告捷使其硬件成为AI开发的最小阻力旅途。诚然英伟达芯片供不应求，但比AI硬件更难找到的，可能是训导丰富的AI开发东谈主员——而许多开发东谈主员齐熟悉CUDA。

这给了英伟达一条深厚且平常的护城河来保护其业务，但这并不虞味着它贫乏准备垂死的竞争敌手，这些敌手的策略各不相通。诚然像AMD和英特尔这么的老牌公司正在试图使用他们我方的GPU来挑战英伟达，但像Cerebras和SambaNova这么的初创公司如故开发出好像显耀提高生成式AI闇练和推理效用的更始芯片架构。它们是最有可能挑战英伟达的竞争敌手。

AMD：另一位GPU制造商

上风：AMD的GPU是劝服力澈底的英伟达替代品

颓势：软件生态系统无法与英伟达的CUDA相抗衡

在图形芯片界限，AMD与英伟达的战争已不息了近二十年。这是一场未必抗争衡的竞争。在图形处理方面，AMD的GPU在销售和心智占有率上很少打败英伟达。但是，AMD的硬件有其上风。公司的平常GPU家具组合涵盖了从札记本电脑的集成图形到领有1500亿个晶体管的AI专用数据中心GPU。该公司还早期援救并遴选了高带宽内存（HBM），这是如今全球最先进GPU所必需的一种内存表情。

“若是你看硬件……它与英伟达比拟并不忘形，”Kimball说谈，他指的是AMD的Instinct MI325X，这是一款英伟达H100的竞争敌手。“AMD在这款芯片的操办上作念得超越出色。”

MI325X霸术于本年年底推出，领有朝上1500亿个晶体管和288GB的高带宽内存，尽管其在实质应用中的阐扬尚待考证。MI325X的前身MI300X赢得了微软的好评，微软使用包括MI300X在内的AMD硬件来处理部分ChatGPT 3.5和4的做事。Meta和戴尔也部署了MI300X，Meta在其最新的谣言语模子Llama 3.1的部分开发中使用了这些芯片。

AMD仍有一个攻击需要克服：软件。AMD提供了一个开源平台ROCm来匡助开发东谈主员为其GPU编程，但它的东谈主气不如CUDA。AMD意志到了这一时弊，并在2024年7月首肯收购欧洲最大的独到AI实验室Silo AI，该实验室在使用ROCm和AMD硬件进行大范围AI闇练方面有训导。AMD还霸术收购ZT Systems，一家在数据中心基础措施方面领有专长的公司，以匡助AMD更好地为部署其硬件的客户做事。打造一个好像与CUDA匹敌的敌手绝非易事，但AMD正在任重道远。

英特尔：软件告捷

上风：Gaudi 3 AI加快器阐扬强劲

颓势：下一款大AI芯片要到2025年底才会推出

英特尔的挑战与AMD相背。英特尔艰巨英伟达的CUDA和AMD的ROCm的胜仗匹配家具，但其于2018年推出了一个开源融合编程平台OneAPI。与CUDA和ROCm不同，OneAPI涵盖多个类别的硬件，包括CPU、GPU和FPGA。因此，它不错匡助开发东谈主员在职何英特尔硬件上加快AI任务（以过甚他任务）。

另一方面，硬件是一个时弊，至少与 Nvidia 和 AMD 比拟是如斯。英特尔的 Gaudi AI 加快器是英特尔2019 年收购 AI 硬件初创公司 Habana Labs的恶果，取得了进展，最新的Gaudi 3 的性能可与 Nvidia 的 H100 相比好意思。

但是，目下尚不明晰英特尔的下一代硬件版块究竟会是什么阵势，这引起了一些担忧。Moor Insights & Strategy 创举东谈主帕特里克·穆尔黑德 (Patrick Moorhead ) 暗意：“Gaudi 3 超越矫健。”但他暗意，放置 2024 年 7 月，“还莫得 Gaudi 4”。

相背，英特尔霸术转向一款齐人攫金的芯片，代号为 Falcon Shores，该芯片遴选基于区块的模块化架构，结合了英特尔x 86 CPU 内核和 Xe GPU 内核；后者是英特尔最近进军图形硬件界限的一部分。不外，英特尔尚未显露计议 Falcon Shores 架构和性能的详备信息，预测要到 2025 年底才会发布。

Cerebras：越大越好

优点：晶圆级芯片每颗芯片提供矫健的性能和内存

错误：由于尺寸和资本，应用界限有限

不错笃信的是，AMD和Intel是Nvidia最具信得过度的挑战者。它们在操办告捷芯片和构建编程平台方面有着悠久的历史。但在范围较小、未训导证的玩家中，有一个脱颖而出：Cerebras。

这家公司专注于超等计算机的AI，于2019年推出了Wafer Scale Engine，这是一块巨大的晶圆级硅片，领有1.2万亿个晶体管。最新版块Wafer Scale Engine 3将这一数字擢升到了4万亿个晶体管。行为比较，Nvidia最新最大的GPU——B200，"仅"领有2080亿个晶体管。Cerebras围绕这个晶圆级怪物构建的计算机CS-3，恰是Condor Galaxy 3的中枢，该超等计算机将由64台CS-3构成，处理高达8 exaflop的AI计算任务。G42，一家总部位于阿布扎比的企业集团，霸术使用该系统闇练改日的前沿大型话语模子。

“这有点偏向于特定的应用，而不是通用型的，”Bernstein Research的高档分析师Stacy Rasgon说。“并不是每个东谈主齐会购买这些计算机。但他们有一些客户，比如好意思国国防部和Condor Galaxy 3超等计算机。”

Cerebras的WSC-3在大多数情况下不会挑战Nvidia、AMD或Intel的硬件；它太大、太崇高、太专科化了。但它可能在超等计算机界限为Cerebras提供独特上风，因为莫得其他公司操办晶圆范围的芯片。

SambaNova：

为Transformer而生的变形架构

优点：可设置的架构有助于开发东谈主员优化AI模子的效用

错误：硬件还需要证明对世界商场的计议性

竖立于2017年的SambaNova是另一家欺诈非传统芯片架构科罚AI闇练问题的芯片操办公司。其旗舰家具SN40L遴选公司所谓的“可重构数据流架构”，由存储器和计算资源的模块构成。这些模块之间的结合不错凭证需要进行为态诊治，杠杆比例以促进大型神经汇聚的数据快速传输。

Prendki以为，这种可定制的硅片在闇练大型话语模子时可能会超越有效，因为AI开发东谈主员不错凭证不同的模子来优化硬件。莫得其他公司提供这么的功能。

SambaNova还通过其配套的软件栈SambaFlow取得了告捷。Moorhead说：“在基础措施层面，SambaNova的平台阐扬出色。”SambaFlow不错分析机器学习模子，并匡助开发东谈主员再行设置SN40L以加快模子的性能。诚然SambaNova还有许多要证明的场所，但其客户包括软银和模拟器件公司。

Groq：专注于功能

优点：出色的AI推感性能

错误：目下仅限于推理当用

另一家在AI硬件上有独特更始的公司是Groq。Groq的策略是邃密结合内存和计算资源，以加快大型话语模子对辅导的反映速率。

“他们的架构超越扎眼内存。内存与处理器邃密耦合。你需要更多的节点，但每个token的价钱和性能险些苟且，”Moorhead说谈。“token”是模子处理的基本数据单元；在大型话语模子中，时常是一个词或部分词。更令东谈主印象久了的是，Groq的芯片——话语处理单元推理引擎——遴选的是GlobalFoundries的14纳米时刻，而这如故是比用于制造Nvidia H100的台积电时刻逾期几代的工艺。

2023年7月，Groq展示了其芯片的推理速率，运转Meta的Llama 3 80亿参数大型话语模子时，每秒朝上1250个token。这一阐扬以致朝上了SambaNova的演示，其推理速率朝上每秒1000个token。

高通：功耗至上

优点：平常的AI功能芯片组合

错误：贫乏用于AI闇练的大型前沿芯片

高通以Snapdragon系统级芯片知名，这款芯片为诸如三星Galaxy S24 Ultra和OnePlus 12等流行的安卓手机提供能源。高通是一家不错与AMD、Intel和Nvidia抗衡的巨头。

但与这些竞争敌手不同，高通将其AI策略更多地聚首在特定任务的AI推理和能效上。AI基准组织MLCommons的创举成员、AI优化公司Krai的CEO Anton Lokhmotov暗意，高通在枢纽的基准测试中显耀提高了其Qualcomm Cloud AI 100做事器的推聪敏商。在ResNet-50图像分类基准测试中，这些做事器的性能从180样本/瓦擢升至240样本/瓦，使用的硬件基本保持不变。

在开荒上处理土产货AI任务而无需结合到云霄的高效AI推理亦然一个上风，Lokhmotov说。一个典型例子是微软的Copilot Plus PC。微软和高通与戴尔、惠普和期许等札记本制造商配合，首批配备高通芯片的Copilot Plus札记本电脑已于7月上市。高通还在智高东谈主机和平板电脑商场占据强地面位，其Snapdragon芯片为三星、OnePlus和摩托罗拉等开荒提供能源。

高通如故AI驾驶辅助和自动驾驶平台的主要玩家。2024岁首，当代旗下的Mobius部门晓喻与高通配合，使用Snapdragon Ride平台——该平台是Nvidia Drive平台的竞争敌手——用于高档驾驶辅助系统。

超大范围数据中心：

为功耗定制智能

优点：垂直整合有助于操办

错误：超大范围数据中心可能会优先得志本身需乞降使用

超大范围数据中心（Hyperscalers）——那些部署硬件范围庞大的云计算巨头——与“大科技”同义。亚马逊、苹果、谷歌、Meta和微软齐但愿尽快部署AI硬件，既用于本身使用，也为其云计算客户做事。为加快这一进度，他们齐在里面操办芯片。

谷歌比竞争敌手更早投资于AI处理器：该公司于2015岁首次晓喻的Tensor Processing Units（TPU）如今接济着其大部分AI基础措施。第六代TPU Trillium于2023年5月晓喻，并成为谷歌AI超等计算机的一部分，这是一项针对公司处理AI任务的云做事。

Prendki说，谷歌的TPU为公司在追求AI契机时提供了上风。“我很运道，无谓牵挂讨论芯片从那儿来，”她说。但是，TPU的使用并莫得完全排斥供应焦虑，因为谷歌的不同部门仍然需要分享资源。

谷歌如故不再零丁。亚马逊领有两款自研芯片，Trainium用于闇练，Inferentia用于推理。微软领有Maia，Meta领有MTIA，而据传苹果也在开发处理其云基础措施中AI任务的硅片。

这些超大范围数据中心的芯片并未胜仗与Nvidia竞争，因为他们不向客户销售硬件，但他们照实通过云做事提供硬件拜谒，比如谷歌的AI超等计算机、亚马逊的AWS和微软的Azure。在许厚情况下，超大范围数据中心提供的做事既运转在自家硬件上，也运转在Nvidia、AMD和Intel的硬件上；而微软则被以为是Nvidia的最大客户。

中国芯片：不细成见改日

另一类竞争者的降生并非源自时刻需求，而是地缘政事践诺。好意思国对AI硬件出口的抑止肃除了芯片制造商向中国公司出售最新、最矫健的芯片。行为回答，中国公司正在操办自有AI芯片。

国内科技巨头所推出的加快器是Nvidia H100的替代品，但是，代工场的产量问题据称抑止了供应，此外，巨头还在销售“AI一体机”科罚决策，旨在为中国企业提供土产货化的AI基础措施。

为了绕过好意思国的出口料理法则，中国行业可能会转向替代时刻。举例，中国盘问东谈主员在光子芯片方面取得了进展，这种芯片欺诈光而不是电荷来进行计算。“光束的上风在于你不错让两束光交叉，”Prendki说谈。“因此，它减少了在硅芯片上时常碰到的抑止，不行交叉旅途。你不错使电路更复杂，且资本更低。”诚然光子芯片仍处于超越早期的阶段，但中国的投资可能会加快其发展。

更多空间

昭彰，Nvidia 并不艰巨竞争敌手。一样昭彰的是，在改日几年内，莫得一家竞争敌手好像挑战 Nvidia，更别说打败它了。本文华访的悉数东谈主齐首肯，Nvidia 目下占据着无与伦比的主导地位，但这并不虞味着它将永恒排挤竞争敌手。

“听着，商场需要弃取，”Moorhead 说。“若是到 2026 年，我无法设想 AMD 的商场份额会低于 10% 或 20%，英特尔亦然如斯。时常，商场可爱三家公司，而咱们有三个合理的竞争敌手。”Kimball 暗意，与此同期，超大范围公司可能会挑战 Nvidia，因为他们将更多的 AI 做事飘浮到里面硬件上。

然后还有不细目身分。Cerebras、SambaNova 和 Groq 是繁密初创公司中的杰出人物，它们但愿通过新颖的科罚决策蚕食 Nvidia 的商场份额。此外，还突出十家其他公司加入其中，包括 d-Matrix、Untether、Tenstorrent和Etched，它们齐寄但愿于针对生成式 AI 优化的新芯片架构。这些初创公司中可能有许多会失败，但也许下一个 Nvidia 会从幸存者中脱颖而出。

https://spectrum.ieee.org/nvidia-ai

半导体佳构公众号保举

专注半导体界限更多原创内容

矜恤全球半导体产业动向与趋势

*免责声明：本文由作家原创。著作内容系作家个东谈主不雅点，半导体行业不雅察转载仅为了传达一种不同的不雅点，不代表半导体行业不雅察对该不雅点赞同或援救，若是有任何异议，接待计议半导体行业不雅察。

今天是《半导体行业不雅察》为您分享的第3888内容，接待矜恤。

『半导体第一垂直媒体』

及时专科原创深度

公众号ID：icbank

可爱咱们的内容就点“在看”分享给小伙伴哦

上一篇：汤加群岛发生5.9级地震震源深度10千米

下一篇：GaN，新拐点?

让建站和SEO变得简单