AMD在芯片战场上的战略定位:LisaSu专访揭示与英伟达和Intel的竞争态势
- 时间:
- 浏览:0
- 来源:佳苑鑫源网络科技
大家好,今天我来为大家详细地介绍一下关于英特尔、AMD、英伟达,三大厂商同台竞技混合GPU+CPU的问题。以下是我对这个问题的总结和归纳,希望能对大家有所帮助。
文章目录列表:
英特尔、AMD、英伟达,三大厂商同台竞技混合GPU+CPU
如果说英伟达的Grace CPU超级芯片的架构是CPU+GPU是巧合,那么英特尔和AMD推出的Falcon Shores XPU芯片、Instinct MI300芯片同样是CPU+GPU结构时,CPU+GPU一体的架构就很难称之为巧合了。
更为“碰巧”的是,以上三种芯片其都是用于数据中心的场景,这就意味着在未来两年内,AMD、英伟达和英特尔都将拥有混合CPU+GPU芯片进入数据中心市场。
可以说CPU+GPU的形式已经成为未来芯片设计的趋势。
英特尔推出XPU
英特尔宣布了一款特殊的融合型处理器“Falcon Shores”,官方称之为XPU。其核心是一个新的处理器架构,将英特尔的x86 CPU和Xe GPU硬件置入同一颗Xeon芯片中。
Falcon Shores芯片基于区块(Tile)设计,具备非常高的伸缩性、灵活性,可以更好地满足HPC、AI应用需求。
按照英特尔给出的数字,对比当今水平,Falcon Shores的能耗比提升超过5倍,x86计算密度提升超过5倍,内存容量与密度提升超过5倍。
Falcon Shores芯片将在2024年推出。
AMD推出APU
在数据中心领域,AMD同样展示其野心。
APU是AMD传统上用于集成显卡的客户端CPU的“加速处理单元”命名法。自2006年Opteron CPU的鼎盛时期以来,AMD一直梦想着使用APU,并于2010年开始推出 款用于PC的APU。随后在索尼Play Station4和5以及微软Xbox XS中推出了定制APU系列 游戏 机,也推出了一些Opteron APU——2013年的X2100和2017年的X3000。
最近,AMD公布的路线图中显示,其将在2023年推出Instinct MI300芯片,这是AMD推出的 款百亿亿次APU,AMD将其称为“ 上 个数据中心APU”。
而这个APU是一种将CPU和GPU内核组合到一个封装中的芯片,仔细来说是将基于Zen4的Epyc CPU与使用其全新CDNA3架构的GPU相结合。
AMD表示Instinct MI300预计将比其Instinct MI250X提供超过8倍的AI训练性能提升,与支持Instinct MI200系列的CDNA2 GPU架构相比,用于Instinct MI300的CDNA3架构将为AI工作负载提供超过5倍的性能功耗比提升。
Instinct MI300将于2023年问世。
英伟达Grace超级芯片
一直专注于GPU设计的英伟达,在去年宣布进军基于Arm架构的CPU时引发了一阵轰动。在今年3月,英伟达推出解决HPC和大规模人工智能应用程序的Grace Hopper超级芯片。这款芯片将NVIDIA Hopper GPU与Grace CPU通过NVLink-C2C结合在一个集成模块中。
CPU+GPU的Grace Hopper核心数减半,LPDDR5X内存也只有512GB,但多了显卡的80GBHBM3内存,总带宽可达3.5TB/s,代价是功耗1000W,每个机架容纳42个节点。
英伟达同样承诺在2023年上半年推出其超级芯片。
从推出的时间节点来看,英特尔Falcon Shores芯片、AMD Instinct MI300、英伟达Grace Hopper超级芯片分别在2024年、2023年、2023年上半年推出。
CPU+GPU的形式,为什么引起了三大巨头的兴趣,纷纷将其布局于数据中心?
首先,在数字经济时代,算力正在成为一种新的生产力,广泛融合到 社会 生产生活的各个方面。数据中心是算力的物理承载,是数字化发展的关键基础设施。全球数据中心新增稳定,2021年全球数据中戏市场规模超过679亿美元,较2020年增长9.8%。因此,具有巨大市场的数据中心早已被 科技 巨头紧盯。
其次,数据中心会收集大量的数据,因此需要搭建于数据中心的芯片具有极大算力,将CPU与GPU组合可以提高算力。英特尔高级副总裁兼加速计算系统和图形(AXG)集团总经理Raja Koduri的演讲中提及,如果想要成功获得HPC市场,就需要芯片能够处理海量的数据集。尽管,GPU具有强大的计算能力,能够同时并行工作数百个的内核,但如今独立的GPU仍然有一大缺陷,就是大的数据集无法轻松放入独立GPU内存里,需要耗费时间等待显存数据缓慢刷新。
特别是内存问题,将CPU与GPU放入同一架构,能够消除冗余内存副本来改善问题,处理器不再需要将数据复制到自己的专用内存池来访问/更改该数据。 内存池还意味着不需要第二个内存芯片池,即连接到CPU的DRAM。例如,Instinct MI300将把CDNA3 GPU小芯片和Zen4 CPU小芯片组合到一个处理器封装中,这两个处理器池将共享封装HBM内存。
英伟达官方表示,使用NVLink-C2C互连,Grace CPU将数据传输到Hopper GPU的速度比传统CPU快15倍;但对于数据集规模超大的场景来说,即使有像NVLink和AMD的Infinity Fabric这样的高速接口,由于HPC级处理器操作数据的速度非常快,在CPU和GPU之间交换数据的延迟和带宽代价仍然相当高昂。因此如果能尽可能缩短这一链路的物理距离,就可以节约很多能源并提升性能。
AMD表示,与使用分立CPU和GPU的实现相比,该架构的设计将允许APU使用更低的功耗;英特尔同样表示,其Falcon Shores芯片将显着提高带宽、每瓦性能、计算密度和内存容量。
整合多个独立组件往往会带来很多长期收益,但并不只是将CPU与GPU简单整合到一颗芯片中。英特尔、英伟达及AMD的GPU+CPU均是选择了Chiplet方式。
传统上,为了开发复杂的 IC 产品,供应商设计了一种将所有功能集成在同一芯片上的芯片。在随后的每一代中,每个芯片的功能数量都急剧增加。在最新的 7nm 和 5nm 节点上,成本和复杂性飙升。
而使用Chiplet设计,将具有不同功能和工艺节点的模块化芯片或小芯片封装在同一芯片,芯片客户可以选择这些小芯片中的任何一个,并将它们组装在一个先进的封装中,从而产生一种新的、复杂的芯片设计,作为片上系统 (SoC) 的替代品。
正是由于小芯片的特性,三家巨头在自己发展多芯片互连的同时,还展开了定制服务。
英特尔在发布Falcon Shores时介绍,其架构将使用Chiplet方法,采用不同制造工艺制造的多个芯片和不同的处理器模块可以紧密地塞在一个芯片封装中。这使得英特尔可以在其可以放入其芯片的CPU、GPU、I/O、内存类型、电源管理和其他电路类型上进行更高级别的定制。
最特别的是,Falcon Shores可以按需配置不同区块模块,尤其是x86CPU核心、XeGPU核心,数量和比例都非常灵活,就看做什么用了。
目前,英特尔已开放其 x86 架构进行许可,并制定了Chiplet策略,允许客户将 Arm 和 RISC-V 内核放在一个封装中。
最近,AMD同样打开了定制的大门。AMD首席技术官Mark Papermaster在分析师日会议上表示:“我们专注于让芯片更容易且更灵活实现。”
AMD允许客户在紧凑的芯片封装中实现多个芯粒(也称为chiplet或compute tiles )。AMD已经在使用tiles,但现在AMD允许第三方制造加速器或其他芯片,以将其与x86 CPU和GPU一起包含在其2D或3D封装中。
AMD的定制芯片战略将围绕新的Infinity Architecture 4.0展开,它是芯片封装中芯粒的互连。专有的Infinity结构将与CXL 2.0互连兼容。
Infinity互连还将支持UCIe(Universal Chiplet Interconnect Express)以连接封装中的chiplet。UCIe已经得到英特尔、AMD、Arm、谷歌、Meta等公司的支持。
总体而言,AMD的服务器GPU轨迹与英特尔、英伟达非常相似。这三家公司都在向CPU+GPU组合产品方向发展,英伟达的GraceHopper(Grace+H100)、英特尔的Falcon Shores XPU(混合和匹配CPU+GPU),现在MI300在单个封装上同时使用CPU和GPU小芯片。在所有这三种情况下,这些技术旨在将最好的CPU和最好的GPU结合起来,用于不完全受两者约束的工作负载。
市场研究公司Counterpoint Research的研究分析师Akshara Bassi表示:“随着芯片面积变得越来越大以及晶圆成品率问题越来越重要,多芯片模块封装设计能够实现比单芯片设计更佳的功耗和性能表现。”
Chiplet将继续存在,但就目前而言,该领域是一个孤岛。AMD、苹果、英特尔和英伟达正在将自研的互连设计方案应用于特定的封装技术中。
2018 年,英特尔将 EMIB(嵌入式多硅片)技术升级为逻辑晶圆 3D 堆叠技术。2019 年,英特尔推出 Co-EMIB 技术,能够将两个或多个 Foveros 芯片互连。
AMD率先提出Chiplet模式,在2019年全面采用小芯片技术获得了技术优势。Lisa Su 在演讲时表达了未来的规划,“我们与台积电就他们的 3D 结构密切合作,将小芯片封装与芯片堆叠相结合,为未来的高性能计算产品创建 3D 小芯片架构。”
今年 3 月 2 日,英特尔、AMD、Arm、高通、台积电、三星、日月光、谷歌云、Meta、微软等十大巨头宣布成立 Chiplet 标准联盟,推出了通用小芯片互连标准 (UCIe),希望将行业聚合起来。
迄今为止,只有少数芯片巨头开发和制造了基于Chiplet的设计。由于先进节点开发芯片的成本不断上升,业界比以往任何时候都更需要Chiplet。在多芯片潮流下,下一代顶级芯片必然也将是多芯片设计。
撰文?/?钱亚光
编辑?/?涂彦平
设计?/?赵昊然
题图?/?张?萌
在半导体行业,产品开发和市场成熟所耗费的时间往往非常长,相比之下,资产雄厚的大公司通过并购规模相对较小且具备技术实力的公司,要比自己从零开始更 ,风险也会更小。因此,在此领域并购 发。
在今年数起大规模并购中,市值约为1000亿美元的AMD要以300亿美元的股票代价收购市值300多亿美元的赛灵思(Xilinx)的传闻,虽然不是涉及金额最大,但因成功的可能性较高而备受关注。
近年来,随着汽车电气化、智能化、网联化的推进,半导体部件广泛应用于汽车各子系统,汽车半导体成汽车电动化与智能化的直接受益者。
智能网联和自动驾驶等技术的兴起,智能汽车对于计算和数据处理能力需求急剧增加,给了英特尔、AMD、高通、英伟达等老牌芯片厂商进入汽车芯片市场的机会。
异构计算已经成行业趋势
随着智能车联网系统、低阶自动驾驶、基于5G的车路协同等人工智能的场景化落地,像CPU这样的通用处理器已无法满足多元化人工智能应用的需求,具有高并行、高密集计算能力的异构计算就成了人工智能时代的必然选择。而异构部分变得比核心CPU更加重要,因为整体异构计算的性能主要看异构部分而不是CPU。
所谓异构计算,即使用不同类型指令集体系架构的计算单元组成系统的计算方式,常见的计算单元类别包括CPU、GPU、ASIC( lication?Specific?Integrated?Circuit,专用集成电路)、FPGA(Field?Programmable?Gate?Array,现场可编程门阵列)等。
这里的CPU是执行通用计算的核心硬件单元,其他则是异构计算单元。其中GPU也是通用计算工具,适合大量数据的并行计算;ASIC是针对专项任务的定制计算工具,能够在特定功能上进行强化;FPGA则是可以通过刷新固件改变功能的半定制计算工具,将这些计算单元组合在一起,就能形成适应性广泛、功能更强、效率更高的异构计算系统。
2020年,芯片领域的大额并购屡见不鲜。一方面,年初的疫情导致不少半导体企业面临生存与发展危机,抱团取暖成为重要自救手段;另一方面,半导体行业对通信、汽车等众多产业的影响越来越高,行业内部竞争也越来越激烈,使得巨头们不得不通过并购进一步壮大自身实力。
芯片行业并购 发,规模惊人
今年4月,专注于汽车行业的英飞凌集团(Infineon)以90亿欧元吞并了美国竞争对手赛普拉斯(Cypress)。英飞凌的产品组合,几乎覆盖所有主要的汽车应用;而赛普拉斯的加入,进一步增强了其娱乐系统、人机交互、触控屏幕和互联方面的实力。
7月,美国模拟芯片巨头亚诺德(ADI)以210亿美元的价格成功收购其竞争对手美信公司(Maxim),亚德诺在自动驾驶芯片、智能驾舱等方面有独到之处;而美信的技术,全面支持自动驾驶及驾驶辅助系统、车联网系统所需的宽带、复杂互连和数据完整性。
9月,英伟达宣布将以400亿美元的价格从软银手中收购芯片设计公司ARM。由于ARM架构的低能耗CPU被广泛使用在移动通讯领域、消费电子产品以及汽车领域,作为GPU霸主英伟达,如果能在CPU上占据优势,无疑在未来的异构计算中掌握更的主动权,有更多胜算,但交易对众多芯片厂商影响巨大,是否能成功,还未可知。
10月上旬,据外媒报道,AMD正与赛灵思进行谈判,商讨并购事宜。这笔交易的规模可能高达300亿美元,从而创下AMD有史以来最大的一笔收购交易。
AMD是全球 的微处理器制造商,其CPU、GPU、主板芯片组等产品覆盖计算机、通信和消费电子等各个领域。赛灵思是全球规模最大的FPGA芯片制造商,其研发的FPGA芯片、软件设计工具等产品也广泛覆盖人工智能、数据中心和自动驾驶等领域。
作为在CPU领域可与英特尔一争高下的角色、在GPU领域英伟达最强劲的对手,AMD并购在FPGA领域的 公司赛灵思,自然引起了业界的高度关注。其实,这一方面是AMD针对异构计算时代到来的应对动作,另一方面也是AMD和英特尔面对未来的又一次角逐。
AMD与英特尔的半世纪情仇
英特尔与AMD是电脑CPU的主要玩家,近年来它们的竞争越发激烈。AMD于1969年在硅谷创立,仅比英特尔成立晚一年,AMD创始人杰里·桑德斯(Jerry?Sanders)与英特尔创始人罗伯特·诺伊斯(Robert?Noyce)、戈登·摩尔(Gordon?Moore)都曾就职于仙童半导体。
英特尔受到投资者青睐,资金充裕,1971年推出 块微处理器4004,并逐渐发展成为 上技术 的半导体制造厂商。而此时的AMD由于缺乏资金,只能凭借杰里·桑德斯对半导体行业的了解,做半导体领域的贸易商,到1974年,AMD成为各类半导体产品的第二大供应商。此时英特尔和AMD是合作伙伴关系。
1970到1980年代,PC巨头IBM公司对操作系统和CPU采取了外包策略,要求微处理器供应商英特尔将X86系列处理器授权给AMD生产。这样,AMD作为第二供应商与英特尔一起向IBM供货。
1987年,英特尔为了谋求自己微处理器 供应的地位,提前结束了Intel?80386系列芯片的技术授权,AMD将英特尔告上法庭,直到8年后,AMD才拿到386知识产权。
此后,AMD利用X86的知识产权大搞自主研发,其K系列微处理器对英特尔的奔腾处理器发起反击。1999年,AMD抢先跨越CPU主 1GHz的大关,2003年又推出兼容X86前期产品的64位速龙芯片。2004年,AMD在台式机市场上占有了50%的份额, 在市场份额上超过了英特尔。
2005年,英特尔推出“钟摆(Tick-Tock)”策略,每隔两年就会推出新的制程技术,然后隔年推出新的微构架,开启“黄金十年”。而AMD由于2006年花54亿美元收购了图形芯片制造商ATI,债务大规模增长,加上芯片设计问题导致新产品发布推迟,随后营收和利润螺旋式下降,跌入“失落十年”。
AMD?CEO苏姿丰(Lisa?Su)
到2014年,以擅长为走下坡半导体公司找出路而闻名的苏姿丰(Lisa?Su)出任AMD的CEO,她曾在IBM、飞思卡尔和德州仪器担任技术性职位,和英伟达公司创始人黄仁勋同为中国台湾台南人,而且是亲戚(苏姿丰外公和黄仁勋母亲是兄妹)。
她上任后,抛弃了运营费用昂贵的晶圆厂,并将工作外包给台积电,将研发方向聚焦在高性能计算市场,重点市场包括数据中心、个 脑、游戏主机等,新处理器架构在笔记本电脑和台式机领域重新打开了局面,在许多性能基准上与英特尔匹敌甚至超越,一举扭转了AMD的颓势。
2017年ADM推出了Zen架构处理器,公司股价也从2015年不到2美元/股逐步恢复到约50美元/股。现在,Zen系列处理器目前已经更新到第三代,在市场上与英特尔Gen系列处理器分庭抗礼。
2020年10月9日,AMD正式揭晓了搭配台积电7nm工艺全新的Zen?3?CPU架构,以及最新一代锐龙5000系列桌面处理器,同时展示了计划于2022年前推出的基于5nm工艺Zen?4架构CPU。
与此同时,由于7nm流程的产量问题,英特尔原定于2021年1月发布的7nm制程CPU生产时间将推后约6个月。因此,英特尔在产品上已经远远落后于7nm架构Ryzen芯片已上市的AMD。
英特尔CEO罗伯特·斯旺?(Robert?Swan)
英特尔CEO罗伯特·斯旺表示,正在考虑将把自家设计的芯片外包给台积电生产,这意味着英特尔放弃了五十年来的主要竞争优势——集芯片设计、制造于一身。
此前苹果宣布结束近15年来对英特尔的依赖,转而使用Arm架构自研CPU,这对英特尔无疑也是个坏消息。
AMD为何看上赛灵思
赛灵思于?1984?年发明了 ?FPGA,也是目前FPGA市场的 ,2019年份额达52%, 于英特尔的35%,年收入超过30亿美元。赛灵思长期以来一直不断地将其业务扩展至人工智能、数据中心、通讯和自动驾驶等领域,通过其FPGA处理器和软件 等产品,逐步构建起自己的FPGA生态。
其中,赛灵思在汽车领域的全球合作伙伴超过两百家,涵盖了全球所有主流的Tier?1、整车制造商以及各种初创型企业。截至目前,全球汽车系统中应用了超过1.9亿片赛灵思车规级器件,其中有超过7500万片专门用于量产型ADAS。
根据拓墣产业研究院今年9月发布的2020年第二季度全球前10大IC设计公司营收排名中,AMD以19.32亿美元的营收排名第五,同比增长26.2%;赛灵思则以7.27亿美元营收位列第六,同比下滑14.5%。
赛灵思和AMD一直以来合作紧密,此前赛灵思为AMD?EPYC(霄龙)数据中心处理器提供的一系列面向存储系统的IP,可以帮助AMD构建低延时的 数据通路,从而实现 的FPGA存储加速功能。
两者还合作开发了用于数据中心的高性能推理系统,该系统包括8个由赛灵思提供的Alveo?U250加速器卡,主要用于进行实时机器学习、视 处理和数据分析,在GoogleLeNet卷积神经网络上达到了每秒30000张图像的推理吞吐量,打破了推理性能的 纪录。
从两家公司的合作来看,AMD的服务器搭配赛灵思的加速器卡,能够促进双方释放潜能。如果AMD成功收购赛灵思,产品的契合度可能会进一步提升。
在技术发展上,赛灵思除了保持FPGA方面的优势,还从FPGA慢慢转换到了基于FPGA+AI引擎的SoC结构,并花了超过10亿美元和四年时间来开发自适应计算加速 ACAP。ACAP是一个高度集成的多核异构计算 ,核心是新一代的?FPGA?架构,适用于加速广泛的应用,其中包括视 转码、数据库、数据压缩、搜索、AI推断、基因组学、机器视觉、计算存储及网络加速等。
这种 的目标针对半导体市场增长领域,包括数据中心、无线5G通信、航空和国防雷达、汽车驾驶员辅助(ADAS)和有线通信。这些技术可能也是AMD收购赛灵思的重要原因。
赛灵思CEO?Victor?Peng
两家公司还有一个联系,赛灵思CEO?Victor?Peng在2008年加入赛灵思之前,是AMD图形产品组(GPG)硅工程应用的公司副总裁,并且是AMD负责图形、主机游戏、CPU芯片组和消费者业务的中央硅工程团队的负责人。
他曾表示,作为FPGA的领头羊,赛灵思的竞争对手不再是Altera,而是英伟达和英特尔的处理器业务。
近几年,在PC市场不断萎缩且移动市场迟迟难以打开的背景下,英特尔通过收购,在产品上遍及了边缘计算、数据中心,从CPU、FPGA到ASIC等各种异构计算业务支撑,希望能够拓展PC以外的新业务。
比如2016年,英特尔花费167亿美元收购FPGA市场的老二Altera;2017年,英特尔花费153亿美元收购在ADAS和自动驾驶 的以色列Mobileye,之前还收购了数家自动驾驶相关的初创公司;2018年,英特尔宣布收购芯片制造商eASIC,将结构化的ASIC和FPGA进行互补;2019年,英特尔以20亿美元重金收购生产可编程的深度学习加速器的Habana?Labs。
这些举动给AMD带来了巨大的压力,在PC上取得全面突破后,想要全面挑战英特尔,势必也要加强在异构计算方面的实力,尽快开拓边缘计算、数据中心方面的新市场,因此,掌握异构计算一大计算单元类型FPGA的赛灵思成为AMD的理想收购对象。
赛灵思虽然占据了50%以上的FPGA市场份额,但由于该细分市场规模过小,在过去十年中都没有大量的收入增长,早在2011年创造了24亿美元的营收,但直到2019年,营收才突破30亿美元。
由于华为在2019年占赛灵思营收的比例高达6%-8%,因此美国政府针对华为的技术出口禁令,让赛灵思的业务受到了不小冲击,2020财年第四季度营收7.56亿美元,同比下滑8.7%,净利润下跌20%。而AMD恰好刚刚获得了美国商务部的许可,能够向华为供货,如果这桩收购案成功落地,赛灵思也将有望恢复对华为的供货。
如果这次收购赛灵思成功,AMD将会成为 一家整合了CPU、GPU、FPGA产品线的芯片开发商,迈出走向下一代异构计算的重要一步,还将有机会将产品触角深入到人工智能、物联网、航空、汽车、5G通信等以前基本没有布局的领域,增加与英特尔、英伟达等抗衡的资本,这将给整个半导体市场乃至用户带来更多的益处。
本文来源于汽车之家车家号作者,不代表汽车之家的观点立场。
好了,今天关于“英特尔、AMD、英伟达,三大厂商同台竞技混合GPU+CPU”的话题就讲到这里了。希望大家能够对“英特尔、AMD、英伟达,三大厂商同台竞技混合GPU+CPU”有更深入的认识,并且从我的回答中得到一些帮助。
猜你喜欢