英特尔从英伟达手中夺走了人工智能技术的领导地位

作者:

日期:2022-05-20

观点总结

  • 英特尔最近推出了7nm Gaudi2 AI训练NPU。它的性能比英伟达目前的A100高出2倍。
  • Gaudi2在Gaudi发布一年后推出。虽然由于即将到来的H100,Gaudi2的领导地位只会是短暂的,但现在的势头似乎对Habana(哈巴那)有利。
  • 这花了很长时间,但英特尔终于在2022年将其AI行动起来。这可能会给英伟达带来巨大的压力。
Intel

上述观点的理论基础

任何熟悉英伟达(NVDA)战略的人都知道,该公司在软件和硬件方面都全力以赴。人工智能是英伟达在最近的投资者日声称的1万亿美元市场机会的核心技术。未来,英伟达设想所有企业都将建设AI数据中心。

然而,英伟达并不是唯一一家追求这一市场机会的公司。多年后,英特尔(终于在2022年将其人工智能行动整合在一起,形成了一股合力。这可能会对英伟达的市场份额产生不利影响,反之,为英特尔开辟了一个非常有利可图的新市场。特别是,英特尔刚刚推出了最新的Habana AI引擎部分,将英伟达当前一代A100 NPU 处理器按在地上摩擦。这意味着英伟达的人工智能训练领导力终于受到了严峻的挑战。

论据概述

英特尔拥有多管齐下的人工智能战略。基本上,英特尔的战略是为其所有芯片注入人工智能功能。因此,当你听到像AMD这样的公司大肆宣传将Xilinx AI纳入其芯片时,英特尔实际上多年来一直在追求类似的战略。特别是以下这些行动:

  • 在CPU中,英特尔利用其AVX-512的领先地位,并将其与特定的8位和16位AI指令相结合。在即将到来的Sapphire Rapids Xeon中,英特尔将最终推出一个名为AMX的成熟AI加速器,使Nvidia的中端AI加速器过时。(英特尔声称性能是Ice Lake的30倍,尽管我估计理论上的TOPS改进约为10倍)。
  • 在FPGA中,英特尔几年前推出了相当于英伟达Tensor Cores的FPGA,尽管这部分仍然在14nm的工艺制程上。
  • 在GPU中,英特尔即将推出的Ponte Vecchio应该与Nvidia即将推出的Hopper相当。
  • 除了这种“传统”芯片之外,英特尔还拥有专用的Habana NPU(神经处理单元)用于训练和推理。

具体产品举例论证:Habana NPU(神经处理单元)

需要明确的是,我一直非常批评英特尔的Habana(哈巴那)战略和执行。特别是考虑到英特尔将很快以其Ponte Vecchio GPU的形式拥有与Nvidia类似的竞争产品,因此Habana加速器的必要性尚不清楚。鉴于去年在AWS上推出的Gaudi(高迪)部分采用过时的16nm工艺,情况更是如此。

然而,Habana(哈巴那)/Gaudi(高迪)在性能上缺乏的东西,它在定价上弥补了这一点。英特尔/哈瓦那声称,与A100相比,它的性能/价格提高了40%。Habana(哈巴那)能够以四种方式实现这一目标。

首先,作为一个专用的NPU,Gaudi(高迪)缺乏所有的GPU功能。这允许更多的深度学习硬件,这使得Gaudi(高迪)比英伟达的16nm V100部分更快,因此与7nm A100相比降低了性能增量。其次,Gaudi1不仅比V100快,而且硅芯片面积更小,制造成本更低。第三,16nm晶圆本质上比7nm晶圆便宜,进一步扩大了成本差距。最后,英伟达正在通过收取超高利润率的价格,最大限度地利用其在人工智能训练方面的垄断地位。通过放弃一些毛利率,Habana(哈巴那)最终能够提供16nm零件,与英伟达的产品相比,每美元价格具有有利的性能。

Gaudi(高迪2

尽管如此,显而易见的下一步行动是迁移到7nm工艺制程上,这就是Habana刚刚用Gaudi2推出时用到的工艺制程。值得注意的是,Gaudi2 在 Gaudi1 在 AWS 中推出大约半年后推出,或者在 Gaudi1 首次发布 1.5 年后推出。因此,虽然Habana(哈巴那)在工艺技术方面仍然落后,但正如A100在大约两年前推出的那样,这种快速的步伐确实恢复了对Habana(哈巴那)执行的信心。

与Gaudi1相比,Gaudi2的核心器件数量增加了两倍。这使得Habana(哈巴那够声称比A100具有2倍的性能优势,这是在许多基准测试中衡量的(如下所示)。换句话说,Habana(哈巴那目前在AI性能方面具有明确的领导地位(忽略了Cerebras的晶圆级引擎)。此外,Gaudi2还超越了A100的80GB内存,并且像第一代Gaudi一样,仍然依赖于开放式以太网互连,而不是Nvidia专有的NVLink:

Gaudi2 以 2.45TB/秒的带宽将封装内存储器容量从 32GB 增加到 96GB 的 HBM2E 增加了两倍,并集成了 24 个 100GbE RoCE RDMA 网卡,片上用于使用标准以太网进行扩展和横向扩展。

Habana(哈巴那)架构的性能

虽然人们可能会评论英伟达将在第三季度推出其H100 Hopper GPU,这使得Habana(哈巴那)的领导地位只是短暂的(英伟达声称其基准性能是A100的3倍),但Gaudi2仍将是一个引人注目的替代方案。特别是因为前面提到的一些优势(7nm晶圆比5nm晶圆便宜,而Habana没有试图获得与Nvidia相同的毛利率)仍然有效。

也许作为警告,Gaudi2确实具有比A100高得多的TDP,因此就每瓦性能而言,差异较小。

最终,Gaudi2最看好的是,它在同一工艺节点中提供了比A100高出2倍的性能优势。这表明Habana只是拥有一个卓越的架构,由于A100是注入了AI功能的GPU,因此缺乏所有传统的处理能力。因此,当Habana最终达到工艺节点时间到市场平价时,它可能会有一个明确的领导地位。(如果Gaudi2在2020年推出,它将在2年内拥有2倍的性能领导地位,而不是2个月)。

英特尔未来的战略

成功进军人工智能不仅可以推动英特尔的增长,还可以成为英特尔技术领先地位的关键指标。如果投资者认识到这一点(以及英特尔在未来几年内解决其他一些问题),那么也许股市可能会奖励英特尔更高的股价,类似于英伟达和其他公司。

提醒一下,这是帕特·盖尔辛格(Pat Gelsinger)股价“双倍”策略的两大支柱之一:以两倍的性能倍数将收益翻倍。

投资者需要注意的地方

Gaudi2的推出主要是一场道德上的胜利。在同一工艺节点上,Habana声称它比A100具有2倍的性能优势。然而,随着英伟达下个季度转向H100,Habana的领导地位将无可否认是短暂的。尽管如此,Gaudi是许多初创公司的第一代芯片,这些芯片已经出现,严重挑战了英伟达。另一个令人鼓舞的迹象是,它是在Gaudi在AWS上市后仅六个月推出的(尽管这延迟了六个月),这表明Habana正在稳步降低其工艺劣势。尽管AWS尚未宣布有关其引入Gaudi2的计划的任何消息,但它应该允许Habana在云中保持其现有的每美元性能优势。

从更高的层面来看,经过多年的发展,2022年是英特尔人工智能战略的重要一年。在Gaudi2之后,英特尔将进一步推出其Ponte Vecchio GPU(应该具有与H100类似的性能)以及具有AMX矩阵加速指令的Sapphire Rapids Xeon CPU - 这些就像每个CPU内部的Tensor内核一样,无需单独的GPU。今年下半年,英特尔还将与 HBM 合作推出 Sapphire Rapids。

总而言之,在人工智能方面,英伟达远不再是唯一的竞争对手,其市场份额的领导地位主要涉及创建人工智能模型的训练部分,而不是推断Xeons已经广泛部署多年的地方。到今年年底,英特尔将有三款领先产品在这个领域展开竞争。鉴于英伟达的溢价定价和利润率,因此它目前市场价格的现状似乎站不住脚。