观点总结

英特尔最近推出了7nm Gaudi2 AI训练NPU。它的性能比英伟达目前的A100高出2倍。
Gaudi2在Gaudi发布一年后推出。虽然由于即将到来的H100，Gaudi2的领导地位只会是短暂的，但现在的势头似乎对Habana（哈巴那）有利。
这花了很长时间，但英特尔终于在2022年将其AI行动起来。这可能会给英伟达带来巨大的压力。

Intel

上述观点的理论基础

任何熟悉英伟达（NVDA）战略的人都知道，该公司在软件和硬件方面都全力以赴。人工智能是英伟达在最近的投资者日声称的1万亿美元市场机会的核心技术。未来，英伟达设想所有企业都将建设AI数据中心。

然而，英伟达并不是唯一一家追求这一市场机会的公司。多年后，英特尔（终于在2022年将其人工智能行动整合在一起，形成了一股合力。这可能会对英伟达的市场份额产生不利影响，反之，为英特尔开辟了一个非常有利可图的新市场。特别是，英特尔刚刚推出了最新的Habana AI引擎部分，将英伟达当前一代A100 NPU 处理器按在地上摩擦。这意味着英伟达的人工智能训练领导力终于受到了严峻的挑战。

论据概述

英特尔拥有多管齐下的人工智能战略。基本上，英特尔的战略是为其所有芯片注入人工智能功能。因此，当你听到像AMD这样的公司大肆宣传将Xilinx AI纳入其芯片时，英特尔实际上多年来一直在追求类似的战略。特别是以下这些行动：

在CPU中，英特尔利用其AVX-512的领先地位，并将其与特定的8位和16位AI指令相结合。在即将到来的Sapphire Rapids Xeon中，英特尔将最终推出一个名为AMX的成熟AI加速器，使Nvidia的中端AI加速器过时。（英特尔声称性能是Ice Lake的30倍，尽管我估计理论上的TOPS改进约为10倍）。
在FPGA中，英特尔几年前推出了相当于英伟达Tensor Cores的FPGA，尽管这部分仍然在14nm的工艺制程上。
在GPU中，英特尔即将推出的Ponte Vecchio应该与Nvidia即将推出的Hopper相当。
除了这种“传统”芯片之外，英特尔还拥有专用的Habana NPU（神经处理单元）用于训练和推理。

具体产品举例论证：Habana NPU（神经处理单元）

需要明确的是，我一直非常批评英特尔的Habana（哈巴那）战略和执行。特别是考虑到英特尔将很快以其Ponte Vecchio GPU的形式拥有与Nvidia类似的竞争产品，因此Habana加速器的必要性尚不清楚。鉴于去年在AWS上推出的Gaudi（高迪）部分采用过时的16nm工艺，情况更是如此。

然而，Habana（哈巴那）/Gaudi（高迪）在性能上缺乏的东西，它在定价上弥补了这一点。英特尔/哈瓦那声称，与A100相比，它的性能/价格提高了40%。Habana（哈巴那）能够以四种方式实现这一目标。

首先，作为一个专用的NPU，Gaudi（高迪）缺乏所有的GPU功能。这允许更多的深度学习硬件，这使得Gaudi（高迪）比英伟达的16nm V100部分更快，因此与7nm A100相比降低了性能增量。其次，Gaudi1不仅比V100快，而且硅芯片面积更小，制造成本更低。第三，16nm晶圆本质上比7nm晶圆便宜，进一步扩大了成本差距。最后，英伟达正在通过收取超高利润率的价格，最大限度地利用其在人工智能训练方面的垄断地位。通过放弃一些毛利率，Habana（哈巴那）最终能够提供16nm零件，与英伟达的产品相比，每美元价格具有有利的性能。

Gaudi（高迪2

尽管如此，显而易见的下一步行动是迁移到7nm工艺制程上，这就是Habana刚刚用Gaudi2推出时用到的工艺制程。值得注意的是，Gaudi2 在 Gaudi1 在 AWS 中推出大约半年后推出，或者在 Gaudi1 首次发布 1.5 年后推出。因此，虽然Habana（哈巴那）在工艺技术方面仍然落后，但正如A100在大约两年前推出的那样，这种快速的步伐确实恢复了对Habana（哈巴那）执行的信心。

与Gaudi1相比，Gaudi2的核心器件数量增加了两倍。这使得Habana（哈巴那够声称比A100具有2倍的性能优势，这是在许多基准测试中衡量的（如下所示）。换句话说，Habana（哈巴那目前在AI性能方面具有明确的领导地位（忽略了Cerebras的晶圆级引擎）。此外，Gaudi2还超越了A100的80GB内存，并且像第一代Gaudi一样，仍然依赖于开放式以太网互连，而不是Nvidia专有的NVLink：

Gaudi2 以 2.45TB/秒的带宽将封装内存储器容量从 32GB 增加到 96GB 的 HBM2E 增加了两倍，并集成了 24 个 100GbE RoCE RDMA 网卡，片上用于使用标准以太网进行扩展和横向扩展。

Habana（哈巴那）架构的性能

虽然人们可能会评论英伟达将在第三季度推出其H100 Hopper GPU，这使得Habana（哈巴那）的领导地位只是短暂的（英伟达声称其基准性能是A100的3倍），但Gaudi2仍将是一个引人注目的替代方案。特别是因为前面提到的一些优势（7nm晶圆比5nm晶圆便宜，而Habana没有试图获得与Nvidia相同的毛利率）仍然有效。

也许作为警告，Gaudi2确实具有比A100高得多的TDP，因此就每瓦性能而言，差异较小。

最终，Gaudi2最看好的是，它在同一工艺节点中提供了比A100高出2倍的性能优势。这表明Habana只是拥有一个卓越的架构，由于A100是注入了AI功能的GPU，因此缺乏所有传统的处理能力。因此，当Habana最终达到工艺节点时间到市场平价时，它可能会有一个明确的领导地位。（如果Gaudi2在2020年推出，它将在2年内拥有2倍的性能领导地位，而不是2个月）。

英特尔未来的战略

成功进军人工智能不仅可以推动英特尔的增长，还可以成为英特尔技术领先地位的关键指标。如果投资者认识到这一点（以及英特尔在未来几年内解决其他一些问题），那么也许股市可能会奖励英特尔更高的股价，类似于英伟达和其他公司。

提醒一下，这是帕特·盖尔辛格（Pat Gelsinger）股价“双倍”策略的两大支柱之一：以两倍的性能倍数将收益翻倍。

投资者需要注意的地方

Gaudi2的推出主要是一场道德上的胜利。在同一工艺节点上，Habana声称它比A100具有2倍的性能优势。然而，随着英伟达下个季度转向H100，Habana的领导地位将无可否认是短暂的。尽管如此，Gaudi是许多初创公司的第一代芯片，这些芯片已经出现，严重挑战了英伟达。另一个令人鼓舞的迹象是，它是在Gaudi在AWS上市后仅六个月推出的（尽管这延迟了六个月），这表明Habana正在稳步降低其工艺劣势。尽管AWS尚未宣布有关其引入Gaudi2的计划的任何消息，但它应该允许Habana在云中保持其现有的每美元性能优势。

从更高的层面来看，经过多年的发展，2022年是英特尔人工智能战略的重要一年。在Gaudi2之后，英特尔将进一步推出其Ponte Vecchio GPU（应该具有与H100类似的性能）以及具有AMX矩阵加速指令的Sapphire Rapids Xeon CPU - 这些就像每个CPU内部的Tensor内核一样，无需单独的GPU。今年下半年，英特尔还将与 HBM 合作推出 Sapphire Rapids。

总而言之，在人工智能方面，英伟达远不再是唯一的竞争对手，其市场份额的领导地位主要涉及创建人工智能模型的训练部分，而不是推断Xeons已经广泛部署多年的地方。到今年年底，英特尔将有三款领先产品在这个领域展开竞争。鉴于英伟达的溢价定价和利润率，因此它目前市场价格的现状似乎站不住脚。

下载收藏

客服咨询

400 093 7005

周一至周日：09:00AM-21:00PM

微信扫码关注

小程序扫码注册