0 微博 Qzone

10淘金:英伟达重磅CPU Vera交付:专为智能体AI设计 甲骨文承诺部署数十万颗

10淘金  2026-05-19 11:47:00  阅读量: 2583

  2026年5月19日  10淘金讯  当地时间5月18日,英伟达正式宣布,其首款专为Agentic AI(智能体AI)设计的CPU——Vera,已完成对Anthropic、OpenAI、SpaceX AI及甲骨文云的首批交付。

  这款在今年3月GTC大会上亮相的重磅芯片,正式从英伟达的实验室走向了生产前线,首批交付过程充满了硅谷特有的仪式感。

  上周五,英伟达副总裁伊恩·巴克亲自“开车送货”,第一站是Anthropic位于旧金山SoMa区的办公室,其计算负责人詹姆斯·布拉德伯里接收了服务器;在OpenAI的总部,巴克甚至掏出螺丝刀,当场打开机箱盖展示内部结构;当天行程的终点是帕洛阿尔托的SpaceX AI办公室,埃隆·马斯克亲自签收,并在现场详细询问了核心数量、内存布局及散热方案,SpaceX AI正计划将Vera用于强化学习工作负载与智能体仿真管线。

  本周一,甲骨文产品管理负责人卡兰·巴塔在接收现场透露,“甲骨文云基础设施(OCI)计划从2026年开始部署数十万颗英伟达Vera CPU。Agentic AI需要在大规模下维持持续性能,Vera的架构专为高吞吐推理设计,这正是我们为下一代企业AI提供动力所需的效率。”

  Agent AI并非仅靠GPU运行。每个代理沙箱、每次工具调用、每个编排层、每次长上下文检索操作都需要CPU处理。

  Vera旨在满足Agent AI对CPU的需求,黄仁勋在本届GTC大会上将其定位为公司"下一个数十亿美元级业务"。

  与传统CPU设计追求“核心数量”最大化不同,Vera专为高吞吐推理、工具调用及代码生成设计。它搭载了88个英伟达自研的奥林巴斯(Olympus)核心,满载情况下单核性能较前代Grace提升50%,内存带宽高达1.2 TB/s,同时支持FP8精度,可直接承接AI推理与强化学习任务,无需GPU中转数据,可大幅提升AI流水线整体效率。

  黄仁勋曾指出,当企业坐拥价值500亿美元的GPU时,绝不能让它们因为CPU处理速度慢而闲置。Vera存在的意义,就是当AI智能体需要同时处理规划任务、检索长上下文或调用API时,以极致的单线程性能和能效,让昂贵的GPU满负荷运转。

  另外,Vera不仅是独立的CPU产品,它还将作为即将发布的Vera Rubin超级芯片平台的主机处理器,通过NVLink-C2C与两颗Rubin GPU配对,形成统一内存架构,以更高的能效为AI工厂供能。这种“CPU+GPU”异构协同的全栈AI算力方案,有望推动英伟达从单一GPU厂商向全栈AI计算平台提供商转型。

  英伟达表示,Vera的高速核心与互连设计能够以传统基础设施两倍的能效,完成向GPU馈送数据所需的调度、控制与数据搬移工作。


返回10淘金
用户评价
发表您的看法