首页 国内 国际 社会 军事 科技 财经 体育 娱乐
首页 采集科技文章 返回首页

英伟达重磅CPU Vera交付:专为智能体AI设计 甲骨文承诺部署数十万颗|gpu|黄仁勋|知名企业|甲骨文公司

《科创板日报》5月19日讯(编辑 宋子乔) 当地时间5月18日,英伟达正式宣布,其首款专为Agentic AI(智能体AI)设计的CPU——Vera,已完成对Anthropic、OpenAI、SpaceX AI及甲骨文云的首批交付


这款在今年3月GTC大会上亮相的重磅芯片,正式从英伟达的实验室走向了生产前线,首批交付过程充满了硅谷特有的仪式感。

上周五,英伟达副总裁伊恩•巴克亲自“开车送货”,第一站是Anthropic位于旧金山SoMa区的办公室,其计算负责人詹姆斯•布拉德伯里接收了服务器;在OpenAI的总部,巴克甚至掏出螺丝刀,当场打开机箱盖展示内部结构;当天行程的终点是帕洛阿尔托的SpaceX AI办公室,埃隆•马斯克亲自签收,并在现场详细询问了核心数量、内存布局及散热方案,SpaceX AI正计划将Vera用于强化学习工作负载与智能体仿真管线。




本周一,甲骨文产品管理负责人卡兰•巴塔在接收现场透露,“甲骨文云基础设施(OCI)计划从2026年开始部署数十万颗英伟达Vera CPU。Agentic AI需要在大规模下维持持续性能,Vera的架构专为高吞吐推理设计,这正是我们为下一代企业AI提供动力所需的效率。”


Agent AI并非仅靠GPU运行。每个代理沙箱、每次工具调用、每个编排层、每次长上下文检索操作都需要CPU处理。

Vera旨在满足Agent AI对CPU的需求,黄仁勋在本届GTC大会上将其定位为公司"下一个数十亿美元级业务"

与传统CPU设计追求“核心数量”最大化不同,Vera专为高吞吐推理、工具调用及代码生成设计。它搭载了88个英伟达自研的奥林巴斯(Olympus)核心,满载情况下单核性能较前代Grace提升50%,内存带宽高达1.2 TB/s,同时支持FP8精度,可直接承接AI推理与强化学习任务,无需GPU中转数据,可大幅提升AI流水线整体效率。

黄仁勋曾指出,当企业坐拥价值500亿美元的GPU时,绝不能让它们因为CPU处理速度慢而闲置。Vera存在的意义,就是当AI智能体需要同时处理规划任务、检索长上下文或调用API时,以极致的单线程性能和能效,让昂贵的GPU满负荷运转。

另外,Vera不仅是独立的CPU产品,它还将作为即将发布的Vera Rubin超级芯片平台的主机处理器,通过NVLink-C2C与两颗Rubin GPU配对,形成统一内存架构,以更高的能效为AI工厂供能。这种“CPU+GPU”异构协同的全栈AI算力方案,有望推动英伟达从单一GPU厂商向全栈AI计算平台提供商转型。

英伟达表示,Vera的高速核心与互连设计能够以传统基础设施两倍的能效,完成向GPU馈送数据所需的调度、控制与数据搬移工作

📚 相关阅读

• 我国牵头高压直流输电领域电容器国际标准成功立项|母线|选型|电力系统
• 智元分拆四足机器人业务|邱恒|人形|智能驾驶|世界机器人大会
• 英特尔与亚马逊和谷歌洽谈AI芯片封装|人工智能|知名企业|亚马逊公司|Google
• 全球电动汽车销量 连涨两个月 中东局势紧张 电动汽车卖爆了
• 中信建投:继续看好AI板块,尤其是光通信环节|光纤|光缆|ai板块
• AI算力需求引爆存储龙头,三星市值突破1万亿美元|人工智能早参|台积电|ai算力|三星电子|先进制程|知名企业