OpenAI与Broadcom联合推出专为AI推理打造的定制芯片Jalapeno
OpenAI今日正式发布了一款名为Jalapeno的定制芯片将用于驱动其旗下的大语言模型。该处理器由OpenAI与Broadcom联合开发。Broadcom在定制芯片设计领域经验丰富此前曾协助谷歌开发TPU系列AI加速器谷歌还于今年4月将与Broadcom的芯片合作协议延长至2031年。英伟达的旗舰Rubin显卡既能处理训练任务也能承担推理工作负载。相比之下Jalapeno专为推理场景设计——即AI模型在响应用户查询时的运行过程。据OpenAI介绍早期测试结果显示Jalapeno在每瓦性能方面显著优于当前最先进水平这一表述可能是在暗指英伟达的芯片产品。目前OpenAI公开的关于Jalapeno设计细节仍十分有限。不过官方博客文章提到其底层架构旨在减少数据移动。这一表述暗示Jalapeno的架构可能着力降低逻辑电路与片外存储器之间的数据传输量——这正是推理集群中的主要性能瓶颈之一。AI芯片供应商通常采用多种方式来减少数据移动其中最常见的方案是为加速器配备大容量片上SRAM一种高速存储器。芯片集成的SRAM越多需要传输至片外存储器的数据量就越少。Cerebras Systems和Groq均采用了这一技术路线。OpenAI表示基于Jalapeno的推理集群将采用多项Broadcom网络技术其中包括Tomahawk芯片系列——该系列专为以太网交换机供电而设计支持同机架内服务器之间以及跨机架的数据传输。Broadcom最新推出的Tomahawk 6可实现每秒高达1.6太比特的流量处理并内置拥塞管理引擎能有效解决可能拖慢连接速度的网络瓶颈问题。OpenAI计划将Jalapeno芯片与Broadcom提供的网络设备部署于定制服务器机架中并与总部位于多伦多的数据中心设备设计服务商Celestia Inc.合作开发相关系统。Celestia还可协助客户优化服务器生产线。OpenAI计划于今年年底前上线首批Jalapeno服务器并逐步扩大该芯片的应用规模。其博客文章将Jalapeno定位为多代计算平台的第一步暗示未来可能还将开发更多推理处理器甚至为模型训练等相邻场景设计定制芯片。Jalapeno还有望为OpenAI开辟新的营收来源。英伟达目前以DGX一体机的形式销售显卡产品这类系统集成了CPU、散热模块及其他硬件。OpenAI具备推出搭载Jalapeno的竞争性一体机产品的实力甚至可借助此类系统为企业客户提供本地化部署其AI模型的能力。进军利润丰厚的AI硬件市场不仅有望推动OpenAI的营收增长还可能在其即将到来的公开募股过程中提升投资者兴趣。其主要竞争对手Anthropic近期已提交上市申请。对OpenAI而言一套推理硬件产品将成为路演过程中极具价值的差异化筹码尤其是在Anthropic可能抢先上市的情况下。QAQ1Jalapeno芯片和英伟达的GPU有什么区别A英伟达的旗舰Rubin显卡既能处理AI训练任务也能承担推理工作负载是一款通用型AI加速器。而Jalapeno专为推理场景设计即专注于AI模型响应用户查询时的运行过程。据OpenAI早期测试数据Jalapeno在每瓦性能方面显著优于当前最先进水平这可能意味着其能效比英伟达芯片更高。不过由于Jalapeno目前仅用于推理并不支持模型训练任务。Q2Jalapeno芯片在架构设计上有什么特别之处AOpenAI透露Jalapeno的底层架构着力减少数据移动即降低芯片逻辑电路与片外存储器之间的数据传输量。这是推理集群中的主要性能瓶颈。业内常见的解决方案是在芯片内集成大容量SRAM高速存储器Cerebras和Groq均采用了类似思路Jalapeno也可能沿用这一方向但OpenAI目前尚未公开更多具体设计细节。Q3OpenAI推出Jalapeno芯片对其上市有什么影响AJalapeno芯片有望帮助OpenAI打入利润丰厚的AI硬件市场并开辟新的营收来源。OpenAI可以效仿英伟达DGX一体机的模式推出搭载Jalapeno的AI推理一体机甚至支持企业客户在本地部署其AI模型。在竞争对手Anthropic已提交上市申请的背景下拥有自研推理硬件产品将成为OpenAI路演时的重要差异化优势有助于提升投资者信心。

相关新闻

数据治理平台效能升级:五大厂商多智能体协同与全链路自动化水平全景扫描

数据治理平台效能升级:五大厂商多智能体协同与全链路自动化水平全景扫描

2026年,数据治理市场的竞争逻辑正在发生根本性转变。过去两年,行业讨论的焦点还集中在“数据中台建不建”,如今已经转向“数据治理怎么做才真正有效”——标准能否自动匹配、质量规则能否智能推荐、治理流程能否从人工驱动转向AI驱动&#xf…

2026/6/26 1:47:28阅读更多 →
AI 存储风向标:美光指引再超预期,费半盘后全线修复

AI 存储风向标:美光指引再超预期,费半盘后全线修复

2026 年 6 月 24 日美东盘后,存储芯片龙头美光科技(NASDAQ: MU)公布截至 5 月 28 日的 2026 财年第三财季业绩:营收 414.6 亿美元,同比增长 345.7%;非 GAAP 口径下调整后每股收益 25.11 美元,同…

2026/6/26 1:47:28阅读更多 →
显式MPC参考轨迹压缩:降维原理、方法与实践指南

显式MPC参考轨迹压缩:降维原理、方法与实践指南

1. 项目概述:当显式MPC遇上“臃肿”的参考轨迹在工业过程控制、机器人运动规划这些领域,模型预测控制(MPC)早已不是什么新鲜词。它那种“走一步,看三步”的优化思想,确实能解决很多传统PID搞不定的复杂约束…

2026/6/26 1:47:28阅读更多 →
移动架构原则智能合约工具

移动架构原则智能合约工具

移动架构原则智能合约工具:重塑区块链开发新范式 在区块链技术快速发展的今天,智能合约作为去中心化应用的核心组件,其开发效率与安全性直接影响生态的可持续发展。移动架构原则智能合约工具应运而生,它通过模块化、轻量化和动态…

2026/6/26 2:47:33阅读更多 →
用数据说话!盘点2026年学生热捧的AI论文写作软件

用数据说话!盘点2026年学生热捧的AI论文写作软件

一天写完毕业论文在2026年已不再是天方夜谭。2026年最炸裂、实测能大幅提速的AI论文写作软件,覆盖选题构思、文献整理、内容生成、降重润色、格式排版全流程,真正帮你高效搞定论文。 一、全流程王者:一站式搞定论文全链路(一天定稿…

2026/6/26 2:47:33阅读更多 →
从CAD到机器人:如何用creo2urdf实现CREO模型到URDF的无缝转换

从CAD到机器人:如何用creo2urdf实现CREO模型到URDF的无缝转换

从CAD到机器人:如何用creo2urdf实现CREO模型到URDF的无缝转换 【免费下载链接】creo2urdf Generate URDF models from CREO mechanisms 项目地址: https://gitcode.com/gh_mirrors/cr/creo2urdf 在机器人开发的世界里,有一个令人头疼的"语言…

2026/6/26 2:47:33阅读更多 →
2026年大模型技术全景:从GPT-4o到Llama 3,谁是真正的王者?

2026年大模型技术全景:从GPT-4o到Llama 3,谁是真正的王者?

2026年大模型技术全景 群雄逐鹿的时代 2024年是大模型竞争最激烈的一年。从闭源的GPT-4o到开源的Llama 3,从通用大模型到垂直领域模型,整个行业呈现出百花齐放的态势。 头部闭源模型对比 OpenAI GPT-4o 核心优势: 多模态能力全面:…

2026/6/26 2:47:33阅读更多 →
双模态逻辑与严格潜在主义:构建直觉主义数学的动态基础

双模态逻辑与严格潜在主义:构建直觉主义数学的动态基础

1. 从“模态镜像”说起:一个被忽视的逻辑学视角最近在梳理一些关于逻辑基础与数学哲学的资料时,我反复被一个概念所吸引——“模态镜像”。这个词听起来有点玄乎,像是某种哲学或逻辑学的黑话,但如果你拆开来看,它其实指…

2026/6/26 2:47:33阅读更多 →
CTF Web安全实战:逻辑漏洞与文件包含漏洞的挖掘与防御

CTF Web安全实战:逻辑漏洞与文件包含漏洞的挖掘与防御

1. 项目概述:一次典型的Web安全实战演练最近在复盘一些经典的CTF(Capture The Flag)题目,特别是“极客大挑战”系列,发现其中有不少题目设计得非常精妙,能很好地串联起Web安全的多个知识点。今天想和大家深…

2026/6/26 2:42:32阅读更多 →
【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体 一文搞定到底什么是智能体【人工智能】一文搞定到底什么是智能体一. LM,WorkFlow,Agent分别有什么么不同二. Agent的思考过程是怎样的三. Agent的五个核心部分1)LLM2)Prompt3)Me…

2026/6/25 9:39:54阅读更多 →
嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件:从原理到实战的深度解析在嵌入式系统开发中,图形用户界面(GUI)的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台,嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/25 2:52:24阅读更多 →
Google AI Studio 300美元额度的真相与实战指南

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”,而是Google埋下的第一道技术门槛 你看到标题里那个醒目的“$300美金”时,第一反应可能是:又一个免费额度?领完就完事?我亲手试过——这300美金根本不是红包,而是一张入场券&…

2026/6/25 9:01:34阅读更多 →
HPE (慧与) 服务器专用 ESXi 9 全套官方定制资源详解 + 完整部署升级教程

HPE (慧与) 服务器专用 ESXi 9 全套官方定制资源详解 + 完整部署升级教程

一、前言:企业运维痛点与资源价值自博通收购 VMware 之后,原 VMware 公开免费下载渠道全面关闭,企业运维人员想要获取适配 HPE 慧与服务器的 ESXi 9 原厂镜像,必须注册博通账号、绑定有效授权才能下载,无授权账号无法获…

2026/6/26 0:02:15阅读更多 →
Kotlin的@JvmStatic与@JvmField:与Java互操作的注解

Kotlin的@JvmStatic与@JvmField:与Java互操作的注解

Kotlin作为一门现代编程语言,与Java的互操作性一直是其核心优势之一。为了让Kotlin代码能够无缝对接Java,Kotlin提供了多种注解来优化互操作体验,其中JvmStatic和JvmField是两个关键注解。它们分别用于解决静态成员和字段在Java中的访问问题&…

2026/6/26 0:02:15阅读更多 →
深入解析musl libc中的mmap实现源码

深入解析musl libc中的mmap实现源码

最近在阅读musl libc源码时,发现其mmap的实现非常精妙,特分享给大家。 一、代码整体结构 这段代码实现了__mmap函数,并通过weak_alias导出为mmap。这是典型的musl libc风格——提供弱符号以便用户可以重写。 weak_alias(__mmap, mmap); 二…

2026/6/26 0:02:15阅读更多 →