OpenAI首款芯片Jalapeño亮相:控制智能生产全流程,对标苹果挑战英伟达?
OpenAI终于做芯片野心初现OpenAI终于做芯片了很多人看到这条新闻第一反应是英伟达麻烦了。但我看到的恰恰相反。首款芯片Jalapeño最重要的意义并非直奔着英伟达而来这是OpenAI第一次公开承认自己不满足于做一家模型公司了。它想控制的是生产智能的整个过程从模型到芯片从数据中心到能源从训练到推理从生产Token到销售Token。Jalapeño表面是一颗芯片实际上更像一张路线图OpenAI终于把自己的野心摆到了桌面上。模型差距缩小计算差距扩大自从大模型爆发以来AI行业几乎所有注意力都在模型。GPT - 4出来行业被震一次Claude追上来Gemini追上来DeepSeek把性价比打出来Meta推开源。每次发布大家盯着同一组东西参数、榜单、代码能力、数学能力、长上下文、多模态。模型当然重要但一个变化已经出现模型领先的窗口正在变短。今天一个模型刚发布几个月后开源社区、竞争对手、云厂商就会跟上。能力差距仍然存在但越来越难独立构成长期壁垒。真正拉开差距的东西开始往更底层走算力供应、推理成本、系统吞吐、网络能力、数据中心建设、能源获取。没有模型发布那么好看也不会立刻刷屏但它们决定一家AI公司能不能长期跑下去。黄仁勋最近说了一句话英伟达系统也许不是采购价格最低的但能生成成本最低的Token、最高的Token吞吐量最终带来最高收入。老黄这段话很直接行业一直抱怨英伟达贵黄仁勋没在采购价上辩解而是把问题换到另一个维度别看买机器花多少钱要看每个Token的生产成本。这就是AI时代新的账本服务器和GPU不是最终单位Token才是。OpenAI恰好站在这个问题最中心。ChatGPT每天处理海量请求Codex要消耗更多推理步骤未来还有Agent、视频生成、机器人、长推理链。模型越有用Token消耗越大产品越成功推理账单越厚。残酷的地方在这里OpenAI用户越多英伟达越赚钱OpenAI产品越强底层算力税越重。如果每一个Token都要经过外部硬件平台收一道税OpenAI就很难拥有完整的护城河。它可以有最强模型有超级入口有开发者生态但最核心的生产成本始终卡在别人手里。Jalapeño的本质就在这里OpenAI开始自己造Token工厂。GPT开始设计GPTJalapeño这款芯片最容易被低估的细节是九个月流片。传统高性能ASIC项目周期通常18个月到36个月。先进工艺更麻烦架构、验证、物理实现、封装、软件栈、调试任何一环出问题成本迅速放大。OpenAI和博通把周期压到了九个月。这不能理解成芯片行业突然变简单OpenAI没有凭空长出一条半导体产业链。博通在定制芯片和网络基础设施上经验深厚Celestica负责板卡、机架和系统工程。OpenAI真正贡献的是更稀缺的东西它知道未来模型要怎么跑。很多芯片公司做AI加速器难点在于猜负载。模型结构会变推理方式会变服务模式会变。芯片一旦流片物理世界没有软件世界那么好回滚。OpenAI不用完全靠猜每天运行ChatGPT、Codex和API知道哪些内核最常用哪些内存搬运最浪费哪些网络瓶颈最影响集群效率哪些延迟会直接伤害产品体验。它还知道未来Agent产品会怎么消耗推理资源。这些经验以前只是后台工程知识现在被写进芯片架构。在OpenAI的官方新闻稿里有一句话很关键OpenAI使用自己的模型加速了部分设计和优化流程。还说提供给用户的模型也在帮助改进运行未来模型的基础设施。GPT开始参与设计下一代GPT的机器。过去几十年芯片的链条是先设计芯片芯片运行软件软件运行AI。现在链条开始回头AI帮助人类设计芯片芯片再运行下一代AI。一旦这个闭环成立九个月可能只是开始未来可能是六个月、三个月甚至更密集的迭代。芯片行业过去有自己的节奏模型行业有自己的节奏前者慢后者快。Jalapeño把两个节奏往一起拉。这一步如果走通OpenAI的飞轮会变得很吓人。更好的模型帮助设计更好的芯片更好的芯片降低下一代模型运行成本更低成本支撑更多用户和产品更多用户和产品带来更多真实负载数据这些数据再反过来定义下一代芯片。这才是OpenAI真正想要的循环。削减推理税控制现金流Jalapeño不是训练芯片它面向的是大语言模型推理这点很关键。训练像造航母一次投入巨大需要极强的通用能力需要不断适配新模型新架构新实验。训练市场仍然高度依赖英伟达不只是GPU而是CUDA、网络、系统、软件库、开发者生态整套平台。推理更像出租车队每天跑每小时跑每分钟跑。用户每提一个问题API每响应一次Agent每推进一步都要发生推理。它更在意低延迟、低成本、高吞吐、高利用率。训练烧阶段性大钱推理烧日常现金流。这也是AI公司走到商业化阶段后最头疼的问题。GPT训练一次很贵但推理每天都在发生。Agent时代会继续放大这个问题一次任务可能包含几十次甚至几百次模型调用。长上下文、链式推理、多模态生成、代码执行都在继续推高Token消耗。Jalapeño瞄准的就是这笔推理税它更像OpenAI自己的TPU。Google、亚马逊、Meta、微软都走过类似路线只要负载足够大自研ASIC就有高性价比的经济意义。OpenAI现在具备这个条件有真实请求、有产品路线、有模型团队、有博通这样的产业伙伴还有巨大的成本压力。Jalapeño不需要对外出售也能证明价值只要它让ChatGPT回答更便宜、让Codex跑得更快、让API毛利更高它就有意义。OpenAI还提到Jalapeño会减少数据传输平衡计算、内存和网络资源让实际利用率更接近理论峰值。算力贵很多时候贵在没被充分用起来GPU等待网络内存搬运拖慢计算调度不佳造成空转所有浪费最后都变成电费和资本开支。采购价只是第一层系统效率才是最后的账。OpenAI越来越像苹果很多人会把Jalapeño理解成OpenAI挑战英伟达但我觉得OpenAI并不想成为下一家英伟达更像是在学苹果。苹果最厉害的地方从来不是某一个单点。iPhone强iOS强A系列和M系列芯片强App Store强。但苹果真正难打的地方是这些东西被放在同一个闭环里。芯片为系统优化系统为应用优化应用体验再反过来定义下一代芯片。这套闭环让苹果可以在同样电池、同样体积、同样散热约束下做出别人很难复制的体验。OpenAI正在搭类似的东西。模型是智能内核ChatGPT是超级入口Codex是开发工具API是生态分发层Jalapeño是自研芯片数据中心是AI工厂。OpenAI CEO Altman这两年反复谈芯片、能源、核聚变、数据中心现在看可能压根不是在追概念他已经不再用AI创业公司的方式规划OpenAI了。如果说英伟达卖铲子那么OpenAI想拥有矿山。英伟达要做所有AI公司的工厂设备供应商卖GPU、卖网络、卖系统、卖软件生态、卖AI工厂方案理想客户是每一个需要生产Token的公司。OpenAI想给自己建一套工厂卖的不是设备是最终生成出来的智能。短期看OpenAI离不开英伟达。训练和通用计算仍然需要GPU平台Jalapeño也不可能很快覆盖全部负载。它大概率先进入OpenAI最确定、规模最大、优化收益最高的推理场景。长期看裂缝已经出现。当模型公司开始拥有自己的芯片路线图英伟达的客户就不再只是客户它们也会成为AI基础设施的另一类玩家。AI时代新规律显现过去二十年互联网最重要的资产是流量谁掌握用户谁掌握价值。今天AI时代正在出现新的规律模型越来越像流量而计算越来越像土地。模型会迭代产品会变化排行榜会不断刷新。但那些生产智能的工厂芯片、网络、数据中心、能源会越来越集中在少数玩家手里。GPT开始设计GPT看起来只是一次流片但它真正宣告的事情是OpenAI已经不满足于成为最聪明的公司它想成为控制智能生产的公司。

相关新闻

拉萨口腔专科医院哪家比较好

拉萨口腔专科医院哪家比较好

在拉萨,不少缺牙朋友面对大大小小的口腔机构,都会纠结:拉萨口腔专科医院哪家比较好?尤其是要做种植牙的时候,大家都想找技术靠谱、体验舒服的专业诊室。我帮不少缺牙的朋友问过这个问题哦,根据实际体验来看…

2026/6/27 23:22:22阅读更多 →
三分钟带你认识有机溶质转运蛋白(OST)家族

三分钟带你认识有机溶质转运蛋白(OST)家族

有机溶质转运蛋白(OST)有机溶质转运蛋白(Organic Solute Transporter,OST)家族是一类重要的膜转运蛋白,在维持机体胆汁酸和固醇类物质的稳态平衡中发挥着核心作用。OST蛋白属于溶质载体(SLC&…

2026/6/27 23:22:22阅读更多 →
token调用的缓存命中已经把成本降低到了0-----我已经没有成本了

token调用的缓存命中已经把成本降低到了0-----我已经没有成本了

我不知道怎么回事,但是他现在显示我现在每天就是费用0好像每天成本不到一毛钱其实这就是5块钱能用40天的水平。之所以会这么低,是因为有缓存命中的部分,例如没有评论的部分,以及我自己的态度提示词是一样的同样命中缓存我以前的目…

2026/6/27 23:22:22阅读更多 →
【Ambari Plus】Step8—MariaDB 初始化

【Ambari Plus】Step8—MariaDB 初始化

Step8—MariaDB 初始化 Ambari Server 后面会把元数据写入 MariaDB,所以数据库要提前准备好。这一步只处理 MariaDB 服务本身:安装、字符集、监听地址、root 密码和远程连通验证。Ambari 专用库和专用用户放到 Step9 再创建。 本文只在核心节点 hadoop1.…

2026/6/28 4:08:18阅读更多 →
别急着教 Agent 思考,先喂它吃口干净的:ETL 入门

别急着教 Agent 思考,先喂它吃口干净的:ETL 入门

别急着教 Agent 思考,先喂它吃口干净的:ETL 入门 摘要:很多人一上来就盯着 Agent 的规划、决策、反思,却把更底下那层忘了:数据到底干不干净。ETL 在 Agent 时代一点都不过时,反而更要命。传统程序吃到脏数…

2026/6/28 4:08:18阅读更多 →
熬夜压力大白发越来越多?科学解析与营养干预指南

熬夜压力大白发越来越多?科学解析与营养干预指南

熬夜压力大白发越来越多?这是很多当代成年人都会遇到的头发问题,从临床营养角度来看,这种现象确实和长期的不良生活状态直接相关,大多是毛囊核心营养缺口导致黑色素合成不足引发的,通过科学的营养补充可以有效干预改善…

2026/6/28 4:08:18阅读更多 →
【网络安全】svn信息泄漏

【网络安全】svn信息泄漏

一、svn介绍SVN,全称为 Subversion,是一个开源的集中式版本控制系统(CVCS)。在 Git 彻底统治开源界之前,SVN 曾是软件开发团队进行代码管理和协同开发的绝对主流工具。结合你正在使用 dvcs-ripper 进行安全测试的背景&…

2026/6/28 4:08:18阅读更多 →
不定积分不是导数逆向计算,是沿着螺旋轨迹反向累加全部无穷小微观生长单元,还原完整宏观脉络-《全域数学vs传统数学:人类文明进阶200讲》第53讲 高中通俗版逐字稿

不定积分不是导数逆向计算,是沿着螺旋轨迹反向累加全部无穷小微观生长单元,还原完整宏观脉络-《全域数学vs传统数学:人类文明进阶200讲》第53讲 高中通俗版逐字稿

《全域数学vs传统数学:人类文明进阶200讲》第53讲 高中通俗版逐字稿 讲次: 第53讲 主题: 不定积分不是导数逆向计算,是沿着螺旋轨迹反向累加全部无穷小微观生长单元,还原完整宏观脉络 对标课本知识点: 不…

2026/6/28 4:08:18阅读更多 →
湖北香樟好不好?踩过死苗返工坑,5年采购商总结5条避坑干货

湖北香樟好不好?踩过死苗返工坑,5年采购商总结5条避坑干货

做苗木采购5年,被问得最多的问题之一就是“湖北香樟好不好”。说实话,作为长江流域原生的乡土树种,湖北香樟本身冠幅饱满、气候适配性强,正常移栽成活率能到90%以上,是市政、地产项目的稳妥选择。 但我前前后后踩过的香…

2026/6/28 4:03:18阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/6/28 0:08:01阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/6/28 0:08:01阅读更多 →