AI 公司巨亏,你却用得越来越便宜
你大概也注意到一个挺拧巴的事。一边新闻天天说 AI 公司在疯狂烧钱、巨额亏损——做 ChatGPT 的 OpenAI据估算一年要亏一百多亿美元马斯克的 xAI 更夸张传出来的数字是每赚一块钱、要倒贴大概二十六块。整个行业今年在 AI 基础设施上砸的钱估算有六千多亿美元。另一边你自己用 AI 的体感却是越来越便宜甚至越来越多免费。国产的 DeepSeek 前阵子又永久降价把同等能力的价格打到了对手的几十分之一。拉长看达到同一个水平的 AI每年价格大概降十倍。更怪的还在后头2026 年上半年AI 这行其实还在同时涨价——内存HBM半年涨了五倍多、高端显卡抢不到货好几家云厂商的 API 价格往上调有的涨幅夸张到四倍多。烧钱、涨价、白菜价。三件方向完全相反的事在同一个行业、同一段时间里同时发生。这到底怎么回事钱到底是怎么算的我把这事从头捋了一遍发现关键就一句话——这压根不是一笔账是三笔账各走各的。把这三笔账拆开你就看懂了 2026 年 AI 行业几乎所有的拧巴。第一笔账训练烧的是赌明天的钱AI 公司烧的那些天文数字绝大部分不是花在「伺候你这次提问」上是花在训练下一代模型 抢算力上。这是一场军备竞赛。谁的模型强一档谁就可能赢家通吃所以谁也不敢停——拼命买显卡、建数据中心、囤算力赌的是一个还没到来的未来。这笔钱有多吓人据估算光是几家最大的云巨头今年在 AI 基础设施上的预算就有四千多亿美元。而且越往后越烧有泄露出来的内部预测说OpenAI 的年亏损会从今年的一百多亿一路涨到几年后的四百多亿。更要命的是这笔账没法对冲。Anthropic 的 CEO 自己说过一句很实在的话大意买算力这件事世上没有任何对冲手段——买多了万一需求没跟上能把公司拖垮买少了又会在竞争里掉队。所以第一笔账的特点是赌未来越赌越烧。它跟你这次用 AI 花了几分钱几乎没关系。第二笔账硬件涨价的是卖铲子的第二笔账解释了为什么 2026 还在「涨价」。淘金热里最稳赚的从来是卖铲子的。AI 这波铲子就是显卡和内存。需求太猛供给跟不上——高端 GPU 长期抢不到那个专门给 AI 用的高带宽内存HBM据报道半年价格涨了五倍多。卖铲子的做芯片、做内存的赚翻了而买铲子的云厂商、模型公司成本被狠狠抬高。于是你会看到好几家云厂商把 AI 相关的服务往上调价有的涨幅到了四倍多国内也有大模型厂商一年之内连着涨了三次价。注意这一层的涨价涨的是算力和硬件的价不是终端模型调用的价。这两层方向正好拧着。第三笔账推理白菜价是真本事现在到了最关键、也最反直觉的一笔——你天天感受到的「越来越便宜」到底怎么来的。先分清一个事AI 的成本九成以上其实不在训练在推理——也就是你每发一次问、它每答一次要花的那些实打实的算力开销。训练是一次性的推理是每次调用都要花的跑一辈子。而推理这一层的单次成本这两年是结构性地往下掉的。靠两样东西。第一样是工程。这两年业界把「怎么让模型答得又快又省」卷出花了我尽量用人话说这几招MoE混合专家模型很大但每次回答只激活其中一小部分「专家」不用整个大脑全开省算力。稀疏注意力不让模型对每个字都死磕只盯重要的省下大量计算。量化把模型里的数字精度降一降比如从高精度压到低精度内存少一半、速度更快质量几乎不掉。KV 缓存压缩把对话里反复要用的中间结果压小省显存——这块去年到今年进步特别大。推测解码用一个小快模型先「抢答」几个字大模型一次性批量核对省掉一个一个憋字的功夫。这些招叠起来单次推理成本能砍掉六到八成。国产的 DeepSeek 是个典型——据报道它新一代模型在超长上下文下算力开销只要上一代的两三成、缓存只要一成靠的就是自研的一套注意力架构顺带也用上了国产算力。第二样是竞争。开源模型这一年集体逼近了第一梯队——好几个开源模型家族在发布后几个月内就摸到了接近顶级闭源模型的水平价格却便宜十倍以上。这就给所有人的报价压了一个硬顶你卖太贵客户干脆自己跑个开源的。DeepSeek 带头把价格打到全球新低小米这些也跟着压价格战就这么烧起来了。工程把成本压下来竞争把利润挤出去。两头一夹推理价格就成了白菜价。但有两件事你得想明白讲到这「三笔账」的拧巴就解开了烧钱烧在训练、涨价涨在硬件、白菜价降在推理。三层各走各的一点都不矛盾。但白菜价这件事还藏着两件反直觉的事不说清楚你会被带偏。第一你享受的便宜是「昨天的智能」在打折。价格暴跌的是「达到某个固定水平」的能力。去年的顶级模型今年变成了便宜货——这部分确实每年降十倍。但「当前最强的那一档」价格一直很坚挺。研究机构的数据也印证固定能力的价格每年能降几十倍可前沿模型几乎不降。而且现在最强的那批「会思考」的推理模型答一个问题前要先在心里「想」一大通这些思考也是要烧 token 的。所以哪怕单价在降你真用最强的模型干活账单不一定少。便宜的永远是昨天的前沿今天的前沿永远贵。这是这门生意的铁律。第二越便宜大家反而花得越多。这就是经济学里有名的「杰文斯悖论」——东西越便宜用得越凶总开销不降反升。AI 这儿体现得淋漓尽致。单 token 是便宜了但现在的 agent 干个活动不动调用模型几十上百次长上下文、反复自我检查都是成倍地吃 token。结果就是据报道Uber 四个月就烧光了全年的 AI 预算——因为内部用 Claude Code 写代码的人从三成飙到八成多每个工程师一个月的 API 账单冲到几百上千美元。所以「白菜价」没让任何人真省到钱它只是把整个盘子做得更大了。这也正是模型公司那个怪现象的根源——客户越多亏得越狠每多一个用户、每多一次调用它都得垫上实打实的算力成本。那这对你意味着什么把三笔账和这两件事摞一块落到实处如果你是用 AI 的人别一上来就用最贵最强的。分清档位——要顶尖推理的活用前沿模型大量重复、简单的活用便宜档连谷歌的 CEO 都在劝大客户多用便宜的 Flash 档说能省下十亿美元级的钱。还有别按「每 token 多少钱」算账要按「干成一件事总共花多少」算——前者在降后者可能在涨。如果你关心这行往哪走盯两个东西。一是谁烧得起——同样在亏有的公司选择不自己建数据中心、而是租算力把烧钱比例压得低有的背着一大堆免费用户烧钱比例下不来。资本轻的活下去的概率更大。二是价格的地板在哪——只要开源模型能逼近前沿价格的底就是「你自己跑一个开源等价模型要花多少」而这个底每年还在往下掉三到五成。换句话说靠卖「通用模型调用」赚大钱会越来越难。还有一个容易被忽略的红利推理白菜价的意义其实不在帮你省钱是解锁了以前做不起的东西。以前一个任务调模型上百次、喂几十万字上下文、让它反复自检——这些想都不敢想因为烧不起。现在做得起了。机会就在这些「过去太贵、现在突然可行」的应用里。最后所以别再纠结「AI 到底是在烧钱还是白菜价」了——它同时是。烧的是赌明天的钱涨的是中间卖铲子的价降的是卖给你今天的价。三笔账各走各的方向。看懂这三笔账2026 年 AI 行业那些看着拧巴的事全都顺了为什么巨亏还要拼命降价推理账上不降价就抢不到客户为什么降价了还是活不下去训练账上烧得更凶以及——为什么这场淘金热里最稳赚的可能不是挖金子的做模型的而是卖铲子的做芯片和算力的。便宜的是昨天烧钱的是明天。你我享受着昨天打折的智能而这些公司在赌一个还没到来的明天。

相关新闻

2025-2026铝合金门窗行业十大品牌盘点

2025-2026铝合金门窗行业十大品牌盘点

随着国内家装行业稳步发展,以及建筑节能相关规范持续落地,铝合金系统门窗凭借良好的密封性能与适配性,逐步成为家装门窗改造、新房装修中的主流选择。门窗作为建筑围护结构的重要组成部分,关乎室内居住环境与日常使用体验&#xf…

2026/6/23 12:44:15阅读更多 →
从零开始掌握SiYuan笔记:5个实用技巧让你的知识管理更高效

从零开始掌握SiYuan笔记:5个实用技巧让你的知识管理更高效

从零开始掌握SiYuan笔记:5个实用技巧让你的知识管理更高效 【免费下载链接】siyuan A privacy-first, self-hosted, fully open source personal knowledge management software, written in typescript and golang. 项目地址: https://gitcode.com/GitHub_Trendi…

2026/6/23 12:44:15阅读更多 →
Emacs AI助手:3个理由让你在编辑器中体验大型语言模型的强大能力

Emacs AI助手:3个理由让你在编辑器中体验大型语言模型的强大能力

Emacs AI助手:3个理由让你在编辑器中体验大型语言模型的强大能力 【免费下载链接】ellama Work with local and cloud LLMs from Emacs. 项目地址: https://gitcode.com/gh_mirrors/el/ellama 你是否曾经在编写代码时希望有个助手能即时审查你的逻辑&#xf…

2026/6/23 12:39:14阅读更多 →
Apifox AI 如何智能生成API测试用例:从文档到自动化的实践指南

Apifox AI 如何智能生成API测试用例:从文档到自动化的实践指南

1. 项目概述:当AI遇见API测试 如果你和我一样,是个常年和API打交道的开发或测试,那你一定对这样的场景不陌生:产品经理催着要接口文档,后端同学吭哧吭哧在Swagger或Postman里写完,丢给你一个链接。然后&…

2026/6/23 15:04:45阅读更多 →
MeterSphere接口自动化场景构建:从变量传递到数据驱动的全流程实战

MeterSphere接口自动化场景构建:从变量传递到数据驱动的全流程实战

1. 项目概述:为什么我们需要一个“场景”? 如果你做过接口测试,尤其是想把一堆零散的接口用例串起来跑一遍,那你肯定遇到过这个麻烦:登录接口返回的token,怎么传给后续的查询接口?查询接口拿到的…

2026/6/23 15:04:45阅读更多 →
Claude Fable 5与Mythos 5于6月12日全球下架 安全验证要求与隐私争议并存

Claude Fable 5与Mythos 5于6月12日全球下架 安全验证要求与隐私争议并存

{ "body": " Anthropic的Claude Fable 5及Mythos 5于2026年6月12日因jailbreak漏洞担忧全球下架,至今未恢复。 \n 产品下架直接原因与范围 \n 官方公告显示,下架覆盖全球所有地区,用户无法通过网页或API调用这两个模型。…

2026/6/23 15:04:45阅读更多 →
Python+Selenium UI自动化测试实战:从环境搭建到CI/CD集成

Python+Selenium UI自动化测试实战:从环境搭建到CI/CD集成

1. 项目概述:为什么我们需要UI自动化测试? 在软件开发的迭代周期里,回归测试是个绕不开的体力活。每次发布新版本,测试同学都要把核心功能点再手动走一遍,耗时费力不说,还容易因为疲劳导致漏测。我经历过一…

2026/6/23 15:04:45阅读更多 →
AI Infra工程师必须掌握的Transformer底层机制

AI Infra工程师必须掌握的Transformer底层机制

1. 这不是一道选择题:AI Infra工程师绕不开Transformer的底层逻辑“AI Infra工程师为什么必须懂Transformer”——这个问题在2024年已经不是技术探讨,而是岗位能力的硬性门槛。我带过三支AI平台团队,从零搭建过推理服务中台、大模型微调调度系…

2026/6/23 15:04:45阅读更多 →
光伏组件I-V特性建模与MPPT参数一键计算工具(Matlab/Simulink)

光伏组件I-V特性建模与MPPT参数一键计算工具(Matlab/Simulink)

本文还有配套的精品资源,点击获取 简介:提供开箱即用的Simulink光伏面板模型(pv_panel.slx)和配套MATLAB参数计算脚本(calcul_valeurs.m),支持基于单二极管等效电路的电压-电流特性仿真。输入…

2026/6/23 14:59:44阅读更多 →
【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体 一文搞定到底什么是智能体【人工智能】一文搞定到底什么是智能体一. LM,WorkFlow,Agent分别有什么么不同二. Agent的思考过程是怎样的三. Agent的五个核心部分1)LLM2)Prompt3)Me…

2026/6/23 7:04:52阅读更多 →
嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件:从原理到实战的深度解析在嵌入式系统开发中,图形用户界面(GUI)的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台,嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/23 1:55:32阅读更多 →
Google AI Studio 300美元额度的真相与实战指南

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”,而是Google埋下的第一道技术门槛 你看到标题里那个醒目的“$300美金”时,第一反应可能是:又一个免费额度?领完就完事?我亲手试过——这300美金根本不是红包,而是一张入场券&…

2026/6/23 5:55:37阅读更多 →
2026年京东云 618 活动 Hermes Agent/OpenClaw配置Token Plan新手必看指南

2026年京东云 618 活动 Hermes Agent/OpenClaw配置Token Plan新手必看指南

2026年京东云 618 活动 Hermes Agent/OpenClaw配置Token Plan新手必看指南。OpenClaw是开源的个人AI助手,Hermes Agent则是一个能自我进化的AI智能体框架。阿里云提供计算巢、轻量服务器及无影云电脑三种部署OpenClaw 与 Hermes Agent的方案、百炼Token Plan兼容主流…

2026/6/23 0:00:38阅读更多 →
2026年北京电子沙盘制作公司深度评测:从技术选型到落地效果,谁在真正定义“数字+实体”的融合边界?

2026年北京电子沙盘制作公司深度评测:从技术选型到落地效果,谁在真正定义“数字+实体”的融合边界?

模块一:行业背景——百亿赛道爆发,北京市场的特殊性与选型困局2026年,电子沙盘行业已走过“要不要做”的讨论,进入“找谁做、怎么做”的深水区。据行业研究机构数据,2025年国内电子沙盘市场规模已突破85亿元&#xff0…

2026/6/23 0:00:38阅读更多 →
音视频场景下的 Java 开发者面试:技术与挑战

音视频场景下的 Java 开发者面试:技术与挑战

面试互联网大厂:从音视频场景看 Java 开发者的技能与挑战 在互联网大厂求职的面试中,Java 开发者往往需要面对严苛的技术问题。今天,我们将通过一位名叫燕双非的搞笑程序员与严肃的面试官之间的对话,看看在音视频场景下&#xff0…

2026/6/23 0:00:38阅读更多 →