“用Claude比发工资还贵?换!”耗时9个月,这家AI公司换上DeepSeek后,CEO直言:迁移工作量暴涨100倍,但一年省下数百万美元
模型能力或许已经不再是最大瓶颈真正让企业夜不能寐的开始变成账单。整理 | 郑丽媛出品 | CSDNIDCSDNnews这几年大模型行业的竞争几乎围绕着参数规模、推理能力和榜单排名展开谁的模型更聪明谁就能吸引更多开发者和企业客户但随着 AI Agent 进入实际生产环境越来越多公司发现模型再强如果成本无法控制最终也很难成为一门可持续的生意。最近一家名为 Lindy 的 AI Agent 创业公司就公开展示了这种变化其创始人兼 CEO Flo Crivello 宣布公司已经把生产环境中的全部模型流量从 Anthropic 切换至 DeepSeek V4——按照他的说法这一决定不仅为公司节省了数百万美元的推理成本而且在部分核心业务场景中模型表现甚至还出现了提升。消息一出很快在 AI 圈引发热议。一个被推理成本逼出来的决定简单介绍一下。Lindy 是一家专注于 AI Agent 的平台用户无需编写代码就可以创建自己的 AI 助手让其自动完成邮件处理、会议安排、CRM 录入、客户跟进、数据整理等各种办公任务。其创始人 Flo Crivello 也并非第一次创业。在创办 Lindy 之前他曾在 Uber 担任工程师和产品负责人后来又创立远程办公平台Teamflow并成功融资 5200 万美元。2023 年生成式 AI 浪潮兴起他将业务方向转向 AI Agent 并推出了 Lindy。与很多AI应用一样Lindy的核心成本并不是服务器、办公场地或者市场营销而是模型推理费用。今年 4 月Crivello 就在 X 上公开表示推理成本已成为公司最大的支出项目甚至超过了员工薪资总额。对于一家依赖 AI 持续运行的产品而言这个问题显然很严峻。而事实上类似情况正在整个行业蔓延● 不久前GitHub 宣布调整 Copilot 订阅模式将部分服务从固定月费转向按量计费。因为 Agent 式编程越来越普及用户一次性触发的推理请求数量大幅增长原本的订阅价格已经难以覆盖成本。● Uber 内部也面临类似困扰。由于大量使用 Anthropic 旗下 Claude Code 等 AI 工具公司原本规划给 2026 年的 AI 预算仅用了四个月便接近耗尽甚至引发管理层对于投入产出比的重新讨论。就在为此近期 Linux 基金会甚至联合谷歌、微软、IBM、Salesforce 等企业成立了 Tokenomics 基金会希望推动建立统一的 AI Token 成本标准。领取地址https://s.csdn.cn/4nPsOpDeepSeek 并不是 Lindy 的第一个选择尽管面临着推理成本难题但 Lindy 最终选择 DeepSeek并非一时冲动。按照 Crivello 的说法团队实际上已经为这次切换模型准备了很长时间“我们一直在寻找替代方案并评估各种开源模型大概持续了 6-9 个月。”过去一年里开源模型的发展速度让很多创业公司重新思考自己的技术路线。如果把时间拨回 2024 年很多企业对于开源模型的评价仍然是“差距明显”但到了 2025 年底至 2026 年情况已经发生巨大变化DeepSeek、Kimi、GLM 等一批中国模型持续刷新性能纪录而推理成本却远低于 OpenAI 和 Anthropic 等闭源模型。Crivello 曾透露Lindy 最初一度想把月之暗面的 Kimi 作为默认模型后来又认真评估过智谱 AI 推出的 GLM 系列模型。而最终他们将目光锁定在今年 4 月发布预览版的 DeepSeek V4 上。相比此前广受关注的 DeepSeek R1V4 进一步提升了通用能力和 Agent 任务表现并继续保持极具竞争力的价格优势。今年 6 月初在 Lindy 完成内部测试后一个让团队颇为意外的结果出现了不仅成本更低在某些关键业务场景中DeepSeek 的表现甚至超过了 Anthropic。比预想多出了“100 倍工作量”然而从 Anthropic 迁移到 DeepSeek远不像修改几行 API 代码那么简单——Crivello 后来在 X 上感慨“整个过程最终比我们最初预想的多出了 100 倍工作量。”很多人看到这里可能会疑惑既然都是大模型接口为什么迁移会如此复杂原因在于企业生产环境里的 AI 系统实际上是一整套高度耦合的工程体系。模型背后连接着 Prompt 工程、自动化评测系统、用户反馈机制、监控与观测平台、路由调度逻辑、安全与合规流程等等。而更换模型之后这些环节往往都需要重新适配。Crivello 透露团队进行了大量线上和线下评测同时还进行了所谓的“Vibe Eval”——即由真人主观判断输出结果是否符合预期验证 DeepSeek 是否真的能在真实生产环境中达到甚至超越 Anthropic 的表现。“我们做了大量评估工作然后逐步放量上线观察对用户留存的影响同时还需要不断调整 Prompt 以适配新模型。”对了有一点要注意Lindy 并没有选择自行部署 DeepSeek。他们采用的是美国推理服务商 Atlas Cloud 提供的 DeepSeek V4 服务。这样既保留了成本优势也避免了承担自建推理基础设施带来的额外复杂性。因此从结果来看Lindy 真正投入的成本并不只是模型迁移而是一次底层 AI 基础设施升级。所以DeepSeek 赢在哪里根据 Crivello 透露的消息目前 Lindy 最核心的业务之一是邮件处理。系统需要阅读用户收件箱内容理解上下文关系并按照用户过往表达习惯自动生成回复草稿。而恰恰是在这些高频任务上DeepSeek 给出了超出预期的表现——Crivello 表示“我们在一些核心用例上看到了令人惊讶的性能提升。”不过他也强调 DeepSeek 并非全面领先。在复杂工作流自动化任务上Anthropic 旗下 Claude Sonnet 目前仍然更强“在工作流自动化方面DeepSeek 还不如 Sonnet但这并不是我们最核心的业务场景。”所以虽然 Lindy 已把生产流量全部迁移至 DeepSeek但 Anthropic 并没有完全离开其技术栈首先Lindy 内部员工仍在大量使用 Claude因为 Anthropic 的 Max 订阅计划性价比依然很高。Crivello 坦言“如果不是 Max 订阅计划我们可能也会换掉 Claude。”其次在面对复杂任务时Anthropic 可以充当“保险丝”的角色。此前有用户询问未来 Lindy 是否可能重新回到 AnthropicCrivello 给出的回答是“当系统检测到任务失败时我们大概率仍会升级调用 Opus。”不过他同时强调这种情况只占极小比例。一句话概括Anthropic 从过去 Lindy 的默认选择变成了一个备用模型。但 Crivello 也补充道未来 Anthropic 若是推出更强的新模型并大幅降低价格他将重新成为其客户“如果 Anthropic 下一代模型足够有竞争力我们很可能会重新用回它的产品。”省下的钱究竟值不值得截至目前Crivello 并未公开具体节省金额只说“节省了数百万美元”。不过对于一家推理成本已超过工资支出的AI创业公司来说即便只是节省 30%-50% 的模型费用这也是一笔可观的资金了。而如果把 Lindy 的决定放到个行业背景下去观察会发现它其实代表着一种越来越明显的趋势过去几年大模型市场基本由 OpenAI 和 Anthropic 主导企业选择模型时更关注能力上限但随着模型之间的差距不断缩小成本开始成为新的决策因素。来自 Vercel AI Gateway 的数据就显示在 2026 年 5 月仅一个月时间里DeepSeek 在平台 Token 调用量中的占比便从不足 1% 飙升至 17%但其对应的收入占比仅约 1%——原因很简单DeepSeek 太便宜了。于是一种新的市场结构开始形成一边是 OpenAI、Anthropic 等提供最强性能、最高价格的旗舰模型另一边则是 DeepSeek、GLM、Kimi 等性能越来越接近、价格却低得多的开放权重模型。对于 Lindy 这种每天消耗海量 Token 的公司来说问题最终变得十分现实如果能用更低成本获得 80%-90% 的效果那么为剩余那部分能力支付数倍价格还划算吗对此Crivello 给出的答案非常直接“对于像我们这样消耗大量 Token 的公司来说100%必须要这么做否则就是不负责任。”在他看来很多企业之所以还没有行动只是因为它们更习惯相信那些知名品牌。但未来几年或许企业将越来越不在乎模型来自哪里而更在乎最终效果和成本。参考链接https://runtimewire.com/article/lindy-deepseek-v4-anthropic-production-switchhttps://thenewstack.io/lindy-deepseek-anthropic-switch/

相关新闻

AI 时代 DevOps 三层架构详解:数据、智能编排与执行的全链路闭环

AI 时代 DevOps 三层架构详解:数据、智能编排与执行的全链路闭环

不知道你有没有遇到过这样的场景:开发环境已经把制品打包好了,却因为生产网和开发网物理隔离,无法直接推送——这是很多企业在实施DevOps时都会遇到的真实困境。 制品摆渡的“最后一公里”,到底怎样才能既安全合规,又自…

2026/6/27 20:57:03阅读更多 →
技术解析:护照阅读器在银行跨境业务中的技术落地与架构实践

技术解析:护照阅读器在银行跨境业务中的技术落地与架构实践

在金融科技领域,身份核验始终是业务流程的核心入口。随着银行跨境业务量的爆发式增长,传统人工录入 肉眼核验的模式已无法满足效率与风控的双重需求。护照阅读器作为身份核验的关键硬件,正在成为银行跨境业务线的标配设备。本文从技术视角&a…

2026/6/27 20:52:02阅读更多 →
iSulad vs Docker深度对比:为什么轻量级容器引擎更适合边缘计算?

iSulad vs Docker深度对比:为什么轻量级容器引擎更适合边缘计算?

iSulad vs Docker深度对比:为什么轻量级容器引擎更适合边缘计算? 【免费下载链接】iSulad iSulad is a light weight container runtime daemon which is designed for IOT and Cloud infrastructure. 项目地址: https://gitcode.com/openeuler/iSulad…

2026/6/27 20:52:02阅读更多 →
高频PCB叠层DFM怎么设计?阻抗可控

高频PCB叠层DFM怎么设计?阻抗可控

高频PCB的信号完整性、EMC性能、阻抗精度,七成取决于叠层结构的DFM设计,而非后期布线优化。低频电路板叠层只需满足通电与基础屏蔽需求,但高频电路对层序排布、介质厚度、参考平面、层间耦合有着严苛的工艺与电气约束,不合理的叠层…

2026/6/27 22:32:18阅读更多 →
抛弃usb network gate:基于硬件API的OA系统自动授权调用与集成教程

抛弃usb network gate:基于硬件API的OA系统自动授权调用与集成教程

在企业内部系统集成中,如何让物理的网银 U 盾、行业加密狗像软件权限一样,在 OA 系统中实现自动化的借用与挂载?本文将探讨为何在企业级开发中必须抛弃 usb network gate 等纯软件共享方案。并通过一套基于企业级硬件 USB 网关的 RESTful API…

2026/6/27 22:32:18阅读更多 →
C++高频交易系统延迟痛点大揭秘:从毫秒到纳秒的调优之路

C++高频交易系统延迟痛点大揭秘:从毫秒到纳秒的调优之路

1. 网络层优化:突破内核协议栈的性能边界在传统网络架构中,数据需要经历多次上下文切换和内存拷贝。某国际交易所的实测数据显示,单个数据包在内核态和用户态之间的切换耗时占总延迟的43%。我们采用DPDK技术重构网络栈后,发现三个…

2026/6/27 22:32:18阅读更多 →
什么是有效客流?一文讲透客流统计中的高价值数据指标

什么是有效客流?一文讲透客流统计中的高价值数据指标

线下实体的数字化转型喊了很多年,客流统计几乎是每个商场、门店、景区的标配,但真正把客流数据用出价值的运营者并不多。很多人拿到日报的第一反应是:今天来了多少人,比昨天多了还是少了。但再往深问:这些人里多少是推…

2026/6/27 22:32:18阅读更多 →
财务共享中心建设中的成本控制陷阱:如何避免“降本”变“增负”?

财务共享中心建设中的成本控制陷阱:如何避免“降本”变“增负”?

一、前言:多数企业的财务共享,都陷入了“伪降本”怪圈在企业财务数字化与集约化管理升级的浪潮中,财务共享中心(FSSC)成为中大型集团标准化建设的标配。企业建设共享中心的核心初衷高度统一:集中核算、统一流程、精简冗余人员、压…

2026/6/27 22:32:18阅读更多 →
2026年上半年软考系统集成项目管理师应用技术真题及答案解析(第一批)

2026年上半年软考系统集成项目管理师应用技术真题及答案解析(第一批)

某公司承接大型信息系统运维项目,项目经理李明带领从不同部门抽调的15人组成项目团队(含 5名开发、3名测试、2名设计、3名运维及2名管理人员)。李明认为所有人集中办公,沟通交流非常方便,不需要制定沟通管理计划。 项…

2026/6/27 22:27:17阅读更多 →
【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体 一文搞定到底什么是智能体【人工智能】一文搞定到底什么是智能体一. LM,WorkFlow,Agent分别有什么么不同二. Agent的思考过程是怎样的三. Agent的五个核心部分1)LLM2)Prompt3)Me…

2026/6/27 11:20:40阅读更多 →
嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件:从原理到实战的深度解析在嵌入式系统开发中,图形用户界面(GUI)的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台,嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/27 5:46:02阅读更多 →
Google AI Studio 300美元额度的真相与实战指南

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”,而是Google埋下的第一道技术门槛 你看到标题里那个醒目的“$300美金”时,第一反应可能是:又一个免费额度?领完就完事?我亲手试过——这300美金根本不是红包,而是一张入场券&…

2026/6/27 11:20:39阅读更多 →
10分钟AI语音克隆与实时变声:Retrieval-based-Voice-Conversion-WebUI完整指南

10分钟AI语音克隆与实时变声:Retrieval-based-Voice-Conversion-WebUI完整指南

10分钟AI语音克隆与实时变声&#xff1a;Retrieval-based-Voice-Conversion-WebUI完整指南 【免费下载链接】Retrieval-based-Voice-Conversion-WebUI Easily train a good VC model with voice data < 10 mins! 项目地址: https://gitcode.com/GitHub_Trending/re/Retrie…

2026/6/27 0:04:03阅读更多 →
Layerdivider:3分钟AI智能分层,彻底告别手动抠图时代

Layerdivider:3分钟AI智能分层,彻底告别手动抠图时代

Layerdivider&#xff1a;3分钟AI智能分层&#xff0c;彻底告别手动抠图时代 【免费下载链接】layerdivider A tool to divide a single illustration into a layered structure. 项目地址: https://gitcode.com/gh_mirrors/la/layerdivider 还在为复杂的图像分层工作烦…

2026/6/27 0:04:03阅读更多 →
Tomcat中X-Frame-Options配置实战:防御点击劫持的四种方法与最佳实践

Tomcat中X-Frame-Options配置实战:防御点击劫持的四种方法与最佳实践

1. 项目概述&#xff1a;为什么X-Frame-Options是Web安全的“防盗门”&#xff1f;最近在排查一个老项目的安全审计报告时&#xff0c;又被提到了“点击劫持”风险&#xff0c;矛头直指缺失的X-Frame-Options响应头。这已经不是第一次了&#xff0c;很多开发团队&#xff0c;尤…

2026/6/27 0:04:03阅读更多 →