同一个模型,三个平台:OpenRouter - SiliconFlow - DeepInfra 实测对比
前面几期测的都是模型官方 API。但你实际用的时候大概率走的不是官方——而是通过某个聚合平台。为什么几个现实原因不想每个模型绑一张信用卡公司采购要求统一结算官方 API 在某些地区不稳定想用一个 API Key 调所有模型所以这期我不测模型了——同一个 DeepSeek V4 Pro走三个主流聚合平台OpenRouter、SiliconFlow、DeepInfra。比价格、延迟、可靠性、文档质量。先说结论OpenRouter 最全面但贵。SiliconFlow 最便宜、中文支持最好。DeepInfra 开源模型最便宜但文档稀烂。测试设计参数值测试时间2026-05-24测试模型DeepSeek V4 Pro同一个模型三个平台都支持任务5 任务框架代码生成、Bug 修复、文档注释、SQL 生成、单元测试每平台调用数25 次5 任务 × 5 轮测可靠性统计指标价格、首 token 延迟、端到端延迟、错误率、文档可用性平台简介平台一句话模型数中国访问OpenRouter最大的模型聚合商支持 300 模型300需翻墙被墙SiliconFlow硅基流动国产平台中文社区活跃150直连国内访问快DeepInfra开源模型为主推理优化好100直连偶尔慢价格对比同一模型DeepSeek V4 Pro三个平台输入/输出价格每百万 token平台输入 $/M输出 $/Mvs 官方额外费用DeepSeek 官方$1.74$3.48—无OpenRouter$2.00$4.0015%无SiliconFlow$1.74$3.48同价无DeepInfra$2.10$4.2021%无SiliconFlow 跟官方同价——这是最有竞争力的。OpenRouter 加价 15%DeepInfra 加价 21%。延迟对比同一个模型同样的 prompt走不同平台的响应速度5 任务 × 5 轮平均平台首 token 延迟生成速度 (t/s)端到端延迟最差延迟 (P95)DeepSeek 官方380ms48 t/s12.5s18.2sOpenRouter520ms45 t/s14.1s23.5sSiliconFlow360ms47 t/s12.3s16.1sDeepInfra610ms42 t/s15.8s29.4s关键发现SiliconFlow 的延迟比官方还低 20ms——可能因为它在中国有节点而 DeepSeek 官方服务器也在国内链路上 SiliconFlow 做了加速。DeepInfra 的延迟最高且最不稳——P95 延迟飙到 29.4s有一轮 SQL 生成任务等了 30 多秒才出结果。OpenRouter 延迟中规中矩但如果你在国内且没翻墙根本连不上。可靠性25 次调用错误率平台成功超时500 错误限流 (429)错误率DeepSeek 官方250000%OpenRouter240104%SiliconFlow250000%DeepInfra2221012%DeepInfra 的错误率 12%——25 次调用有 3 次失败。其中 2 次是超时等了 60s 没返回1 次是 500 内部错误。这跟我之前的体验一致DeepInfra 在高峰期北京时间晚上 9-11 点稳定性明显下降。SiliconFlow 25 次全成功跟官方一样的可靠性。API 兼容性维度OpenRouterSiliconFlowDeepInfraOpenAI 兼容✅ 完整✅ 完整✅ 基本Anthropic 兼容✅ 完整✅ 基本❌ 不支持Streaming✅✅✅Function Calling✅✅⚠️ 部分模型思考模式 (thinking)✅ 透传✅ 透传❌ 不支持统一 API Key✅✅✅如果你用 DeepSeek V4 Pro 的 Anthropic 兼容端点/v1/messagesSiliconFlow 支持DeepInfra 不支持。OpenRouter 全部支持但 Anthropic 端点需要单独配置。文档质量维度OpenRouterSiliconFlowDeepInfra快速开始 (5 分钟能跑通)✅✅⚠️ 要摸索中文文档❌ 全英文✅ 完整中文❌ 全英文错误码说明✅ 详细✅ 详细⚠️ 只有 HTTP 状态码SDK / 示例代码✅ Python/JS/Go✅ Python/JS⚠️ 只有 curl定价透明✅ 每个模型标价✅ 每个模型标价✅ 定价页OpenRouter 文档最全但全是英文。SiliconFlow 中文文档写得最好——快速开始 3 分钟就能跑通。DeepInfra 的文档基本是凑合能用——需要看源码或社区帖子才能搞明白一些细节。计费方式平台计费方式起充发票余额提醒OpenRouter预充值 (Credits)$5无✅SiliconFlow预充值 (人民币)¥10✅ 可开票✅DeepInfra预充值 (USD)$10❌❌SiliconFlow 支持人民币充值和开发票——这对公司报销场景非常友好。OpenRouter 和 DeepInfra 都只支持美元且不开发票。模型覆盖对比类型OpenRouterSiliconFlowDeepInfraGPT-4o / o4mini 等✅ 全部❌ 无合规原因❌Claude 系列✅ 全部❌ 无❌DeepSeek 系列✅✅ V3/V4✅ V3Qwen 系列✅✅ 完整✅Llama 系列✅✅✅ 开源模型最全Gemini 系列✅❌❌开源模型本地蒸馏✅✅✅最便宜SiliconFlow 没有海外闭源模型GPT/Claude/Gemini这是合规限制不是技术问题。如果你的工作流需要用 GPT-4oSiliconFlow 满足不了。最终建议你的情况选哪个理由国内开发者常用 DeepSeek QwenSiliconFlow跟官方同价、中文文档好、延迟最低需要同时用 GPT/Claude/DeepSeek/GeminiOpenRouter唯一能全接的平台开源模型推理Llama/Qwen 本地蒸馏DeepInfra开源模型最便宜但稳定性和文档差公司报销、要发票SiliconFlow唯一支持人民币充值和开票在国外或科学上网下OpenRouter生态最全追求最低延迟SiliconFlow 或官方直连聚合平台总有额外一跳一个提醒为什么要走聚合平台有人会问“聚合平台还贵了为什么不直接走官方 API”理由不是省钱是运维成本你不需要管理 5 个不同的 API Key你不需要对接 5 套不同的计费系统你不需要处理 5 种不同的错误码账单一目了然方便报销聚合平台赚的就是这个统一的钱。如果你只用 DeepSeek——走官方就行更便宜。如果你用 3 个以上的模型——聚合平台值得那 15% 的溢价。

相关新闻

TrafficLLM:用大语言模型做开放集加密流量分析

TrafficLLM:用大语言模型做开放集加密流量分析

核心思路 加密流量仍会因包大小、时序、方向等统计特征被攻击者识别(如判断访问的网站或观看的视频),而现实场景要求模型能做“开放集”判断——只识别目标流量,其余一律拒识,不能像传统闭合集模型那样把所有输入硬塞…

2026/7/5 9:11:56阅读更多 →
被问了 20 次-该用哪个模型-后,我做了这个决策框架

被问了 20 次-该用哪个模型-后,我做了这个决策框架

前面 7 篇文章测了十几个模型,每篇末尾都给了一张"你的场景 → 选这个"的表格。但不断有读者问我:“我还是不知道选哪个。能不能把所有数据放在一起比?” 可以。这篇文章就是模块一的元分析——汇总 DeepSeek 全家桶、Qwen、GPT-4o…

2026/7/5 9:11:56阅读更多 →
空洞骑士模组管理器终极指南:Scarab如何让MOD安装变得简单快速

空洞骑士模组管理器终极指南:Scarab如何让MOD安装变得简单快速

空洞骑士模组管理器终极指南:Scarab如何让MOD安装变得简单快速 【免费下载链接】Scarab An installer for Hollow Knight mods written with Avalonia. 项目地址: https://gitcode.com/gh_mirrors/sc/Scarab 还在为《空洞骑士》模组安装的复杂流程而头疼吗&a…

2026/7/5 9:06:56阅读更多 →
3步终极指南:用开源工具拯救者工具箱彻底解决C盘空间不足问题

3步终极指南:用开源工具拯救者工具箱彻底解决C盘空间不足问题

3步终极指南:用开源工具拯救者工具箱彻底解决C盘空间不足问题 【免费下载链接】LenovoLegionToolkit Lightweight Lenovo Vantage and Hotkeys replacement for Lenovo Legion laptops. 项目地址: https://gitcode.com/gh_mirrors/le/LenovoLegionToolkit 你…

2026/7/5 10:17:01阅读更多 →
改进数值解析法在PCB热建模中的应用与优化

改进数值解析法在PCB热建模中的应用与优化

1. 为什么PCB热建模需要改进的数值解析法?在电子设备小型化与高功率密度化的今天,一块指甲盖大小的PCB上可能集成了数十个发热元件。传统热仿真方法面临两大困境:一是计算资源消耗随元件数量呈指数级增长,二是辐射传热这一非线性因…

2026/7/5 10:17:01阅读更多 →
PCB泪滴设计:提升可靠性的关键技术

PCB泪滴设计:提升可靠性的关键技术

1. PCB泪滴设计:从入门到精通的全面指南在PCB设计领域,泪滴(Teardrop)是一个看似微小却至关重要的设计元素。作为一名有十年经验的PCB设计工程师,我见过太多因为忽视泪滴设计而导致的产品可靠性问题。泪滴是在焊盘与走…

2026/7/5 10:17:01阅读更多 →
ICM-42688-P与MK24FN1M0VDC12在工业运动感知中的协同应用

ICM-42688-P与MK24FN1M0VDC12在工业运动感知中的协同应用

1. ICM-42688-P与MK24FN1M0VDC12的硬件协同价值解析在工业级运动感知系统中,ICM-42688-P作为TDK InvenSense旗下的6轴MEMS惯性测量单元(IMU),其核心优势在于集成了三轴陀螺仪和三轴加速度计,并采用超声波辅助检测技术。实测表明,在…

2026/7/5 10:17:01阅读更多 →
电子产品散热设计:从理论计算到工程实践

电子产品散热设计:从理论计算到工程实践

1. 电子产品散热设计的关键挑战在电子设备小型化与高性能化的双重趋势下,散热设计已成为制约产品可靠性的关键瓶颈。以最新发布的某旗舰手机为例,其SoC芯片峰值功耗已达15W,而内部散热空间不足3cm,热流密度达到传统笔记本电脑的5倍…

2026/7/5 10:17:01阅读更多 →
Graviton5处理器性能提升25%的技术解析与实践

Graviton5处理器性能提升25%的技术解析与实践

1. 为什么Graviton5能带来25%的性能跃升Amazon Graviton5处理器最近在业界引发广泛关注,实测数据显示其能为各类应用带来平均25%的性能提升。这个数字背后是AWS在芯片架构层面的多重创新:1.1 核心架构全面升级Graviton5采用了ARM Neoverse V2核心架构&am…

2026/7/5 10:12:00阅读更多 →
从GitHub安全案例解析常见漏洞与防护实践

从GitHub安全案例解析常见漏洞与防护实践

1. 项目概述:从GitHub Trending看安全实战 最近在GitHub Trending上看到一个项目,叫 skills4/skills ,它因为一些安全漏洞案例被大家讨论。这其实是一个挺典型的场景:一个旨在展示或教授某种技能的仓库,本身却成了安…

2026/7/5 0:01:08阅读更多 →
MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

# MLT 2026启示:因果推理与概率建模驱动下一代LLM应用## 一、背景与挑战:从“黑箱预测”到“可信推理”2026年6月,第7届机器学习与趋势国际会议(MLT 2026)将在悉尼召开。会议议程中,“因果与可解释机器学习…

2026/7/5 0:01:08阅读更多 →
通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

1. 项目概述与漏洞背景最近在梳理一些历史OA系统的安全风险时,通达OA v11.6版本中的一个老漏洞又进入了我的视线。这个漏洞位于/general/bi_design/appcenter/report_bi.func.php文件中,是一个典型的SQL注入点。虽然这个漏洞的利用方式看起来并不复杂&am…

2026/7/5 0:01:08阅读更多 →
从GitHub安全案例解析常见漏洞与防护实践

从GitHub安全案例解析常见漏洞与防护实践

1. 项目概述:从GitHub Trending看安全实战 最近在GitHub Trending上看到一个项目,叫 skills4/skills ,它因为一些安全漏洞案例被大家讨论。这其实是一个挺典型的场景:一个旨在展示或教授某种技能的仓库,本身却成了安…

2026/7/5 0:01:08阅读更多 →
MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

# MLT 2026启示:因果推理与概率建模驱动下一代LLM应用## 一、背景与挑战:从“黑箱预测”到“可信推理”2026年6月,第7届机器学习与趋势国际会议(MLT 2026)将在悉尼召开。会议议程中,“因果与可解释机器学习…

2026/7/5 0:01:08阅读更多 →
通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

1. 项目概述与漏洞背景最近在梳理一些历史OA系统的安全风险时,通达OA v11.6版本中的一个老漏洞又进入了我的视线。这个漏洞位于/general/bi_design/appcenter/report_bi.func.php文件中,是一个典型的SQL注入点。虽然这个漏洞的利用方式看起来并不复杂&am…

2026/7/5 0:01:08阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/5 1:30:27阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/5 3:48:10阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/5 3:48:09阅读更多 →