模型路由与提示预处理:控制大语言模型成本、提升令牌使用效果的新方法!
大语言模型使用成本问题凸显并非所有提示都是相同的。通过将简单的提示路由到更便宜的模型能在令牌成本上节省一大笔钱。图片来源Shutterstock Gen AI作为资深的 Delphi 开发者对当年和 Visual Basic 开发者之间的“语言战争”记忆犹新。Delphi 早期代号是“VBK”即“VB 杀手”这引起 VB 社区不满他们会到 Delphi 论坛挑起争端而 Delphi 开发者也会反击引发激烈口水战。那些日子令人怀念。如今讨论更上层次——哪种模型更适合用于编码虽现在争论没当年 VB 和 Delphi 之争激烈但大家各有看法。企业在为团队选择模型前会对不同模型进行评估大多数团队已选定常用的一系列模型。有时与 Claude 或 Codex 聊天体验欠佳。不久后像 GStack 和 Superpowers 这样的脚手架工具开始为与大语言模型LLM交互提供基础支持即在提示到达模型本身之前对其进行基本处理。这些工具有助于建立有用的上下文就像在“原始提示”之上增加一层。上下文工程是在聊天界面之上添加的第一层也是最常见的一层。选定模型和工具后大家追求令牌使用最大化。但账单寄来时管理者不高兴了。随着成本飙升领导层担心钱没花在刀刃上。模型路由下一层解决方案就像汇编语言和手动调整寄存器被编译器和结构化语言取代进而发展出框架和库最近又出现大语言模型和提示工程一样开发者和管理者开始意识到有更好方法管理大语言模型使用成本。但自然地刚弄清楚事情运作方式新的一层就会出现让辛苦积累的知识过时。显然仅能用英语编写代码不足以阻止下一次抽象出现。所以又一层抽象出现了。世事皆如此。因此模型路由成为让每一分令牌成本都发挥最大价值的最新方法。其理念是并非所有提示都需要同等处理能力。向 Claude 提出的问题并非都需要前沿模型深度思考。模型路由器可以分析提示内容决定哪个模型最适合回答该提示并将查询导向该模型。也许简单请求更适合用旧模型处理也许代码审查用专门为此设计的模型效果更好。模型路由可以提高令牌使用效率。如今使用 Claude Code 时必须为整个会话选择一个模型若想用顶级模型无论最终做什么都得为此付费。而模型路由器可以让灵活选择模型从而控制成本。像 Coinbase 这样的公司在令牌使用量增加的同时AI 支出却减少了一半。从令牌最大化到令牌匹配大语言模型不断发展功能越来越强大也越来越专业化。将提示路由到既适合任务又具有成本效益的模型是提高令牌使用效果的关键。目前团队是手动进行这项工作的但未来人工智能本身将成为做出此类决策的最佳方式。例如Claude Code Router 可以根据每个提示所需的工作类型将其路由到多个流行模型中的任意一个而且它是开源的。接下来出现的将是提示预处理。可以努力编写好的提示但人工智能本身可以对提问进行优化。提示工程中最好的技巧之一就是告诉大语言模型“提出我没问但应该问的问题”。不难想象未来写出一个提示人工智能会帮助澄清、完善它然后将其路由到最合适、最具成本效益的模型来获取答案。将不再需要选择特定的大语言模型提供商而是可以专注于明确表达自己的需求。所以别再为特定模型手工编写提示了让即将出现的模型路由器和提示预处理器为完成这些繁琐的工作吧。人工智能、开发工具、生成式 AI、软件开发该何去何从呢

相关新闻

Vivado/Vitis 2026.1 避坑指南

Vivado/Vitis 2026.1 避坑指南

Vivado/Vitis 2026.1 避坑指南 坑点一:安装后执行 installLibs.sh 脚本报错 Vitis 安装完成后,系统会提示运行 installLibs.sh。在 Ubuntu 下,实际应使用命令: sudo bash installLibs.sh但执行时可能遇到如下错误: …

2026/7/3 18:06:25阅读更多 →
百度网盘秒传链接网页工具终极指南:5分钟学会全平台免费秒传转存

百度网盘秒传链接网页工具终极指南:5分钟学会全平台免费秒传转存

百度网盘秒传链接网页工具终极指南:5分钟学会全平台免费秒传转存 【免费下载链接】baidupan-rapidupload 百度网盘秒传链接转存/生成/转换 网页工具 (全平台可用) 项目地址: https://gitcode.com/gh_mirrors/bai/baidupan-rapidupload 还在为百度网盘文件分享…

2026/7/3 18:06:25阅读更多 →
IIM-42652 IMU与PIC18F2682的6DoF运动追踪实现

IIM-42652 IMU与PIC18F2682的6DoF运动追踪实现

1. IIM-42652 IMU的工业级运动追踪特性解析 IIM-42652是TDK旗下InvenSense品牌推出的6轴智能工业级运动追踪MEMS器件。这款尺寸仅3.02.50.91mm的微型传感器,集成了三轴陀螺仪和三轴加速度计,采用LGA封装,工作温度范围覆盖-40C至105C的严苛工业…

2026/7/3 18:06:25阅读更多 →
实战方案:InvenTree开源库存管理系统助力企业实现精细化库存控制

实战方案:InvenTree开源库存管理系统助力企业实现精细化库存控制

实战方案:InvenTree开源库存管理系统助力企业实现精细化库存控制 【免费下载链接】InvenTree Open Source Inventory Management System 项目地址: https://gitcode.com/GitHub_Trending/in/InvenTree 面对日益复杂的零件管理和库存追踪需求,传统…

2026/7/3 23:32:45阅读更多 →
PIC18F47K42与IS31FL3731打造可编程LED显示系统

PIC18F47K42与IS31FL3731打造可编程LED显示系统

1. 项目概述:用硬件点亮创意最近在折腾一个有趣的硬件项目——使用IS31FL3731 LED驱动芯片搭配PIC18F47K42微控制器来制作可编程的LED显示系统。这个组合特别适合想要把创意想法转化为炫酷视觉效果的朋友们,无论是制作个性化的LED招牌、互动艺术装置&…

2026/7/3 23:32:45阅读更多 →
Qwen-Image-Edit-Rapid-AIO终极指南:4步完成专业级AI图像编辑

Qwen-Image-Edit-Rapid-AIO终极指南:4步完成专业级AI图像编辑

Qwen-Image-Edit-Rapid-AIO终极指南:4步完成专业级AI图像编辑 【免费下载链接】Qwen-Image-Edit-Rapid-AIO 项目地址: https://ai.gitcode.com/hf_mirrors/Phr00t/Qwen-Image-Edit-Rapid-AIO 你是否曾经被复杂的AI图像编辑工具劝退?传统的AI图像…

2026/7/3 23:32:45阅读更多 →
IS31FL3731 LED驱动与TM4C1299微控制器的嵌入式开发实践

IS31FL3731 LED驱动与TM4C1299微控制器的嵌入式开发实践

1. IS31FL3731 LED驱动芯片的硬件魔法当第一次拿到IS31FL3731这颗LED驱动芯片时,我完全被它的设计哲学震撼了。作为一款I2C接口的可编程矩阵LED驱动器,它解决了嵌入式开发中最头疼的IO资源问题。传统方案中,控制16x9144个LED需要144个GPIO引脚…

2026/7/3 23:32:45阅读更多 →
DC-DC降压转换设计:171010550与PIC32MZ的智能电源方案

DC-DC降压转换设计:171010550与PIC32MZ的智能电源方案

1. 项目背景与核心器件选型解析在电力电子领域,DC-DC降压转换(Buck Converter)是最基础也最关键的拓扑结构之一。这次我们要实现的方案采用了171010550电源管理IC与PIC32MZ1024EFE144微控制器的组合,这个搭配在工业控制、新能源设…

2026/7/3 23:32:45阅读更多 →
2026中英文语音识别怎么选?清楚准好整理的方案更省事

2026中英文语音识别怎么选?清楚准好整理的方案更省事

"2026年选中英文语音识别工具,核心判断标准就是“清楚、准确、好整理”三个维度,不用追花里胡哨的附加功能,对学生群体来说,能满足课堂转写、论文访谈整理、小组讨论记录核心需求,不用后续花大量时间二次整理的工…

2026/7/3 23:27:44阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/3 14:18:39阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/7/3 14:38:35阅读更多 →
LV3296与PIC18F45K22的UART通信与USB扩展方案

LV3296与PIC18F45K22的UART通信与USB扩展方案

1. LV3296与PIC18F45K22的硬件搭档解析在嵌入式数据采集系统中,LV3296条形码扫描模块与PIC18F45K22微控制器的组合堪称经典搭配。LV3296作为一款工业级条码扫描头,其核心是一颗高性能CMOS图像传感器,配合专用解码芯片,能自动识别包…

2026/7/3 0:03:41阅读更多 →
AI初创生存指南:6个月完成可信度验证闭环

AI初创生存指南:6个月完成可信度验证闭环

1. 这不是“逆袭指南”,而是一份AI初创公司真实生存手记“How To Beat Odds As an AI Startup?”——这个标题乍看像一句热血口号,但在我带过7个从0到1的AI产品团队、亲手踩过融资失败、技术债崩盘、客户POC卡在最后一公里等23类典型坑之后,…

2026/7/3 0:03:41阅读更多 →
多模态+推理链+RAG 2.0+智能体:工业级AI系统落地四支柱

多模态+推理链+RAG 2.0+智能体:工业级AI系统落地四支柱

1. 这不是又一篇“AI趋势速览”,而是一份实操者手记:当多模态、推理链、检索增强与智能体协作真正撞进工程现场“LAI #73”这个编号本身就像一个暗号——它不属于某家大厂的白皮书,也不是学术会议的议程表,而是长期泡在模型训练集…

2026/7/3 0:03:41阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/3 1:12:46阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/3 1:36:36阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/3 2:08:15阅读更多 →