Hermes Agent 这次更新有点猛:MoA 跑分超过 Opus 4.8 和 GPT 5.5
今天这个更新我觉得 Hermes Agent 可以单独拿出来说一下不是因为它又接了一个模型也不是因为它做了一个新按钮而是 Nous Research 把 MoA也就是 Mixture of Agents做成了 Hermes Agent 里的一个虚拟模型官方在 HermesBench 上放了一组结果opus-4.8 gpt-5.5 reference的 MoA preset分数是0.8202单独跑claude-opus-4.8是0.7607单独跑gpt-5.5是0.7412换成人话就是 Hermes Agent 这套 MoA 组合在这个 benchmark 上跑过了 Opus 4.8也跑过了 GPT 5.5最强模型的问题是普通人用不到现在最强模型的问题不只是贵更麻烦的是很多普通用户根本用不到有的锁在企业入口里有的要白名单有的工具调用不完整有的只能聊天接不到自己的文件、终端、浏览器和自动化工作流所以过去我们说“最强模型”很多时候像是在看别人家的发动机知道它猛但很难装到自己的车上Hermes Agent 这次的思路不一样它没有说我要从头训练一个更强模型它是把几个已经很强的模型组合起来用先让参考模型各自思考再把它们的分析交给一个 aggregator由 aggregator 真正输出答案、调用工具、继续跑 Agent loop这件事挺现实很多任务不一定缺一个完美模型缺的是多个强模型先从不同角度看一遍然后由一个能干活的 Agent 把判断落到工具里参考模型只出主意aggregator 才动手这里有个细节很重要Hermes Agent 的 MoA 不是让所有模型一起乱调用工具参考模型不会拿到工具 schema它们只看用户和助手的对话文本不看 Hermes 的系统 prompt也不看完整工具调用 transcript真正写回复、决定要不要调用工具、执行后续步骤的是 aggregator这个边界很关键如果多个模型都能动工具Agent 会变得很难控谁读了文件谁执行了命令谁触发了外部 API出了问题也不好追Hermes Agent 把行动权收在 aggregator 这里参考模型只负责补充视角对普通用户来说它仍然像是在选一个模型但背后其实已经变成了一次多模型协作用起来不是实验室功能直接/moa这点我比较喜欢MoA 在 Hermes Agent 里不是一个额外工具集也不需要你自己写编排代码它被做成了普通模型系统里的 provider也就是说你可以像切模型一样切到 MoA/model default --provider moa更简单一点直接/moa如果你配置了不同 preset比如 review也可以/moa review还有一个适合日常使用的方式你可以只让某一次任务临时用 MoA跑完再切回原模型/moa review this migration plan and find the hidden risks简单问答、普通改写、短摘要没必要浪费 MoA但如果是代码审查、系统迁移、复杂 bug、产品机会判断、长链路自动化方案多一个强模型视角就有价值尤其是 Agent 任务里错一次不是回答难看一点而是可能真的改文件、跑命令、调接口还不知道如何开启/moa 命令的同学我帮你们问了我会怎么实际用如果你还没装 Hermes Agent可以先跑官方推荐的 setuphermes setup --portal先把基础链路跑通模型能用工具能用终端能用文件能读写再去试 MoA不要第一天就把所有 preset、所有 provider、所有复杂配置都堆上去我会先拿三类任务试代码和架构判断比如迁移方案、PR review、线上故障排查研究和决策比如判断一个出海 SaaS 机会是不是真需求竞品是不是伪繁荣某个 API 市场能不能做成产品长链路 Agent 工作比如让 Hermes Agent 读资料、写脚本、跑验证、整理结果、再把流程沉淀成 skill这些任务不是一句回答能结束的它需要模型有判断也需要 Agent 会继续干活MoA 的价值就在这里不是让答案看起来更豪华而是让复杂任务在真正动手之前多一轮高质量检查兄弟们真可以体验下这次 MoA 值得看的地方不是“多模型”这个概念本身多模型讨论已经很多年了真正变化的是Hermes Agent 把它做成了一个普通人能直接切换的模型入口你不需要自己写 router不需要复制 A 模型答案给 B 模型也不需要手动维护上下文更重要的是它没有牺牲 Hermes Agent 原来的工具调用、会话历史、gateway、TUI、Desktop 和 Agent loop你只是在需要的时候输入/moa然后让几个顶级模型先把问题想一遍最后由 aggregator 把活接着干下去当然它不是免费魔法MoA 会增加模型调用次数也会增加成本所以我不会把它当成默认聊天模型我会把它当成难题模式遇到复杂判断、复杂执行、复杂排错时再开最强模型被锁在少数入口里是一件现实问题Hermes Agent 没有等一个万能新模型出现而是先把现有强模型组合起来变成一个可以调用、可以配置、可以接工具的工作能力这比单纯喊“模型更强了”有意思多了学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

相关新闻

【C语言避坑指南】为什么 fscanf 读取逗号分隔的数据会失败?深度解析与解决方案

【C语言避坑指南】为什么 fscanf 读取逗号分隔的数据会失败?深度解析与解决方案

1. 案发现场&#xff1a;代码与现象我们先来还原一下问题场景。这段代码的意图很简单&#xff1a;定义一个学生结构体&#xff0c;将其写入文件&#xff0c;然后再读出来打印。原始代码#include <stdio.h>struct stu {char name[20];int age;int math; };int main() {str…

2026/6/28 2:28:14阅读更多 →
GEO优化5大致命坑:第3个,90%企业都在踩

GEO优化5大致命坑:第3个,90%企业都在踩

2026年&#xff0c;AI搜索优化&#xff08;GEO&#xff09;已经成为企业获客的新赛道。但我们跟进数十个GEO落地项目后发现&#xff1a;90%的企业&#xff0c;在前3个月都会踩中同一个致命误区&#xff0c;白白浪费时间、预算和流量机会。今天拆解GEO优化最常见的5个大坑&#…

2026/6/28 2:28:14阅读更多 →
RAG 总答偏,先查 chunk

RAG 总答偏,先查 chunk

如果你的 RAG 总把旧政策、半张表格、无权限文档混在一起&#xff0c;先别急着换 embedding。 很多检索事故不是发生在检索那一刻&#xff0c;而是文档入库时已经埋好&#xff1a;parser 后面直接接 fixed chunker&#xff0c;版本、权限、来源都没贴在知识单元上。你拿半截事…

2026/6/28 2:23:13阅读更多 →
第 46 篇:反爬虫策略与应对方案——知己知彼,百战不殆

第 46 篇:反爬虫策略与应对方案——知己知彼,百战不殆

写爬虫的人必须了解反爬虫的原理。只有知道对方怎么防,才能知道怎么攻。 本篇我们从目标站的角度出发,系统讲解: 常见反爬策略(UA、IP、验证码、JS 混淆等); 每种策略的识别方法; 每种策略的应对方案; 反爬与反反爬的"猫鼠游戏"伦理边界。 一、反爬虫策略全…

2026/6/28 5:43:24阅读更多 →
Ontology 技术入门:从语义建模到智能推理

Ontology 技术入门:从语义建模到智能推理

在数据系统越来越复杂、AI 应用越来越依赖领域知识的今天&#xff0c;Ontology&#xff08;本体&#xff09;正在从一个偏学术的概念&#xff0c;变成知识工程、智能决策、知识图谱和大模型应用中的关键基础设施。很多人第一次接触 ontology 时&#xff0c;会把它理解成“更复杂…

2026/6/28 5:43:24阅读更多 →
INT8 量化部署实战:从浮点模型到边缘芯片

INT8 量化部署实战:从浮点模型到边缘芯片

INT8 量化部署实战&#xff1a;从浮点模型到边缘芯片 边缘部署为何必须量化 在云端推理场景下&#xff0c;GPU 集群的算力冗余让模型精度与推理速度之间的矛盾并不尖锐。但当推理负载下沉到边缘侧——比如一块 STM32H743&#xff08;Cortex-M7&#xff0c;480MHz&#xff0c;1…

2026/6/28 5:43:24阅读更多 →
2026 降噪耳机怎么选?隔绝宿舍说话声,5 款学生党高性价比机型实测推荐

2026 降噪耳机怎么选?隔绝宿舍说话声,5 款学生党高性价比机型实测推荐

对于绝大多数高校学生而言&#xff0c;宿舍既是日常休息的私密空间&#xff0c;也是备考刷题、完成课业的核心学习场景。但多人共处的集体环境里&#xff0c;不可避免会出现室友交谈、语音通话、追剧外放等声音&#xff0c;这类以300-4000Hz 中高频为主的人声干扰&#xff0c;往…

2026/6/28 5:43:24阅读更多 →
四款主流收银软件深度横评:从生鲜称重到餐饮外卖的实测选型指南

四款主流收银软件深度横评:从生鲜称重到餐饮外卖的实测选型指南

在零售和餐饮行业数字化转型的浪潮中&#xff0c;选择一套合适的收银管理系统往往比购买硬件更让人头疼。很多老板在初期只关注价格&#xff0c;结果上线后发现系统在高客流时卡顿、连锁数据不同步&#xff0c;或者生鲜称重识别率低&#xff0c;导致排队拥堵&#xff0c;顾客体…

2026/6/28 5:43:24阅读更多 →
浅谈Java匿名内部类

浅谈Java匿名内部类

一、特点 基本定义 匿名内部类&#xff1a;没有类名的局部内部类&#xff0c;只能在定义时直接创建唯一对象&#xff0c;只能使用一次。 核心特点 1. 没有类名&#xff0c;不能手动实例化第二次 没有类名&#xff0c;无法用 new 类名() 再次创建对象只能在定义的同时 new 出来&…

2026/6/28 5:38:23阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月&#xff0c;Boris Cherny 公开宣布自己卸载了 IDE。一时间&#xff0c;Vibe Coding 成了全行业最热的话题。6个月后&#xff0c;当我们回过头来拉一份真实账本&#xff0c;发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言&#xff1a;审计结束三个月了&#xff0c;审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间&#xff0c;内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中&#xff0c;审计…

2026/6/28 0:08:01阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月&#xff0c;Boris Cherny 公开宣布自己卸载了 IDE。一时间&#xff0c;Vibe Coding 成了全行业最热的话题。6个月后&#xff0c;当我们回过头来拉一份真实账本&#xff0c;发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言&#xff1a;审计结束三个月了&#xff0c;审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间&#xff0c;内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中&#xff0c;审计…

2026/6/28 0:08:01阅读更多 →