AI工程范式的又一次演进:Harness Engineering
如果按月份来给AI领域划分关键词那么2月份大概属于openclaw而从3月开始这个关键词则逐渐变成了Harness Engineering。作为近两个月新兴的核心概念围绕Harness Engineering的讨论迅速展开相关文章也层出不穷。但其中相当一部分内容停留在概念层面的反复堆砌读完之后往往只剩下模糊的印象甚至会觉得莫名其妙而难以形成有效的认知。所以我打算聊一聊自己对这个概念的理解。Harness Engineering的正式采用了这个术语并给出了大规模实践案例使这个词迅速在行业内传播开来。演进历程要理解 Harness Engineering最好的方式是把它放到 AI 工程实践的演进脉络中去看。从 2022 年底 ChatGPT 引爆大模型浪潮至今工程师们围绕“如何更好地使用大模型”这个核心命题已经走过了三个清晰的阶段Prompt Engineering → Context Engineering → Harness Engineering。每一次范式的跃迁都不是对前一阶段的否定而是解决了前一阶段未能覆盖的问题。Prompt Engineering如何与大模型对话时间线2022 年底 ~ 2024 年初这是一切的起点。当大模型刚刚进入开发者视野时最直接的问题是怎么让它按我的意思来于是 Prompt Engineering提示词工程应运而生。它的核心在于精心设计输入给模型的文本指令通过措辞、格式、示例的调整来引导模型产出期望的结果。这个阶段的典型实践包括角色设定「你是一个资深的 Java 架构师请基于以下需求...」少样本学习Few-shot在 prompt 中嵌入几组输入-输出示例让模型模仿格式和风格思维链Chain of Thought引导模型「一步步思考」提升推理任务的准确率输出格式约束「请以 JSON 格式返回包含以下字段...」Prompt Engineering 的价值是真实的——在很多场景下一个精心设计的 prompt 确实能显著提升模型输出质量。但它的局限也同样明显Prompt 本质上是一次性的静态指令。当任务变得复杂、需要多步推理、需要引用外部知识时仅靠 prompt 的措辞技巧已经不够用了。你可以把一个 prompt 写到 2000 字把所有的约束、示例、上下文都塞进去但这就像试图在一封信里把所有事情交代清楚——信息越多模型越容易迷失重点。Context Engineering信息编排的工程时间线2024 年初 ~ 2025 年底随着 RAG检索增强生成、Function Calling、多轮对话记忆管理等技术的成熟工程师们意识到比起在 prompt 里堆砌文字更重要的是在正确的时机向模型提供正确的信息。这就是 Context Engineering上下文工程的核心理念。它不再只关注“怎么写提示词”而是把注意力转移到如何动态构建和管理模型的输入上下文。Context Engineering 的典型实践包括RAG根据用户查询从知识库中检索相关文档片段动态注入上下文Tool / Function Calling让模型在推理过程中主动调用外部工具获取实时信息Memory对多轮对话历史进行摘要、压缩、裁剪确保有限的上下文窗口被高效利用System Prompt 模板化根据不同场景动态组装 system prompt而非一成不变的静态文本如果说 Prompt Engineering 是“教你怎么写一封好信”那 Context Engineering 就是“设计一套信息投递系统让合适的信息在合适的时候到达合适的位置”。这个阶段的工程复杂度明显上升开发者不再只是调 prompt而是开始构建向量数据库、设计检索策略、工具管理、多步调用链路编排。围绕 LangChain、LlamaIndex 等框架的生态也在这个阶段快速发展。但 Context Engineering 仍然有一个隐含的前提人在回路中。大多数场景下模型在人类的直接监督下运行——一次调用、一次审核、一次反馈。当我们开始追求让 AI 自主完成复杂的多步任务也就是进入AI Agent的领域时新的问题浮出了水面上下文可以编排得很好但 Agent 在自主执行的过程中会偏离轨道、会产生幻觉、会在工具调用中犯错、会把有限的 token 预算耗尽在无意义的循环上——而这时没有人类在旁边及时纠偏。Harness Engineering从驾驭对话到驾驭智能体这就是 Harness Engineering 登场的背景。Harness Engineering的直译就是驾驭工程它的目标是通过构建受控、可靠、自动化的运行环境使大模型智能体AI Agent能在无人持续干预下稳定、安全、高效地完成复杂任务。注意这里的关键词——“无人持续干预”。Prompt Engineering 和 Context Engineering 本质上都在优化人机交互的单次质量而 Harness Engineering 要解决的是当你放手之后Agent 还能不能靠谱地跑下去一个有趣的渊源Test HarnessHarness这个词在软件领域并不陌生。如果你有过测试工程的经验大概率听说过Test Harness测试用具一组 stubs桩和 drivers驱动的集合用于在生产环境不可用时为被测组件模拟运行环境使测试可自动化、可重复、可隔离。我觉得 Harness Engineering 或多或少借鉴了这个概念。两者共享同一个隐喻——harness挽具/缰绳用一套外部基础设施“套住”一个核心组件使其行为可控。但从 Test Harness 到 Agent Harness包裹的对象从确定性的代码变成了不确定性的模型复杂度完全不同。Test Harness 面对的被测代码给定相同输入必定产生相同输出需要控制的只是外部依赖。而 Agent Harness 面对的大模型天然具有随机性即使相同的输入也可能产出不同的结果需要控制的是模型本身的不确定行为。所以严格来说Harness这个词在软件领域有几十年历史但Harness Engineering作为一个面向 AI Agent 的工程理念是 2026 年的新提法。它借用了传统 Test Harness 的隐喻但指向的问题域是全新的。一个不发明新技术的“新概念”坦率地说Harness Engineering 是一个综述性概念。它没有发明任何新技术——工具调用、状态管理、上下文压缩、护栏Guardrails、沙箱隔离——这些东西在 Harness 这个词出现之前就已经存在了。从这个角度看它和当年的DevOps、Platform Engineering、MLOps如出一辙给一组已有的实践起了一个名字画了一个边界建立了一套共识。但这恰恰是它的价值所在。在 DevOps 这个词出现之前开发和运维之间的协作实践已经零散地存在了——CI/CD、基础设施即代码、监控告警——但直到 DevOps 把这些实践命名为一个整体行业才形成了系统性的方法论才有了成熟的工具链和组织架构的变革。Harness Engineering 正处在类似的节点上。它把围绕 AI Agent 的各种工程实践——沙箱环境、工具注册与权限控制、状态持久化与恢复、上下文窗口管理、护栏策略、可观测性——统一纳入一个框架。这不是简单地换一个说法而是实践出真知并用这种真知指导未来的发展。一个更直觉的理解方式如果上面的技术描述还是有些抽象不妨换一个更直觉的类比。想象 AI 是一匹野马。这匹马动力十足、耐力惊人但野性难驯。你想借助它日行千里但你绝不想让它把你带到沟里去。三个阶段对应的就是驯马术的三个层次Prompt Engineering提示词工程像在旁边“喊话”——“左转慢点停”。马听不听取决于你喊得够不够准即使你喊得准马偶尔还是会不听。Context Engineering上下文工程给马提供“地图”和“路标”——让它知道前方是什么路况、应该往哪走。马的视野变广了但它仍然可能我行我素。Harness Engineering驾驭工程给马套上缰绳马鞍护栏并建好赛道加油站自动检修站。马依然是那匹马动力和能力没变但整个运行环境确保它只能在安全的范围内奔跑跑偏了会被纠正累了会自动补给出了问题会被及时发现。这三层不是替代关系而是叠加关系。好的 prompt 依然重要精准的上下文依然关键而 Harness 在此基础上加的这一层解决的是 Agent长时间自主运行时的可控性问题。结语Harness Engineering的重点不在于 Harness而在于Engineering。在软件工程领域Engineering工程这个词的含义远远超出了“编程”或“写代码”。它强调的是系统性、规范化、可预测、以及协作性地构建和维护复杂软件系统的全过程。从需求分析、架构设计到测试验证、持续交付再到监控运维——工程关注的从来不只是“能不能跑起来”而是“能不能可靠地、持续地、可维护地跑下去”。这恰好也是 AI Agent 当前面临的核心挑战。模型的能力已经足够强大但让强大的能力稳定地、安全地、可预期地交付价值——这是一个工程问题不是一个模型问题。

相关新闻

认缴出资一直不缴,股东会被“取消”资格吗?

认缴出资一直不缴,股东会被“取消”资格吗?

会,但不是公司一句话就能取消。 2024 年 7 月 1 日施行的新《公司法》第 52 条专门设了“股东失权”制度:股东认缴了出资却不按期足额缴纳,公司可以经过法定程序让他丧失对应的、尚未缴纳那部分的股权。但这套程序有严格的前置步骤和时间要求…

2026/6/23 18:50:39阅读更多 →
【剪映小助手】字幕信息生成接口(Caption Infos)

【剪映小助手】字幕信息生成接口(Caption Infos)

字幕信息生成接口 目录 简介依赖关系性能故障排除更多信息 简介 字幕信息生成接口:说明该接口在草稿自动化里的用途、依赖模块与常见报错。具体方法、路径、字段和校验请以 OpenAPI 为准。 依赖关系分析 组件依赖图 #mermaid-svg-PM1tfhvoUEcoHTeY{font-famil…

2026/6/23 18:50:39阅读更多 →
Ubuntu 20.04 下 Nextcloud Snap 部署避坑指南:SSL、权限与反向代理实战

Ubuntu 20.04 下 Nextcloud Snap 部署避坑指南:SSL、权限与反向代理实战

1. 为什么 Ubuntu 20.04 用户还在为 Nextcloud 安装反复折腾? 我第一次在 Ubuntu 20.04 上部署 Nextcloud 是 2021 年初,当时手头只有一台闲置的旧笔记本,想搭个私有云存照片和文档。结果光是环境准备就卡了三天——Apache 配置冲突、PHP 扩…

2026/6/23 18:45:39阅读更多 →
【共创季稿事节】鸿蒙原生ArkTS布局方式之List+LazyForEach懒加载布局

【共创季稿事节】鸿蒙原生ArkTS布局方式之List+LazyForEach懒加载布局

鸿蒙原生ArkTS布局方式之ListLazyForEach懒加载布局 一、引言 在移动应用开发中,长列表是最常见也最具挑战性的 UI 场景——无论是社交应用的好友动态、电商应用的商品列表,还是资讯应用的新闻流。传统的一次性加载全部数据并创建所有 UI 组件的做法&…

2026/6/23 21:11:34阅读更多 →
机器到底能不能做漆器?一手实测记录

机器到底能不能做漆器?一手实测记录

做这行五年了,手上摸过上千件大漆作品。从传统雕漆到现代漆画,从脱胎漆器到推光漆,但凡有点名气的工艺门类,我都追着看过。这几年圈子里最热的话题,不是哪位大师又得了奖,而是“机器到底能不能做漆器”——…

2026/6/23 21:11:34阅读更多 →
Nature 绘图复现 | 基因家族散点图

Nature 绘图复现 | 基因家族散点图

在发表科研论文的过程中,科研绘图是必不可少的,而提升绘图水平最直接的方法就是跟着顶刊学习。为了便于使用,本系列文章介绍的所有绘图都已收录到了 CNSplot 项目中本期我们复现的是 2020 年发表在 Nature Neuroscience 上的一篇期刊的 Figur…

2026/6/23 21:11:34阅读更多 →
微信聊天记录删了还能恢复吗?官方免费方法 + 专业第三方恢复渠道详解

微信聊天记录删了还能恢复吗?官方免费方法 + 专业第三方恢复渠道详解

生活中不少人会因清理内存、手滑误删、换机重装微信丢失重要聊天记录,转账凭证、合同沟通、家人回忆、工作资料全部无法查看。根据腾讯官方公开说明,微信不会在服务器永久储存用户私聊数据,所有聊天内容仅保存在本地手机设备中,删…

2026/6/23 21:11:34阅读更多 →
基于助睿的自媒体多平台数据清洗实验

基于助睿的自媒体多平台数据清洗实验

1 实验目的本实验依托全班同学多平台自媒体作品互动原始数据集,借助助睿 ETL 工具完成多源数据抽取、清洗与标准化预处理,生成两张业务分层数据表,为后续特征衍生、指标计算与可视化看板搭建提供合规可用数据源。通过实操训练,要求…

2026/6/23 21:11:34阅读更多 →
Sunshine游戏串流技术架构深度解析:自托管流媒体服务器实现原理

Sunshine游戏串流技术架构深度解析:自托管流媒体服务器实现原理

Sunshine游戏串流技术架构深度解析:自托管流媒体服务器实现原理 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine 1. 系统架构概述与技术实现 1.1 核心组件架构设计 Su…

2026/6/23 21:06:33阅读更多 →
【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体 一文搞定到底什么是智能体【人工智能】一文搞定到底什么是智能体一. LM,WorkFlow,Agent分别有什么么不同二. Agent的思考过程是怎样的三. Agent的五个核心部分1)LLM2)Prompt3)Me…

2026/6/23 7:04:52阅读更多 →
嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件:从原理到实战的深度解析在嵌入式系统开发中,图形用户界面(GUI)的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台,嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/23 1:55:32阅读更多 →
Google AI Studio 300美元额度的真相与实战指南

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”,而是Google埋下的第一道技术门槛 你看到标题里那个醒目的“$300美金”时,第一反应可能是:又一个免费额度?领完就完事?我亲手试过——这300美金根本不是红包,而是一张入场券&…

2026/6/23 5:55:37阅读更多 →
2026年京东云 618 活动 Hermes Agent/OpenClaw配置Token Plan新手必看指南

2026年京东云 618 活动 Hermes Agent/OpenClaw配置Token Plan新手必看指南

2026年京东云 618 活动 Hermes Agent/OpenClaw配置Token Plan新手必看指南。OpenClaw是开源的个人AI助手,Hermes Agent则是一个能自我进化的AI智能体框架。阿里云提供计算巢、轻量服务器及无影云电脑三种部署OpenClaw 与 Hermes Agent的方案、百炼Token Plan兼容主流…

2026/6/23 0:00:38阅读更多 →
2026年北京电子沙盘制作公司深度评测:从技术选型到落地效果,谁在真正定义“数字+实体”的融合边界?

2026年北京电子沙盘制作公司深度评测:从技术选型到落地效果,谁在真正定义“数字+实体”的融合边界?

模块一:行业背景——百亿赛道爆发,北京市场的特殊性与选型困局2026年,电子沙盘行业已走过“要不要做”的讨论,进入“找谁做、怎么做”的深水区。据行业研究机构数据,2025年国内电子沙盘市场规模已突破85亿元&#xff0…

2026/6/23 0:00:38阅读更多 →
音视频场景下的 Java 开发者面试:技术与挑战

音视频场景下的 Java 开发者面试:技术与挑战

面试互联网大厂:从音视频场景看 Java 开发者的技能与挑战 在互联网大厂求职的面试中,Java 开发者往往需要面对严苛的技术问题。今天,我们将通过一位名叫燕双非的搞笑程序员与严肃的面试官之间的对话,看看在音视频场景下&#xff0…

2026/6/23 0:00:38阅读更多 →