Anthropic Claude Code 研究解读:Agent 编程时代,专业判断为什么更值钱了
摘要Anthropic 在 2026 年 6 月 16 日发布了对约 40 万个 Claude Code 交互会话的隐私保护分析试图回答一个很现实的问题当编码 Agent 能读文件、改代码、跑命令、提交结果时人类的专业能力还重要吗结论很有意思Agent 正在承担更多执行工作但真正决定成功率的仍然是用户对问题、业务和系统上下文的理解。换句话说AI 编程降低了写代码门槛却提高了“会定义问题、会验收结果、会纠偏”的价值。背景Agent 编程从工具使用进入工作方式变化过去我们谈 AI 编程重点常常是补全代码、生成函数、解释报错。现在的变化更大Claude Code、Codex、Cursor、Gemini Code Assist 等工具已经不只是回答问题而是在一个项目里连续读代码、修改文件、运行测试、分析失败、继续修复。这类 Agent 编程的核心变化是工作单元变长了。用户不再只让模型写一小段代码而是交给它一个目标比如“修复这个测试失败”“给这个服务加一个接口”“把这组数据处理成报表”。这时候人和模型之间的分工就成为关键谁决定做什么谁决定怎么做谁负责发现方向错了Anthropic 这份研究基于 2025 年 10 月到 2026 年 4 月之间约 40 万个 Claude Code 交互会话覆盖约 23.5 万名用户。它不是 benchmark而是对真实使用行为的观察因此对研发团队理解 Agent 落地更有参考价值。关键发现一人决定“做什么”Agent 决定“怎么做”Anthropic 用分类器分析会话里的决策把决策分为规划决策和执行决策。规划决策包括目标、方案、完成标准执行决策包括改哪些文件、写什么代码、用什么命令、如何组织实现。研究显示在典型会话中用户大约做出 70% 的规划决策而 Claude 做出约 80% 的执行决策。也就是说人主要控制方向Agent 主要承担实现。这和很多研发团队的体感一致。AI 编程最有效的用法不是让模型“自由发挥”也不是把它当搜索引擎而是把它变成执行力很强的工程助手。人给出约束、上下文和验收标准Agent 在这个范围内完成大量读写、修改和验证。关键发现二专业度越高Agent 每次指令能做的事越多研究里还有一个很重要的指标不同专业程度的用户每发出一条 promptClaude 会执行多少动作、输出多少内容。Anthropic 发现新手会话中每条 prompt 通常触发约 5 个 Claude 动作和约 600 词输出专家会话中每条 prompt 会触发超过两倍的动作链输出量也显著更高。文章还指出在控制工作类型、任务价值、月份、职业和模型家族等因素后用户专业度每提升一级Claude 的动作量和输出量仍然显著增加。这说明“会用 Agent”不是多写提示词模板而是能给出高质量任务定义。专业用户知道哪些文件相关、哪些边界不能破、什么测试必须跑、什么结果才算完成。Agent 因此能更放心地展开执行而不是在模糊指令里反复试错。关键发现三编码背景没那么绝对领域理解更重要一个很有启发的结果是在会产生代码变更的会话中软件相关职业和非软件职业的成功率差距并没有想象中那么大。Anthropic 报告称主要职业类别在编码任务上的成功率与软件工程职业组相差不大。这并不意味着软件工程能力不重要而是说明 Agent 把一部分“把意图翻译成代码”的工作吸收掉了。对于财务、法律、运营、科研等领域的人来说如果他们非常清楚业务规则、数据含义和验收标准就有可能指挥 Agent 完成过去必须由程序员实现的自动化任务。对企业研发团队来说这会改变需求交付链路。未来一部分内部工具、数据处理脚本、报表自动化可能由业务专家直接借助 Agent 完成。研发团队的角色会更多转向平台治理、代码质量、权限隔离、复用组件和生产化审核。关键发现四任务类型正在从修 bug 转向端到端工作Anthropic 观察到2025 年 10 月到 2026 年 4 月之间Claude Code 会话的任务结构发生了变化修复故障代码的比例明显下降而运行软件、部署配置、数据分析、文档写作等更端到端的工作占比上升。这说明 Agent 编程不只是提高 debug 效率它正在进入软件生命周期的更多环节。一个 Agent 会话可能包含理解需求、查代码、改实现、跑测试、写说明、准备部署命令。对研发团队的启发是评估 Agent 工具不能只看“能不能修一道题”还要看它能不能安全地跨越多个工程环节。权限模型、命令执行范围、测试环境、代码审查、日志留存和回滚机制会变得越来越重要。对研发团队的实践建议第一把 Agent 当作执行单元而不是决策者。让人负责目标、约束、上下文和验收标准让 Agent 负责搜索、修改、运行和整理。第二要求用户给出可验证的完成标准。例如“所有单测通过”“生成迁移脚本并 dry-run”“输出差异说明和回滚方案”。没有验收标准的任务Agent 很容易看起来完成了实际上留下隐患。第三为 Agent 建立权限边界。读代码和跑测试可以放宽写生产配置、删除数据、推送代码、触发部署则应该有明确确认或审查流程。第四培训重点不要只放在提示词而要放在任务分解、系统理解、测试设计和代码审查。真正放大 Agent 能力的是专业判断而不是漂亮话术。第五关注非研发岗位的低代码/轻代码需求。业务专家未来会越来越多地借助 Agent 写脚本、分析数据和生成工具研发团队应该提供模板、沙箱、依赖管理和安全规范。风险与限制这份研究依赖模型分类器分析会话不能直接等同于真实世界业务结果。一个会话通过测试或提交代码并不代表上线后一定正确。Claude Code 用户也不完全代表所有编程 Agent 用户不同工具、组织和权限环境下结果可能不同。另外Agent 让更多人能够生成代码也会带来新的治理问题谁负责代码质量谁负责安全漏洞谁决定脚本是否可以接入生产数据如果企业只看到效率提升而没有补上审查和权限体系风险会随着使用规模一起扩大。结论Anthropic 这项研究给研发团队的核心信号是Agent 编程不会让专业能力消失反而会把专业能力从“亲手实现每一行代码”迁移到“定义正确问题、约束执行路径、验证最终结果”。未来优秀的工程师和业务专家可能不只是写代码更快而是能更好地指挥 Agent 完成复杂任务。企业要抓住这波效率提升不能只采购工具还要建设 Agent 工作流、权限边界、测试规范和代码审查机制。参考来源Anthropic ResearchAgentic coding and persistent returns to expertise2026-06-16https://www.anthropic.com/research/claude-code-expertiseAnthropic Claude Code 产品页https://www.anthropic.com/claude-code

相关新闻

Voohu:车载以太网1000BASE-T1共模扼流圈的宽带阻抗匹配与信号完整性设计

Voohu:车载以太网1000BASE-T1共模扼流圈的宽带阻抗匹配与信号完整性设计

车载以太网1000BASE-T1采用单对非屏蔽双绞线(UTP)实现1Gbps全双工传输,工作频率高达600MHz。共模扼流圈(CMC)是抑制共模噪声、保证信号完整性的关键元件,需在宽频带内提供足够的共模阻抗,同时最…

2026/6/18 12:03:21阅读更多 →
“电商的‘王牌’TMS,为何到了医药行业就成了‘废铁’?”

“电商的‘王牌’TMS,为何到了医药行业就成了‘废铁’?”

在运输管理系统(TMS)的选型讨论中,一个经常被忽略的问题——TMS的行业适配性到底重不重要? 答案是:极其重要,而且不同行业之间的功能差异远比想象中更大。 很多企业选型时,倾向于寻找“功能最…

2026/6/18 12:03:21阅读更多 →
人形机器人芯片设计

人形机器人芯片设计

序言 人形机器人芯片设计,正处于一个“从能用迈向好用、从通用走向专用”的关键转折点。一台人形机器人全身有数十到数百个关节,每个关节都需要独立的电机驱动和编码器。如果说算法是机器人的“灵魂”,那么芯片就是承载灵魂的“骨骼”与“神…

2026/6/18 12:03:21阅读更多 →
效率突围|okbiye AI PPT生成:打破模板固化,解锁全场景无门槛演示创作

效率突围|okbiye AI PPT生成:打破模板固化,解锁全场景无门槛演示创作

okbiye-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/AI PPTAI PPT制作 - Okbiye智能写作https://www.okbiye.com/ppt 在学习和办公的日常里,PPT从来都不是简单的图文拼接,而是成果输出、观点表达、场景汇报的核心载体。但绝大多数人做PPT…

2026/6/18 13:04:27阅读更多 →
普通人用AI搞钱的核心逻辑:信息差、工具差与规模化

普通人用AI搞钱的核心逻辑:信息差、工具差与规模化

当别人还在纠结“AI会不会取代我”的时候,已经有人靠AI月入十万。秘密不在模型有多强,而在于你比别人早知道什么、早会用什麼、早规模化什么。一、先看一组数据,你就懂了 2026年3月30日,中文大模型基准测评SuperCLUE发布了最新结果…

2026/6/18 13:04:27阅读更多 →
NXP JN516x MicroMAC API:超低功耗无线传感器节点的底层通信利器

NXP JN516x MicroMAC API:超低功耗无线传感器节点的底层通信利器

1. 项目概述与核心价值如果你正在开发基于能量收集(Energy Harvesting)技术的超低功耗无线传感器节点,比如那些从环境光、振动或温差中获取微弱能量的设备,那么功耗就是你头顶的达摩克利斯之剑。每一微安电流、每一毫秒的射频活动…

2026/6/18 13:04:27阅读更多 →
剪流GEO:2026年线上品牌曝光,AI工具如何让品牌影响力破局重生

剪流GEO:2026年线上品牌曝光,AI工具如何让品牌影响力破局重生

你是否察觉,一场无声的变革正在席卷互联网?当用户习惯性地向DeepSeek、豆包、Kimi提问“哪个品牌更好”,当超过70%的消费者借助AIGC做出购买决策——你的品牌,还能在AI的答案里“被看见”吗? 令人警醒的现实是&#xf…

2026/6/18 13:04:27阅读更多 →
AI驱动浏览器自动化:基于PlayWright MCP的实践指南

AI驱动浏览器自动化:基于PlayWright MCP的实践指南

1. 项目概述:当AI学会“动手”,自动化进入新纪元最近在折腾一个挺有意思的东西,我把它叫做“让AI长出手脚”。听起来有点科幻,但核心其实很实在:我们平时用Claude、ChatGPT这类大模型聊天、写代码、分析问题&#xff0…

2026/6/18 13:04:27阅读更多 →
如何通过智能调度释放CPU性能:CPUDoc完整优化指南

如何通过智能调度释放CPU性能:CPUDoc完整优化指南

如何通过智能调度释放CPU性能:CPUDoc完整优化指南 【免费下载链接】CPUDoc 项目地址: https://gitcode.com/gh_mirrors/cp/CPUDoc 还在为电脑卡顿、游戏掉帧而烦恼吗?你是否知道Windows系统默认的CPU调度策略可能正在浪费你的硬件性能&#xff1…

2026/6/18 12:59:19阅读更多 →
ZigBee HA智能家居开发实战:从集群模型到NXP JN516x代码实现

ZigBee HA智能家居开发实战:从集群模型到NXP JN516x代码实现

1. ZigBee HA:智能家居的“通用语言”与开发基石如果你正在或计划踏入智能家居设备开发领域,尤其是基于ZigBee协议,那么“ZigBee Home Automation”这个名词你一定不陌生。它不仅仅是ZigBee联盟定义的一套应用层规范,更是确保不同…

2026/6/18 0:00:24阅读更多 →
Java毕设选题推荐:基于 Spring Boot 的个人随笔博客运维管理系统的设计与实现 基于 Spring Boot 的用户原创博客分享社区【附源码、mysql、文档、调试+代码讲解+全bao等】

Java毕设选题推荐:基于 Spring Boot 的个人随笔博客运维管理系统的设计与实现 基于 Spring Boot 的用户原创博客分享社区【附源码、mysql、文档、调试+代码讲解+全bao等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

2026/6/18 0:00:24阅读更多 →
JN517x嵌入式开发实战:看门狗、脉冲计数器与I2C接口的深度解析与避坑指南

JN517x嵌入式开发实战:看门狗、脉冲计数器与I2C接口的深度解析与避坑指南

1. 项目概述在嵌入式开发领域,尤其是基于NXP JN517x这类无线微控制器的项目中,系统稳定性和与外设的可靠交互是两大核心挑战。前者关乎产品能否在无人值守的复杂环境中长期运行,后者则决定了设备能否准确感知世界并与其他芯片“对话”。JN517…

2026/6/18 0:00:24阅读更多 →