Anthropic Claude Code 研究解读：Agent 编程时代，专业判断为什么更值钱了-拓冰网站优化

摘要Anthropic 在 2026 年 6 月 16 日发布了对约 40 万个 Claude Code 交互会话的隐私保护分析试图回答一个很现实的问题当编码 Agent 能读文件、改代码、跑命令、提交结果时人类的专业能力还重要吗结论很有意思Agent 正在承担更多执行工作但真正决定成功率的仍然是用户对问题、业务和系统上下文的理解。换句话说AI 编程降低了写代码门槛却提高了“会定义问题、会验收结果、会纠偏”的价值。背景Agent 编程从工具使用进入工作方式变化过去我们谈 AI 编程重点常常是补全代码、生成函数、解释报错。现在的变化更大Claude Code、Codex、Cursor、Gemini Code Assist 等工具已经不只是回答问题而是在一个项目里连续读代码、修改文件、运行测试、分析失败、继续修复。这类 Agent 编程的核心变化是工作单元变长了。用户不再只让模型写一小段代码而是交给它一个目标比如“修复这个测试失败”“给这个服务加一个接口”“把这组数据处理成报表”。这时候人和模型之间的分工就成为关键谁决定做什么谁决定怎么做谁负责发现方向错了Anthropic 这份研究基于 2025 年 10 月到 2026 年 4 月之间约 40 万个 Claude Code 交互会话覆盖约 23.5 万名用户。它不是 benchmark而是对真实使用行为的观察因此对研发团队理解 Agent 落地更有参考价值。关键发现一人决定“做什么”Agent 决定“怎么做”Anthropic 用分类器分析会话里的决策把决策分为规划决策和执行决策。规划决策包括目标、方案、完成标准执行决策包括改哪些文件、写什么代码、用什么命令、如何组织实现。研究显示在典型会话中用户大约做出 70% 的规划决策而 Claude 做出约 80% 的执行决策。也就是说人主要控制方向Agent 主要承担实现。这和很多研发团队的体感一致。AI 编程最有效的用法不是让模型“自由发挥”也不是把它当搜索引擎而是把它变成执行力很强的工程助手。人给出约束、上下文和验收标准Agent 在这个范围内完成大量读写、修改和验证。关键发现二专业度越高Agent 每次指令能做的事越多研究里还有一个很重要的指标不同专业程度的用户每发出一条 promptClaude 会执行多少动作、输出多少内容。Anthropic 发现新手会话中每条 prompt 通常触发约 5 个 Claude 动作和约 600 词输出专家会话中每条 prompt 会触发超过两倍的动作链输出量也显著更高。文章还指出在控制工作类型、任务价值、月份、职业和模型家族等因素后用户专业度每提升一级Claude 的动作量和输出量仍然显著增加。这说明“会用 Agent”不是多写提示词模板而是能给出高质量任务定义。专业用户知道哪些文件相关、哪些边界不能破、什么测试必须跑、什么结果才算完成。Agent 因此能更放心地展开执行而不是在模糊指令里反复试错。关键发现三编码背景没那么绝对领域理解更重要一个很有启发的结果是在会产生代码变更的会话中软件相关职业和非软件职业的成功率差距并没有想象中那么大。Anthropic 报告称主要职业类别在编码任务上的成功率与软件工程职业组相差不大。这并不意味着软件工程能力不重要而是说明 Agent 把一部分“把意图翻译成代码”的工作吸收掉了。对于财务、法律、运营、科研等领域的人来说如果他们非常清楚业务规则、数据含义和验收标准就有可能指挥 Agent 完成过去必须由程序员实现的自动化任务。对企业研发团队来说这会改变需求交付链路。未来一部分内部工具、数据处理脚本、报表自动化可能由业务专家直接借助 Agent 完成。研发团队的角色会更多转向平台治理、代码质量、权限隔离、复用组件和生产化审核。关键发现四任务类型正在从修 bug 转向端到端工作Anthropic 观察到2025 年 10 月到 2026 年 4 月之间Claude Code 会话的任务结构发生了变化修复故障代码的比例明显下降而运行软件、部署配置、数据分析、文档写作等更端到端的工作占比上升。这说明 Agent 编程不只是提高 debug 效率它正在进入软件生命周期的更多环节。一个 Agent 会话可能包含理解需求、查代码、改实现、跑测试、写说明、准备部署命令。对研发团队的启发是评估 Agent 工具不能只看“能不能修一道题”还要看它能不能安全地跨越多个工程环节。权限模型、命令执行范围、测试环境、代码审查、日志留存和回滚机制会变得越来越重要。对研发团队的实践建议第一把 Agent 当作执行单元而不是决策者。让人负责目标、约束、上下文和验收标准让 Agent 负责搜索、修改、运行和整理。第二要求用户给出可验证的完成标准。例如“所有单测通过”“生成迁移脚本并 dry-run”“输出差异说明和回滚方案”。没有验收标准的任务Agent 很容易看起来完成了实际上留下隐患。第三为 Agent 建立权限边界。读代码和跑测试可以放宽写生产配置、删除数据、推送代码、触发部署则应该有明确确认或审查流程。第四培训重点不要只放在提示词而要放在任务分解、系统理解、测试设计和代码审查。真正放大 Agent 能力的是专业判断而不是漂亮话术。第五关注非研发岗位的低代码/轻代码需求。业务专家未来会越来越多地借助 Agent 写脚本、分析数据和生成工具研发团队应该提供模板、沙箱、依赖管理和安全规范。风险与限制这份研究依赖模型分类器分析会话不能直接等同于真实世界业务结果。一个会话通过测试或提交代码并不代表上线后一定正确。Claude Code 用户也不完全代表所有编程 Agent 用户不同工具、组织和权限环境下结果可能不同。另外Agent 让更多人能够生成代码也会带来新的治理问题谁负责代码质量谁负责安全漏洞谁决定脚本是否可以接入生产数据如果企业只看到效率提升而没有补上审查和权限体系风险会随着使用规模一起扩大。结论Anthropic 这项研究给研发团队的核心信号是Agent 编程不会让专业能力消失反而会把专业能力从“亲手实现每一行代码”迁移到“定义正确问题、约束执行路径、验证最终结果”。未来优秀的工程师和业务专家可能不只是写代码更快而是能更好地指挥 Agent 完成复杂任务。企业要抓住这波效率提升不能只采购工具还要建设 Agent 工作流、权限边界、测试规范和代码审查机制。参考来源Anthropic ResearchAgentic coding and persistent returns to expertise2026-06-16https://www.anthropic.com/research/claude-code-expertiseAnthropic Claude Code 产品页https://www.anthropic.com/claude-code

相关新闻

Voohu：车载以太网1000BASE-T1共模扼流圈的宽带阻抗匹配与信号完整性设计

车载以太网1000BASE-T1采用单对非屏蔽双绞线（UTP）实现1Gbps全双工传输，工作频率高达600MHz。共模扼流圈（CMC）是抑制共模噪声、保证信号完整性的关键元件，需在宽频带内提供足够的共模阻抗，同时最…

2026/6/27 13:36:55阅读更多 →

“电商的‘王牌’TMS，为何到了医药行业就成了‘废铁’？”

在运输管理系统（TMS）的选型讨论中，一个经常被忽略的问题——TMS的行业适配性到底重不重要？ 答案是：极其重要，而且不同行业之间的功能差异远比想象中更大。很多企业选型时，倾向于寻找“功能最…

2026/6/27 13:58:48阅读更多 →

人形机器人芯片设计

序言人形机器人芯片设计，正处于一个“从能用迈向好用、从通用走向专用”的关键转折点。一台人形机器人全身有数十到数百个关节，每个关节都需要独立的电机驱动和编码器。如果说算法是机器人的“灵魂”，那么芯片就是承载灵魂的“骨骼”与“神…

2026/6/27 14:50:16阅读更多 →

如何快速精通猫抓工具：新手终极实战手册

如何快速精通猫抓工具：新手终极实战手册【免费下载链接】cat-catch 猫抓浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 还在为网页上的精彩视频无法保存而烦恼吗&…

2026/6/27 19:51:42阅读更多 →

两位华西博士+两位副高：皓贝一口腔医院的专家底气

皓贝一口腔医院的专家团队配置，围绕“两位华西博士两位副主任医师”的核心架构展开。两位华西博士分别来自四川大学华西口腔医学院和华西医科大学口腔医学院，在种植和正畸两个方向各有专攻。种植方向的博士专家，拥有15年三甲口腔专科医院种植…

2026/6/27 19:51:42阅读更多 →

筛选自动化获客工具，至臻AI覆盖抖音全链路

如何理性看待“青岛AI员工软件排名”与选型维度在寻找“青岛AI员工软件排名前十的品牌有哪些”相关答案时，企业主往往会面临信息不对称的问题。实际上，行业内并没有官方发布的绝对排名，不同工具的技术路径和适用场景差异巨大。与其纠结于模糊…

2026/6/27 19:51:42阅读更多 →

5分钟解锁网易云音乐NCM格式：跨平台音乐解密全攻略

5分钟解锁网易云音乐NCM格式：跨平台音乐解密全攻略【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 你是否曾经下载了网易云音乐的歌曲，却发现它们被加密成NCM格式，只能在特定客户端播放&#xff1…

2026/6/27 19:51:42阅读更多 →

【JAVA毕设源码分享】基于SpringBoot的宠物领养一站式服务系统设计与实现(程序+文档+代码讲解+一条龙定制)

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…

2026/6/27 19:51:41阅读更多 →

从30分钟到5分钟！用C++20模块化与分布式编译榨干硬件性能

作为一名深耕C多年的技术专家，我深知编译效率对开发者的意义——它不仅是生产力的放大器，更是项目成败的隐形推手。想象一下，修改一行代码，却要等待30分钟才能看到结果，这种“时间黑洞”足以扼杀任何灵感。今天&#x…

2026/6/27 19:46:41阅读更多 →

【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体一文搞定到底什么是智能体【人工智能】一文搞定到底什么是智能体一. LM，WorkFlow，Agent分别有什么么不同二. Agent的思考过程是怎样的三. Agent的五个核心部分1）LLM2）Prompt3）Me…

2026/6/27 11:20:40阅读更多 →

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件：从原理到实战的深度解析在嵌入式系统开发中，图形用户界面（GUI）的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台，嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/27 5:46:02阅读更多 →

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”，而是Google埋下的第一道技术门槛你看到标题里那个醒目的“$300美金”时，第一反应可能是：又一个免费额度？领完就完事？我亲手试过——这300美金根本不是红包，而是一张入场券&…

2026/6/27 11:20:39阅读更多 →

10分钟AI语音克隆与实时变声：Retrieval-based-Voice-Conversion-WebUI完整指南

10分钟AI语音克隆与实时变声：Retrieval-based-Voice-Conversion-WebUI完整指南【免费下载链接】Retrieval-based-Voice-Conversion-WebUI Easily train a good VC model with voice data < 10 mins! 项目地址: https://gitcode.com/GitHub_Trending/re/Retrie…

2026/6/27 0:04:03阅读更多 →

Layerdivider：3分钟AI智能分层，彻底告别手动抠图时代

Layerdivider：3分钟AI智能分层，彻底告别手动抠图时代【免费下载链接】layerdivider A tool to divide a single illustration into a layered structure. 项目地址: https://gitcode.com/gh_mirrors/la/layerdivider 还在为复杂的图像分层工作烦…

2026/6/27 0:04:03阅读更多 →

Tomcat中X-Frame-Options配置实战：防御点击劫持的四种方法与最佳实践

1. 项目概述：为什么X-Frame-Options是Web安全的“防盗门”？最近在排查一个老项目的安全审计报告时，又被提到了“点击劫持”风险，矛头直指缺失的X-Frame-Options响应头。这已经不是第一次了，很多开发团队，尤…

2026/6/27 0:04:03阅读更多 →