Anthropic连续发力!Sonnet5上线Fable限时归来,Claude Science可能才是那个学术王炸!
宝子们好这里是AIWritePaper官方账号~这两天Anthropic的动作有点密集。Claude Sonnet 5 发布直接进入Free和Pro的默认模型位置也同步出现在Claude Code和Claude Platform。官方给它的关键词是agentic它能制定计划能调用浏览器和终端能把过去需要更大模型才能撑住的多步骤任务继续往前推。Claude Science也开始公测。它不是一个新聊天框而是面向科学家的AI workbench。它能接入科研人员常用的数据库、代码环境、计算资源和专业工具也能把图表、手稿、代码和审查记录放在一起。再加上额度重置以及Fable 5限时返场这几条消息放在一起看Anthropic想做的已经很清楚模型已经准备进入研究流程。以前我们问 AI能不能帮我写一段综述现在更该问的是能不能把文献、证据、图表、代码、引用和审稿意见放进同一个可追溯流程里Claude Science把结构、生物信息、图表和分析工作放在同一个科研界面里。这件事对于学术人来说比又多一个大模型更值得认真看。一、Claude Science 从“帮我写”到“一起验证”Claude Science目前开放测试Mac和Linux版本已经上线只是安装后是一个localhost的web服务。。。有点草率了。。跟分享的应用画风不是很一致。。要不是设置里那几个安装完成后需要预先配置的生信方向的skills。我真以为只是个本地服务套上了个claude的ui接了个中转的api。。Claude Science的官方定位是给科学家的AI workbench。这个词比chat更准确。由于今天又刷新了一下额度。。小编把5小时额度给干没了。。晚点测试一下这货的真实能力到底如何。而且有个很大的问题。。它有sonnet 5但是没有fable。。说白了workbench应该更像实验台。材料放在哪里工具怎么调用计算在哪里跑图表怎么生成结果如何复现哪一步需要人批准哪一步可以交给机器执行都要有位置。传统学术写作通常很碎。文献在Zotero笔记在Obsidian数据在Excel或R图表在Python脚本里论文正文在Word修改意见散在邮件和批注里。Claude/Codex加进来以后很多人只是多开了一个聊天窗口让它帮忙概括文献、改写段落、润色摘要。问题也出在这里聊天窗口能生成文字却很难天然保留证据链。Claude Science需要解决的是每个输出都带有生成历史、代码环境、输入说明和对话记录。图表不是只给一张图片而是连同生成代码和环境一起交给你。手稿不是只给一段文字而是可以沿着来源、计算、图表和修改记录回头检查。学术写作里的 workbench至少要留下四条线索放到论文写作里这个提醒很实用。AI辅助论文不能只追求段落顺而要把“为什么这么写”保留下来。一段文献综述最好能追到原始论文。一个数字最好能追到数据表或计算脚本。一张图最好能追到绘图代码。总结出来的内容最好能知道它来自哪组证据而不是来自模型的顺手补全。看看官方配图。。和目前的beta版区别贼大。。可复现artifact的关键在于图表、代码、环境和修改意见同时存在不只是导出一张漂亮图片。写得像论文只是表面。经得起回看才是学术写作真正需要的能力。二、Sonnet 5 适合日常学术任务的执行层Sonnet 5这次发布有一个定位很适合普通学术写作者它不是被包装成最顶级模型而是被放在性价比和执行能力的位置上。官方说Sonnet 5在推理、工具调用、编码和知识工作上明显强于Sonnet 4.6部分高effort场景可以接近 Opus 4.8同时价格更低。发布初期的API价格是每百万输入 token 2 美元、输出 10 美元8 月 31日后恢复到输入 3 美元、输出 15 美元。这个定价逻辑说明它更像日常任务的主力模型。Sonnet 5 的价值不在于取代所有高阶模型而在于用更合适的成本覆盖大量日常知识工作。学术写作里有大量任务并不需要最贵模型但很需要一个稳定执行层。比如整理材料。把一批文献按研究对象、方法、样本、核心发现、局限整理成表格这件事不炫技但很耗时间。模型需要耐心、格式稳定、不要漏列。再比如推进结构。根据研究问题生成章节接口表检查绪论是否导出了研究缺口判断方法章节能不能回答研究问题。这类任务需要推理但更需要按流程做完而不是给两句空泛建议。还有代码和图表。现在很多论文都绕不开数据处理、可视化和格式转换。Sonnet 5 更强的工具调用和终端能力适合处理清洗表格、生成初版图表、检查脚本错误、把图注和图表逻辑对应起来。局部审稿也适合放在这一层。让它只检查一个小节有没有概念跳跃、引用是否对应、段落是否堆砌。这种任务不值得每次都调用最贵模型但确实需要一个不容易半途而废的助手。所以Sonnet 5 对学术写作的意义不是替你写完论文而是把那些低到中高难度的研究杂活稳定接住。你给它边界和材料它帮你把流程往前推。三、Fable 5 适合长周期难题Fable 5重新开放以后很容易让人产生一个误解既然它更强写论文是不是就应该直接上Fable不一定。Anthropic对Fable 5的定位是高难度知识工作、长周期项目和复杂agent任务。官方页面提到它适合多阶段任务、长时间推进、自我检查、代理协作。换句话说Fable 5是为了处理那些普通模型会中途失焦、漏掉约束、无法持续维护上下文的大任务。任务类型更适合的模型位置原因文献矩阵、摘要整理、局部润色、图表脚本修错Sonnet 5执行稳定、成本更合适不需要每次动用最高阶模型。长篇综述规划、跨材料论证、多 Agent 审稿Fable 5更适合长周期、多阶段、需要自我检查和持续上下文的任务。科研数据、代码、图表、文稿、计算资源打通Claude Science / 工作台范式关键不只是模型强而是能把工具、记录、复现和审查串起来。一篇长篇综述如果要处理上千篇文献需要做摘要以及提取核心主张、关键证据、量化结论、争议点和研究脉络再构建可审查的叙事框架这类任务更接近Fable 5的应用场景。一篇跨材料论文如果同时有访谈、问卷、公开数据和政策文本需要把不同材料对应到不同研究问题并检查结论有没有超过证据范围也更适合交给更强的长周期模型协助规划。多轮深度审稿也是类似场景。方法审稿、理论审稿、证据审稿、语言审稿不同视角反复检查同一份论文规划。这里的价值不是生成更多文字而是让漏洞暴露出来。但如果只是改摘要、调语序、写一封投稿邮件大概率是浪费。学术写作里最常见的问题不是模型不够强而是任务没有拆开证据没有准备好完成标准没有写清楚。拿更强模型去处理模糊任务只会得到更高级的模糊输出。更合理的分工是Sonnet 5做日常推进Fable 5做少数长周期难题Claude Science这类工作台负责把材料、工具、计算和审查串起来。四、Claude Science多Agent 综述写作Claude Science的案例里最值得学术写作者认真看的是Allen Institute神经科学家Jérôme Lecoq的长篇综述流程。这个案例的关键设计是把综述拆成一套计算流程子Agent阅读大量论文提取中心论点和关键量化发现存入evidence state database流程再构建叙事弧线按章节分配给不同子Agent每个章节内部还会从证据库生成跨研究的量化图表。它使用了actor-critic pairs一个 Agent 负责生成内容另一个独立的reviewer agent 检查准确性和引用保真。这才是 AI 辅助学术写作真正高级的地方先做证据库再做叙事先抽取可核查事实再生成章节先有 reviewer agent再进入终稿。很多宝子们现在用AI写综述流程大概是题目丢进去让模型列大纲再逐节扩写快交稿时人工补几个引用。这个流程看起来快但证据状态不可控。模型写到哪里证据跟到哪里常常说不清。Lecoq这个案例提供了另一种做法先做证据库再做叙事先抽取可核查事实再生成章节先有 reviewer agent再进入终稿。Reviewer agent 的意义不是替你写得更像论文而是把引用、计算和证据错误提前拦下来。普通学术写作者未必需要Claude Science也未必能处理上千篇论文。但可以搭一个轻量版。先把文献做成证据表。每篇文献至少记录研究对象、方法、样本、核心发现、关键数字、局限和可引用位置。再把观点挂到证据上。每个想写进论文的判断都要对应一条或多条证据。挂不上去的判断先不要写进正文。生成章节时不让模型自由发挥背景知识只允许它使用证据表里的内容。完成后另起一次reviewer pass只检查引用是否对应、结论是否越界、有没有把相关关系写成因果。收口时还是人来判断。AI可以帮你发现问题但论文的责任不能外包。这套流程不需要神奇提示词却更接近真正的学术写作。五、Claude Science 能把你的论文变成一个小型 workbench不是每个人都在做蛋白质结构预测也不是每篇论文都需要 HPC 集群。Claude Science 看起来离普通文科、教育学、管理学论文很远但它背后的工作台逻辑其实很通用。科研工作台的另一层价值是把本地环境、远程计算、代码执行和结果回收接到同一条链路里。一篇论文可以拆出的四个工作区。这样一来AI的角色会清楚很多它不是论文作者而是材料整理员、结构助理、初稿生成器和审稿助手。研究问题怎么定义证据边界怎么守最终结论能说到哪里仍然是人的责任。Claude Science 给普通写作者的提醒也在这里别再只问模型会不会写开始设计它在研究流程里应该站在哪个位置。六、把这套思路落地从一张研究任务卡开始如果想把上面的思路落到自己的论文里不必一上来搭一个复杂系统。先从一张研究任务卡开始。这张卡片要写清楚几件事研究对象是谁研究问题是什么手里有哪些材料暂时不讨论什么结论最多能推到哪里。只要这几行写不清后面的大纲再漂亮也只是模型在替你补空白。接着做文献矩阵可以让Claude/Codex帮你整理可以但表格字段要可检查作者、年份、对象、方法、核心发现、关键证据、可用章节、不能推出的结论。末尾那一列很重要它能提醒你不要把材料往外推得太远。文献矩阵之后再做证据地图。把准备写进论文的判断逐条列出来让 AI 帮你匹配证据。没有证据支撑的判断单独标为待补材料。不要急着把它润色进正文。等证据地图稳定再写章节接口。绪论要交出研究问题文献综述要交出研究缺口方法章节要交出可执行路径分析章节要交出被证据支持的解释结论章节只能交出有限回答。模型分工也可以在这个阶段定下来。日常整理、局部改写、图表脚本和小节检查用Sonnet 5这类执行层模型就够。长篇综述、跨材料论证、多Agent审稿再考虑Fable 5或更高阶模型。不是所有任务都需要最贵模型也不是所有任务都应该压成一个prompt。生成之后最好另起一个对话做独立审查。只查引用是否对应数字是否可追溯结论是否越界概念有没有混用是否出现没有来源的“已有研究表明”。还有一件事容易被忽略就是保留记录。重要提示词、版本变化、数据处理代码、图表生成脚本和人工修改记录都值得留下来。它们不是形式主义而是答辩、投稿、返修和复现时的底气。这套流程的目标不是让论文AI味太重而是让论文重新回到研究本身。AI可以提速但每一步都要留下痕迹。七、收束一下AI 学术写作的下一阶段是“可审计的协作”Claude Science、Sonnet 5、Fable 5 放在一起看会出现一个很清晰的方向。模型会继续变强但真正改变学术写作的不只是更强的生成能力而是更完整的协作机制能接工具能跑代码能调计算资源能生成图表能保留历史也能让 reviewer agent 检查引用和计算。这会把学术写作从“Claude/Codex帮我写一段”推向“Claude/Codex帮我维护一个研究系统”。但这不意味着研究者可以退场。模型越强研究者越要清楚自己负责什么定义问题、选择材料、确认方法、判断证据、守住结论边界。开题时Claude/Codex可以帮你把题目压窄不能替你决定什么问题值得研究。写综述时Claude/Codex可以帮你整理文献不能替你判断哪些争议真正构成缺口。做图表时Claude/Codex可以帮你改代码、调样式不能替你确认口径是否合理。返修时Claude/Codex可以帮你拆审稿意见不能替你承担结论的学术责任。以后真正会用 AI 写论文的人可能不是最会写 prompt 的人而是最会搭工作台的人。他的文献不是散的证据不是飘的图表不是孤立的引用不是补上去的审稿也不是临交稿才想起来的。Claude/Codex负责把流程跑起来研究者负责让流程站得住。

相关新闻

定义判断知识点

定义判断知识点

目录 单定义多定义 双定义三定义 抽象定义/难题刷题 单定义 定义判断没有多少知识点,更多像言语的细节题,属于比较费时的版块。 单定义题圈划出关键词,即主谓宾,定状补等限定词,快速对比选项区别。 关键词不宜划多&a…

2026/7/3 1:08:46阅读更多 →
Python 零基础入门:运算符、格式化输出与字符编码全解(避坑版)

Python 零基础入门:运算符、格式化输出与字符编码全解(避坑版)

Python 零基础入门:运算符、格式化输出与字符编码全解(避坑版) 摘要 本文面向纯零基础学习者,系统拆解Python三大核心基础:格式化输出全用法、全品类运算符与优先级、字符编码底层原理。全文附带可直接运行的示例代码、…

2026/7/3 1:03:45阅读更多 →
Multimodal-CoT:多模态思维链的工程落地与工业实践

Multimodal-CoT:多模态思维链的工程落地与工业实践

1. 什么是真正的“思维链”——不是技巧,而是认知建模的底层迁移你有没有试过让ChatGPT解一道初中物理题,比如“一个质量为2kg的物体从10米高处自由下落,忽略空气阻力,求落地时的速度?”——它大概率会直接套用公式 $v…

2026/7/3 1:03:45阅读更多 →
支付宝小程序大文件分片上传实战:实现断点续传与并发控制

支付宝小程序大文件分片上传实战:实现断点续传与并发控制

1. 项目概述与核心价值最近在做一个支付宝小程序的工具类项目,用户需要上传一些设计稿和原型文件,文件大小从几兆到几百兆不等。直接调用支付宝官方的my.uploadFileAPI,遇到超过10MB的文件就很容易失败,网络一波动,用户…

2026/7/3 2:18:49阅读更多 →
基于C++的高校信息查询与管理系统设计与实现

基于C++的高校信息查询与管理系统设计与实现

摘要:本系统是一个基于C语言开发的高校信息管理系统,实现了对全国高校基本信息的录入、查询、修改和删除等功能。系统采用模块化设计思想,使用自定义链表作为核心数据结构,支持灵活的查询语法和数据验证机制。项目概览项目简介本项…

2026/7/3 2:18:49阅读更多 →
AI SQL 改写边界:能改快,不代表可以自动上线

AI SQL 改写边界:能改快,不代表可以自动上线

AI SQL 改写边界:能改快,不代表可以自动上线 一、SQL 改写的风险不在语法,而在语义 AI 辅助 SQL 改写很诱人。给它一条慢 SQL、执行计划和表结构,它可以生成看起来更简洁的写法,甚至建议索引和 join 顺序。但数据库系统…

2026/7/3 2:18:49阅读更多 →
安汇平台:从出金体验与流程透明度看资金管理的实际感受

安汇平台:从出金体验与流程透明度看资金管理的实际感受

在交易类工具的使用过程中,资金相关体验往往是用户最敏感的部分之一。相比界面功能或策略工具,资金的流转效率与透明程度更直接影响用户对平台的整体信任感。因此,从出金流程角度去观察一个平台的设计逻辑,往往比单纯看宣传信息更…

2026/7/3 2:18:49阅读更多 →
关于Nginx配置中的listen使用

关于Nginx配置中的listen使用

位置:server块中作用:监听ip上的端口,server块匹配请求的第一步;语法:listen ip:port default_server;ip: 监听具体ip:192.168.200.10:80 default_server,只有当请求ip:port为…

2026/7/3 2:18:49阅读更多 →
大数据毕业设计选题指南:技术前沿与实战要点

大数据毕业设计选题指南:技术前沿与实战要点

1. 大数据专业毕业设计选题现状分析2026届大数据专业学生正面临着一个充满机遇与挑战的毕业季。随着数据要素成为新型生产要素,企业对数据价值的挖掘需求呈现爆发式增长。根据行业调研显示,近三年大数据相关岗位的年均增长率达到28%,但同时也…

2026/7/3 2:13:49阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/2 12:10:34阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/7/2 12:10:34阅读更多 →
LV3296与PIC18F45K22的UART通信与USB扩展方案

LV3296与PIC18F45K22的UART通信与USB扩展方案

1. LV3296与PIC18F45K22的硬件搭档解析在嵌入式数据采集系统中,LV3296条形码扫描模块与PIC18F45K22微控制器的组合堪称经典搭配。LV3296作为一款工业级条码扫描头,其核心是一颗高性能CMOS图像传感器,配合专用解码芯片,能自动识别包…

2026/7/3 0:03:41阅读更多 →
AI初创生存指南:6个月完成可信度验证闭环

AI初创生存指南:6个月完成可信度验证闭环

1. 这不是“逆袭指南”,而是一份AI初创公司真实生存手记“How To Beat Odds As an AI Startup?”——这个标题乍看像一句热血口号,但在我带过7个从0到1的AI产品团队、亲手踩过融资失败、技术债崩盘、客户POC卡在最后一公里等23类典型坑之后,…

2026/7/3 0:03:41阅读更多 →
多模态+推理链+RAG 2.0+智能体:工业级AI系统落地四支柱

多模态+推理链+RAG 2.0+智能体:工业级AI系统落地四支柱

1. 这不是又一篇“AI趋势速览”,而是一份实操者手记:当多模态、推理链、检索增强与智能体协作真正撞进工程现场“LAI #73”这个编号本身就像一个暗号——它不属于某家大厂的白皮书,也不是学术会议的议程表,而是长期泡在模型训练集…

2026/7/3 0:03:41阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/3 1:12:46阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/3 1:36:36阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/3 2:08:15阅读更多 →