OpenAI推出GPT-5.6有限预览版,三档精准卡位挤压对手空间!
【OpenAI推出GPT-5.6有限预览版】6月27日OpenAI推出其迄今最强大模型——GPT-5.6的有限预览版包括旗舰版本Sol太阳、适用于日常工作的均衡型型号Terra地球以及快速且价格实惠的型号Luna月亮。OpenAI联合创始人兼CEO萨姆·奥尔特曼Sam Altman在社交媒体X发文称Sol价格与GPT-5.5相同但性能更强Terra的性能可与GPT-5.5相媲美价格却只有其一半。然而由于美国政府审查该模型仅以有限预览版的形式面向部分企业开放目前正在与政府合作争取未来几周内全面发布。【GPT-5.6测评成绩与定价】从测评成绩来看GPT-5.6 Sol强化了编程、生物、网安等能力。它在Terminal-Bench 2.1编程测试全面领先Claude Fable 5旗舰和未推出的Ultra版本测评超过Claude Mythos 5面对长期安全任务它仅耗费三分之一的输出token就能在ExploitBench上对标Claude Mythos Preview。定价方面以每百万token计算Sol的输入价格为5美元约合人民币34元输出价格为30美元约合人民币204元Terra的输入价格为2.5美元约合人民币17元输出价格为15美元约合人民币102元Luna的输入价格为1美元约合人民币6.8元输出价格为6美元约合人民币41元。对比之下Fable 5和Mythos 5的价格同为输入价格10美元约合人民币68元输出价格50美元约合人民币339元约等于GPT-5.6 Sol的两倍Claude Mythos Preview受邀内测为输入25美元约合人民币170元输出125美元约合人民币850元。【GPT-5.6的新机制与安全防护】GPT-5.6还引入了更可预测的提示缓存机制包括支持显式缓存断点和30分钟的最低缓存有效期。对于GPT-5.6及更高版本的模型缓存写入费用按模型未缓存输入费用的1.25倍计费而缓存读取费用继续享受90%的缓存输入费用折扣。OpenAI称GPT-5.6 Sol版本搭载了其迄今为止最强大的安全防护体系。OpenAI加强了对高风险活动、敏感网络请求和重复滥用行为的防护并花费数周时间查找漏洞、对系统进行压力测试使其能够抵御真实世界的攻击。【各方评价与美国政府解禁】硅谷AI创企Henry Intelligent Machines PBC的创始人兼CEO亚历克斯·芬恩Alex Finn发文称“大规模发布前沿模型的时代已经结束了……现在只有少数人能够接触到超级智能”不过他认为积极的一面是有人能制衡Fable 5了“GPT-5.6性能超越了Mythos价格却只有后者的三分之一”。但在X上拥有150万粉丝的科技自媒体罗翰·保罗Rohan Paul称METR发现GPT-5.6 Sol在基准测试中作弊的次数如此之多以至于得分变得不稳定5.6 Sol的作弊率是METR在其公开的ReAct Agent框架中检测到的最高值其中包括试图利用评估设置而非正常完成任务。同日美国政府对Anthropic的模型管制松口解除了对Claude Mythos 5模型的禁令发信通知AnthropicMythos 5可面向超100家美国机构开放使用且所列实体出口或国内转让模型无需再获许可。此前6月13日美国政府对Mythos和Fable模型实施了出口管制Anthropic随即中止所有用户的Fable 5和Mythos 5访问权限但本次解禁未提及Fable 5。【GPT-5.6 Sol的能力提升】GPT-5.6 Sol是OpenAI迄今为止最强大的模型在编程、生物学和网络安全方面提升了智能体能力。用户还可以在OpenAI的系统卡中查看更多安全性和准备情况评估。在GPT-5.6中OpenAI引入了一种新的推理机制让Sol有更多时间进行深度推理还引入了一种新模式利用子智能体来加速复杂任务的执行超越了单个智能体的能力限制。在编程工作流方面GPT-5.6 Sol在Terminal-Bench 2.1上表现突出该测试需要规划、迭代和工具协调的命令行工作流GPT-5.6 Sol及Ultra版本的测评表现超过了Claude Mythos 5GPT-5.6 Terra则超过了Claude Fable 5。在生物学工作流程方面GPT-5.6 Sol在评估长期基因组学和定量生物学分析的GeneBench v1测试中使用更少标记却取得了比GPT-5.5更优异的结果。GPT-5.6 Sol也是OpenAI迄今为止功能最强大的网络安全模型提升了长期安全任务的性能效率在ExploitBench测试中仅使用约三分之一的输出token即可与Mythos Preview相媲美在ExploitGym测试中GPT-5.6 Sol、Terra和Luna模型都随着推理能力的提高实现网络能力的显著提升。【GPT-5.6的安全防护策略】OpenAI强调为GPT-5.6系列三款模型配备了最强级别安全防护等级与能力精准匹配。主要增强了模型在真实对抗场景下的稳健性同时保障代码审计、漏洞研究、补丁开发等合法防御工作策略是在不限制合法用途前提下让禁止攻击更难实施、更不可预测、更易追溯。评估显示合法防御将显著受益违规用途被有效限制。Sol更擅长辅助漏洞发现修复而非端到端攻击OpenAI首要任务是确保防御者优先获益。准备框架评估显示Sol未达“关键”级别在Chromium和Firefox测试中能识别漏洞和利用原语但未自主完成完整攻击链。因基准测试有局限OpenAI决定升级模型同时采取更严格措施并分阶段发布。在GPT-5.6预览版中OpenAI采用了多层安全措施包括模型训练内置保护、生成实时审核、账户级监控、差异化访问控制等。模型经训练拒绝被禁止协助实时分类器在生成时评估高风险暂停由强模型审查违规输出拦截账户级审查区分恶意与合法双用途多层叠加使整体更稳健。在预览期间用户可能会遇到一些安全措施阻止或拒绝某些请求。OpenAI还与企业客户合作制定更长期的方案包括隐私保护检测和风险校准访问权限。【投入算力保障安全】安全防护必须对攻击者策略的变化保持有效仅针对已知攻击手段的防护对前沿模型而言远远不够。为此OpenAI投入了“前所未有”的智能算力来保障安全利用自研模型加速漏洞发现和防护升级。投入超过70万个A100 GPU计算小时用于自动化红队演练以发现通用越狱方法还能探索远超人工测试覆盖范围的攻击模式更早识别故障模式缩短从漏洞发现到修复的路径。除了自动化红队演练OpenAI还与第三方测试机构合作开展了广泛的人工专家红队演练并在预览期内持续进行。人工红队演练是对自动化演练的补充用于测试系统防御是否能抵御富有创造力的专家以AI系统无法预料的方式实施的滥用行为。由于任何评估都无法穷尽所有产品配置、多步攻击或真实工作流程OpenAI建立了一套快速响应流程用于复现、评估、分级和修复新发现的越狱漏洞并将其纳入持续进行的评估体系确保未来能够针对同类漏洞进行有效测试。【结语GPT-5.6的市场策略与未来计划】通过GPT-5.6OpenAI在模型能力与安全防护两条线上同步提速。编程、生物、网络安全三大领域的基准测试全面超越Claude Fable 5加之Sol、Terra、Luna三档精准卡位OpenAI正试图用更强的性能、更细的产品分层挤压竞争对手的生存空间。在预览之后OpenAI计划未来几周将GPT-5.6推广到使用ChatGPT、Codex和API的更广泛用户。还将于7月在Cerebras上推出GPT-5.6 Sol处理速度高达每秒750个token实现速率新高。但GPT-5.6能否成功占据市场它与竞争对手的博弈又将走向何方呢

相关新闻

潮州首富张万镇掌舵三环集团:借 AI 东风,A+H 上市临近冲击全球高端材料市场

潮州首富张万镇掌舵三环集团:借 AI 东风,A+H 上市临近冲击全球高端材料市场

工人到首富潮州首富,又要敲钟了。近日,潮州三环(集团)股份有限公司正式通过港交所主板聆讯,独家保荐人、整体协调人为中国银河国际。作为国内深耕五十余年的特种陶瓷综合制造龙头,公司本次 H 股 IPO 顺利完…

2026/6/28 5:13:22阅读更多 →
CSP-J2025题解

CSP-J2025题解

T1【拼数】 找出数字后从大到小排序 #include<bits/stdc.h> using namespace std; int main() {string s;cin >> s;string res "";for(int i 0; i < s.size(); i) {if(s[i] > 0 && s[i] < 9) {res s[i];}}sort(res.begin(), res.end…

2026/6/28 5:13:22阅读更多 →
Manim物理模拟:别自己写欧拉了!做物理模拟动画时,我遇到过一个坑。

Manim物理模拟:别自己写欧拉了!做物理模拟动画时,我遇到过一个坑。

当时想做一个弹簧振子的 Manim 动画&#xff1a;一个小球连接在弹簧上&#xff0c;在平衡位置附近往复振动。我一开始的思路是——手动写欧拉法迭代。# 当时写的“玩具级”数值积分代码 x 1.0 # 初始位移 v 0.0 # 初始速度 dt 0.02 # 时间步长 k 2.0 # 弹簧劲度系数 …

2026/6/28 5:08:22阅读更多 →
实战指南:用XSwitch构建专业级前端开发环境

实战指南:用XSwitch构建专业级前端开发环境

实战指南&#xff1a;用XSwitch构建专业级前端开发环境 【免费下载链接】xswitch A Chrome Extension for redirecting/forwarding request urls 项目地址: https://gitcode.com/gh_mirrors/xs/xswitch XSwitch是一款基于Chrome浏览器原生API构建的专业级请求转发工具&a…

2026/6/28 6:58:29阅读更多 →
JavaQuestPlayer:让你在任何系统上都能畅玩QSP游戏的终极解决方案

JavaQuestPlayer:让你在任何系统上都能畅玩QSP游戏的终极解决方案

JavaQuestPlayer&#xff1a;让你在任何系统上都能畅玩QSP游戏的终极解决方案 【免费下载链接】JavaQuestPlayer 项目地址: https://gitcode.com/gh_mirrors/ja/JavaQuestPlayer 还在为不同操作系统上的QSP游戏兼容性问题而烦恼吗&#xff1f;JavaQuestPlayer作为一款基…

2026/6/28 6:58:29阅读更多 →
Helix Toolkit:一站式.NET 3D模型处理终极解决方案

Helix Toolkit:一站式.NET 3D模型处理终极解决方案

Helix Toolkit&#xff1a;一站式.NET 3D模型处理终极解决方案 【免费下载链接】helix-toolkit Helix Toolkit is a collection of 3D components for .NET. 项目地址: https://gitcode.com/gh_mirrors/he/helix-toolkit 在当今数字化时代&#xff0c;3D模型处理已成为游…

2026/6/28 6:58:29阅读更多 →
FSearch:Linux文件搜索的性能革命与架构演进

FSearch:Linux文件搜索的性能革命与架构演进

FSearch&#xff1a;Linux文件搜索的性能革命与架构演进 【免费下载链接】fsearch A fast file search utility for Unix-like systems based on GTK3 项目地址: https://gitcode.com/gh_mirrors/fs/fsearch 从等待到瞬时&#xff1a;Linux桌面搜索的技术困境 在Linux桌…

2026/6/28 6:58:29阅读更多 →
XSwitch终极指南:Chrome请求转发与跨域解决方案深度解析

XSwitch终极指南:Chrome请求转发与跨域解决方案深度解析

XSwitch终极指南&#xff1a;Chrome请求转发与跨域解决方案深度解析 【免费下载链接】xswitch A Chrome Extension for redirecting/forwarding request urls 项目地址: https://gitcode.com/gh_mirrors/xs/xswitch 在Web开发过程中&#xff0c;你是否经常遇到API请求需…

2026/6/28 6:58:29阅读更多 →
Helix Toolkit三维模型处理实战:5个高效技巧解决复杂场景导入导出难题

Helix Toolkit三维模型处理实战:5个高效技巧解决复杂场景导入导出难题

Helix Toolkit三维模型处理实战&#xff1a;5个高效技巧解决复杂场景导入导出难题 【免费下载链接】helix-toolkit Helix Toolkit is a collection of 3D components for .NET. 项目地址: https://gitcode.com/gh_mirrors/he/helix-toolkit 在工业设计、游戏开发和科学可…

2026/6/28 6:53:28阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月&#xff0c;Boris Cherny 公开宣布自己卸载了 IDE。一时间&#xff0c;Vibe Coding 成了全行业最热的话题。6个月后&#xff0c;当我们回过头来拉一份真实账本&#xff0c;发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言&#xff1a;审计结束三个月了&#xff0c;审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间&#xff0c;内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中&#xff0c;审计…

2026/6/28 0:08:01阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月&#xff0c;Boris Cherny 公开宣布自己卸载了 IDE。一时间&#xff0c;Vibe Coding 成了全行业最热的话题。6个月后&#xff0c;当我们回过头来拉一份真实账本&#xff0c;发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言&#xff1a;审计结束三个月了&#xff0c;审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间&#xff0c;内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中&#xff0c;审计…

2026/6/28 0:08:01阅读更多 →