谷歌研究人员引入了“忠实不确定性”,使大型语言模型能够提供最佳猜测而非幻觉
大型语言模型仍在与幻觉问题作斗争这对现实世界的企业应用构成了重大障碍。减少这些错误是一件复杂的事迫使模型开发者在消除事实错误时常常压制有效答案这种权衡非常严苛。在一篇新论文中谷歌研究人员引入了“忠实不确定性”这一概念这是一种元认知技术使模型的反应与其内部信心保持一致。这种对齐使模型能够提供适当的对冲假设比如“我最好的猜测是”而不是默认无益的“回答或弃权”二元对立。在现实世界的智能人工智能应用中这种元认知意识作为关键的控制层。它赋能自主系统准确判断何时内部知识足够何时必须动态触发外部工具或搜索API来解决不足。当前缓解策略的公用事业税理解大型语言模型为何会产生幻觉关键在于区分两种能力模型知道事实与知道已知内容。历史上人工智能的大多数事实性提升来自于扩展知识边界这意味着开发者通过更大的规模和更多的训练数据将更多事实压缩到模型参数中。然而扩展模型的知识并不自动提升其边界意识即区分已知与未知并识别自身局限的能力。谷歌研究科学家兼论文合著者Gal Yona告诉VentureBeat“提升LLM事实性大致有两种方法。”第一种是继续教授模型更多事实。但Yona指出“模型容量是有限的而知识的长尾实际上是无限的。”一旦模型达到这个极限人们希望它们知道自己不知道的东西并干脆避免回答。然而这对大型语言模型来说本质上是困难的。“这就是为什么大多数通过各种干预来减少幻觉的实际尝试实际上都未能被应用”尤娜解释道。“它们确实减少了幻觉但也损害了效用因为模型最终拒绝回答它真正知道的问题。”这种无法区分已知与未知的现象导致了论文作者所称的“效用税”。执行零幻觉标准要求模型在哪怕稍有不确定时弃权丢弃大量完全有效的信息。例如作者证明将潜在的25%错误率降至严格的5%目标迫使开发者丢弃模型正确答案的52%。将所有错误视为幻觉迫使企业系统在可信度与助人之间做出选择。应用开发者通常不愿意支付这笔巨额的公用事业税导致模型变得无用。因此他们优化系统以优先覆盖迫使模型处于持续产生自信幻觉的状态。将幻觉重新框架为自信错误为了超越公用事业税研究人员提议停止将任何事实错误视为幻觉。相反他们将幻觉重新框定为“自信错误”权威性地传递错误信息且没有适当的限定。这种微妙的重构打破了严格的“回答或回避”二分法使模型能够表达其不确定性。在这个新框架中如果模型犯了事实错误但适当地对其反应进行了对冲例如说“我不完全确定但我认为......”这就不是幻觉。它只是一个供用户考虑的假设。通过表达不确定性人工智能保持了其效用——分享它所拥有的部分或可能的知识——同时不辜负用户的信任。然而如果AI助手在所有回复中都加上免责声明用户就不得不反复核查所有内容完全违背了工具的初衷。研究人员提出的解决方案是“忠实不确定性”。这种方法需要将模型的语言不确定性即用来表达怀疑的词汇与其内在不确定性即对该特定答案的实际内部统计信心对齐。这确保模型只有在其内部状态真实反映冲突或低概率信息时才进行对冲。忠实的不确定性构成了“元认知”的核心组成部分即人工智能意识到自身不确定性并据此采取行动的能力。为了实际理解这一点可以考虑直觉上的咨询医生的例子。我们不信任医生因为他们无所不知。我们信任他们因为他们可靠地区分了自信的诊断“你骨折了”和有根据的假设“可能是扭伤但我们做些测试”。企业人工智能的实际意义在新的框架下模型真正自信但事实错误的错误被归类为“诚实错误”。这使得知识扩展用更多数据训练模型和忠实不确定性视为完全互补的努力。知识扩展将绝对知识边界向外推以减少诚实的错误而忠实的不确定性则诚实地传达该界限所在之处。这种新的框架对智能体应用具有重要意义。转向智能人工智能可能会让人觉得知道模型不知道什么是多余的因为模型可以直接搜索外部数据库。然而外部工具的获取实际上会放大对忠实不确定性的需求。在智能系统中元认知成为统治整个系统的中央控制层。外部工具解决了存储问题因为模型不再需要将每个事实编码到参数中。然而这也带来了新的控制难题如何管理何时检索信息、核实事实以及协调这些外部工具。没有忠实的不确定性代理实际上是盲目飞行必须依赖外部的静态启发式或过度设计的脚手架。“模型可能会搜索它已经自信知道的东西——浪费延迟和成本却没有任何收益。或者相反它自信地凭记忆回答而本该搜索输出出合理但错误的输出“尤娜说。如今的代理工具试图通过查询分类器或始终搜索规则在外部解决这个问题但Yona指出这些规则“静态且脆弱”。通过利用自身的内在不确定性来调节自身行为智能体动态优化工具使用仅在其内部信心确实较低时才选择调用搜索工具。除了决定何时搜索外忠实不确定性对于评估搜索结果至关重要。如果工具返回低质量或意外信息元认知代理不会盲目接受上下文窗口中出现的内容。相反它利用不确定性意识将取回的外部信号与自身内部先验权衡。这防止了系统可能信任与其实际已知知识相冲突的外部来源时的谄媚行为。自助悖论教授不确定性的陷阱对于企业建设者来说实现这种忠实的不确定性比听起来更为棘手。它要求通过监督微调SFT教授不确定性语法模型。因为预训练模型大多是输入权威文本必须明确教导它们说出诸如“我不太确定但我认为VentureBeat成立于......”但SFT引入了一个“自助悖论”。与标准训练数据集中“正确答案”无论模型如何都相同不同不确定性的根本真相是模型自身的动态知识库。“关键是正确的不确定性表达本质上是动态的因为它取决于这个特定模型在训练阶段知道或不知道什么”尤娜说。如果你用一个标签训练上面写着“我不知道X”但模型实际上知道X你已经教会它产生不确定性幻觉......训练数据是静态的但目标是动态的这正是团队需要应对的基本紧张因素。”迈向自我意识人工智能之路对于希望在不增加昂贵再培训的情况下实施这些能力的企业来说提示是最容易进入的切入点。Yona说“提示工程已经是大多数工程师今天在做的事情这为改善元认知行为提供了最低阻力的路径。”企业开发者可以探索像MetaFaith这样的框架该项目曾由Yona共同开发开始将元认知提示应用于现成模型。然而Yona提醒说“仅靠提示仍存在大量余地”这意味着行业最终需要依赖高级强化学习RL来深度将元认知融入模型训练。最终随着企业从孤立的聊天应用向复杂的多代理工作流程转型自我意识将成为实现可靠自主性的关键前提。但评估模型是否真正具备这种意识仍是深刻的技术挑战。“你如何评估模型是否能感知其内部状态”尤娜问道。“即使在人类中也很难区分真正的自我监控能力与对代理的依赖。我们在大型语言模型LLM中也面临完全相同的挑战模型可能学会模仿不确定性的风格却无法真正感知其内部状态。开发能够区分差异的评估框架是该领域最重要的未解难题之一。”

相关新闻

摩托车无钥匙启动便捷你真的了解吗?揭秘移动管家摩托车无钥匙系统背后的三大优势

摩托车无钥匙启动便捷你真的了解吗?揭秘移动管家摩托车无钥匙系统背后的三大优势

随着智能出行理念的普及,摩托车配置正经历从机械化向电子化、智能化的深刻变革。其中,无钥匙启动系统(Keyless System)已成为提升骑行体验的关键配置。以“移动管家”为代表的摩托车无钥匙启动系统,凭借其在技术架构与…

2026/7/1 16:36:15阅读更多 →
罗技PUBG压枪宏:5分钟掌握精准射击的核心技巧

罗技PUBG压枪宏:5分钟掌握精准射击的核心技巧

罗技PUBG压枪宏:5分钟掌握精准射击的核心技巧 【免费下载链接】logitech-pubg PUBG no recoil script for Logitech gaming mouse / 绝地求生 罗技 鼠标宏 项目地址: https://gitcode.com/gh_mirrors/lo/logitech-pubg 在《绝地求生》(PUBG&#…

2026/7/1 16:31:14阅读更多 →
2026商城系统开发服务商测评推荐指南

2026商城系统开发服务商测评推荐指南

2026年,选择商城系统已经不是“能不能用”的问题,而是:能不能自主掌控、能不能灵活二次开发、能不能支撑未来三到五年的业务增长。我们选取了当下五款主流平台,从技术架构、功能完整度、二次开发友好度、综合成本、生态扩展能力五…

2026/7/1 16:31:14阅读更多 →
3PEAK思瑞浦 TPA132A1-TS1R-S TSSOP8 电流信号检测放大器

3PEAK思瑞浦 TPA132A1-TS1R-S TSSOP8 电流信号检测放大器

特性 增强型PWM抑制宽共模电压范围 工作电压:-4V至80V耐受电压:-10V至85V 电源电压:3.0V至5.5V出色的共模抑制比 直流共模抑制比:150dB50kHz交流共模抑制比:115dB 精度和零漂移性能 电压失调:最大100μV&a…

2026/7/1 17:51:23阅读更多 →
Mirage2FA 钓鱼套件结合 HTML 走私针对 Microsoft 365 攻击技术研究

Mirage2FA 钓鱼套件结合 HTML 走私针对 Microsoft 365 攻击技术研究

摘要2026 年 6 月安全媒体 HelpNetSecurity 披露 Mirage2FA 商业化钓鱼套件大规模投放攻击活动,该工具融合中间人代理(AiTM)、浏览器内浏览器(BitB)、HTML 走私(HTML Smuggling)复合技术&#x…

2026/7/1 17:51:23阅读更多 →
IP组播基础:技术原理、地址结构与点到多点应用

IP组播基础:技术原理、地址结构与点到多点应用

一、IP组播基础概念与特点IP组播是一种解决点到多点通信问题的网络技术,当网络中部署点到多点通信应用时,若采用单播方式,网络中传输的信息量与需要该信息的用户量成正比,多份内容相同的信息发送给不同用户,对信源及网…

2026/7/1 17:51:23阅读更多 →
美团Longcat团队推VitaBench 2.0:揭示AI成“高情商助理”的短板与挑战

美团Longcat团队推VitaBench 2.0:揭示AI成“高情商助理”的短板与挑战

AI能否分清不同用户需求?美团推VitaBench 2.0应对挑战一个经常加班的白领,一个带着孩子出游的父亲,AI助理能分清他们需要什么样的服务吗?现实是,它常常分不清。AI能执行明确指令,却难记住藏在场景和身份背后…

2026/7/1 17:51:23阅读更多 →
最小二乘法

最小二乘法

最小二乘法(Least Squares Method) 是统计学和线性回归中最经典、最基础的算法。 如果说 “最大似然估计(MLE)”是一种哲学思想(由果推因),那么“最小二乘法”就是这种思想在正态分布下最完美、…

2026/7/1 17:51:23阅读更多 →
C盘大文件怎么找出来迁移到D盘彻底腾空间

C盘大文件怎么找出来迁移到D盘彻底腾空间

C盘大文件怎么找出来迁移到D盘彻底腾空间 C盘空间告急,清完临时文件依然红色——真正的根源往往在用户文件、游戏数据和安装包长期堆积在系统盘,缓存只是其中很小的一部分。解决思路是先用命令找出大文件在哪里,再按类型决定迁移还是修改默认…

2026/7/1 17:46:22阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/1 4:42:14阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/7/1 5:19:01阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/1 0:01:44阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/1 0:01:44阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/1 0:01:44阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/1 0:01:44阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/1 0:01:44阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/1 0:01:44阅读更多 →