本文分类:news发布日期:2026/2/11 6:16:46
打赏

相关文章

AAAI2026 | 针对LLM外部推理的因果奖励调整方法

点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入!近日,天基全重实验室研究团队的论文“Causal Reward Adjustment: Mitigating Reward Hacking in External Reasoning via Backdoor Correction”被人工智能会议大会(The 40th Annual AAAI C…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部