本文分类:news发布日期:2025/12/24 22:51:38
打赏

相关文章

Anthropic 开源 Bloom:基于 LLM 的自动化行为评估框架

Anthropic 最近放出了一个叫 Bloom 的开源框架,专门用来测试大语言模型会不会出现某些特定行为。比如模型是不是会阿谀奉承用户、有没有政治倾向、会不会为了自保撒谎或者试图绕过监督机制这类问题。 这个框架跟常规的…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部