本文分类:news发布日期:2026/1/31 2:39:06
打赏

相关文章

verl社区项目盘点:大家都在用它做什么?

verl社区项目盘点:大家都在用它做什么? 强化学习(RL)在大语言模型后训练中的价值,早已不是实验室里的概念验证。当“训得动、跑得快、效果好”成为工业级RLHF落地的硬门槛,一个真正为LLM量身打造的训练框架…

用gpt-oss-20b-WEBUI做了个智能问答机器人,全过程分享

用gpt-oss-20b-WEBUI做了个智能问答机器人,全过程分享 在办公室角落那台闲置的双卡4090D服务器上,我花了不到一小时,搭出了一个能准确回答技术文档、自动解析PDF表格、还能帮同事写周报的本地问答机器人——没有调API,不依赖云服…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部