本文分类:news发布日期:2026/4/1 9:02:11
打赏

相关文章

强化学习DPO-数学基本概念

目录1) 概率(模型输出 token 概率)你要记住2) log 概率(训练里常用)直觉3) 损失函数(loss 越小越好)一句话4) 梯度下降(参数怎么改)直觉比喻四个概念串成一条链 太好了,这 4 个概念是你后面学 DPO/RL 的地基。…

Pixel Aurora Engine镜像免配置部署:预装LoRA库与Prompt模板

Pixel Aurora Engine镜像免配置部署:预装LoRA库与Prompt模板 1. 产品概览 Pixel Aurora Engine是一款专为像素艺术创作设计的AI绘图工作站,采用复古游戏机风格的交互界面。这个镜像已经预装了完整的运行环境和工具库,用户无需进行复杂的配置…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部