本文分类:news发布日期:2026/3/30 19:52:49
打赏

相关文章

Burp漏洞扫描(实操)

BP实操 那么接下来我们去BP里看一下这两个东西。 我现在在BP的主页面 我现在正在主动扫描pikachu的靶场,用的是“任务”右边的“新建扫描”。 下面这个API扫描也是不常用,但也是主动扫描的一种。 在下面这个框框放入你要扫描的URL就行了,它就…

Token是什么

Token是什么一、核心定义(1.1 & 1.2)Token是什么?通用概念:代表身份或信息的数字凭证/基本单元,应用于计算机、AI、区块链等领域AI领域的通俗理解:AI用来"数文字"的最小单位,相当于"AI世界里…

大模型微调之——PPO、DPO、GRPO 核心区别对比

文章目录为什么要做强化反馈学习一、核心定义与原理1. PPO (Proximal Policy Optimization,近端策略优化)2. DPO (Direct Preference Optimization,直接偏好优化)3. GRPO (Group Relative Policy Optimization,群体策略优化)二、关键维度对比…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部