本文分类:news发布日期:2026/3/7 20:24:43
打赏

相关文章

为何 LoRA 初始化 B=0 而 A 为高斯分布初始化?

回答:首先肯定不能A和B全部都为0的,全部都为0的话,梯度是没有的;所以,需要一部分为0初始化,一部分正常初始化,这样的目的是可以保证模型初始化的时候和原模型一样的输出;如果A不为0且…

岐金兰空论

岐金兰空论 空论只专注于一件事:意义如何生成。 它不追求成为一门“专业哲学”——因为一旦成为专业,就有了边界,有了壁垒,有了需要捍卫的领地。它不企图垄断对痕迹层的解释权——因为痕迹是每一个他者用自己的生命…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部