本文分类:news发布日期:2026/1/1 14:30:49
打赏

相关文章

Trainer重构案例:实现课程学习训练策略

Trainer重构案例:实现课程学习训练策略 在当前大模型研发进入“工业化”阶段的背景下,如何让模型更高效、稳定地学会复杂任务,已成为工程团队的核心命题。传统微调方式往往采用“全量数据固定顺序”的训练模式,看似简单直接&#…

开始使用vnpy1

买了本二手书,《python量化交易实战 使用vnpy构建交易系统》: 按照书中的东西开始做 他用的版本是vnpy3.3.0,但是我觉得3.9.4应该也没什么问题,1.安装python=3.10.19 2.安装vnpy==3.9.4 3.安装vnpy的其他组件vnpy-…

QLoRA低显存训练秘籍:消费级显卡也能跑百亿参数模型

QLoRA低显存训练秘籍:消费级显卡也能跑百亿参数模型 在一台搭载 RTX 3090 的普通台式机上,微调一个700亿参数的大语言模型——这在过去几乎是天方夜谭。但今天,它已经成了许多开发者工作流中的日常操作。你不需要集群、不必租用 A100 实例&am…

ReFT受限微调变换:适用于特定参数子集的方法

ReFT受限微调变换:适用于特定参数子集的方法 在大模型时代,一个现实问题正日益凸显:当我们手握百亿甚至千亿参数的预训练语言模型时,如何以合理成本将其适配到具体任务?全量微调动辄需要数十GB显存和数天训练时间&…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部