本文分类:news发布日期:2026/1/8 22:48:27
打赏

相关文章

ADVANCE Day45

浙大疏锦行 📘 Day 45 实战作业:给模型装上仪表盘 —— TensorBoard 实战 1. 作业综述 核心目标: 环境搭建:安装并启动 TensorBoard。指标监控 (Scalar):不再盯着控制台刷屏,而是画出漂亮的 Loss 和 Ac…

一文搞清微调技术的发展与演进

现在的大语言模型发展得非常快,从几亿参数到千亿参数,不仅模型越来越大,能力也越来越强。但是在实际工作中,我们很少会从零开始训练一个这样的巨无霸模型,因为那样的成本和资源需求实在太高了。更多的时候,…

【收藏】LLM大模型全景解析:从零开始理解AI智能的诞生

LLM大模型是基于Transformer架构的海量参数模型,通过规模效应、自注意力机制和训练范式调整实现通用智能。工作流程包括分词、嵌入表示、多层Transformer堆叠和概率预测,实现数据压缩→规律学习→智能涌现。LLM有Decoder-Only、Encoder-Only和Encoder-De…

linux的root目录缓存清理

1. 找出隐藏的大文件 / 文件夹(关键步骤)先执行以下命令,查看 /root 下所有文件(包括隐藏文件) 的空间占用,定位具体占用空间的文件:# 查看/root下所有文件(含隐藏)的空间…

mysql之联合索引

文章目录 一:联合索引二:创建联合索引三:删除索引四:总结: 一:联合索引 联合索引又称组合索引或者复合索引,是建立在俩列或者多列以上的索引。 二:创建联合索引 语法&#xff1a…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部