本文分类:news发布日期:2026/1/21 17:13:50
打赏

相关文章

max-num-batched-tokens计算方法

目录1️⃣ 参数本质回顾2️⃣ 理论计算方法3️⃣ 一般范围seq计算1️⃣ KV cache 本质2️⃣ 假设参数3️⃣ 代入公式4️⃣ 面试说明点 明白,你想深入了解 --max-num-batched-tokens 的范围和计算方法,不仅是经验值,…

复健刷题日记

前言 因为高中毕业了,所以要打ACM了。但是刚升入西交,所以选择先花一个学期适应新生活,于是复健的任务自然而然拖到寒假才开始。 题单大部分来自300ids blog,可能会自己加一些其他的题。 争取寒假结束能回归CF正途…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部