本文分类:news发布日期:2026/6/5 7:03:42
打赏

相关文章

3.1 用户态访问 BO 的 CPU VA 为什么需要 fake offset

第二章已经把 BO 放进了多地址空间的整体框架里:同一个 BO,可以被 CPU 通过 CPU VA 访问,也可以被 GPU 通过 GPU VA 访问,还可能涉及 DMA address 和物理页。到了第三章,我们先只盯住一个问题:用户态进程怎样拿到一个可以读写 BO 的 CPU 虚拟地址? 在linux驱动中,用户态…

GPT-4的1.8万亿参数与2%激活:MoE架构原理与工程实践

1. 这不是“参数越多越好”的简单故事:GPT-4参数量与激活机制的真实逻辑你可能已经看到过那条刷屏的推文:“GPT-4有1.8万亿参数,但每次只用其中2%。”这句话像一颗小石子,砸进了大模型圈的水面,激起一圈又一圈的涟漪—…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部