本文分类:news发布日期:2026/6/8 20:37:16
打赏

相关文章

052、NPU的矩阵乘法单元:专用硬件加速

052、NPU的矩阵乘法单元:专用硬件加速 去年调试一块自研NPU芯片时,遇到一个诡异现象:跑ResNet-50前向推理,前几层延迟正常,到第7层卷积突然卡了将近3毫秒。用逻辑分析仪抓总线,发现矩阵乘法单元(MAC阵列)在那一层频繁进入“忙等待”状态——数据已经喂进去了,但结果迟…

CPU08新分支指令CBEQ与DBNZ:嵌入式MCU代码优化实战

1. 项目概述:CPU08新分支指令的实战价值在嵌入式微控制器(MCU)的开发世界里,每一字节的代码空间和每一个时钟周期都弥足珍贵。尤其是在资源受限的8位MCU上,如何用更少的指令、更快的速度完成循环、查找等基础操作&…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部