本文分类:news发布日期:2026/6/7 21:58:49
打赏

相关文章

Milvus 初探:为什么选择向量检索?从原理到安装部署全解析

系列导读 你现在看到的是《Milvus 向量检索平台从入门到生产实战:10 步构建高性能 AI 搜索系统》的第 1/10 篇,当前这篇会重点解决:从零搭建第一个 Milvus 实例,理解向量检索为何成为 AI 基础设施标配。 上一篇回顾:这是系列首篇,我们先把整体背景和问题边界搭起来。 下…

045、NPU的带宽利用率:Roofline模型分析

045、NPU的带宽利用率:Roofline模型分析 上周五晚上十一点,我在调试一块搭载自研NPU的AI加速卡。板子跑ResNet-50推理,理论算力标称4TOPS,结果实测帧率只有标称值的六成。盯着示波器上DDR总线的波形,我意识到问题不在计算单元——带宽瓶颈把算力活活饿死了。 这种场景在…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部