本文分类:news发布日期:2026/2/7 12:53:24
打赏

相关文章

HCCL Profiling通信耗时埋点与Timeline生成

摘要 在大规模分布式训练中,通信效率直接决定整体性能。HCCL Profiling通过精准的通信操作耗时埋点,生成可视化Timeline,为性能瓶颈定位提供数据支撑。本文将深度解析/hccl/profiler/trace_collector.cpp的实现机制,演示AllReduc…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部