CANN/ops-math取余算子标量接口
aclnnFmodScalar aclnnInplaceFmodScalar【免费下载链接】ops-math本项目是CANN提供的数学类基础计算算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-math功能说明对self和 host scalarother执行 Mod 取余计算out self - other * trunc(self / other)。outshape 需要与self一致。接口原型aclnnStatus aclnnFmodScalarGetWorkspaceSize( const aclTensor* self, const aclScalar* other, aclTensor* out, uint64_t* workspaceSize, aclOpExecutor** executor); aclnnStatus aclnnFmodScalar( void* workspace, uint64_t workspaceSize, aclOpExecutor* executor, aclrtStream stream); aclnnStatus aclnnInplaceFmodScalarGetWorkspaceSize( aclTensor* selfRef, const aclScalar* other, uint64_t* workspaceSize, aclOpExecutor** executor); aclnnStatus aclnnInplaceFmodScalar( void* workspace, uint64_t workspaceSize, aclOpExecutor* executor, aclrtStream stream);约束self、out支持 ND维度不超过 8。aclnn 层支持 DOUBLE、BFLOAT16、FLOAT16、FLOAT32、INT32、INT64、INT8、UINT8 类型推导AICore kernel 覆盖 BFLOAT16、FLOAT16、FLOAT32、INT32其余类型走 AICPU fallback。BFLOAT16 仅在支持该数据类型的 NPU 平台上走 AICore。outshape 必须等于selfshape。样例见examples/test_aclnn_fmod_scalar.cpp。【免费下载链接】ops-math本项目是CANN提供的数学类基础计算算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-math创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关新闻

CANN/ops-math Mod取模算子

CANN/ops-math Mod取模算子

Mod 【免费下载链接】ops-math 本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-math 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atlas A3 推理系列产品√At…

2026/6/20 5:28:13阅读更多 →
H100与DeepSeek-V4-Flash软硬协同推理实战

H100与DeepSeek-V4-Flash软硬协同推理实战

1. 为什么非得在H100上跑DeepSeek-V4-Flash?不是显卡越新越好,而是算力结构必须对得上“在H100上部署DeepSeek-V4-Flash服务”——这句话里藏着三个关键锚点:H100是硬件底座,DeepSeek-V4是模型本体,Flash是推理加速范式…

2026/6/20 5:28:13阅读更多 →
XXPermissions:Android权限管理的终极解决方案与实战指南

XXPermissions:Android权限管理的终极解决方案与实战指南

XXPermissions:Android权限管理的终极解决方案与实战指南 【免费下载链接】XXPermissions Android Permissions Framework, Adapt to Android 16 项目地址: https://gitcode.com/GitHub_Trending/xx/XXPermissions Android权限管理一直是开发者面临的核心挑战…

2026/6/20 5:23:13阅读更多 →
深入解析MPC8360E/MPC8358E处理器接口电气特性与硬件设计实践

深入解析MPC8360E/MPC8358E处理器接口电气特性与硬件设计实践

1. 项目概述与核心价值在嵌入式硬件开发,尤其是网络通信和工业控制这类对可靠性和实时性要求极高的领域,处理器与外部器件接口的电气特性设计是决定项目成败的基石。很多工程师在拿到一份动辄数百页的芯片硬件规格书时,往往会被里面密密麻麻的…

2026/6/20 6:43:19阅读更多 →
品牌视觉操作系统:用AI实现可追溯、可迭代的VI设计

品牌视觉操作系统:用AI实现可追溯、可迭代的VI设计

1. 项目概述:这不是一个“AI画图工具”,而是一套能自学你审美的品牌视觉操作系统我做这套东西的起点,特别朴素——朋友张口要一万块做VI,我算了下账:硬件产品还没量产,团队三个人挤在共享办公区&#xff0c…

2026/6/20 6:43:19阅读更多 →
2020年CSP-X复赛真题及题解(T4:分糖果)

2020年CSP-X复赛真题及题解(T4:分糖果)

2020年CSP-X复赛真题及题解(T4:分糖果) 题目背景 老师组织一群孩子围成一个圈进行游戏,游戏结束后老师会根据每个孩子的表现进行评分并给予糖果奖励。 题目描述 每个孩子只能看见与自己相邻的 222 个孩子(左边的和…

2026/6/20 6:43:19阅读更多 →
Qwen2.5-VL行业微调:物理归一化与跨模态对齐器重训实战

Qwen2.5-VL行业微调:物理归一化与跨模态对齐器重训实战

1. 项目概述:为什么在特殊行业数据上微调Qwen2.5-VL不是“跑通就行”的事 Qwen2.5-VL是通义千问系列中首个真正意义上支持 端到端多模态理解与生成 的开源大模型,它不像早期VLM那样把图像特征硬塞进纯文本LLM的输入层,而是通过一个可学习的…

2026/6/20 6:43:19阅读更多 →
简悦4.0.2:面向深度阅读者的认知增强系统

简悦4.0.2:面向深度阅读者的认知增强系统

1. 项目概述:这不是一个“AI阅读插件”,而是一套面向深度阅读者的认知增强系统“简悦插件 阅读助手 4.0.2 版 - 已全面接入GPT 4.1最新模型”——这个标题里藏着三个被多数人忽略的关键信号:“简悦”不是通用浏览器插件,而是专注学…

2026/6/20 6:43:19阅读更多 →
DVWA靶场实战进阶:BurpSuite配置与漏洞挖掘深度解析

DVWA靶场实战进阶:BurpSuite配置与漏洞挖掘深度解析

1. 项目概述:从靶场通关到实战思维的跨越很多朋友在学Web安全时,都把DVWA(Damn Vulnerable Web Application)靶场当作“新手村”,照着教程一步步点完,看到“漏洞利用成功”的提示就以为通关了。我当年也是这…

2026/6/20 6:38:19阅读更多 →
【课程设计/毕业设计】基于 Web 的高校县志馆藏信息综合管理系统设计与实现 基于Django的青岛滨海学院特色文献捐赠流转管理系统的设计与实现【附源码、数据库、万字文档】

【课程设计/毕业设计】基于 Web 的高校县志馆藏信息综合管理系统设计与实现 基于Django的青岛滨海学院特色文献捐赠流转管理系统的设计与实现【附源码、数据库、万字文档】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

2026/6/20 0:02:40阅读更多 →
MC68HC908RF2A定时器PWM生成原理与实战:无缓冲与缓冲模式详解

MC68HC908RF2A定时器PWM生成原理与实战:无缓冲与缓冲模式详解

1. 项目概述与核心价值在嵌入式开发,尤其是电机驱动、LED调光、开关电源这些需要精确控制“能量”的领域,脉冲宽度调制(PWM)技术是工程师手中的一把瑞士军刀。它的本质很简单:用一个固定频率的方波,通过改变…

2026/6/20 0:02:40阅读更多 →
在银河麒麟V10桌面(2205版本)上实战部署软RAID 1:从模块黑名单到自动挂载

在银河麒麟V10桌面(2205版本)上实战部署软RAID 1:从模块黑名单到自动挂载

1. 银河麒麟V10桌面系统与软RAID 1基础认知 第一次在银河麒麟V10桌面上折腾软RAID 1时,我踩了不少坑。这个国产操作系统基于Linux内核,但2205版本对软RAID模块做了特殊处理,需要额外操作才能正常使用。软RAID 1其实就是磁盘镜像技术&#xff…

2026/6/20 0:02:40阅读更多 →