通义千问3-Reranker-0.6B效果展示：学术文献检索重排Top3准确率92%

本文分类：news发布日期：2026/5/15 9:54:51

本文链接：http://www.mqxn.cn/news/921953.html

GLM-4V-9B GPU利用率提升实践：CUDA Graph + KV Cache优化实测对比

GLM-4V-9B GPU利用率提升实践：CUDA Graph KV Cache优化实测对比 1. 项目背景与优化需求 GLM-4V-9B作为一款强大的多模态大模型，在消费级显卡上运行时常常面临显存不足和计算效率低下的问题。虽然4-bit量化技术已经大幅降低了显存需求，但在…

建站知识 2026/5/15 9:52:23

计算机视觉opencv之抠图流光估计物体追踪

一、抠图抠图只不过是一个大家比较熟悉的叫法，其实实现抠图运用到的就是opencv中的一些方法。对图片进行抠图，抠出扇子，现要求使用 Python 结合 OpenCV 库编写代码实现图片： 1.读取图片，将尺寸设置为宽640&#xf…

建站知识 2026/5/15 9:53:56

Qwen3-ASR-0.6B多场景落地：支持API服务化、桌面客户端、Web嵌入三类部署形态

Qwen3-ASR-0.6B多场景落地：支持API服务化、桌面客户端、Web嵌入三类部署形态 1. 项目简介与核心价值 Qwen3-ASR-0.6B是基于阿里云通义千问团队开源语音识别模型开发的本地智能语音转文字工具。这个工具最大的特点是完全在本地运行，不需要联网&#xff…

建站知识 2026/5/15 9:52:24

Nunchaku FLUX.1 CustomV3镜像免配置：内置CUDA 12.1+PyTorch 2.3+ComfyUI v0.3.18

Nunchaku FLUX.1 CustomV3镜像免配置：内置CUDA 12.1PyTorch 2.3ComfyUI v0.3.18 想要快速生成高质量图片却不想折腾环境配置？Nunchaku FLUX.1 CustomV3镜像就是为你准备的完美解决方案。这个预配置镜像内置了最新的CUDA 12.1、PyTorch 2.3和ComfyUI v0.…

建站知识 2026/4/26 7:53:50

鸿蒙 PC 实战：交叉编译 zlib（aarch64-linux-ohos）完整可复现指南

欢迎加入开源鸿蒙PC社区：https://harmonypc.csdn.net/ 文章目录欢迎加入开源鸿蒙PC社区：[https://harmonypc.csdn.net/](https://harmonypc.csdn.net/)鸿蒙 PC 实战：交叉编译 zlib（aarch64-linux-ohos）完整可复现指南项…

建站知识 2026/5/3 9:10:01

计算机视觉opencv之绘制轮廓模版匹配，传参方法

一、绘制轮廓上一篇博客中我们介绍了轮廓的绘制，但是比较片面现在我们实现对图片花的外轮廓用红线绘制如果我们使用上一次轮廓绘制的代码会发现，效果并不是预想的那样import cv2 image1cv2.imread(r"D:\project\hua.png") image1_graycv2.cvtC…

建站知识 2026/4/28 17:16:48

Phi-3-mini-128k-instruct镜像免配置指南：开箱即用的38亿参数开源模型快速上手

Phi-3-mini-128k-instruct镜像免配置指南：开箱即用的38亿参数开源模型快速上手 1. 开箱即用的轻量级AI模型 Phi-3-Mini-128K-Instruct是一个仅有38亿参数的轻量级开源模型，却拥有令人惊讶的强大能力。这个模型特别适合那些需要高效文本生成但又受限于计…

建站知识 2026/5/10 23:06:50

SmallThinker-3B-Preview效果实测：在单线程CPU上完成3K token COT推理耗时＜42s

SmallThinker-3B-Preview效果实测：在单线程CPU上完成3K token COT推理耗时<42s 1. 开篇：当推理能力遇见极致轻量如果你正在寻找一个能在普通电脑上流畅运行，还能进行复杂思考推理的AI模型，那么SmallThinker-3B-Preview的出现…

建站知识 2026/5/1 21:12:36

相关文章