本文分类:news发布日期:2026/1/20 4:22:42
打赏

相关文章

135M小模型推理大进步:trlm-135m三阶段训练解析

135M小模型推理大进步:trlm-135m三阶段训练解析 【免费下载链接】trlm-135m 项目地址: https://ai.gitcode.com/hf_mirrors/Shekswess/trlm-135m 导语:参数规模仅1.35亿的trlm-135m模型通过创新的三阶段训练流程,在推理能力上实现显著…

SenseVoice Small实践:心理咨询会话分析工具开发

SenseVoice Small实践:心理咨询会话分析工具开发 1. 引言 在心理咨询服务中,咨询师与来访者的对话不仅是信息交换的过程,更是情绪流动和心理状态变化的直接体现。传统上,咨询过程的回顾依赖于人工记录和主观判断,效率…

VibeThinker中文输入行吗?实测对比来了

VibeThinker中文输入行吗?实测对比来了 在当前大模型普遍追求参数规模和通用能力的背景下,微博开源的 VibeThinker-1.5B-WEBUI 却反其道而行之——以仅15亿参数、7800美元训练成本的小体量,在数学推理与算法编程任务中展现出媲美甚至超越百亿…

实测阿里Z-Image-ComfyUI,8步生成高清图

实测阿里Z-Image-ComfyUI,8步生成高清图 在内容创作节奏日益加快的今天,如何快速、高效地生成高质量图像已成为设计师、运营人员乃至开发者的共同需求。传统文生图工具往往面临部署复杂、推理缓慢、中文支持弱等问题,尤其对非技术背景用户极…

DeepSeek-R1-Distill-Qwen-1.5B部署教程:RTX3060 200 tokens/s实测

DeepSeek-R1-Distill-Qwen-1.5B部署教程:RTX3060 200 tokens/s实测 1. 引言 1.1 本地大模型的“小钢炮”时代来临 随着大模型技术的不断演进,轻量化、高推理能力的小参数模型正成为边缘计算和本地部署的新宠。DeepSeek-R1-Distill-Qwen-1.5B 就是这一…

Qwen3-Next 80B-FP8:26万上下文推理效率王

Qwen3-Next 80B-FP8:26万上下文推理效率王 【免费下载链接】Qwen3-Next-80B-A3B-Thinking-FP8 项目地址: https://ai.gitcode.com/hf_mirrors/Qwen/Qwen3-Next-80B-A3B-Thinking-FP8 导语:阿里达摩院推出Qwen3-Next-80B-A3B-Thinking-FP8模型&am…

思翼mk32遥控器配置数传和图传教程

目标:使用天空端来配置图传,数传和遥控器接收机 mk32说明书:MK15 v1.3.pdfMK32 v1.2.pdf mk32介绍:MK32_手持地面站_链路产品 - 思翼科技 | 赋能与构建智能机器人生态 - MK32MK15 v1.3.pdf 硬件:px4飞控&#xff0c…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部