本文分类:news发布日期:2026/1/8 10:19:20
打赏

相关文章

GPT-OSS-20B:210亿参数本地AI推理新选择

OpenAI推出210亿参数的开源大模型GPT-OSS-20B,通过创新的混合专家(MoE)架构与MXFP4量化技术,将高性能AI推理带入16GB内存设备,为本地部署与行业定制开辟新路径。 【免费下载链接】gpt-oss-20b gpt-oss-20b —— 适用于…

腾讯Hunyuan3D-2.1:开源!文本图像秒变3D资产

导语:腾讯正式开源Hunyuan3D-2.1,通过先进的扩散模型技术,实现从文本或图像到高分辨率纹理3D资产的一站式生成,为数字创意领域带来效率革命。 【免费下载链接】Hunyuan3D-2.1 腾讯开源项目Hunyuan3D-2.1,一站式图像到3…

Qwen3-VL-4B:AI视觉交互能力大升级!

Qwen3-VL-4B:AI视觉交互能力大升级! 【免费下载链接】Qwen3-VL-4B-Instruct-unsloth-bnb-4bit 项目地址: https://ai.gitcode.com/hf_mirrors/unsloth/Qwen3-VL-4B-Instruct-unsloth-bnb-4bit 导语:Qwen3-VL-4B-Instruct作为Qwen系列…

Cogito v2 70B:AI双模式推理大模型深度解析

导语 【免费下载链接】cogito-v2-preview-llama-70B 项目地址: https://ai.gitcode.com/hf_mirrors/unsloth/cogito-v2-preview-llama-70B DeepCogito推出Cogito v2 70B大模型,通过创新的双模式推理架构和迭代蒸馏放大技术,在编码、STEM领域实现…

高并发请求处理能力如何?Fun-ASR压力测试报告

Fun-ASR高并发压力测试报告:真实性能表现与工程实践洞察 在企业级语音识别应用日益普及的今天,一个常被低估却至关重要的问题浮出水面:当几十甚至上百个音频文件同时上传时,系统会不会卡死?会议直播中多人轮流发言&…

解决CUDA out of memory:Fun-ASR内存优化策略分享

解决CUDA out of memory:Fun-ASR内存优化策略分享 在部署语音识别系统时,你是否曾被“CUDA out of memory”错误打断过?尤其是在处理一段稍长的音频或批量任务时,GPU显存突然耗尽,服务中断、推理失败接踵而至。这并不是…

DeepSeek-V3.1:双模式AI如何实现思考效率倍增?

DeepSeek-V3.1:双模式AI如何实现思考效率倍增? 【免费下载链接】DeepSeek-V3.1-Base DeepSeek-V3.1 是一款支持思考模式与非思考模式的混合模型 项目地址: https://ai.gitcode.com/hf_mirrors/deepseek-ai/DeepSeek-V3.1-Base 导语 DeepSeek-V3.…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部