本文分类:news发布日期:2026/1/8 5:40:54
打赏

相关文章

LongAlign-13B-64k:轻松搞定64k超长文本的AI神器

LongAlign-13B-64k:轻松搞定64k超长文本的AI神器 【免费下载链接】LongAlign-13B-64k 项目地址: https://ai.gitcode.com/zai-org/LongAlign-13B-64k 导语:THUDM(清华大学知识工程实验室)推出的LongAlign-13B-64k大语言模…

Qwen3-Next-80B:推理能力超越Gemini-2.5-Flash-Thinking

Qwen3-Next-80B:推理能力超越Gemini-2.5-Flash-Thinking 【免费下载链接】Qwen3-Next-80B-A3B-Thinking Qwen3-Next-80B-A3B-Thinking 在复杂推理和强化学习任务中超越 30B–32B 同类模型,并在多项基准测试中优于 Gemini-2.5-Flash-Thinking 项目地址:…

Qwen3-8B:80亿参数双模式AI推理黑科技

Qwen3-8B:80亿参数双模式AI推理黑科技 【免费下载链接】Qwen3-8B Qwen3-8B,新一代大型语言模型,实现逻辑推理、指令遵循和跨语言交流的飞跃性进展。独特思维模式切换,高效对话与深度推理两不误,是多语言交互与创新的强…

ERNIE 4.5黑科技:2比特量化让300B大模型单卡运行

ERNIE 4.5黑科技:2比特量化让300B大模型单卡运行 【免费下载链接】ERNIE-4.5-300B-A47B-2Bits-Paddle 项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-300B-A47B-2Bits-Paddle 导语:百度ERNIE 4.5推出突破性2比特量化技术&#x…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部