本文分类:news发布日期:2025/12/13 2:59:22
相关文章
多语言文档解析新突破:dots.ocr以1.7B参数实现多任务SOTA性能
在数字化办公与信息处理领域,文档解析技术一直是连接物理世界与数字内容的关键桥梁。随着全球化协作的深入和多模态数据的爆发式增长,传统OCR工具在复杂布局识别、多语言处理及跨任务协同方面的局限性日益凸显。近日,由rednote-hilab团队研发…
建站知识
2025/12/13 2:59:21
重磅发布:Granite-4.0-H-Small-Unsloth-BNB-4bit模型开源,引领轻量级AI应用新纪元
在人工智能技术迅猛发展的当下,大语言模型(LLMs)正深刻改变着各行各业的应用格局。然而,模型参数规模的持续增长与终端设备计算资源有限之间的矛盾日益凸显,如何在保证模型性能的同时实现高效部署,成为行业…
建站知识
2025/12/13 2:59:04
中国AI再创全球标杆:HiDream E1.1登顶国际图像编辑榜单,开源技术引领行业变革
中国AI再创全球标杆:HiDream E1.1登顶国际图像编辑榜单,开源技术引领行业变革 【免费下载链接】HiDream-E1-1 项目地址: https://ai.gitcode.com/hf_mirrors/HiDream-ai/HiDream-E1-1
在全球AI视觉技术竞争白热化的当下,中国科技企业…
建站知识
2025/12/13 2:58:48
Holo1.5:开启智能交互新纪元的计算机使用代理基础模型
Holo1.5:开启智能交互新纪元的计算机使用代理基础模型 【免费下载链接】Holo1.5-7B 项目地址: https://ai.gitcode.com/hf_mirrors/Hcompany/Holo1.5-7B
模型概述
计算机使用(CU)代理是一类能够代表用户与真实应用程序(包…
建站知识
2025/12/13 2:58:26
开源多模态新突破:CogVLM2系列模型震撼发布,性能全面跃升且部署门槛大幅降低
开源多模态新突破:CogVLM2系列模型震撼发布,性能全面跃升且部署门槛大幅降低 【免费下载链接】cogvlm2-llama3-chat-19B 项目地址: https://ai.gitcode.com/zai-org/cogvlm2-llama3-chat-19B 如上图所示,这是CogVLM2模型的官方标志。该…
建站知识
2025/12/13 2:58:14
OpenAI Whisper参数全解析:从入门到精通的语音转文本配置指南
OpenAI Whisper参数全解析:从入门到精通的语音转文本配置指南 【免费下载链接】whisper-tiny.en 项目地址: https://ai.gitcode.com/hf_mirrors/openai/whisper-tiny.en
在人工智能语音处理领域,OpenAI推出的Whisper模型以其卓越的语音转文本能力…
建站知识
2025/12/13 2:58:07
FLUX.1 Kontext Dev:开源图像编辑领域的革命性突破
FLUX.1 Kontext Dev:开源图像编辑领域的革命性突破 【免费下载链接】FLUX.1-Kontext-dev 项目地址: https://ai.gitcode.com/hf_mirrors/black-forest-labs/FLUX.1-Kontext-dev
在当今数字创意产业飞速发展的浪潮中,图像编辑工具的性能与灵活性成…
建站知识
2025/12/13 2:57:56
文本驱动视频编辑革命:Lucy Edit AI重新定义动态视觉创作边界
在数字内容创作领域,视频编辑技术正经历着从手动操作向智能驱动的范式转移。Lucy Edit AI作为全球首创的文本提示视频转换平台,突破性地实现了在保持原始运动轨迹与时间序列完整性的前提下,通过自然语言指令完成复杂视频编辑。这项技术彻底改…
建站知识
2025/12/13 2:57:40

