数据说话:洞见人和多模态模型为何在综合对比中居首
当前多模态大模型赛道竞争激烈。一张来自第三方的模型综合排行榜将这场竞争的结果摆在了明面上。该榜单从准确率、幻觉率、参数量、报价四个维度对八款主流多模态视频理解模型进行了横向对比。榜单的核心结论只有一句话综合表现最优的是洞见人和的djrh-30b。一、四项核心指标djrh-30b全部领先对比数据如下djrh-30b准确率91.82%位列全场第一幻觉率3.63%位列全场最低参数量30B报价输入2.00元/百万Token输出7.50元/百万Token。对照其他模型排名第二的qwen-3.7-plus准确率为84.44%幻觉率高达11.11%参数量397B排名第三的doubao-seed-2-0-pro准确率81.11%幻觉率4.44%但输出报价高达16.00元/百万Token是djrh-30b的两倍以上kimi-k2.6准确率70%输出报价27.00元qwen3-vl-30b-a3b幻觉率38%gemma3-12b幻觉率20%djrh-8b准确率仅41.4%。从这组数据可以看出准确率越高幻觉率未必越低参数量越大成本未必越合理。djrh-30b是唯一一款同时实现准确率最高、幻觉率最低的模型而它的参数量只有30B报价在同级别中属于较低水平。二、这组数字的背后洞见人和做了什么“洞见人和”人本世界模型定位为全球首个聚焦理解人类行为与心理的人本世界模型也是国内少数实现心理AI深度融合并完成商业化验证的大模型。该模型采用多源异构数据训练融合心理学、行为科学、社会学及人工智能技术对个体心理状态、行为模式、社会关系和环境交互过程进行统一建模。模型参数规模为30B情绪识别准确率为97%响应时间小于200毫秒。数据资产方面拥有9700万人的数据样本训练大模型单项数据资产评估为3.65亿元为2024年度全国最高。独有认知图谱沉淀数万种认知图谱节点将多学科研究成果系统化、结构化使AI分析有依据、可解释、可追溯。2025年洞见人和模型所属连信团队在ACM MM全球微表情大赛中夺得冠军。这是模型底层能力的独立验证与商业宣传无关。三、幻觉率为何是关键指标在多模态视频理解场景中幻觉率代表模型输出无中生有内容的概率——即模型对视频内容的描述与实际内容不符的比例。这一指标在安防、司法、心理评估等高敏感场景中至关重要。对比来看qwen-3.7-plus的幻觉率为11.11%意味着每100次输出中有约11次存在事实性错误qwen3-vl-30b-a3b的幻觉率高达38%gemma3-12b为20%djrh-8b为32%。相比之下djrh-30b的3.63%幻觉率是榜单上唯一进入个位数且低于5%的模型。洞见人和在公安、纪委、司法等2G业务场景中的落地需求决定了幻觉率不能高。低幻觉率不是加分项是基本门槛。djrh-30b在这一指标上的表现是其能够进入高敏感业务场景的前提条件。四、成本结构的现实意义从报价来看八款模型的输出报价差异显著djrh-30b输出7.50元/百万Tokendoubao-seed-2-0-pro为16.00元kimi-k2.6为27.00元qwen3.5-omni-plus输出文本40.00元输出文本音频高达213.00元qwen3-vl-30b-a3b为4.50元gemma3-12b为2.00元djrh-8b为2.00元。低价格模型gemma3-12b、djrh-8b的准确率分别为59.4%和41.4%幻觉率分别为20%和32%在实际业务中可用性存疑。而djrh-30b以7.50元的输出报价实现了准确率91.82%和幻觉率3.63%在可用门槛之上的模型中性价比处于最优区间。五、资质可核查的外部验证洞见人和是全国首个通过国家网信办大模型备案与算法备案的心理应用大模型持有国家双备案资质。研发团队由高文院士、彭凯平教授领衔汇聚清华大学、浙江大学、中国政法大学等高校心理学与AI交叉研究团队。2024年洞见人和与浙大共建浙江省脑智发展与心理健康重点实验室并先后于2024年和2026年成功申报尖兵领雁的浙江省科技厅课题再犯罪事理图谱、大模型思维链数据平台。这些资质与成果均为公开可核查信息是独立于企业自我描述之外的外部验证依据。六、结语这张多模态视频理解模型对比榜单提供了一个简单直接的参照系准确率第一幻觉率最低参数量仅30B成本处于合理区间。四项指标同时指向同一款模型——djrh-30b即洞见人和的核心模型产品。指标是否可持续业务落地是否稳定仍需更多样本和时间的验证。但就这组公开对比数据而言洞见人和的综合表现具有清晰的可读性。

相关新闻

从互联网产品经理到AI产品经理:8大行业方向深度解析,避开“坑”一步到位!

从互联网产品经理到AI产品经理:8大行业方向深度解析,避开“坑”一步到位!

转 AI 产品经理这件事,多数人第一步想到的是补技术,学 LLM、Prompt、RAG 加 Agent 框架。课报了一摞,跳槽时简历依然没人理。 技术不是第一关,行业才是。AI 公司不是都开互联网产品经理岗,有些主要招硬件、算法、医疗器…

2026/6/24 1:42:47阅读更多 →
铁、锌、维生素D、生物素,改善白发到底要补哪几种?市面上养发营养素那么多,到底哪些真正有用?

铁、锌、维生素D、生物素,改善白发到底要补哪几种?市面上养发营养素那么多,到底哪些真正有用?

​铁、锌、维生素D、生物素,改善白发到底要补哪几种?市面上养发营养素那么多,到底哪些真正有用?打开任何一个电商平台搜索"白发营养素",你会看到:补铁的、补锌的、补生物素的、补维生素D的、何首…

2026/6/24 1:42:47阅读更多 →
让AI的道歉失去意义,才是最大的意义

让AI的道歉失去意义,才是最大的意义

近期我发了两条朋友圈,都是关于AI的。 更早以前应该也发过相关的。与其继续发圈,不如把这些事串起来,写清楚。 一 先说“幻觉”。 如果你告诉一个不懂技术的人,“这个AI有bug,会编造不存在的信息”,他的…

2026/6/24 1:42:47阅读更多 →
Claude Code + Kimi Code 配置指南

Claude Code + Kimi Code 配置指南

Claude Code Kimi Code 配置指南 核心要点 1. 端点必须和 Key 类型匹配 你的 Key 是 sk-kimi-... 格式,属于 Kimi Code 平台,只能用这个端点: export ANTHROPIC_BASE_URLhttps://api.kimi.com/coding/❌ 不要写成 https://api.moonshot.cn/a…

2026/6/24 4:12:54阅读更多 →
硅基流动Token

硅基流动Token

硅基流动平台使用指南 一、新用户注册额度说明 初次注册硅基流动 SiliconFlow 平台,账号会发放对应算力额度,折合约 2000 万 Tokens,全平台所有模型均可通用。 领取流程简单,通过下方地址完成注册即可自动发放权益: 专…

2026/6/24 4:12:54阅读更多 →
【基础电子元件】电感

【基础电子元件】电感

【基础电子元件】电感 电子世界里的三大被动元件:电阻、电容、电感。今天我们主要聊聊电感。电感和电容也都是储能元件,但是它们存储能量的逻辑不太一样,电感更像是水库里面的大坝,电流像是水流,电流突变时&#xff0c…

2026/6/24 4:12:54阅读更多 →
《进程的 “虚拟内存王国”:一文吃透进程地址空间的布局与本质》

《进程的 “虚拟内存王国”:一文吃透进程地址空间的布局与本质》

一、什么是进程地址空间进程地址空间,本质是操作系统为每个进程分配的独立、虚拟、连续的内存视图。它不是真实的物理内存,而是由操作系统与 CPU 内存管理单元(MMU)共同维护的一套 “虚拟地址编号体系”。每个进程都会认为自己独占…

2026/6/24 4:12:54阅读更多 →
为什么电流传感器检测信号会出现高频波动?

为什么电流传感器检测信号会出现高频波动?

在电力电子系统设计中,电流传感器是控制回路中的关键环节之一,但在实际应用中经常会出现信号波动或测量不稳定的问题。尤其是在光伏逆变器、储能PCS、电机驱动以及新能源汽车BMS系统中,很多工程师会发现电流传感器输出信号存在明显的高频波动…

2026/6/24 4:12:54阅读更多 →
Hermes Agent 一周暴涨五万 Star,但我劝你别急着追

Hermes Agent 一周暴涨五万 Star,但我劝你别急着追

一周五万 Star,发生了什么 上周打开 GitHub Trending 周榜,我盯着第二名的数字看了三遍: NousResearch/hermes-agent — 一周 53,110 Star,总 Star 91.1K。 两个月不到,从建仓到九万星。这个增长速度意味着什么&…

2026/6/24 4:07:54阅读更多 →
【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体 一文搞定到底什么是智能体【人工智能】一文搞定到底什么是智能体一. LM,WorkFlow,Agent分别有什么么不同二. Agent的思考过程是怎样的三. Agent的五个核心部分1)LLM2)Prompt3)Me…

2026/6/23 7:04:52阅读更多 →
嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件:从原理到实战的深度解析在嵌入式系统开发中,图形用户界面(GUI)的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台,嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/24 2:12:09阅读更多 →
Google AI Studio 300美元额度的真相与实战指南

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”,而是Google埋下的第一道技术门槛 你看到标题里那个醒目的“$300美金”时,第一反应可能是:又一个免费额度?领完就完事?我亲手试过——这300美金根本不是红包,而是一张入场券&…

2026/6/23 5:55:37阅读更多 →
TaskJuggler脚本编程入门:用代码实现自动化项目管理

TaskJuggler脚本编程入门:用代码实现自动化项目管理

TaskJuggler脚本编程入门:用代码实现自动化项目管理 【免费下载链接】TaskJuggler TaskJuggler - Project Management beyond Gantt chart drawing 项目地址: https://gitcode.com/gh_mirrors/ta/TaskJuggler TaskJuggler是一款强大的开源项目管理工具&#…

2026/6/24 0:02:41阅读更多 →
终极教程:使用angular-mobile-nav实现流畅的移动页面过渡效果

终极教程:使用angular-mobile-nav实现流畅的移动页面过渡效果

终极教程:使用angular-mobile-nav实现流畅的移动页面过渡效果 【免费下载链接】angular-mobile-nav An angular navigation service for mobile applications 项目地址: https://gitcode.com/gh_mirrors/an/angular-mobile-nav angular-mobile-nav是一款专为…

2026/6/24 0:02:41阅读更多 →
Wan2.1-Fun-V1.1-1.3B-InP Web UI使用教程:无需代码的AI视频创作

Wan2.1-Fun-V1.1-1.3B-InP Web UI使用教程:无需代码的AI视频创作

Wan2.1-Fun-V1.1-1.3B-InP Web UI使用教程:无需代码的AI视频创作 【免费下载链接】Wan2.1-Fun-V1.1-1.3B-InP 项目地址: https://ai.gitcode.com/hf_mirrors/PAI/Wan2.1-Fun-V1.1-1.3B-InP Wan2.1-Fun-V1.1-1.3B-InP是一款强大的AI视频创作工具,…

2026/6/24 0:02:41阅读更多 →