本文分类:news发布日期:2026/1/14 3:50:52
相关文章
自监督预训练阶段:HunyuanOCR如何利用无标签数据
HunyuanOCR如何利用无标签数据实现高效自监督预训练
在当今AI驱动的文档数字化浪潮中,一个现实问题始终困扰着工程团队:高质量标注数据太贵、太少,而模型却越来越“吃”数据。尤其是在多语言、复杂版式的实际场景下,传统OCR系统往…
建站知识
2026/1/14 3:50:47
Zotero插件构想:利用HunyuanOCR自动标注文献截图内容
Zotero-HunyuanOCR:让文献截图“活”起来的本地智能标注方案
在数字学术工作流中,你是否也遇到过这样的场景?从一篇PDF里截下一段关键摘要,拖进Zotero后却只能当作一张“哑图”——无法搜索、不能引用、更谈不上结构化管理。想要提…
建站知识
2026/1/14 3:45:56
读取文件夹并展示图像的相关问题
读取文件需要在前端安装tauri-plugin-fs,这主要是在batchPrint中的frontend中安装的;
需要在src-tauri/capabilities/default.json中添加permission,以获取权限{"$schema": "../gen/schemas/desktop-sc…
建站知识
2026/1/14 3:49:30
Task03:离线物料系统的构建
@目录0. 代码版本1. 整体文件2. 原始物料的爬取2.1 爬虫文件2.2 流程图示2.3 流程描述2.3.1 start_requests2.3.1 SinanewsPipeline3. 新闻画像的处理3.1 相关文件3.2 流程图示3.3 流程描述3.3.1 update_new_items()3.…
建站知识
2026/1/13 8:19:56
字号大小估计功能:HunyuanOCR是否能返回相对尺寸
HunyuanOCR能否理解字号?从排版语义到智能文档理解的跃迁
在数字化办公日益普及的今天,我们早已不满足于“把图片转成文字”这种基础能力。当你扫描一份PDF合同、上传一张会议PPT截图,或是处理一份财务报表时,真正困扰你的往往不是…
建站知识
2026/1/12 2:07:39
RISC-V架构展望:未来在平头哥处理器上运行的潜力
RISC-V架构展望:未来在平头哥处理器上运行的潜力
在智能制造、边缘AI和国产化替代加速推进的今天,一个核心问题正日益凸显:我们能否在一个完全自主可控的芯片平台上,高效运行现代轻量化大模型?这不仅是技术挑战&#x…
建站知识
2026/1/6 2:46:54
2025年宁夏银川优秀的岗亭生产厂家排行榜单,岗亭集成房屋/值班岗亭/成品移动岗亭/移动岗亭,岗亭生产厂家哪家好 - 品牌推荐师
随着城市公共设施升级与场景化需求激增,岗亭行业正从单一功能向模块化、智能化、定制化方向转型。据统计,2024年全国岗亭市场规模突破120亿元,其中宁夏银川依托“一带一路”区位优势及本地基建需求,涌现出一批技术…
建站知识
2026/1/14 3:25:45
LayoutParser生态兼容性:HunyuanOCR能否成为新backend?
LayoutParser生态兼容性:HunyuanOCR能否成为新backend?
在企业级文档智能系统日益复杂的今天,如何构建一个高精度、低延迟、多语言支持且易于维护的OCR流水线,已成为AI工程落地的核心挑战。传统的OCR方案大多采用“检测识别”级联…
建站知识
2026/1/6 13:00:51

