首页 > 科技信息 > 科技信息 > 腾讯混元OCR模型宣布开源:参数量1B 支持14种小语种翻译

腾讯混元OCR模型宣布开源:参数量1B 支持14种小语种翻译

发布时间:2025-11-25 18:43:53

11月25日,腾讯混元于11月25日推出开源OCR模型HunyuanOCR,该模型参数量为1B,基于混元原生多模态架构构建,在多项OCR应用评测中取得当前最优效果。

腾讯混元OCR模型宣布开源:参数量1B 支持14种小语种翻译

该模型采用端到端训练推理范式,通过单次前向推理即可完成多项任务,相比传统级联方案更具效率优势。其架构由原生分辨率视频编码器、自适应视觉适配器与轻量化语言模型三部分组成。

在性能方面,HunyuanOCR在复杂文档解析评测OmniDocBench中获得94.1分,超过谷歌Gemini3-pro等模型;在涵盖文档、街景、手写等九大场景的测试集上,其文字检测与识别能力领先同类开源及商业模型。同时,该模型支持14种小语种翻译,并在ICDAR2025文档翻译比赛中获得小模型赛道冠军。

目前该模型已应用于票据字段抽取、视频字幕识别及拍照翻译等场景,并正式对外开放源代码。

科技信息更多>>

荣耀最奢华直板旗舰!荣耀Magic8 RSR线下提前展示:全配置揭晓 NVIDIA辟谣RTX 50系列停产:全系正常供应!缺货是显存供应拖后腿 仅用一周时间,谷歌就让OpenAI认清现实 追觅CEO俞浩回应“百万亿市值”争议:这是一个用20年去验证的目标 1天内报告3起:华硕主板用户反馈9800X3D处理器“烧毁” 不再征收100%附加税 加拿大将进口4.9万辆中国电车 半年亏掉80亿美元后,OpenAI终于给ChatGPT加了广告 OpenAI宣布将启动广告测试 以提升ChatGPT的营收能力 全新一代奥迪A6 Allroad曝光!侧面配垂直通风口,动力3.0T V6插混 2026年1月车市降价信息汇总,17台车都便宜了! 份额是三星2倍多,国产手机Soc芯片崛起,排在全球第4名了 2700万台车!日本汽车拿了20多年的第一名,被中国抢走了 鸿蒙5.0用户超3600万了,为何小米、OV、荣耀们还用安卓? 2025年仅5家主要车企,完成了年度目标,小米增长200% 雷军直播拆车,在线辟谣,给其它车企打了个样 小米战胜美国专利流氓:5个专利,4个无效,一个部分有效 赵福全:AI是人类社会发展的拐点,汽车产业需正确认知与系统布局 法拉第未来Super One首批整套零部件将启运离港 两年前小鹏想要淘汰混动,两年后小鹏转身拥抱增程 给新能源汽车系上安全带 立中集团子公司拟引入战投昆仑新材 加速固态电池材料等布局 华为MatePad Edge发布:5999元起 配合磁吸键盘可转换为笔记本形态 华为Mate X7折叠屏手机发布:12999元起,搭载第二代红枫影像技术 华为发布新款非凡大师手表,售价24999元 华为Mate80 RS非凡大师手机发布:11999-12999元 马斯克开始用Grok替代员工了!最惨部门裁员90% 腾讯混元OCR模型宣布开源:参数量1B 支持14种小语种翻译 “老登”俞敏洪,不背用员工血汗钱旅游的“锅” 140亿“风投女王”,豪掷3亿美元收购字节股份 极狐全新阿尔法T5上市,限时售价10.98万元起