腾讯发布 HY-MT1.5:翻译又快又准,连手机都能跑

信息来源: https://www.aibase.com/zh/news/242672026-01-06 18:06

翻译软件我们天天用,但背后的模型通常很大,往往需要连接云端服务器才能运行。腾讯这次推出的 HY-MT1.5系列打破了这个限制,推出了两个版本,满足不同场景的需求:

1.8B 小尺寸版: 别看它体量小,它在性能上几乎能和体量大得多的模型叫板。经过优化后,它只需要约1GB 的内存就能在手机等端侧设备上流畅运行。翻译50个汉字左右的句子,平均响应时间仅需 0.18秒。

7B 升级版: 它是之前获得 WMT25冠军系统的升级版,更擅长处理复杂的混合语言翻译、专业术语解析以及特定的格式翻译,主要面向服务器部署。

为了让模型更懂人类的语言习惯,腾讯的研究团队采用了“五步走”的训练方法:
打好语言基础: 先让模型学习海量的多语言文本,掌握基本的语言规律。
专项训练: 专门输入大量的对译数据,让它从“会说话”变成“会翻译”。
精雕细琢: 使用高质量的文档数据进行微调,让翻译结果更地道。
名师出高徒(蒸馏): 让7B 的大模型带1.8B 的小模型,把大模型的“智慧”传授给小模型,让它体积虽小但大脑依然聪明。
人类评判: 最后引入人类的审美标准,针对准确度、流畅度和文化差异进行打分优化。

实测表现:超越部分主流大模型。在多项权威测试中,这套模型的表现非常亮眼:
在 WMT25等国际测试中,7B 版本的得分超过了 Gemini3.0Pro 以及许多专业的翻译模型。即便是在“普通话转少数民族语言”这种冷门领域,它的表现依然拔尖。1.8B 版本在人类真实测试中的评分,也超过了百度、谷歌、微软等主流商业翻译系统。

除了翻译得准,HY-MT1.5还解决了一些实际使用中的痛点:
术语精准: 你可以告诉它特定的词怎么翻。比如“混元珠”必须翻成“Chaos Pearl”,它就不会自作聪明地翻成别的词。
联系上下文: 比如单词“pilot”,没有上下文它可能翻成“飞行员”,但如果这段话是讲美剧的,它能聪明地识别出这是指“试播集”。
格式不变: 如果你在翻译一段带有 HTML 标签或特殊格式的代码,它能在翻译内容的同时,完美保留原来的标签结构。

目前,腾讯已经将该模型的权重在GitHub和Hugging Face上开源,这意味着全球的开发者都可以使用这项技术来提升自己的应用体验。

相关快讯

阿里千问模型Qwen3-Max-Thinking超越GPT-5.2,刷新全球推理纪录

阿里巴巴正式发布千问旗舰推理模型Qwen3-Max-Thinking,在多项关键性能基准测试中表现超过GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等顶尖模型。该模型总参数超万亿,进行了更大规模的强化学习后训练,通...
阿里巴巴集团官方技术博客
2026-01-30

 环球音乐“投诚”,AI要重塑音乐产业

全球最大音乐公司环球音乐集团与英伟达达成合作,基于英伟达的Music Flamingo模型,开发新的音乐发现、创作和互动方式。以后推荐歌单,可能不再是“猜你喜欢”,而是AI“懂你灵魂”。 之前环球音乐还因版权问题怒告AI公司,现在却和算力巨...
2026-01-07

李飞飞World Labs融资50亿美元,估值冲500亿押注世界模型

斯坦福教授李飞飞创立的World Labs正洽谈50亿美元融资,估值目标500亿美元,较2024年增长5倍。公司核心产品Marble可通过图文生成符合物理规律的3D世界,已应用于游戏、机器人仿真等领域。投资方包括a16z、英伟达风投等,Je...
The Information独家报道
2026-01-24

英伟达 CES 2026 重磅发布

黄仁勋宣布 Rubin AI 超级芯片平台全面投产,推出 Alpamayo 自动驾驶开源 VLA 模型(首个实现自主思考推理)、BlueField-4 数据处理器(能效提升 5 倍)、DGX Spark/Station 桌面 AI 超算及 ...
https://www.msn.cn/zh-cn///--ces-2026-/ar-AA1Tv9HL?ocid=BingNewsSerp
2026-01-05

三大模型同日竞技,国产AI迎来“超级发布日

昨天(1月27日)绝对是载入AI史册的一天。DeepSeek团队开源了DeepSeek-OCR 2模型,采用创新的DeepEncoder V2方法,让AI能够根据图像含义动态重排视觉内容,更接近人类的视觉逻辑。 与此同时,月之暗面推出了新一...
2026-01-28

Anthropic推出完全由Claude编写代码的智能体

Anthropic推出的新型AI智能体Cowork,其全部代码均由Claude模型自主编写完成,开发周期仅约10天,展示了AI在软件工程领域的强大自动化能力
Anthropic技术博客官方发布
2026-01-15

抖音直播AI治理成效显著,违规识别准确率超90%

抖音发布的《2025抖音直播治理白皮书》显示,AI大模型将违规处置效率提升31%,全年无限期回收37万个违规直播账号。 AI审核效率显著提升,违规内容识别准确率超过90%,整体违规曝光量减少37%。该白皮书还透露,抖音直播年内协助警方捣毁诈...
抖音直播治理白皮书及官方公告
2026-01-26

MiniMax发布Music 2.5,主打“格莱美级”AI音乐创作

MiniMax推出升级版AI音乐生成模型Music 2.5,支持全段落标签控制、旋律走向优化,尤其针对华语市场优化人声与曲风适配。官方演示中,用户输入“创作一首周杰伦风格的春日恋曲”,模型即可生成完整编曲+人声Demo。AI音乐卷到“风格复...
2026-01-31

暂无评论

none
暂无评论...