腾讯发布 HY-MT1.5:翻译又快又准,连手机都能跑

信息来源: https://www.aibase.com/zh/news/242672026-01-06 18:06

翻译软件我们天天用,但背后的模型通常很大,往往需要连接云端服务器才能运行。腾讯这次推出的 HY-MT1.5系列打破了这个限制,推出了两个版本,满足不同场景的需求:

1.8B 小尺寸版: 别看它体量小,它在性能上几乎能和体量大得多的模型叫板。经过优化后,它只需要约1GB 的内存就能在手机等端侧设备上流畅运行。翻译50个汉字左右的句子,平均响应时间仅需 0.18秒。

7B 升级版: 它是之前获得 WMT25冠军系统的升级版,更擅长处理复杂的混合语言翻译、专业术语解析以及特定的格式翻译,主要面向服务器部署。

为了让模型更懂人类的语言习惯,腾讯的研究团队采用了“五步走”的训练方法:
打好语言基础: 先让模型学习海量的多语言文本,掌握基本的语言规律。
专项训练: 专门输入大量的对译数据,让它从“会说话”变成“会翻译”。
精雕细琢: 使用高质量的文档数据进行微调,让翻译结果更地道。
名师出高徒(蒸馏): 让7B 的大模型带1.8B 的小模型,把大模型的“智慧”传授给小模型,让它体积虽小但大脑依然聪明。
人类评判: 最后引入人类的审美标准,针对准确度、流畅度和文化差异进行打分优化。

实测表现:超越部分主流大模型。在多项权威测试中,这套模型的表现非常亮眼:
在 WMT25等国际测试中,7B 版本的得分超过了 Gemini3.0Pro 以及许多专业的翻译模型。即便是在“普通话转少数民族语言”这种冷门领域,它的表现依然拔尖。1.8B 版本在人类真实测试中的评分,也超过了百度、谷歌、微软等主流商业翻译系统。

除了翻译得准,HY-MT1.5还解决了一些实际使用中的痛点:
术语精准: 你可以告诉它特定的词怎么翻。比如“混元珠”必须翻成“Chaos Pearl”,它就不会自作聪明地翻成别的词。
联系上下文: 比如单词“pilot”,没有上下文它可能翻成“飞行员”,但如果这段话是讲美剧的,它能聪明地识别出这是指“试播集”。
格式不变: 如果你在翻译一段带有 HTML 标签或特殊格式的代码,它能在翻译内容的同时,完美保留原来的标签结构。

目前,腾讯已经将该模型的权重在GitHub和Hugging Face上开源,这意味着全球的开发者都可以使用这项技术来提升自己的应用体验。

相关快讯

智谱GLM-4.7登顶全球开源榜

中国开源模型全球下载量占比达17.1%,首次反超美国15.8%,Vercel、Kilo Code等国际平台第一时间接入。
2026-01-06

特斯拉Optimus机器人或于三年内登陆火星

据《独立报》报道,埃隆·马斯克表示,特斯拉的Optimus人形机器人有望在2026年的火星任务中进行技术测试,为后续人类登陆做准备。他同时宣称,Optimus将在三年内超越世界上最好的人类外科医生,解决优秀外科医生短缺的问题
独立报
2026-01-20

三大模型同日竞技,国产AI迎来“超级发布日

昨天(1月27日)绝对是载入AI史册的一天。DeepSeek团队开源了DeepSeek-OCR 2模型,采用创新的DeepEncoder V2方法,让AI能够根据图像含义动态重排视觉内容,更接近人类的视觉逻辑。 与此同时,月之暗面推出了新一...
2026-01-28

马斯克预言AGI今年实现,电力将成未来硬通货

马斯克在播客中预测2026年实现AGI,2030年前AI智能总量超人类;称“瓦特”为未来货币,中国发电量优势将助推其AI算力领先;Optimus机器人3年内超越顶尖外科医生
马斯克《Moonshots》播客实录
2026-01-13

Meta元宇宙部门裁员10%,资源转向AI

Meta启动Reality Labs部门约10%的裁员(涉及1500人),首席技术官博斯沃思紧急召集会议,强调AI可穿戴设备为未来重点。此前扎克伯格要求削减元宇宙预算30%,加速AI投入
https://news.qq.com/rain/a/20260113A01HHM00
2026-01-13

Anthropic推出Claude Cowork,硅谷软件股市值单日蒸发2万亿

Anthropic发布桌面智能体应用Claude Cowork,其通过插件直接操作软件、掌控工作流,引发资本市场对传统软件行业的恐慌性抛售。 硅谷软件股市值单日蒸发近2580亿美元(约合2万亿人民币)。该应用能够根据用户指示操作电脑、应用程...
2026-02-06

暂无评论

none
暂无评论...