腾讯发布 HY-MT1.5:翻译又快又准,连手机都能跑

信息来源: https://www.aibase.com/zh/news/242672026-01-06 18:06

翻译软件我们天天用,但背后的模型通常很大,往往需要连接云端服务器才能运行。腾讯这次推出的 HY-MT1.5系列打破了这个限制,推出了两个版本,满足不同场景的需求:

1.8B 小尺寸版: 别看它体量小,它在性能上几乎能和体量大得多的模型叫板。经过优化后,它只需要约1GB 的内存就能在手机等端侧设备上流畅运行。翻译50个汉字左右的句子,平均响应时间仅需 0.18秒。

7B 升级版: 它是之前获得 WMT25冠军系统的升级版,更擅长处理复杂的混合语言翻译、专业术语解析以及特定的格式翻译,主要面向服务器部署。

为了让模型更懂人类的语言习惯,腾讯的研究团队采用了“五步走”的训练方法:
打好语言基础: 先让模型学习海量的多语言文本,掌握基本的语言规律。
专项训练: 专门输入大量的对译数据,让它从“会说话”变成“会翻译”。
精雕细琢: 使用高质量的文档数据进行微调,让翻译结果更地道。
名师出高徒(蒸馏): 让7B 的大模型带1.8B 的小模型,把大模型的“智慧”传授给小模型,让它体积虽小但大脑依然聪明。
人类评判: 最后引入人类的审美标准,针对准确度、流畅度和文化差异进行打分优化。

实测表现:超越部分主流大模型。在多项权威测试中,这套模型的表现非常亮眼:
在 WMT25等国际测试中,7B 版本的得分超过了 Gemini3.0Pro 以及许多专业的翻译模型。即便是在“普通话转少数民族语言”这种冷门领域,它的表现依然拔尖。1.8B 版本在人类真实测试中的评分,也超过了百度、谷歌、微软等主流商业翻译系统。

除了翻译得准,HY-MT1.5还解决了一些实际使用中的痛点:
术语精准: 你可以告诉它特定的词怎么翻。比如“混元珠”必须翻成“Chaos Pearl”,它就不会自作聪明地翻成别的词。
联系上下文: 比如单词“pilot”,没有上下文它可能翻成“飞行员”,但如果这段话是讲美剧的,它能聪明地识别出这是指“试播集”。
格式不变: 如果你在翻译一段带有 HTML 标签或特殊格式的代码,它能在翻译内容的同时,完美保留原来的标签结构。

目前,腾讯已经将该模型的权重在GitHub和Hugging Face上开源,这意味着全球的开发者都可以使用这项技术来提升自己的应用体验。

相关快讯

AI假图搅局马杜罗捕获事件

AI深伪技术又作妖!美国突袭委内瑞拉后,网上流传的马杜罗“被捕”图片全是AI生成的(用Google Nano Banana Pro),百万浏览量散播假新闻。这提醒我们,AI时代媒体素养超重要!
https://www.france24.com/en/americas/20260106-ai-generated-images-contributed-disinformation-spreading-maduro-capture?referrer=grok.com
2026-01-07

中国人形机器人“众擎T800”海外走红,展示高难度武术

一段名为“众擎T800机器人硬核演示”的视频在海外社交媒体爆火。视频中,该人形机器人流畅地完成了回旋五连踢、360度旋空转身等高难度武术动作,其出色的运动控制和稳定性引发了全球科技爱好者的广泛关注,成为中国机器人技术走向世界舞台的生动案例
2026-01-20

千问App上线教育功能:一句话即可获取期末真题与解析

2026年1月6日,千问App正式推出重磅教育功能,号称拥有“亚洲最大题库”,为数亿学生提供便捷的学习支持。 一键调取期末真题:千问App新功能允许用户通过简单的一句话指令,精准搜索并获取所需的期末试卷。例如,用户只需说出“上海中学高一物理...
2026-01-06

Anthropic推出完全由Claude编写代码的智能体

Anthropic推出的新型AI智能体Cowork,其全部代码均由Claude模型自主编写完成,开发周期仅约10天,展示了AI在软件工程领域的强大自动化能力
Anthropic技术博客官方发布
2026-01-15

抖音直播AI治理成效显著,违规识别准确率超90%

抖音发布的《2025抖音直播治理白皮书》显示,AI大模型将违规处置效率提升31%,全年无限期回收37万个违规直播账号。 AI审核效率显著提升,违规内容识别准确率超过90%,整体违规曝光量减少37%。该白皮书还透露,抖音直播年内协助警方捣毁诈...
抖音直播治理白皮书及官方公告
2026-01-26

AI推荐暗箱操作:GEO服务“买通”AI引监管关注

据《证券时报》调查,市场上已出现名为GEO的服务,旨在通过优化内容,让特定品牌产品在AI生成的推荐答案中获得更高“话语权”。这种通过污染AI数据源来“买通”推荐通道的行为,涉嫌违法违规,已引发监管和市场的警惕,亟待治理
证券时报
2026-01-20

谷歌推出开源医疗AI模型MedGemma 1.5

谷歌宣布推出新一代开源医疗AI模型MedGemma 1.5,增强医学影像支持功能。该模型集旨在为开发者提供评估和调整的起点,以适应其医疗应用场景,截至目前下载量已突破数百万次。 医疗AI正成为各大科技公司竞相布局的重点领域,开源策略有望加速...
谷歌开发者博客
2026-01-14

暂无评论

none
暂无评论...