Google发布Gemini 3.5 Live Translate：70+语言边听边译，保留原声音调

信息来源: X 2026-06-11 02:06

看点：突破了传统回合制翻译，实现低延迟流式边听边译，且能保留说话人音色和语调，不再依赖特定硬件，让同传级体验走向大众。

Google正式发布实时语音互译模型 Gemini 3.5 Live Translate。和传统“等说完再翻”的回合制翻译不同，它采用流式连续生成机制，能在70多种语言之间做到边听边译，全程只比说话人慢几秒，避免了尴尬的停顿。

这个模型最明显的提升在于声音还原和环境适应。翻译后的语音能保留说话人的语调、节奏和音高，不再是机械的合成音；同时支持自动语言检测，不需要提前设定源语言，还能自动滤除噪音，嘈杂环境也能正常使用。

目前该功能已陆续登陆Google旗下产品。普通用户可以直接在 Android 和 iOS 版的 Google 翻译 App 中体验，连接任意耳机即可使用。Android 用户还独享了新增的“听筒模式”，像接电话一样把手机贴到耳边就能听翻译，适合没带耳机又不想外放的场景。

开发者可以通过 Gemini Live API 和 Google AI Studio 直接调用公开预览版，将其接入多语言通话、会议或直播等场景。企业用户则可在 Google Meet 中使用私有预览版。

值得注意的是，这次实时翻译摆脱了对特定硬件（如Pixel手机或Buds耳机）的依赖，任意智能手机都能跑。不过，听筒模式目前仅限Android端，iOS用户还需等待；API目前也处于预览阶段，稳定性仍需观察。

怎么用

图片来源：x.com

图钉AI导航致力于优质、实用的网络站点资源收集与分享！本文地址https://www.tudingai.com/ainews/4974.html转载请注明

距 4 月 23 日的 Hy3 preview 发布已经过去了两个半月，今天（7 月 6 日）腾讯混元 Hy3 正式版终于发布，WorkBuddy 作为首发接入平台同步开启为期两周的限时免费体验。元宝也同步接入且免费开放。 Hy3是一个快慢...

2026-07-07

今天凌晨，OpenAI 扔了个不大不小的炸弹 GPT-5.6 系列发布了。 GPT-5.6 系列包括三款模型，名字挺有意思：Sol（太阳）、Terra（地球）、Luna（月亮）。三款各有分工： Sol 是旗舰，最强大，面向复杂推理、科研...

2026-06-27

腾讯QQ邮箱内测专为AI Agent设计的“Agently Mail”。它为Agent提供独立邮箱身份，与个人邮箱数据隔离，解决了以往授权主邮箱带来的隐私风险。支持OAuth授权及CLI一键配置，已适配Cursor、Claude Code等...

mp.weixin.qq.com

2026-06-25

2026-06-04

暂无评论

暂无评论...

07-13 03:52快讯
Codex 正面硬刚 Claude， Codex取消了5小时使用量限制、Fable 5 延期
就在刚刚OpenAI Codex 负责人@Tibo 发文称暂时取消所有 Plus、Business 和 P
07-09 11:44快讯
工信部：《关于防范AI编程工具Claude Code安全后门隐患的风险提示》
2026年7月8日，工业和信息化部网络安全威胁和漏洞信息共享平台（NVDB）发布《关于防范AI编程工具Cla
07-07 00:51产品发布/更新
腾讯混元Hy3正式上线，WorkBuddy首发接入，限时两周免费体验！
腾讯混元Hy3正式上线，WorkBuddy首发接入并限时两周免费体验，以任务解决率跃升至90%、耗时缩短34%及高性价比开源等亮点，重塑AI办公新标杆。
07-03 16:46快讯
阿里反向出手：7月10日起全面禁用Anthropic全系产品，Claude Code在列
阿里巴巴内部今日下发通知，因近期 Claude Code 被曝存在植入后门的安全风险，经综合评估后将其列入高
07-02 12:46快讯
Claude Fable 5 强势回归！但我号没了~
Anthropic 昨天就宣布 Claude Fable 5大模型将于今日重新部署上线，目前已经可以在Cla