新Google发布Gemini 3.5 Live Translate:70+语言边听边译,保留原声音调
Google发布实时语音互译模型Gemini 3.5 Live Translate。该模型支持70多种语言流式边听边译,延迟仅数秒,并能保留说话人语调与音高。它具备自动语言检测和抗噪能力,无需等说完再翻。普通用户可通过Google翻译App...
在2026年5月20日的谷歌I/O开发者大会上,CEO桑达尔·皮查伊正式推出Gemini 3.5 Flash模型。谷歌将其定义为“迄今最快、最有效的模型”,特别强调了其在智能体(agentic)任务和编码(coding)场景下的强大能力。
根据官方信息,与Claude Opus 4.7、GPT-5.5 xhigh等当前前沿模型相比,Gemini 3.5 Flash的输出速度达到了每秒289个tokens,实现了约4倍的超越。在多项基准测试中,其表现也优于上一代的Gemini 3.1 Pro。谷歌展示了利用该模型驱动的工具,在12小时内从零开始构建出一个可运行的操作系统核心。

该模型已向全球所有用户免费开放。你可以直接在支持的应用(如Gemini应用)的模型下拉菜单中选择“3.5 Flash”进行体验和使用。对于开发者,它有望成为需要快速响应和处理复杂编码任务的高性价比选择。
对于追求效率的AI应用开发者、需要构建智能体流程或频繁进行代码生成的用户,这个新模型值得一试。它标志着谷歌在“模型+硬件+生态”的全栈竞争中,进一步强化了效率优势。不过,官方宣传中“成本往往低于一半”的具体量化对比数据暂未公布,其在复杂多模态理解上的全面表现也需后续独立测评。
图片来源:X