新Google发布Gemini 3.5 Live Translate:70+语言边听边译,保留原声音调
Google发布实时语音互译模型Gemini 3.5 Live Translate。该模型支持70多种语言流式边听边译,延迟仅数秒,并能保留说话人语调与音高。它具备自动语言检测和抗噪能力,无需等说完再翻。普通用户可通过Google翻译App...
阿里云通义千问最新旗舰模型 Qwen3.7-Max 的隐式缓存功能现已上线。最直观的好处是:开发者不需要做任何代码改动或参数配置,缓存机制就会在后台自动生效,直接带来响应变快、调用变便宜的结果。
对于日常高频调用且上下文重复较多的场景,隐式缓存的“开箱即用”能省下不少 Token 费用。但隐式缓存的命中率并非绝对确定,如果你对成本控制有更严苛的要求,需要更高且更稳定的命中率,官方建议转向使用显式缓存。
Qwen3.7-Max 是阿里云近期发布的新一代旗舰智能体模型,目前通过阿里云百炼平台提供 API 服务,输入价格约 12 元/百万 Tokens,输出约 36 元/百万 Tokens。结合此次上线的缓存功能,长上下文或多轮对话场景的实际运行成本有望进一步压降。
怎么用
相关链接