新Google发布Gemini 3.5 Live Translate:70+语言边听边译,保留原声音调
Google发布实时语音互译模型Gemini 3.5 Live Translate。该模型支持70多种语言流式边听边译,延迟仅数秒,并能保留说话人语调与音高。它具备自动语言检测和抗噪能力,无需等说完再翻。普通用户可通过Google翻译App...
Elon Musk通过其公司xAI宣布,Grok Imagine图像生成功能现已在X(原推特)平台上线。用户可以在X上直接使用该功能,基于文本描述生成图像。
Grok Imagine基于xAI最新的文本到图像模型,能够生成逼真、高质量的图像,并支持多种宽高比设置。据联网搜索补充,该功能还具备视频生成能力,其技术基础源于xAI收购的AI视频公司Hotshot,相关模型曾在排行榜取得领先评分。

目前,Grok Imagine可通过X平台上的Grok聊天机器人访问,适合AI内容创作者、设计师或需要快速生成视觉素材的用户。不过,访问路径可能需在X内探索Grok入口,尚无独立官网或API详细说明。
重要提示:根据搜索资料,Grok Imagine仍处于早期测试阶段,最初主要面向Grok Heavy付费用户,其完全免费开放情况未明,可能存有访问限制。生成内容的伦理规范、安全过滤机制以及实际用户体验还有待观察,建议在使用中注意相关风险。