谷歌发布实时语音互译模型 Gemini 3.5 Live Translate
2026-06-11 03:53:25
  • 0
  • 0
  • 0

6 月 9 日消息,北京时间 9 日(今天)晚间,谷歌正式发布最新的实时语音互译音频模型 Gemini 3.5 Live Translate,迈出实时翻译的下一步。

Gemini 3.5 Live Translate 可自动识别 70 多种语言,并生成流畅、自然的翻译语音,同时保留说话者的语调、语速和音高。

根据介绍,传统轮流式系统通常要等说话者说完后才开始翻译,Gemini 3.5 Live Translate 则会连续生成语音,在「等待更多上下文以提升翻译质量」和「即时翻译以跟上说话者节奏」之间取得平衡。整个会话过程中,翻译音频可以保持流畅,避免尴尬停顿,并始终只比说话者慢几秒。(来源:IT 之家)

 
最新文章
相关阅读