Postar

阿里发布视觉增强同传大模型Qwen3.5-LiveTranslate

币界网
币界网
币界网消息,阿里通义实验室于5月19日正式宣布推出新一代实时音视频同传大模型Qwen3.5-LiveTranslate,该模型支持3500多个语言对,并首次引入实时声音克隆、热词自定义与视觉理解。新模型基于Qwen3.5-omni架构,现已支持60种语言的理解与写作,以及29种语言的语音输出。与传统同传软件不同,新模型能够结合实时视觉上下文消除语义歧义,例如在视频画面中出现特定口罩时,系统能精准区分医疗口罩与化妆舞会面具。此外,新模型还引入热词动态注入机制,用户可以在翻译流中直接指定特定人名、品牌或行业术语,确保翻译的准确性。该模型目前已在体验平台Qwen Omni开放,未来API将登录阿里云百炼平台。

Aviso legal: o conteúdo do OKX Orbit é fornecido apenas para fins informativos. Saiba mais

Respostas

Ainda não há comentários. Seja a primeira pessoa a responder!