kaiyun体育其及时同传可在保持非及时翻译94%以上准确度的同期-Kaiyun· (开云)官方网站 登录入口
发布日期:2025-10-02 06:27 点击次数:81
智东西
作家 | 王涵裁剪 | 漠影智东西9月30日音尘,刚刚,通义千问推出多谈话及时音视频同传模子Qwen3-LiveTranslate-Flash,占据多个中英及多谈话语音翻译榜单第又名!
Qwen3-LiveTranslate-Flash齐备了袒护18种谈话的离线和及时两种音视频翻译能力,主要有以下5个中枢亮点:
1、多谈话和方言:维持中语、英文、法语、德语、俄语、意大利语、西班牙语等主要官方谈话和庸碌话、粤语、北京话、吴话、四川话、天津话的方言翻译。
2、视觉增强:初度引入视觉落魄文增强工夫,Qwen3-LiveTranslate-Flash不错通过识别和诈欺口型、作为、翰墨、实体等多模态信息,有用支吾嘈噪音频环境以及一词多译词场景下的翻译不准问题。
3、3秒蔓延:轻量的夹杂大众架构与动态采样计策,同传齐备最低3秒的蔓延。
4、无损同传:该模子弃取语义单位瞻望工夫缓解跨谈话翻译的调序问题,齐备与离线翻译简直无损的翻译质料。
5、音色当然:该模子使用海量语音数据磨真金不怕火,不错字据原始语音实质自合适调度口吻和推崇力的拟东说念主音色。
一、高出Gemini-2.5-Flash,同传准确度达94%以上在公开测试集上,中英及多谈话语音翻译榜单中,Qwen3-LiveTranslate-Flash的准确度优于现时主流大模子Gemini-2.5-Flash、GPT-4o-Audio-Preview和Voxtral Small-24B等模子,在除AVG.XX-EN之外的测试中均是第又名。
Qwen3-LiveTranslate-Flash在不同领域和复杂声学环境下的测试获利也优于Gemini-2.5-Flash等主流大模子。
该模子研发语义单位瞻望工夫来缓解跨谈话调序问题,其及时同传可在保持非及时翻译94%以上准确度的同期,显耀裁减蔓延。
视觉增强工夫进一步让Qwen3-LiveTranslate-Flash在嘈噪音频、一词多译、私著名词翻译等场景翻译更精确。在及时场景中,视觉信息弥补了语音落魄文的缺失,上风更彰着。
官方给出了丰富的实例,Qwen3-LiveTranslate-Flash在同传翻译、视觉增强赞助等能力上的推崇如实能打,确切为专科翻译使命主说念主员握了一把汗。
举例将阿里巴巴2023年12月份季度功绩电话会议进行中语同传:
输入音频:
https://oss.zhidx.com/f31009e4395c7deb609debf197a65f7b/68daad00/uploads/2025/09/68dbace08deb2_68dbace08a53d_68dbace08a4ee_中英同传.mp3输出步调:
凭借视觉增强赞助语音翻译功能,Qwen3-LiveTranslate-Flash或者识别出来mask(口罩)和Musk(马斯克)的分别:
该模子还不错识别低频私著名词,比如东说念主名:
Qwen3-LiveTranslate-Flash还维持多种谈话或方言的不同音色,举例:
1、芊悦,voice参数:Cherry
音色步调:
https://oss.zhidx.com/525060543cfe82f97f67b4028186c137/68daad00/uploads/2025/09/68dbacdf3ba68_68dbacdf38441_68dbacdf3840c_芊悦1.mp3描述:阳光积极、亲切当然密斯姐。
维持的语种/方言:中语、英语、法语、德语、俄语、意大利语、西班牙语、葡萄牙语、日语、韩语
2、不吃鱼,voice参数:Nofish
音色步调:
https://oss.zhidx.com/f1aa4a9ac56a844e07759883ccfedcb4/68daad00/uploads/2025/09/68dbacdf118a1_68dbacdf0dee0_68dbacdf0dea6_不吃鱼1.mp3描述:不会翘舌音的估量打算师。
维持的语种/方言:中语、英语、法语、德语、俄语、意大利语、西班牙语、葡萄牙语、日语、韩语
3、上海-阿珍,voice参数:Jada
音色步调:
https://oss.zhidx.com/f2a8fc34ae1f8e05143da3b3f18a7295/68daad00/uploads/2025/09/68dbacdf6bbdc_68dbacdf68577_68dbacdf6854c_上海-阿珍1.mp3描述:扬铃打饱读的沪上阿姐。
维持的语种/方言:中语(吴语)
4、北京-晓东,voice参数:Dylan
音色步调:
https://oss.zhidx.com/c656142c36e636356d3d45ffff53a8f1/68daad00/uploads/2025/09/68dbacdec7750_68dbacdec35ad_68dbacdec355e_北京-晓东1.mp3描述:北京巷子里长大的少年。
维持的语种/方言:中语(北京话)
5、四川-晴儿,voice参数:Sunny
音色步调:
https://oss.zhidx.com/92a224dfc2b4411c099bf760854dbe7e/68daad00/uploads/2025/09/68dbacdfd0fb1_68dbacdfcd890_68dbacdfcd854_四川-晴儿1.mp3描述:甜到你心里的川妹子。
维持的语种/方言:中语(四川话)
6、天津-李彼得,voice参数:Peter
音色步调:
https://oss.zhidx.com/1f4e465854e05350ccde9ddb3f05a41e/68daad00/uploads/2025/09/68dbace010fb5_68dbace00829e_68dbace00826a_天津-李彼得1.mp3描述:天津相声,专科捧哏。
维持的语种/方言:中语(天津话)
7、粤语-阿清,voice参数:Kiki
音色步调:
https://oss.zhidx.com/e830838613a77c0b3c5d03035d686a19/68daad00/uploads/2025/09/68dbace046bbd_68dbace04354e_68dbace04350f_粤语-阿清1.mp3描述:甜好意思的港妹闺蜜。
维持的语种/方言:粤语
8、四川-程川,voice参数:Eric
音色步调:
https://oss.zhidx.com/aee07fc351746e64cc5498d99feceaac/68daad00/uploads/2025/09/68dbacdf97ef6_68dbacdf94087_68dbacdf94056_四川-程川1.mp3描述:一个跳脱贩子的四川成皆须眉。
维持的语种/方言:中语(四川话)
结语:通义千问加快AI音视频翻译落地Qwen3-LiveTranslate-Flash初度引入视觉落魄文增强工夫,让音视频AI翻译更上了一个台阶。
通义千问团队称,今后还将不竭擢升语音翻译的准确性、当然度、厚谊一致性,拓展更多语种的袒护范围,增强在多样复杂语音环境下的翻译鲁棒性。
在语音翻译这个应用面鼓励工夫跨越的红海赛说念kaiyun体育,通义千问此次推出新模子,或将大幅裁减宇宙竖立者在及时跨谈话交流应用上的立异门槛,加快催生从海外会议、跨境直播到无隔断疏通等场景的下一代居品落地。
- 上一篇:kaiyun体育工场栽培的埃及斑蚊捎带沃尔巴克氏菌-Kaiyun· (开云)官方网站 登录入口
- 下一篇:没有了