您的当前位置:首页>科技咨询>资讯详情

阿里巴巴发布新一代端到端多模态旗舰模型Qwen2.

发表于:2025-03-27 11:00:03 浏览:37次 发布者: 网易互联网

阿里巴巴发布了新一代端到端多模态旗舰模型Qwen2.5-Omni,号称具备全方位多模态感知能力,看听说写样样精通。

采用全新的Thinker-Talker双核架构,Thinker模块负责处理多模态输入并生成语义表征和文本内容,Talker模块则负责将这些信息转化为流畅的语音输出。这种架构实现了端到端的统一,支持实时音视频交互和流畅的语音生成。

能够无缝处理文本、图像、音频和视频等多种输入形式,并同时生成文本和语音输出。支持分块输入和即时输出,实现真正的实时交互。

已在Hugging Face、ModelScope、DashScope和GitHub等平台开源,方便开发者体验和使用。

相比现有方案,语音生成的自然度和稳定性更高。在音频能力上优于同等规模的Qwen2-Audio,与Qwen2.5-VL-7B保持同等水平。在语音指令理解方面表现出色,效果可媲美文本输入。

猜你喜欢

真我GT7 Pro评测:骁龙8至尊版的旗舰杀手
真我GT7 Pro评测:骁龙8至尊版的旗舰杀手
发表于:2024-11-05 浏览:75 发布者: CNMO
王兴:低价竞争不可持续,将不惜一切代价获得行
王兴:低价竞争不可持续,将不惜一切代价获得行
发表于:2025-05-26 浏览:31 发布者: 网易互联网
马斯克X平台,突然遭遇大规模网络攻击!可能和
马斯克X平台,突然遭遇大规模网络攻击!可能和
发表于:2025-03-11 浏览:38 发布者: 网易互联网
饿了么前CEO巨贪案:供应链管理失能
饿了么前CEO巨贪案:供应链管理失能
发表于:2025-07-26 浏览:21 发布者: 网易互联网
2亿单外卖的周末:骑手日赚千元,奶茶店忙到崩
2亿单外卖的周末:骑手日赚千元,奶茶店忙到崩
发表于:2025-07-08 浏览:26 发布者: 网易互联网
双十一数据揭晓:累计销售额超14000亿,3C、家电、服饰等品类占消费重头,京东表现抢眼
双十一数据揭晓:累计销售额超14000亿,3C、家电、服饰等品类占消费重头,京东表现抢眼
发表于:2024-11-15 浏览:68 发布者: 新浪财经
强调良性增长 天猫想重回“起点”
强调良性增长 天猫想重回“起点”
发表于:2025-03-27 浏览:30 发布者: 网易互联网
河南新开跨境电商全货机航线16条
河南新开跨境电商全货机航线16条
发表于:2025-05-26 浏览:24 发布者: 网易互联网
分分合合,钉钉回到“无招”时代
分分合合,钉钉回到“无招”时代
发表于:2025-04-01 浏览:38 发布者: 网易互联网
Meta开始裁减“低绩效”员工 留出人头数来抢夺A
Meta开始裁减“低绩效”员工 留出人头数来抢夺A
发表于:2025-02-11 浏览:43 发布者: 网易科技