当前位置:首页 > 今日A股公司股市行情 > 正文内容

阿里深夜炸场!通义千问发布新一代端到端旗舰模型Qwen2.5-Omni

4个月前 (03-27)今日A股公司股市行情12

  

  财联社3月27日讯,北京时间周四凌晨,阿里巴巴发布通义千问系列的最新旗舰模型Qwen2.5-Omni。这款端到端多模态模型专为广泛的多模态感知设计,能够处理文本、图像、音频和视频等多种输入,同时能够通过生成文本和合成语音提供实时流式响应。

  据“通义千问Qwen”官方微信号介绍,这款模型的主要特点如下:

  全能创新架构:Qwen团队提出了一种全新的Thinker-Talker架构,这是一种端到端的多模态模型,旨在支持文本/图像/音频/视频的跨模态理解,同时以流式方式生成文本和自然语音响应。Qwen提出了一种新的位置编码技术,称为TMRoPE(Time-aligned Multimodal RoPE),通过时间轴对齐实现视频与音频输入的精准同步。

  实时音视频交互:架构旨在支持完全实时交互,支持分块输入和即时输出。

  自然流畅的语音生成:在语音生成的自然性和稳定性方面超越了许多现有的流式和非流式替代方案。

  全模态性能优势:在同等规模的单模态模型进行基准测试时,表现出卓越的性能。Qwen2.5-Omni在音频能力上优于类似大小的Qwen2-Audio,并与Qwen2.5-VL-7B保持同等水平。

  卓越的端到端语音指令跟随能力:Qwen2.5-Omni在端到端语音指令跟随方面表现出与文本输入处理相媲美的效果,在MMLU通用知识理解和GSM8K数学推理等基准测试中表现优异。

  模型性能方面,Qwen2.5-Omni在包括图像,音频,音视频等各种模态下的表现都优于类似大小的单模态模型以及封闭源模型,例如Qwen2.5-VL-7B、Qwen2-Audio和Gemini-1.5-pro。

  在多模态任务OmniBench,Qwen2.5-Omni达到了SOTA的表现。此外,在单模态任务中,Qwen2.5-Omni在多个领域中表现优异,包括语音识别(Common Voice)、翻译(CoVoST2)、音频理解(MMAU)、图像推理(MMMU、MMStar)、视频理解(MVBench)以及语音生成(Seed-tts-eval和主观自然听感)。

  该模型现已在 Hugging Face、ModelScope、DashScope 和 GitHub上开源开放。

  

(文章来源:科创板日报)

   责任编辑:137 原标题:阿里深夜炸场!通义千问发布新一代端到端旗舰模型Qwen2.5-Omni

相关文章

中加基金董事长变更及创新药概念再度活跃,万邦德、力生制药涨停,广生堂等大涨及午评

中加基金董事长变更及创新药概念再度活跃,万邦德、力生制药涨停,广生堂等大涨及午评

  【导读】杨琳履新中加基金迎来新任董事长。   中国基金报记者若晖。   又有千亿级基金公司换帅。   7月16日,中加基金公告称,...

今日175只股长线走稳 站上年线

今日175只股长线走稳 站上年线

  证券时报·数据宝统计,截至今日上午收盘,上证综指3302.19点,收于年线之上,涨跌幅为0.15%,A股总成交额为7331.40亿元。到目前为止,今日有175只A股价格突破了年线,其中...

半导体板块强势上扬 芯朋微、富满微等大涨

半导体板块强势上扬 芯朋微、富满微等大涨

     半导体板块17日盘中发力走高,截至发稿,芯朋微涨超13%,富满微涨近10%,中颖电子涨逾8%,上海贝岭、思瑞浦、炬芯科技等涨逾6%。...

【美股盘前】Q1业绩超预期,微软大涨超8%,多家大行上调其目标价;Meta涨超6

【美股盘前】Q1业绩超预期,微软大涨超8%,多家大行上调其目标价;Meta涨超6

  ①截至发稿,道指期货涨0.58%、标普500指数期货涨1.04%、纳指期货涨0.13%。   ②【特斯拉:有关寻找CEO接班人的媒体报道不属实】截至发稿,特斯拉盘前涨...

航运概念涨1.04%,主力资金净流入这些股

航运概念涨1.04%,主力资金净流入这些股

  截至4月16日收盘,航运概念上涨1.04%,位居概念板块涨幅第4,板块内,34股上涨,南京港、中创物流、重庆港等涨停,华光源海、飞力达、厦门港务等涨幅居前,分别上涨14.24%、8.4...

2月新能源车销量同比增87.1%,广州头部汽车品牌销量领跑

2月新能源车销量同比增87.1%,广州头部汽车品牌销量领跑

  中汽协最新发布的汽车工业运行情况显示,今年2月汽车产销分别完成210.3万辆和212.9万辆,同比分别增长39.6%和34.4%,其中新能源汽车产销分别完成88.8万辆和89.2万辆,...