正文内容 评论(0)
快科技3月27日消息,今天,阿里云宣布通义千问Qwen2.5-Omni-7B正式开源。
这是通义系列模型中首个端到端全模态大模型,可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。
在权威的多模态融合任务OmniBench等测评中,Qwen2.5-Omni刷新业界纪录,全维度远超谷歌的Gemini-1.5-Pro等同类模型。
阿里云表示,相较于动辄数千亿参数的闭源大模型,Qwen2.5-Omni以7B的小尺寸让全模态大模型在产业上的广泛应用成为可能。
即便在手机上,也能部署和应用Qwen2.5-Omni模型。
目前,Qwen2.5-Omni已在魔搭社区和Hugging Face 同步开源,用户也可在Qwen Chat上直接体验。
据悉,2023年起,通义团队陆续开发覆盖0.5B、1.5B、3B、7B、14B、32B、72B、110B等参数的200多款全尺寸大模型,囊括文本生成模型、视觉理解/生成模型、语音理解/生成模型、文生图及视频模型等全模态。
开源地址:
https://huggingface.co/Qwen/Qwen2.5-Omni-7B
- 热门文章
- 换一波
- 好物推荐
- 换一波
-
-
比用毛巾划算 还更卫生!维达悬挂式洗脸巾29.9元(320抽)
2025-03-24 0 -
不加一滴水:摘养NFC芒果/黄桃/苹果汁1kg半价大促9.9 元
2025-03-21 2
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...