正文内容 评论(0

阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o
2025-01-28 14:58:14  出处:快科技 作者:随心 编辑:随心     评论(0)点击可以复制本篇文章的标题和链接对文章内容进行纠错

快科技1月28日消息,今天,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。

其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,超越GPT-4o与Claude3.5。

阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o

官方介绍称,新的Qwen2.5-VL能更准确地解析图像内容,突破性地支持超1小时的视频理解,可以在视频中搜索具体事件,并对视频的不同时间段进行要点总结,从而快速、高效地帮助用户提取视频中蕴藏的关键信息。

阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o

而且无需微调就可变身为一个能操控手机和电脑的AI视觉智能体(Visual Agents),实现给指定朋友送祝福、电脑修图、手机订票等多步骤复杂操作。

Qwen2.5-VL 不仅擅长识别常见物体,如花、鸟、鱼和昆虫,还能够分析图像中的文本、图表、图标、图形和布局。

此外,Qwen2.5-VL将OCR识别能力提升至一个新的水平,增强了多场景、多语言和多方向的文本识别和文本定位能力。同时,在信息抽取能力上进行大幅度增强,以满足日益增长的资质审核、金融商务等数字化、智能化需求。

阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o

【本文结束】如需转载请务必注明出处:快科技

责任编辑:随心

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...