您的位置:首页 >资讯>快报

阿里云推大规模视觉语言模型开源,支持中英文多种语言

2023-08-27 23:52:14 来源:中关村在线 收藏


【资料图】

阿里云于8月25日推出了大规模视觉语言模型Qwen-VL,该模型已在ModeScope开源。此前,阿里云已经开源了通用模型Qwen-7B和对话模型Qwen-7B-Chat。Qwen-VL是一款支持中英文等多种语言的视觉语言模型,相较于此前的视觉语言模型,除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力。Qwen-VL以Qwen-7B为基座语言模型,在模型架构上引入视觉编码器,使得模型支持视觉信号输入,该模型支持的图像输入分辨率为448,此前开源的视觉语言模型通常仅支持224分辨率。官方表示,该模型可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景,在主流的多模态任务评测和多模态聊天能力评测中,取得了远超同等规模通用模型的表现。在Qwen-VL的基础上,通义千问团队使用对齐机制,打造了基于语言模型的视觉AI助手Qwen-VL-Chat,可让开发者快速搭建具备多模态能力的对话应用。通义千问团队同时表示,为了测试模型的多模态对话能力,他们构建了一套基于GPT-4打分机制的测试集“试金石”,对Qwen-VL-Chat及其他模型进行对比测试,Qwen-VL-Chat在中英文的对齐评测中均取得了开源视觉语言模型最好结果。

关键词:

相关的文章>>

标签:
阿里云于8月25日推出了大规模视觉语言模型Qwen-VL,该模型已在ModeScop[ 查看全文 ]
标签:
英伟达,全球人工智能芯片领军企业,近期在其第二财季财报发布后的电话[ 查看全文 ]
标签:
德国民众抗议北约供武激化俄乌冲突[ 查看全文 ]
标签:
券中社8月24日讯,长沙银行披露2023年半年度报告显示,上半年该行完成[ 查看全文 ]
标签:
信达证券股份有限公司张润毅蒋颖近期对盛路通信进行研究并发布了研究报[ 查看全文 ]
标签:
在网上买湾流公务机,这种体验普通人很难拥有,但是看大佬们买,体验竞[ 查看全文 ]
标签:
星盾科技拟向银行申请办理保函授信额度不得超过100万以公司自有100%保[ 查看全文 ]
标签:
挖贝网2023年8月24日,佳和高科(838149)近日发布2023年半年度报,报告[ 查看全文 ]
标签:
三秦都市报-三秦网讯(袁海艳马凯记者陈奋翔)近期,为进一步加强客运[ 查看全文 ]
标签:
水培水仙花是一种非常受欢迎的室内观赏植物,其美丽的花朵和清香的气味[ 查看全文 ]
标签:
挖贝网2023年8月24日,三美股份(603379)近日发布2023年半年度报,报告[ 查看全文 ]
标签:
在8月23日的中甲联赛,广西平果哈嘹客场0-2爆冷输给上海嘉定汇龙,导致[ 查看全文 ]
标签:
一侧是辽阔的大海,一侧是放置着密密麻麻汽车的码头,这里是天津港海岸[ 查看全文 ]
标签:
北汽集团旗下极狐汽车、北京汽车、北京奔驰、北京现代四大品牌出征,在[ 查看全文 ]
标签:
红网时刻新闻8月27日讯(记者何青通讯员黎振兴)8月27日8时,康家岗水[ 查看全文 ]
标签:
重庆大学城市科技学院宿舍套间,重庆大学城市科技学院宿舍这个很多人还[ 查看全文 ]
标签:
养猪行情:据浙江宜兴检验检疫局统计,宜兴地区1—8月共出口饲料添加剂[ 查看全文 ]
标签:
据报道,北京46家博物馆在暑期取消“周一闭馆”政策,每天对观众开放。[ 查看全文 ]
标签:
8月22日,浙江队球员弗兰克在进球后庆祝。[ 查看全文 ]
标签:
胆大包天!美国红旗银行未经批准非法在我国开业!而背后阴谋更深,美国,[ 查看全文 ]

热门标签

热门搜索:

春季养生 健康问答 资讯

资讯

更多
  • 佳和高科2023年上...

  • 水培水仙花怎么加肥

  • 三美股份2023年上...

  • 重庆大学城市科技...

  • 浙江宜兴地区1—8...

  • 为博物馆取消“周...

图说健康

更多

体育健身

更多