阿里云发布多模态大模型Qwen-VL-Max版本 性能比肩GPT-4V
站长网2024-01-26 11:32:140阅
阿里云公布了多模态大模型的最新研究成果,继Plus版本之后,再次推出Max版本。
Qwen-VL-Max模型在视觉推理方面展现出卓越的能力,可以理解并分析复杂的图片信息,包括识人、答题、创作和写代码等任务。此外,该模型还具备视觉定位功能,可根据画面指定区域进行问答。
在基础能力方面,Qwen-VL-Max能够准确描述和识别图片信息,并根据图片进行信息推理和扩展创作。这一特性使得该模型在多个权威测评中表现出色,整体性能堪比GPT-4V和Gemini Ultra。
在文档分析(DocVQA)、中文图像相关(MM-Bench-CN)等任务上,Qwen-VL-Max同样超越了GPT-4V,达到了世界最佳水平。
此外,Qwen-VL-Max在图像文本处理方面也取得了显著进步,中英文文本识别能力显著提高。该模型支持百万像素以上的高清分辨率图和极端宽高比的图像,不仅能完整复现密集文本,还能从表格和文档中提取信息。
目前,Qwen-VL-Plus和Qwen-VL-Max限时免费向用户开放。用户可以在通义千问官网、通义千问APP直接体验Max版本模型的能力,也可以通过阿里云灵积平台(DashScope)调用模型API。
0000
评论列表
共(0)条相关推荐
好莱坞演员继续罢工 抗议AI和3D扫描技术
划重点:🌟好莱坞演员继续罢工,抗议使用AI和3D扫描技术🌟SAG-AFTRA工会提出新合同建议,遭到影视公司拒绝🌟政治立法“NOFAKESACT”引发演员对AI形象控制的希望站长网2023-10-13 15:16:040000Elevate 完成新一轮 2800 万美元融资 使用人工智能技术满足核心需求
消费者福利管理平台Elevate日前宣布完成了一轮融资,由Anthemis牵头、FinCapitalNorwestVenturePartners、Greycroft、BoweryCapital和FireboltVentures参与。本次融资共筹集2800万美元,将用于产品开发、人员招聘和客户获取。站长网2023-04-25 15:35:480000天猫精灵宣布“精灵大模型”升级内测体验4大技能
天猫精灵宣布,正在内测的精灵大模型升级内测体验4大技能。据悉,升级后的天猫精灵不仅能够实现连续对话,还能帮你进行内容创作,当你的吐槽树洞,陪你一起喜怒哀乐。目前,Sound系列用户可通过天猫精灵App首页Banner或点击首页搜索入口进入“精灵大模型开放内测”页面申请报名。站长网2023-07-28 08:46:120000iOS17.4更新:苹果开放非WebKit浏览器引擎 仅限欧盟用户
苹果在其移动操作系统iOS17.4中进行了重大改变,其中一项重要的产品变化是允许替代浏览器引擎在iOS上运行,但此功能仅限于欧盟用户。此前,所有浏览器在iOS上被迫使用WebKit引擎,而现在开发者可以根据需要使用非WebKit引擎,这意味着更多功能和扩展将变得可用。站长网2024-01-26 10:10:060000大模型冰火两重天?GPT访问增速大跌,国内产品热度也下滑,但一天N个发布
当下,大模型、AIGC到底是火还是不火了?让人摸不着头脑。一方面,有国内外的创业公司卖身、ChatGPT的访问量增速下滑、普通用户使用频次及关注度下滑;一方面,行业、大公司们动作频频,热火朝天。似乎,火了半年多的这个行业到了一个十字路口。傅盛朱啸虎激辩ChatGPT访问量增速下滑行业出现不同声音猎豹移动CEO傅盛和投资大佬朱啸虎在朋友圈激辩ChatGPT,引起了一阵讨论热潮。站长网2023-07-04 11:14:360005