登陆注册

VL

  • 阿里云发布多模态大模型Qwen-VL-Max版本 性能比肩GPT-4V

    阿里云公布了多模态大模型的最新研究成果,继Plus版本之后,再次推出Max版本。Qwen-VL-Max模型在视觉推理方面展现出卓越的能力,可以理解并分析复杂的图片信息,包括识人、答题、创作和写代码等任务。此外,该模型还具备视觉定位功能,可根据画面指定区域进行问答。
    站长网2024-01-26 11:32:14
    0000
  • 零一万物Yi-VL多模态语言模型上线 包括Yi-VL-34B、Yi-VL-6B两个版本

    零一万物Yi-VL多模态语言模型是零一万物Yi系列模型家族的新成员,它在图文理解和对话生成方面具备卓越的能力。Yi-VL模型在英文数据集MMMU和中文数据集CMMMU上都取得了领先成绩,展示了在复杂跨学科任务上的实力。
    站长网2024-01-23 09:17:51
    0000
  • 阿里云开源通义千问视觉语言模型Qwen-VL 具备多模态信息理解能力

    阿里云旗下魔搭社区(ModelScope)宣布开源视觉语言模型Qwen-VL。据介绍,Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入,具备多模态信息理解能力。相比之前的模型,Qwen-VL新增了视觉定位、图像中文字理解等功能,可以接受图像和多语言文本作为输入,并输出图像或文本。
    站长网2023-08-26 17:01:23
    0000