深度求索开源多模态大模型DeepSeek-VL系列
站长网2024-03-13 09:45:021阅
3月11日,DeepSeek-AI开源了全新多模态大模型DeepSeek-VL系列,分为1.3b 和7b 两种规模,共有4个版本。它具有融合语言和视觉能力,可以在不损失语言理解能力的情况下处理多模态任务,识别高分辨率图像中的细小物体。这个模型结合了视觉和语言信息,通过预训练微调的方法,在种领域中展现出很好的性能。
在数据构建阶段,DeepSeek VL 模型使用了多种不同领域的数据集,包括公开数据集如 ShareGPT4V、LAION-GPTV、LVIS-Instruct4V 等,以及纯文本数据集如 DeepSeek-LLM。
模型训练过程分为三个关键阶段:视觉 - 语言适配器训练、联合视觉 - 语言预训练和监督微调,以确保模型在不同任务和领域中的准确性和鲁棒性。
据悉,深度求索(DeepSeek),成立于2023年,专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。
![](https://i.zz5.net/images/article/2024/03/13/094502184.jpg)
包括:
deepseek-vl-1.3b-chat:
https://modelscope.cn/models/deepseek-ai/deepseek-vl-1.3b-chat
deepseek-vl-7b-chat:
https://modelscope.cn/models/deepseek-ai/deepseek-vl-7b-chat
deepseek-vl-7b-base:
https://modelscope.cn/models/deepseek-ai/deepseek-vl-7b-base
deepseek-vl-1.3b-base:
https://modelscope.cn/models/deepseek-ai/deepseek-vl-1.3b-base
0001
评论列表
共(0)条相关推荐
独家对话华创资本熊伟铭,还有什么AI项目值得关注和投资?
第三届BEYOND国际科技创新博览会在澳门威尼斯人金光会展中心正式开幕,在此期间,凤凰网科技《AI前哨》与华创资本创始合伙人熊伟铭展开对话,探讨了“AI热”下投融资市场环境的变化和影响。0000Canva上线多个好用的AI设计功能:文本生成插画、自动剪辑视频精华片段
设计平台Canva推出了一系列更新,旨在使其设计生态系统对专业团队和工作空间更具吸引力。该公司重新设计了平台,使新的和现有的编辑工具更易于找到,并宣布推出企业版,为大型组织提供更多的协作、品牌管理和安全性控制。站长网2024-05-27 19:47:140000AI视野:英伟达推文生图模型ConsiStory;高度可控AI试衣OOTDiffusion;开发者推SoraWebui开源项目;Groq最快AI推理芯片成本推算高得离谱
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/🤖📱💼AI应用英伟达推出免训练,可生成连贯图片的文生图模型ConsiStory【AiBase提要:】⭐️多数文生图模型使用随机采样模式,导致生成图像不连贯站长网2024-02-21 16:12:170000到处都是知识演员,怎么避免被割韭菜?
2017年,在当时的网络语境下被认为“油腻”、“拧巴”、“落后于时代”的单向街书店的创办人许知远,开启了人物访谈节目《十三邀》的第二季,第一个嘉宾采访了米未传媒的创始人马东。当时的马东因为做了《奇葩说》这档节目,风头正劲,被认为是继罗振宇之后,对知识的传播开启了一种新的商业模式。在《十三邀》的第一季第一集,许知远带着一种传统知识分子的偏见,采访了罗振宇。0000苹果否认高盛退出信用卡合作 称将继续为用户提供最优服务
近日,《华尔街日报》爆出消息称,科技巨头苹果已向投资银行高盛提议,在12至15个月内终止双方的信用卡合作关系。此前,苹果与高盛联手推出了AppleCard信用卡和储蓄账户。对此,苹果并未正面回应报道的具体内容,仅仅表示“苹果和高盛致力于为客户提供令人惊叹的体验”。有分析认为,苹果的表态中透露出高盛退出的可能性。站长网2023-11-30 10:02:440001