深度求索开源多模态大模型DeepSeek-VL系列
站长网2024-03-13 09:45:021阅
3月11日,DeepSeek-AI开源了全新多模态大模型DeepSeek-VL系列,分为1.3b 和7b 两种规模,共有4个版本。它具有融合语言和视觉能力,可以在不损失语言理解能力的情况下处理多模态任务,识别高分辨率图像中的细小物体。这个模型结合了视觉和语言信息,通过预训练微调的方法,在种领域中展现出很好的性能。
在数据构建阶段,DeepSeek VL 模型使用了多种不同领域的数据集,包括公开数据集如 ShareGPT4V、LAION-GPTV、LVIS-Instruct4V 等,以及纯文本数据集如 DeepSeek-LLM。
模型训练过程分为三个关键阶段:视觉 - 语言适配器训练、联合视觉 - 语言预训练和监督微调,以确保模型在不同任务和领域中的准确性和鲁棒性。
据悉,深度求索(DeepSeek),成立于2023年,专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。
包括:
deepseek-vl-1.3b-chat:
https://modelscope.cn/models/deepseek-ai/deepseek-vl-1.3b-chat
deepseek-vl-7b-chat:
https://modelscope.cn/models/deepseek-ai/deepseek-vl-7b-chat
deepseek-vl-7b-base:
https://modelscope.cn/models/deepseek-ai/deepseek-vl-7b-base
deepseek-vl-1.3b-base:
https://modelscope.cn/models/deepseek-ai/deepseek-vl-1.3b-base
0001
评论列表
共(0)条相关推荐
Deep Nostalgia:通过AI技术让老照片动起来
DeepNostalgia是一项使用机器学习来动画静态图像的技术。它可以通过给静态照片中的人脸添加动画效果,让你的家族历史变得更加生动。你只需要上传照片,DeepNostalgia会将预设的动作模板应用到人脸上,创建出高质量、逼真的视频。这些视频能够让你看到你的祖先笑、眨眼和转头,为你的照片增添活力。站长网2023-08-01 11:31:300001一段话让模型自曝「系统提示词」!ChatGPT、Bing无一幸免
ChatGPT语音对话,发布即惊艳全网——凭借表达自然流畅,嘎嘎乱杀一众AI对话产品。而现在,其背后秘诀——系统提示词居然被人扒了出来!原来对话过程中,ChatGPT要遵循下面这么多规则:使用自然、对话性强、清晰易懂的语言,比如短句、简单词汇;要简洁而有针对性,大多数回应应该是一两个句子,除非用户要求深入探讨,不要垄断对话;使用话语标记来帮助理解,不要使用列表,保持对话流畅;站长网2023-10-21 17:18:3800052.5万起!苹果Vision Pro头显开启预订:国内代购价高达7万
快科技1月20日消息,昨晚9点,苹果VisionPro正式在美国地区开启预售。提供256GB、512GB和1TB三种版本,售价分别是3499美元(约合人民币2.5万元)、3699美元(约合人民币2.66万元)、3899美元(约合人民币2.8万元)。虽然起售价达到2.5万元,但依然被大规模抢购,毕竟这是苹果一款全新产品线,并且号称未来要取代iPhone。站长网2024-01-20 10:36:000000OPPO AI 战略发布会官宣将于 2 月 20 日举行
OPPO宣布,AI战略发布会将于2月20日举行,主题为“开启全民AI手机时代”。2月18日,OPPO创始人兼CEO陈明永在春节假期后的首个工作日发布了一封题为《开启AI手机新时代》的内部信。他在信中宣称,2024年将被铭记为AI手机的元年,未来五年内,AI对手机行业的影响将堪比智能手机取代功能机的革命性变革。站长网2024-02-19 10:11:220000超5亿人“上头”,“抖快号”和“爱优腾”再战微短剧
“天,看了一下午土狗短剧太上头了”“只有我一个人在追这么土的小短剧吗?”“一口气狂追三部虐恋短剧,根本停不下来”……几年间,人们对微短剧的态度悄然改变,曾被疯狂群嘲的“歪嘴龙王”已经成为过去式,又土又上头的爆款剧突然让人欲罢不能。站长网2023-10-30 18:19:340001