首页站长资讯Hugging Face推开源多模态AI模型IDEFICS 支持图像、文本输入

Hugging Face推开源多模态AI模型IDEFICS 支持图像、文本输入

站长网2023-08-24 20:13:370阅

本文概要:

1. Hugging Face 推出开源多模态 AI 模型 IDEFICS，支持图像和文本输入。

2. IDEFICS 基于 DeepMind 的 Flamingo 视觉语言模型，表现与专利模型相当。

3. IDEFICS 有90亿和800亿参数版本，支持生成连贯的文本。

最近， Hugging Face 推出了一个名为 IDEFICS 的开源多模态 AI 模型，它可以接受图像和文本作为输入，并生成连贯的文本输出。

IDEFICS 是一个强大的视觉语言模型，拥有高达800亿的参数量，功能包括根据图像生成描述、回答相关问题以及根据多个图像生成叙述等。

IDEFICS 基于 DeepMind 开发的 Flamingo 模型，后者是一种目前最先进的视觉语言模型，但尚未对外开源。相比之下，IDEFICS 作为 Flamingo 的开源实现版本，其测试结果显示在各类图像理解任务上其表现与 Flamingo 相当。

为训练 IDEFICS，Hugging Face 利用了多种公开的数据集，还额外构建了一个包含1.4亿张图像的大规模图像-文本数据集。

IDEFICS 有两个版本，包括90亿参数的基础版和800亿参数的大模型版，可以处理不同的应用场景。

IDEFICS 的推出为研究人员和开发者提供了一个强大的开源视觉语言模型，相比专利系统如 GPT-3，它提供了更大的灵活性。同时，IDEFICS 也显示出生成式模型处理多模态输入的潜力。

未来如果能进一步提升多模态理解和生成能力，将可以大幅推动诸如机器人、自动驾驶等多模态 AI 应用的发展。

项目网址:https://huggingface.co/spaces/HuggingFaceM4/idefics_playground

HuggingFace推开源多模态AI模型IDEFICS支持图像文本输入

0000

评论列表

共(0)条

相关推荐

站长资讯
研究发现针对ChatGPT、Bard 等LLM的自动越狱攻击
研究人员发现，可以自动构建对抗性攻击，欺骗ChatGPT、Bard和Claude等主要语言模型（LLM），以提供非预期且可能有害的内容传统的越狱需要大量手动开发，通常可以由LLM供应商解决。然而，这些自动化攻击可以大量创建，并且可以在闭源和公开的聊天机器人上运行。
站长网2023-07-31 10:44:46
0001
站长资讯
微软必应聊天Bing Chat即将支持第三方浏览器
昨日，微软官方宣布，BingChat必应聊天即将支持第三方浏览器。但微软还强调了使用MicrosoftEdge浏览器的重要性，因为这样可以解锁更长的对话、聊天历史记录和更多内置的Bing功能，以获得最佳的Bing聊天体验。
站长网2023-08-08 08:45:17
0000
站长资讯
国内免费AI编程助手通义灵码：AI人工智能写代码开发效率提升10倍
对于很多开发者来说，已经开始借助AI智能编码助手提升自己的开发效率。本文为大家分享一款国内好用的AI编程工具通义灵码。据官方介绍，通义灵码是国内用户规模第一的智能编码助手，基于SOTA水准的通义千问代码模型Code-Qwen1.5研发，插件下载量已超350万。体验地址:https://top.aibase.com/tool/tongyilingma
站长网2024-05-24 18:28:43
0000
DeepMind CEO专访：AI还没到拼算力的时候，谷歌优势在研发，智能体是下一个爆点
GoogleDeepMind首席执行官Hassabis最近在接受WIRED采访时表示，AI技术现在还有很大的改进空间，还远没有到只能拼算力的时候。谷歌的优势在于科研能力，未来智能体将改变AI的格局。虽然谷歌的Gemini在开年的AI产品大战中没有获得太多的关注，但是GoogleDeepMind作为人类最前沿的AI机构，依然在抵达通用人工智能的道路上紧追OpenAI。
站长网站长资讯2024-02-25 15:15:47
0000
站长资讯
萌妹爱上足力健，我们总结了年轻人的3个消费趋势
“20岁穿上足力健，少走30年弯路!”2023年，年轻人集体进入“退休时代”，信奉“得之我幸失之我命、功名利禄宠辱不惊”，24岁上老大学、25岁退休、26岁开启养生试验、27岁入住养老院、28岁退休隐居山水间......无心事业，醉心整活儿，奉行“精致穷”的年轻人纷纷化身手工达人，将足力健老人鞋改造成时尚单品。打开小红书，年轻人将老人鞋足力健改成“库洛米紫色限定”，穿lo裙搭配妈妈鞋。
站长网2023-12-18 17:54:24
0000