Meta AI实验室推三项新AI项目庆祝成立十周年:Ego-Exo4D、Audiobox等
**划重点:**
1. 🌐 **Ego-Exo4D:** Meta发布支持视频学习和多模态感知的数据集,涵盖运动、音乐、烹饪等复杂人类活动,可用于增强现实、机器学习和社交网络。
2. 💬 **Seamless Communication:** 推出四个AI研究模型,旨在跨越语言界限实现更自然、真实的表达和快速翻译,包括保留语音表达和语境的SeamlessExpressive等功能。
3. 🎶 **Audiobox:** Meta的新音频生成模型,通过语音输入和自然语言文本提示生成声音和音效,以创造定制的音频文件,为研究人员和学术机构提供先进的音频生成研究支持。
为庆祝Meta基础人工智能研究(FAIR)团队成立十周年,公司隆重推出三个创新的人工智能项目,展示了引人注目的演示。
Ego-Exo4D:
官方项目介绍网址:https://ai.meta.com/blog/ego-exo4d-video-learning-perception/
该项目以数据集及基准测试的形式呈现,旨在支持视频学习和多模态感知的人工智能研究。由Meta的FAIR、Project Aria,以及来自全球15所大学的合作伙伴在两年内共同收集,Ego-Exo4D捕捉了佩戴Project Aria头戴设备的参与者的“自我中心”视角和周围摄像机的“外部中心”视角。
这一数据集聚焦于复杂的人类活动,如运动、音乐、烹饪、舞蹈和自行车维修。Meta认为,该数据集在增强现实系统、机器人学习以及社交网络等领域具有广泛应用前景。1,400多小时的视频数据将于12月以开源形式发布,并计划于明年进行Ego-Exo4D公开基准竞赛。
Seamless Communication:
官方项目介绍网址:https://ai.meta.com/blog/seamless-communication/
该项目旨在通过四个AI研究模型实现更自然、真实的跨语言交流。包括保留语音表达和语境的SeamlessExpressive,以及提供约两秒延迟的语音和文本翻译的SeamlessStreaming。此外,SeamlessM4T v2是一个多语言、多任务的模型,用于轻松实现语音和文本之间的交流。最终,Seamless将集成SeamlessExpressive、SeamlessStreaming和SeamlessM4T v2的功能于一个模型中。
Meta还发布了SeamlessExpressive的演示,用户可以在其中将其语音翻译成其他语言,增强了跨语言沟通的交互性。
官方演示网址:https://seamless.metademolab.com/expressive/
Audiobox:
官方项目介绍网址:https://ai.meta.com/blog/audiobox-generating-audio-voice-natural-language-prompts/
这是Meta全新的音频生成模型,通过结合语音输入和自然语言文本提示,能够生成声音和音效,从而更轻松地创建用于不同用途的定制音频文件。相比其前身Voicebox,Audiobox通过允许用户使用自然语言提示来创建所需的声音或语音类型,提供了更强的可控性。
Meta表示,该模型将首先提供给一组选择的研究人员和学术机构,以推动音频生成研究的发展,并确保人工智能的负责任发展。
这三个项目的推出标志着Meta FAIR团队十年来在人工智能领域取得的巨大成就,并为未来的技术发展和创新奠定了坚实基础。
Meta重组并解散AI监管团队,成员转向生成式AI和AI基础设施团队
**划重点:**1.🔄**公司动向:**Meta(Facebook的母公司)宣布解散负责监管人工智能(AI)项目开发和部署的AI监管团队,成员将转移到生成式AI产品和AI基础设施团队。2.🧠**生成式AI发展:**Meta成立了生成式AI团队,专注于开发能生成语言和图像以模仿人类创作的产品。这一举措是为了赶上AI热潮,许多科技公司纷纷投资于机器学习开发。站长网2023-11-20 10:52:110000圣诞新奇惊喜:利用 AI 技术帮助圣诞老人创建手写信件
站长之家(ChinaZ.com)12月11日消息:人工智能甚至正在接管北极的任务。在即将到来的圣诞节假期之前,圣诞老人和他的助手们迎来了一项革命性的技术支持。一群乐于助人的精灵采用了人工智能技术,制作出独一无二、看似亲手书写的信件,以确保遵守圣诞老人的「北极标准」。0000抖音、小红书又加一个抢用户新功能
很多平台都在尝试让自己APP内部的功能多而全。正如目前正在内测AI搜索的抖音和AI助手的小红书一样。见实观察到,抖音正在内测试AI搜索功能“AI搜”,用户可以“AI搜”功能下获得AI提供的回答,功能类似于在抖音内部设置了一个智能搜索入口。另外,小红书也在内测了群聊AI功能后,新加入了一个名为“达芬奇”的智能AI助手,目前也仍在内测之中。0000千万级热度!从全民跳“科目三”到AI重制经典影视IP,AI视频掀起创作热潮
最近这段时间,只要你还在网上冲浪,就肯定逃不过AI“魔改”视频的洗礼。只需一张图,无论是马斯克还是兵马俑,有生命的、没生命的通通跳起了网红热舞“科目三”。背后是阿里的AI“图生视频”技术搭载在通义千问新上线的“全民舞王”功能上,因为制作门槛足够低,引发无数网友跟风试玩,点燃了2024年AI视频的第一把火。去年11月份起,AI生成视频逐步成为各大公司、初创企业以及资本重点布局的热门赛道。站长网2024-01-19 09:13:170000OpenAI更新GPT商店,增加用户评分和扩展构建者资料
**划重点:**1.🌟用户现在可以为第三方GPT在GPT商店中进行评分,并提供私人反馈。2.🤖GPT构建者的个人资料现在更丰富,包括链接到LinkedIn页面、X账户和网站,以及平均评分和总评分数量等信息。3.💰尽管商店不断扩展功能,但OpenAI与GPT创作者分享收益的设想仍未实现。站长网2024-02-23 10:41:090000