Meta AI提出视频抠图新方法OmnimatteRF:结合动态2D前景图层和3D背景模型
要点:
马里兰大学和Meta AI研究人员提出视频抠图新方法OmnimatteRF,同时利用2D前景图层和3D背景模型。
2D前景图层记录运动物体及影响,3D背景模型适用于复杂几何和非旋转摄像运动,扩展适用视频种类。
在两个视频数据集上,与先前方法相比,该方法取得更好表现,无需每个视频单独参数调整。
Omnimatte是迄今为止最有前景的视频抠图方法。它使用单应性建模背景,因此只适用于背景为平面或仅有旋转运动的视频。D2NeRF通过独立建模场景的动态和静态成分,使用两个辐射场来解决这个问题。它在复杂的大范围运动场景中表现强劲,不需要任何遮挡输入,完全自监督。但是如何融合视频中的2D guidance尚不清楚。
项目地址:https://github.com/facebookresearch/OmnimatteRF
马里兰大学和Meta AI的最新研究提出一种集两者优点于一体的方法,使用3D背景模型与2D前景层。2D前景层表示难以用3D建模的物体、动作和效果。3D背景建模可以处理复杂几何形状和非旋转摄像机运动,扩展适用的视频种类。该方法称为OmnimatteRF。在两个视频数据集上的实验表明,它在各种视频上都有出色表现,无需针对每个视频调参。
OmnimatteRF能够分离前景中的主体部分和背景场景。它使用二维层保留主体的细节,同时利用三维背景模型对复杂场景进行重建。相比仅使用二维图像层表示视频背景的方法,三维建模极大地提升了对真实世界视频的适应能力。
该方法首先使用传统视频遮罩技术分离出动态的前景层。然后,利用这些遮罩结果和单目深度估计,训练一个表征背景的神经辐射场模型TensoRF。最后,将动态前景层和静态三维背景模型联合,重建复杂的真实场景。
研究者在各类真实视频上进行了大量试验,结果证明相比仅使用二维层的方法,OmnimatteRF能够得到更优质的重建效果。该技术对视频制作专业人员具有重要应用价值,可用于拍摄的影片中添加有趣的效果。同时,它也可助力构建沉浸式的虚拟环境。
荣耀Magic Vs2折叠屏手机今日开售 售价6999元起
今日,荣耀MagicVs2折叠屏手机正式开售,有两个版本可供选择,分别售价为6999元和7699元。这款手机拥有多种配色选择,包括绒黑色、冰川蓝和珊瑚紫,采用金属稀土镁合金材质,重量为229克,厚度为10.7毫米。荣耀MagicVs2配备了一块5000mAh的电池,并且采用了高通的骁龙8Gen1移动处理平台,同时还支持66W快充。站长网2023-10-18 11:27:040000经济学家担心生成式AI对印度、印尼的就业带来负面影响
经济学家警告称,OpenAI的ChatGPT等生成式人工智能可能对印度和印尼的就业产生负面影响,他们担心这种快速发展的技术将减少这些国家庞大年轻人口的就业机会。上个月,日本经济研究中心和《日经》杂志询问了印尼、马来西亚、菲律宾、新加坡、泰国和印度的经济学家和分析师,调查了新技术的影响,结果于周一发布。站长网2023-07-03 18:15:060000OpenAI 首席执行官 Sam Altman 解释他为何在人工智能之外大力投资能源
Oklo公司是一家先进的裂变微型反应堆创业公司,周二宣布通过与特殊目的收购公司AltCAcquisitionCorp.进行合并以进行上市交易。AltC由OpenAI首席执行官SamAltman和ChurchillCapital共同创立,Altman也是Oklo董事会主席。站长网2023-07-12 17:26:030000LARP:开放世界游戏的语言代理角色扮演
LARP是一个开创性的框架,旨在增强用户和语言代理在开放世界游戏中的交互。LARP框架包括了一个涵盖记忆处理和决策辅助功能的认知架构,一个具有反馈驱动可学习行动空间的环境交互模块,以及促进各种个性对齐的后处理方法。这一框架的引入优化了用户与预定义具有独特背景和个性特征的代理之间的互动,最终增强了在开放世界情景中进行游戏体验。站长网2024-01-02 10:19:280000美国联邦航空局否认在系统中使用ChatGPT编写代码
美国联邦航空局(FAA)发表声明,否认在其空中交通运营(ATO)或任何其他系统中使用ChatGPT来编写计算机代码。该声明是在美国交通部发布了人工智能使用清单后匆忙发表的。交通部要求其组织列举所有人工智能使用情况以遵守一项行政命令。站长网2023-07-27 16:44:090000