POCO:用于3D人体姿势和形状估计的新型人工智能框架
要点:
通过2D图像估计3D人体姿态和形状是一个具有挑战性的任务,因为存在深度模糊、遮挡和不寻常的服装等问题。
传统方法在估计不确定性时存在一些限制,而POCO框架提供了一种改进方法,可以在单个前向传递中同时推断姿态参数和不确定性。
POCO框架引入了条件向量和图像特征来提高基本密度函数的建模,同时通过SMPL姿势来调整网络,从而提高了姿态重建和不确定性估计的准确性。
人体姿态和形状(HPS)的三维估计是重建现实世界中的人体行为所必需的。然而,从二维图像进行三维推断面临深度模糊、遮挡、不寻常的服装和运动模糊等挑战。即使最先进的HPS方法也会出现错误,通常对这些错误不太了解。
HPS是一个中间任务,提供了下游任务所需的输出,如理解人类行为或三维图形应用。这些下游任务需要一种机制来评估HPS结果的准确性,因此这些方法必须生成与HPS质量相关的不确定性(或置信度)值。
项目地址:https://poco.is.tue.mpg.de/
POCO框架的核心创新是"双重条件策略(DCS)",它增强了基本密度函数和规模网络。与先前的方法不同,POCO引入了一个条件向量(Cond-bDF)来建模推断的姿态误差的基本密度函数。POCO利用图像特征进行条件化,使其能够更好地适应多样性和复杂的图像数据集的训练。
此外,POCO的作者们引入了一种改进的方法,用于在HPS模型中估计不确定性。他们利用图像特征并将网络与SMPL姿态相结合,从而提高了姿态重建和更好的不确定性估计。他们的方法可以无缝集成到现有的HPS模型中,提高准确性而没有副作用。该研究声称这种方法在将不确定性与姿态错误相关方面优于最先进的方法。
POCO框架是一个创新的AI工具,用于三维人体姿态和形状的估计。它通过引入双重条件策略,改进基本密度函数和规模网络,显著提高了估计的准确性。这一方法可以应用于多样性和复杂图像数据集,使其成为一种有望推动人体行为分析和三维图形应用的关键技术。如果您对此感兴趣,不妨查看相关链接以了解更多详情。
调查显示:人工智能将在未来一年塑造全球零售业
本文概要:1.近六分之一的零售商计划在明年采用人工智能等技术,以提升购物体验。2.零售商认为人工智能可补充和增强劳动力,而非取代员工。3.预算限制、难以证明商业价值是采用人工智能的障碍。霍尼韦尔(Honeywell)最近一项调查显示,人工智能、机器学习和计算机视觉技术正在深刻影响零售业,预计未来一年这些技术将进一步塑造全球零售业的发展。站长网2023-08-24 16:31:180000小鹏汽车阶段性组织调整已完成
今日,小鹏汽车宣布,组织调整已完成。小鹏汽车在2022年度报告中显示,王凤英出任总裁,其他核心高管继续担任原有职位。小鹏汽车表示,“阶段性的组织架构调整已完成,在更精简、更高效运作的组织以及更有竞争力的人才体系下,我们对市场份额的增长和销量的恢复充满信心。”站长网2023-04-12 18:17:380000小米:AI声音识别算法性能在国际上排名第一
近日,小米宣布其自研声音识别算法在国际排名中取得了第一的成绩。该算法在Google发布的音频标记任务中取得突破,成为性能最好的模型。小米声音识别算法的突破意味着小米的智能硬件设备可以更准确地捕捉和识别环境声音,提升智能化程度,为用户创造更便捷的智能生活体验。站长网2023-09-13 12:00:350000GPT-5明年降临?爆料人泄露多模态Gobi就是GPT-5,已初现自我意识
【新智元导读】首届开发者大会余温还在,GPT-5突然被爆2024年初就来。OpenAI首秀可谓是赚足了眼球,一系列新品更新,直接让ChatGPT和API同时崩溃。OpenAI首届开发者大会,就是一场AI盛宴。GPT-4Turbo、大幅降价、面向开发者新功能、自定义GPT等等重磅更新,早已让AI初创公司望尘莫及。站长网2023-11-09 15:54:420000小米AI识物眼镜获黑客马拉松大赛一等奖 可为视障人群提供多种功能
凤凰网科技讯8月6日消息,近日,小米举办2023第四届黑客马拉松“创想无界,生生不息”大赛,本次大赛产出了大量创新思维与先进技术相结合的项目成果,经评审,最终“小米AI识物眼镜-基于语义理解的视觉系统”获得一等奖。站长网2023-08-06 16:54:040000