BeLFusion:一种基于行为潜空间的人体运动预测方法
站长网2023-08-04 18:17:510阅
BeLFusion 是一种基于行为潜空间的人体运动预测方法,旨在生成更加真实和多样化的人体运动序列。该方法通过将行为与运动分离,实现从观察到预测姿势的平滑过渡。BeLFusion 的创新架构包括行为 VAE 和条件潜空间扩散模型(LDM),通过这些组件,它能够生成更自然、上下文适应的运动预测。
项目地址:https://github.com/BarqueroGerman/BeLFusion
特点:
1. 行为潜空间:BeLFusion 引入了行为潜空间,使得预测的运动序列更加多样化和真实。
2. 行为 VAE:通过行为编码器、行为耦合器、上下文编码器和辅助解码器组成的行为 VAE,将关节坐标映射到潜空间,生成多样化且上下文适应的运动序列。
3. 条件潜空间扩散模型:BeLFusion 利用 LDM 从潜空间中采样,实现行为与姿势和运动的解耦,以增加预测的多样性和一致性。
4. 高泛化能力:BeLFusion 在不同数据集和动作类别上表现出优秀的泛化能力,超过了同类方法在准确度指标上的表现。
0000
评论列表
共(0)条相关推荐
魅族:Flyme Auto车机系统将在6月14日进行实车体验
魅族旗下Flyme宣布,将在6月14日至15日举行FlymeAuto首次实车体验。Flyme表示,FlymeAuto始终将「流畅度」视为提升智能座舱体验的基础,OneMind智能引擎搭配知意动效、一镜到底,为你带来超越既往的丝滑与流畅。据了解,FlymeAuto,是魅族车机系统,于2023年3月30日在上海正式发布。站长网2023-06-12 17:53:220000汤姆猫:AI产品已初步实现情境对话、AI识物、AI绘图等功能
汤姆猫近日表示,在人工智能上,公司关注到ChatGPT相关技术的应用后,借助国内外的通识大模型,公司致力于将“会说话的汤姆猫”迭代为“会聊天的汤姆猫”。截至目前,公司国内研发团队打造的AI产品已初步实现情境对话、英语口语启蒙、AI识物、AI绘图等功能。站长网2023-07-25 12:20:430000一网站发布任务制造虚假点击量干扰搜索引擎算法 百度起诉获赔205万
据知产北京公众号消息,原告百度公司(简称百度公司)是百度网的运营主体,百度网主要为网络用户提供搜索服务。被告W有限公司(简称W公司)是“W广告任务网”网站的运营主体。站长网2023-10-30 08:40:420000华为申请运输工具类“非凡大师”商标!全新logo曝光 网友炸锅
快科技10月12日消息,据天眼查,近日,华为技术有限公司申请注册ULTIMATEDESIGN”商标,国际分类涉及运输工具,当前商标状态均为等待实质审查,一同曝光的还有新的Logo。值得一提的是,华为此前已成功注册两枚非凡大师”商标,国际分类涉及珠宝钟表、科学仪器。据悉,运输工具”包括电动运载工具、混合动力汽车、电动汽车、汽车、自行车、自平衡车、电动踏板车、摄影无人机等多种商品/服务。站长网2023-10-12 19:55:040000中山大学等提出ScaleLong扩散模型 scaling操作可以稳定模型训练
要点:1.UNet的longskipconnection上的scaling操作可以稳定模型训练。2.Scaling系数的设置影响模型性能,可以通过学习或固定的方式实现。3.对扩散模型任务在训练过程中特征和参数的可视化有助于理解模型稳定性。0000