南京大学发布AvatarBooth 可用文本生成3D人类化身
过去,元宇宙曾经大热,但之后却被冷落。一个很大的原因是生成3D化身的方法大多需要昂贵且复杂的采集设备,以构建高保真的化身模型。因此,对于消费级别的应用开发来说难以负担。
现在,南京大学的研究人员提出了一种全新的方法AvatarBooth。该方法可以生成高质量和可定制的化身,能够准确反映特定个体的视觉和文字特征。与之前只能基于简单文本描述生成化身的方法不同,该方法可以根据任意捕获的面部或身体图像生成个性化头像,并支持基于文本的模型生成和编辑。
论文链接:https://arxiv.org/pdf/2306.09864.pdf
项目链接:https://zeng-yifei.github.io/avatarbooth_page/
AvatarBooth通过学习一个神经隐含表面来表示人类化身的形状和外观。该模型使用脸部和身体的预训练或微调的潜扩散模型来监督学习。姿势一致的约束被提出,在外观定制生成的任务中加强了扩散模型的微调,提供了更准确的多视图监督,在姿势空间中具有一致的外观。模型中还包括一个多分辨率的SDS方案,可以从粗到细地预测化身的精细结构和外观。
只需要一人的几张照片,模型就可以合成3D化身。化身不仅具有个性化独特的外观,而且还可以符合输入文本提示中指定的抽象特征,如「戴眼镜」或「某种风格的帽子」等属性。用户可以方便地编辑和修改化身的整体视觉形象。
为了量化化身生成质量,研究人员招募了30名志愿者,并使用对比方法CLIP-Actor、AvatarCLIP和TEXTure生成了10个化身。每个用户都从四个方面(与文本提示的对应性、外观质量、几何质量和面部的保真度)对结果进行评估,分数范围从1(最差)到5(最好)。结果表明,文中提出的新方法在四个指标上都获得了最高分,证明该模型有能力生成具有更详细外观和几何形状的化身。
不用拿手机了!高德地图PC体验版上线 大屏、功能更多
5月7日消息,高德地图PC体验版现已上线微软Microsoft商店,为用户提供全新的地图大屏幕体验和一系列实用的功能,包括路线规划、信息搜索、收藏和个人主页等。其中,路线规划功能是高德地图PC体验版的一大亮点。该功能支持驾车、新能源、货车、摩托车、公交、骑行和步行等多种出行方式的智能规划方案,可提前规划行程,让出行更加便捷。站长网2023-05-07 10:58:080000苹果提高折抵换购价格 iPhone13ProMax最高可抵5500元
近日,苹果在其官网对AppleTrade-In换购计划进行了更新,提高了折抵换购的价值,适用于iPhone、iPad等产品。根据官方公布的信息,现在购买iPhone13ProMax的用户可享受高达5500元的折抵优惠,而iPhone13Pro的最高折抵金额为4900元。相较于之前的计划,这次调整使得用户可以获得更大的经济回报。站长网2023-07-06 16:49:000001ChatGPT锐评“一生不结婚,会面临什么” 抖音获赞25.5万
ChatGPT3.5版本如今在手机端也能免费使用语音对话,激起了网友们的创意潮流。抖音博主“AI领航者·奕霆”挑战ChatGPT,提出了一个备受关注的问题:“一生不结婚,会面临什么?”ChatGPT的回答却出人意料:站长网2023-11-28 16:04:010000“Hi,Siri”将成历史!苹果计划修改语音助手唤醒方式
快科技5月15日消息,无数人熟悉的Hi,Siri”,或许将在未来几年间成为历史了。近日,MarkGurman在最新的PowerOn”通讯中透露,苹果正在对Siri进行大规模改进,作为改进的一部分,苹果将修改语音助手的唤醒方式。据悉,苹果目前正在研究让Siri能够在使用单个词Siri”作为触发词的情况下理解和响应命令。站长网2023-05-15 09:35:440000Gen-2重磅发布“运动画笔”,可制作视频连环画啦!
著名生成式AI平台Runway在官网宣布,其文生视频产品Gen-2正式发布运动画笔、预设风格、更新导演模式和优化图像模型4个功能。其中,运动画笔成为本次更新的最大亮点,用户只需要对上传的图片指定区域进行涂抹,就能让生成的视频按照特定轨迹运动,而其他没有涂抹的区域完全静止。依靠运动画笔加上运动相机这两个强大功能,制作“视频连环画”将变得非常容易,同时又能精准控制生成视频的内容真的太香了。站长网2023-11-24 09:59:180000