OpenAI 发布新的文本生成 3D 模型 Shap-E:比 Point-E 更快更好
站长网2023-05-09 14:37:320阅
OpenAI 最近分享了他们在将文本提示转化为 3D 物体方面的最新探索,名为 Shap-E。这款生成式 AI 工具提供了一种新的方式来生成 3D 物体,其制作的物体比去年发布的 Point-E 模型更好、更详细、更准确。
截自Shap-E GitHub 页面
OpenAI 构建了 Shap-E 作为文本到 3D 模型生成器,能够生成细粒度纹理和复杂的详细形状。而 Point-E 根据文本提示生成 3D 点云,Shap-E 直接创建物体的轮廓,并采用了名为神经辐射场(NeRFs)的特性来克服之前模型的模糊性。NeRFs 是虚拟和增强现实中使用的技术,可以使三维场景看起来像是真实照片一样。
Shap-E 将这项技术应用于更常见的扩散模型,以形成与文本提示所建议的物体形状和纹理。该过程也比 Point-E 快得多。在单个 NVIDIA V100 GPU 上,集合中的每个 Shap-E 样本生成时间约为 13 秒,而 Point-E 在相同硬件上渲染可能需要多达两分钟的时间。
研究人员解释道:「我们发现,在相同的数据集、模型架构和训练计算资源的条件下,Shap·E 与类似的显式生成模型相匹配或超越其性能。我们还发现,我们的纯文本条件模型可以生成多样化、有趣的物体,而无需依赖图像作为中间表示。这些结果突显了生成隐式表示的潜力,特别是在像三维领域这样的领域,隐式表示比显式表示更具灵活性。」
Shap-E 的开发者承认,与 Point-E 的点云方法相比,大规模使用的计算能力可能较高。这款 AI 在理解如何制作一些复杂物体方面仍然存在困难,但总体而言,其结果在成功方面非常显著。
0000
评论列表
共(0)条相关推荐
Meta 开源 MusicGen 模型:用 AI 将文本和旋律结合 创造全新音乐作品
Meta的MusicGen可以根据文本提示生成短小的新音乐片段,并可选择与现有旋律对齐。与今天的大多数语言模型一样,MusicGen基于Transformer模型。就像语言模型预测句子中的下一个字符一样,MusicGen预测音乐作品中的下一个部分。站长网2023-06-12 22:57:150002颠覆性设计!苹果新专利曝光:实现iPhone正面反向无线充电
快科技10月11日消息,现在的电子行业,产品越出越多,功能也是越来越多。但是不管哪种电子产品,使用的时候都要考虑到续航问题。许多手机厂商也考虑到了这个问题,并且给手机增加了反向无线充电的功能。这样在手表、耳机等电池较小的产品没电时,可以通过这个功能来应急。站长网2023-10-11 20:22:300000智源发布FlagAttention算子集 适配多种大模型训练芯片
为了满足大模型对计算资源的需求,智源研究院开发了FlagAttention项目,旨在构建一套适配多种芯片的大模型核心算子集合。该项目选择使用Triton作为开发语言,通过Triton的开放性和易用性,使得FlagAttention不仅支持NVIDIAGPU,还可以显著降低不同芯片之间模型适配的成本,提高大模型的训练与推理效率。站长网2023-12-08 15:01:410000王慧文再融16亿!大模型创业百天成独角兽,腾讯押注,快手创始人入股
美团老王再创业的第4个月,投资估值光速跻身独角兽。量子位最新获悉,美团联合创始人王慧文的AI创业公司光年之外,已在近期完成了新一轮2.3亿美元(折合人民币16.3亿)融资,投前估值10亿美元,进场百天,晋升独角兽。光年之外的本轮融资,据称由源码资本领投,押注8000万美元,此外腾讯、五源资本和快手创始人宿华均参与其中。站长网2023-06-05 21:29:360000183款新品已拿版号,未来三年游戏市场得有多卷?
今年的游戏圈还挺热闹。何以见得?以葡萄君的主观感受,今年以来厂商们的新品测试和上线的速度明显加快,我们尽力报道也很难跟上他们「腹泻式」的动态——例如前两天,腾讯和网易的游戏发布会相继落幕,数十款新品一股脑涌了出来,葡萄君填测试问卷的手都止不住颤抖。近期的激烈战况,也不得不令人怀疑,厂商们还有多少弹药余粮?未来像这样富裕的仗还会打多少次?站长网2023-05-22 10:04:110000