谷歌推王炸级图像生成功能Generative Powers of Ten 生成图像可无限放大
站长网2023-12-08 11:53:372阅
Google最近发布了一项名为“Generative Powers of Ten”的图像生成功能,这项功能支持对生成的图像进行无限放大。这意味着用户可以将一张人像照片放大到可以看到细胞结构,或者将地球大气层缩放到地面上的物体。
这一目标是通过联合多尺度扩散采样方法实现的。这种方法鼓励不同尺度的一致性,同时保持每个单独采样过程的完整性。而传统的超分辨率方法可能很难在截然不同的比例下创建新的上下文结构,而这项新的方法能够比传统方法实现更深层次的缩放。
论文地址:https://arxiv.org/pdf/2312.02149.pdf
具体实现方法是使用预训练的扩散模型来同时去噪多个不同尺度的场景图像。每个缩放级别的噪声图像以及相应的提示同时输入到相同的预训练扩散模型中,返回对应的清晰图像的估计。然后采用多分辨率混合将这些区域融合成一致的缩放堆栈,并从一致的表示中重新渲染不同的缩放级别。最后,重新渲染的图像被用作DDPM采样步骤中的清晰图像估计。
与其他生成缩放视频的方法相比,这项新方法的观察结果显示,因果生成通常会导致较差的结果,因为先前的生成结果并不总是与后续的缩放级别兼容。而新方法的联合多尺度扩散采样方法则能够产生更深层次的缩放,并保持一致性,是一项重要的突破。
0002
评论列表
共(0)条相关推荐
OpenAI 的领导权争议表明了商业化的危险性
在人工智能(AI)领域,保持与快速发展的行业同步是一项艰巨的任务。上周AI创业公司OpenAI的领导争议成为不容忽视的焦点。该公司的董事会原本罢免了首席执行官兼联合创始人SamAltman,据称是因为他过分重视商业化而忽视了AI的安全性。站长网2023-11-28 17:12:290000人工智能写作助手Flot.ai:使用最新GPT-4 模型 支持200多种语言
Flot.ai是一款人工智能写作助手,能够帮助用户在任何应用或网站上获得AI的帮助,无需复制粘贴就可以使用ChatGPT。Flot.ai使用OpenAI最新的GPT-4模型,支持200多种语言,真正做到一键使用AI。体验地址:https://flot.ai/站长网2023-09-11 18:01:100000魅族20 Classic今日正式开售 售价3099元起
魅族于10月19日发布了新款手机魅族20Classic,提供了16GB运存和256GB、512GB两种存储规格,售价分别为3099元和3399元。消费者预定可享12期免息优惠并获得TWS无线蓝牙耳机。魅族20Classic的设计灵感来自魅族Logo升级后,以青云定胜、悠扬乌铁和余生白首三款全新配色命名,其中“余生白首”给浪漫的印象。站长网2023-10-19 14:59:250000网信办:蔡老板恶意诋毁汽车企业名誉被封号
据网信中国公众号消息,近期,国家网信办根据常态化开展优化营商网络环境工作安排,持续强化网上涉企信息内容管理,严肃查处一批侵犯企业、企业家合法权益的违法违规行为。现将部分典型案例通报如下。0000GPT-4通过哈佛第一学期人文社会科学实验
哈佛大学学生玛雅·博德尼克(MayaBodnick)进行了一项实验,想看看GPT-4能否通过哈佛大学一年级人文社会科学家庭论文的考验。博德尼克让GPT-4撰写了七篇论文,主题涵盖经济概念、拉丁美洲的总统主义以及对普鲁斯特一段话的文学分析。她将这些论文交给教授评分,同时说明论文是由她或GPT-4撰写的,以测试评分的客观性。站长网2023-07-31 09:58:150000