首尔国立大学研究人员引入强化学习革新数字艺术拼贴
划重点:
🔍 研究人员利用强化学习训练 AI 代理人自主创建真正的拼贴艺术品
🔍 强化学习模型通过与画布互动来学习拼贴艺术品的创作过程
🔍 该方法通过用户研究和基于 CLIP 的评估证明了其在 AI 生成的艺术方面的出色性能
韩国首尔国立大学的研究人员致力于训练能够自主创作真正拼贴艺术品的 AI 代理人。目前市面上的 AI 工具(如 DALL-E 和 StableDiffusion)可以生成类似拼贴的图像,但缺乏真正的创作过程的真实性。
为了克服这一挑战,研究人员引入了一种开创性的方法,利用强化学习(RL)来训练 AI 代理人创作 “真正的拼贴艺术品”。与基于像素的方法不同,该方法涉及撕裂和粘贴材料,以复制著名艺术品和其他图像的步骤。研究人员摆脱了现有工具的限制,通过强化学习赋予 AI 代理人理解和执行创作拼贴艺术品的微妙步骤的能力。
研究人员的方法是通过训练 RL 模型与画布进行交互,在拼贴艺术品创作过程的每个步骤上做出决策。在训练过程中,AI 代理人被随机分配的图像所喂养,从而学会适应后续的任何目标或材料。通过多种剪切和粘贴选项,RL 代理人尝试使用不同的材料,以确定哪些材料能够产生与目标图像相似的拼贴艺术品。奖励系统随着时间的推移而发展,主要是增强代理人制作的拼贴艺术品与目标图像之间的相似性。
一个关键的方面是开发可微分的拼贴环境,以便应用基于模型的 RL。这个环境可以让代理人轻松跟踪拼贴艺术品创作过程的动态。该团队的模型在各种图像和场景中具有很好的泛化能力。该架构的突出特点在于其自主性,它不需要拼贴样本或演示数据,强调了 RL 提供的强大无数据学习领域的潜力。
评估包括用户研究和基于 CLIP 的评估。结果表明,与其他基于像素的生成模型相比,该方法的性能更优。该方法的应用标志着 AI 生成的拼贴艺术品在模仿人类艺术创作深度方面迈出了重要的一步。
首尔国立大学的研究团队成功地利用强化学习训练了能够真正创作拼贴艺术品的 AI 代理人。他们的创新模型超越了现有的基于像素的方法,展示了强化学习在使代理人能够自主学习和执行创作真正拼贴艺术品的复杂步骤方面的潜力。通过用户研究和客观评估的验证,这一突破为 AI 在艺术创作中开辟了新的道路,为机器在视觉艺术领域有意义地贡献创造了前景。
论文网址:https://arxiv.org/abs/2311.02202
实时翻译工具Byrdhouse AI 可在视频通话中翻译100多种语言
ByrdhouseAI是一个强大的工具,可以在视频通话中实时翻译100多种语言。它提供了语音翻译字幕和AI驱动的实时口译功能,让用户在会议或聊天中可以将自己的语言转换成另一种语言。此外,用户还可以选择翻译的声音是男声还是女声。体验地址:https://top.aibase.com/tool/byrdhouse站长网2024-01-17 14:22:490000OpenAI 关于「 Q* 」项目的重大突破是促成董事会罢免 Sam Altman 行动的催化剂
在OpenAI首席执行官SamAltman被解雇四天前,几位公司研究人员向董事会发送了一封信函,警告一项强大的人工智能发现可能对人类构成威胁,两位熟悉此事的人士向路透社透露。站长网2023-11-23 09:44:260001比尔·盖茨都为之倾倒的AI Agent,究竟是什么
AIAgent是一个数月前开始广为流传的词汇,近日比尔·盖茨在个人博客上的文章更是为它的热度再添了一把火。“Android、iOS和Windows都是平台,AIAgent将成为下一个平台”,比尔·盖茨在他的博客文章中这样说到。站长网2023-11-16 09:20:150001ChatGPT 还是谷歌 Gemini 更好?新 AI 模型尽管性能卓越但面临现实应用的挑战
谷歌最近推出了一款名为Gemini的新型人工智能模型,并试图通过一份报告证明其优于OpenAI的GPT-4。根据谷歌首席执行官SundarPichai联合撰写的一篇博客文章,Gemini在32项学术基准测试中的30项中表现优于GPT-4,包括数学、阅读、编程和推理测试。0000你用过没!微信将终结“摇一摇”功能:已上线11年了 早期搭讪神器
快科技2月13日消息,微信中存在了11年的功能要下线了,你注意到没?微信在2012年9月份推出的4.3版本中首次加入了摇一摇”功能,至2024年已经有11年以上历史。有不少用户发现,在微信最新的8.0.47版本中,摇一摇”功能不见踪影,取而代之的是近期上线的听一听”功能。摇一摇”这个功能允许用户通过摇动手机,随机找到附近或者全国的其他用户,进行社交互动。它也可以用来传输图片或参与一些活动。站长网2024-02-13 19:49:340000