ImageReward奖励模型:让文本到图像合成更符合人类偏好
Stable Diffusion 等生成式 AI 模型在文本到图像合成方面越来越受欢迎。像 CLIP 或 BLIP 这样的文本图像评分方法可以评估模型生成的图像是否与文本提示匹配,但它们并不总是符合人类的偏好和感知。
清华大学和北京邮电大学的团队开发了第一个通用的文本到图像的人类偏好奖励模型——ImageReward,主要解决改进生成模型(如 Stable Diffusion)中的各种普遍问题,接受了人类反馈的训练,并使它们与人类价值观和偏好保持一致。
ImageReward 使用强化学习和人类反馈进行训练,这是一种受 OpenAI 的 CLIP 启发的方法。ImageReward 已经接受了137,000个人工评分的 AI 图像训练,有望提供更好的图像合成。ImageReward 在各种基准测试中优于 CLIP、Aesthetic 或 BLIP 等其他评分方法30% 到近40%。
ImageReward 从根据各种标准对 AI 图像进行排名的人类评分中学习
在实践中,ImageReward 实现了更好的文本和图像对齐,减少了身体的扭曲渲染,更好地匹配了人类的审美偏好,并减少了毒性和偏见。该团队在几个示例中展示了 ImageReward 如何影响图像质量,他们让不同的文本图像评分器从64代图像中选择表现最优的图像。
与 CLIP 等其他文本图像评分方法相比,ImageReward 在大多数情况下都能产生更好的结果。
该团队希望在未来与研究界合作,找到将 ImageReward 用作 RLHF 中文本到图像模型的真正奖励模型的方法。ImageReward 可从 GitHub 获得,并提供了有关如何将其集成到 Stable Diffusion WebUI 中的说明。
ImageReward项目网址:
https://github.com/THUDM/ImageReward
AI前哨|AI能毁灭人类?这是不是危言耸听?
AI能毁灭人类?凤凰网科技讯《AI前哨》北京时间6月11日消息,最近一段时间,一些研究人员和行业领袖不断警告称,人工智能(AI)可能会对人类的生存构成威胁。但是,对于AI究竟如何摧毁人类,他们并未详谈。0000全球AI应用top50排行榜:超40%是新公司产品 聊天机器人、AI绘画最受欢迎
要点:AI原生应用市场快速增长,其中聊天机器人、助手、创意工具等受欢迎。新的AI公司不断涌现,占据了前50名中超过40%的位置。移动应用与网页应用的AI使用方式存在明显差异,其中移动应用更倾向于一般助手和特定功能应用。站长网2024-03-14 09:48:040000罗翔谈ChatGPT:不要担心它会取代人类,我们是万物之灵
4月26日,中国政法大学刑事司法学院教授罗翔在华南师范大学附属中学的“华附讲坛”上做客。“ChatGPT可为司法量刑应用吗?”“如何使网络舆论不沦为‘多数人的暴政’?”在同学们充满思考、独特的提问下,现场气氛达到了高潮。提到当下很火的ChatGPT,罗翔表示:“我始终将它视为一种工具,因为ChatGPT无法回答像‘如果你妻子和母亲同时掉进水里,谁先救’这样的问题。”站长网2023-04-27 16:45:570000极兔速递向港交所提交上市申请书:2022包裹量东南亚第一
快科技6月17日消息,极兔速递环球有限公司已正式向港交所提交上市申请书,大摩、美银及中金为上市联席保荐人。招股书显示,根据弗若斯特沙利文资料,按2022年包裹量计,该公司为东南亚排名第一的快递运营商,市场份额为22.5%。极兔于2020年进军中国快递市场,按包裹量计,2022年市场份额达到10.9%。极兔的网络如今已全面覆盖东南亚七个国家及地区,在中国的县区地理覆盖率超过98%。站长网2023-06-17 23:47:280001炸场的Sora和冷静的同行
Sora面世半个多月,这个深水炸弹的后续效应依然强烈。OpenAI发布的这个文生视频模型,紧跟着Google发布Gemini1.5的消息,让支持百万级token的Gemini黯然失色,帮助OpenAI在科技圈成功「抢C」,一跃成为视频模型届的GPT3.5时刻。站长网2024-03-06 15:49:340000