谷歌DeepMind新方法Gecko,为测试AI图像生成器引入严格新标准
划重点:
⭐ 谷歌 DeepMind 发布了新的基准 Gecko,揭示了当前文本到图像 AI 评估方法的缺陷,并引入了一个包含超过10万份人类评分的严格新标准。
⭐ “Gecko” 基准通过2000个文本提示对文本到图像模型全面评估,同时提供了增强的自动评估指标,揭示了先前未被发现的模型优和劣势。
⭐ 研究人员希望通过 “Gecko” 基准的引入,能够更准确地评估和诊模型的能力,促进 AI 技术的进一步发展。
谷歌 DeepMind 最近的研究示了当前我们对文本到图像 AI 模型性能评估的隐藏局限性。在其发布在预印本服务器 ariv 上的研究中,他们引入了一种全新的方法称为 “Gecko”,承诺提供一个更全和可靠的基准,以评估这一蓬勃发展的技术。
研究团队在其题为 “用 Gecko 审视文本到图像评估:对度量、提示和人类评分” 的论文中警告称:“虽然文到图像生成模型已经变得无处不在,但它们并不一定生成与给定提示相一致的图。” 他们指出,目前主要用于评估 DALL-E、Midjourney 和 Stable Diffusion 等模型能力数据集和自动度量并不能全面反映实际情况。
小规模的人类评估提供了有限的解,而自动度量可能会忽略重要细微之处,甚至与人类评委产生分歧。 为了揭示这些问题,研究人员开发了 “Gecko”—— 一个新的基准套件,它为文本到图模型提供了更高难度的测试。Gecko基准通过2000个文本提示对模型进行全面考核,探究各种技能和复杂程度。它将这些提示分成具体的子技能,超越模糊的类,以准确找出限制模型的确切弱点。
研究人员还收集了对数个领先模型生成的图像进行的超过10万份人类评分。这一基准可以揭示模型性能差距是源自模型真正的局限性、模糊的提示,还是评估方法的不一致。
“Gecko” 基准还采用了一个基于问的增强自动评估指标,与人类判断更为相关。当用于比较新基准下的最先进模型时,这一组合揭示了先前未被发现的模型优势和劣势。 研究人员希望他的工作能够证明使用多样的基准和评估方法来真正了解文本到图像 AI 在实际部署前能做什么,不能做什么的重要性。他们计划免费公开 “Gecko” 代码和数据,推动进一步的进展。 因此,尽管那些看似令人印象深刻的作品可能乍一看令人印象深刻,但我们仍然需要严格的测试来区分真假。Gecko为我们展示了如何做到这一。
论文:https://arxiv.org/pdf/2404.16820
3个月涨粉1000万,抖音今年最大的黑马出现了?
千万粉丝网红@李炮儿的《中国好声音》挑战之旅,最终折戟于“三十强冲刺赛”。在此之前,@李炮儿现场“拜师”导师柯以敏的新闻爆出后,引发过网友们的一阵讨论,虽然不少人对此持“嘲讽”态度,但这次“好声音之行”对当事人李炮儿的助力却是巨大的。站长网2023-08-02 17:30:520000MetaHuman:一键创建超逼真数字人 无需高配置硬件
MetaHuman是一个创造高度逼真的数字人类角色的框架,它具备完整绑定和动画制作功能。使用MetaHumanCreator,用户可以快速、直观地创建逼真的数字人类角色。而MetaHumanAnimator则可以复制面部表演并实现高保真动画,无需高配置的硬件。用户可以在虚幻引擎中使用MetaHuman,并利用先进的角色技术进行创作。站长网2023-08-09 20:02:570000Midjoureny v6将于下周推出风格一致性功能
昨晚在Midjoureny的OfficeTime中提到,下周将推出新的版本6(v6)更新。这次更新将引入全新的角色和风格参考功能,目前正在进行角色参考的测试。用户将能够在不同风格中保持角色的一致性。需要注意的是,新的风格参考将会取代旧的版本,并且新的描述功能也将很快开始测试。除此之外,他们正在探索加入风格随机选项的可能性。站长网2024-02-29 14:15:4600002024大模型应用元年,科大讯飞率先打响商业化第一枪
浩浩荡荡的AIGC潮流,叠加资本资金如火如荼地注入,过去一年里,AI赛道焕发了新生,再度登上了科技语境的浪潮之巅。然而,与大模型战场的热闹相比,在商业化落地场景,AIGC的步伐却略显踌躇——技术层面,从文字到图像创作再到视频创作,AI屡屡交出了刷新大众视野的答卷,但如何使AI满足实际的商业期望,却仍是摆在行业面前的,一道复杂而严峻的课题。站长网2024-02-01 09:28:360000研究了50个商家案例后,我们找到了2024小红书电商生意经
毋庸置疑,小红书正成为品牌、商家新的生意增长地。2023年,在吹响“买手电商”的号角后,小红书迎来了商业化蓬勃发展的一年。一方面,平台内出现了众多知名的买手直播间,比如董洁的【董生活】、章小蕙的【玫瑰】;另一方面,一批标杆商家也在小红书涌现,其中既有老国货品牌在站内实现年轻化焕新,也有新锐品牌从中“突围”,达成了声量与销量的双爆发。站长网2024-02-07 09:10:400002