谷歌推设计神器“StyleDrop”,给一张图就能复刻作品风格
只要给出一张图片作为参考,StyleDrop就能学习图片的风格,并帮助生成复刻出同风格作品。据称,谷歌的方法优于 Dreambooth、LoRA 或 Textual Inversion 等其他方法。
谷歌的新方法可以使用Muse(Muse 是一种文本到图像的生成视觉转换器)文本图像模型合成特定风格的图像。StyleDrop 捕捉自定义样式的复杂性,包括配色方案、阴影、设计模式以及局部和全局效果。根据谷歌的说法,所需的操作只需输入一张图片即可。大家可以看看以下官方案例:
设计出原风格的水彩绘画:
设计出原风格的logo:
设计出原风格的字母:
StyleDrop通过微调少量可训练的网络参数来学习新的风格,然后通过人工或自动反馈的迭代训练来提高模型的质量。
学习速度快且示例很少
具体来说,StyleDrop 在输入图像上进行训练并生成一组图像来重现该图像。从这些图像中,最高质量的图像通过 CLIP 评分或人工反馈选出,并用于进一步的训练。如果图像不是重现原始图像的内容,而是重现原始图像的风格,则该图像被认为是高质量的。
该团队表示,即使加上工反馈,整个过程也不到三分钟。这是因为 StyleDrop 无需大量的图片来进行迭代训练。
据该团队称, StyleDrop 优于其他从文本到图像模型的样式转换方法,包括 Dreambooth、LoRAs 和Imagen和Stable Diffusion中的文本反转。
与其他方法和模型相比,使用 Muse 的 StyleDrop作品效果
官方还称,StyleDrop 能够捕捉各种风格的纹理、阴影和结构的细微差别,明显优于以前的方法,从而比以前模型更能控制风格。
该团队还将 StyleDrop 与 Dreambooth 相结合,以学习和创建不同样式的新对象作为图像,并可以使用 Muse 的方法以自定义样式创建自定义对象。
StyleDrop学习一种风格,Dreambooth学习一个新对象,比如一只狗
谷歌将 StyleDrop 视为一种多功能工具,其中一个用例是允许设计师或公司使用他们的品牌资产进行训练,并以他们的风格快速制作新想法的原型。
StyleDrop项目网址:https://styledrop.github.io/
GitHub发布编程字体家族Monaspace 支持混合使用5款等宽字体
站长之家(ChinaZ.com)11月10日消息:近日,代码托管平台GitHub发布了一套名为Monaspace的开源编程字体家族。这套字体家族包含5种字体,分别是Neon、Argon、Krypton、Xenon和Radon。站长网2023-11-10 15:19:060000特斯拉上线Model 3现车限时激励 购买后轮驱动版可获8000元保险补贴
就在刚刚,特斯拉中国官方宣布,上线Model3现车限时激励。2023年6月16日(含)至6月30日(含),购买Model3后轮驱动版现车并完成交付可获8000元保险补贴及优惠利率贷款方案。据悉,目前Model3后轮驱动版售价为23.19万元,预计交付日期为1-4周。站长网2023-06-16 16:45:2400009.9买一套AI写真,秒鸭相机能火多久?
只要花9.9元就能有一套自己的数字分身和AI写真,这是最近比较火的一款图像类小程序——秒鸭相机。我在朋友圈、微信群中,都有看过一些朋友圈讨论、转发过这个产品,虽然火爆程度不如以前脸萌、ZAO等风靡一时。但作为图像类且收费的产品,还有这么多人愿意主动分享实属不易。01图像美化一直有机会我一直强调,围绕图像美化一直有机会,这其中包含图片、视频和音频。站长网2023-07-25 16:34:410000谷歌作为人工智能最大支持者之一 警告员工谨慎使用 AI 聊天机器人
谷歌是人工智能的主要支持者之一,但同时警告员工谨慎使用聊天机器人。据四名知情人士告诉路透社,谷歌母公司Alphabet已经向员工发出警告,不要将机密资料输入到AI聊天机器人中,该公司确认此举是基于长期保护信息的政策。站长网2023-06-16 16:45:180000百度透露大模型与搜索引擎结合进展:支持视频和图表回答提问
据科创板日报报道,百度集团副总裁、搜索平台负责人肖阳透露了百度正在内测的“极致满足”和“AI伙伴”的新搜索功能,分别包括:输入搜索词时,百度首页可呈现多答案解释,也支持用视频直接回答用户的问题,并让视频自动定位到关键段落;也可以用书籍来直接回复问题。站长网2023-06-30 19:36:110000