再见设计师！COLE AI系统利用多模型联合生成高质量设计

站长网2023-12-01 11:00:411阅

划重点:

1. 🤯 COLE是由微软亚洲研究院和北京大学的12名研究人员开发的，结合了Meta的Llama2-13B、DeepFloyd IF、LLaVA1.5-13B和GPT-4V等多个AI模型，以及开源图形渲染器Skia。该系统旨在通过用户输入设计项目概念，生成图像并嵌入相关文本，具备可编辑文本和视觉元素的功能。

2. 🌐 COLE采用了不同AI模型的组合，通过对互联网上的10万张高质量原始图形设计图像进行训练，实现了出色的设计生成效果。

3. 🖌️ COLE不仅生成图像，而且提供了可编辑的文本和对象区块，使用户能够在COLE框架内直接进行修改，而无需导出到其他设计软件

近日，微软亚洲研究院和北京大学的研究人员联手开发了一款名为COLE的AI系统，旨在通过多个AI模型的联合工作，为用户提供可编辑的图形设计。COLE的名字来源于亨利·科尔，他被认为是1843年第一张图形化圣诞卡的创作者。

论文网址：https://arxiv.org/pdf/2311.16974.pdf

这一系统的独特之处在于，它不仅可以生成图像，还能够嵌入相关文本，使用户能够通过输入设计项目的概念，如“一张宣传即将举行的冬季假期音乐会的海报，上面有穿着暖和衣物的人在落雪中演奏乐器”，即可获得一张完整的设计。

COLE的背后是一组不同的AI模型，包括Meta的Llama2-13B、DeepFloyd IF、LLaVA1.5-13B以及GPT-4V，以及开源图形渲染器Skia。这些模型的组合是为了应对图形设计的复杂性以及在该领域主要格式（.SVG文件）上缺乏可用的训练数据。

与其它文本到图像生成器相比，如OpenAI的DALL-E3和Midjourney，COLE在设计生成方面取得了令人瞩目的效果。通过对互联网上10万张高质量原始图形设计图像的训练，COLE不仅能够生成清晰有序的图形设计，而且能够在图像内生成可编辑的文本和对象区块。

更值得一提的是，COLE生成的图像可在其框架内进行直接编辑，用户可以点击文本框更改显示的文本或字体，也可以输入新的提示以更改图像的不同视觉元素。这为用户提供了一种便捷的方式，避免了回到设计的起点进行整体修改或将图像导出到其他设计软件的繁琐步骤。

虽然COLE目前更像是一个框架而不是一个成熟的产品，但其研究团队在图形设计服务方面取得的结果令人惊叹。研究人员表示，COLE不仅在生成各种设计项目时表现出色，而且在可编辑性和灵活的编辑空间方面也达到了预期目标。

对于图形设计行业而言，COLE到底是威胁还是新工具呢?研究人员强调，他们设计COLE是为了生成具有可编辑字段的图像，以“在必要时允许用户进一步完善输出，整合人类专业知识”。这意味着图形设计的专业培训仍然对于从COLE框架中获得最佳结果是必要的。

然而，研究人员也指出，相比于其他文本到图像生成器，如他们明确引用的DALL-E3，“我们的COLE系统…能够在只需要简单用户意图的情况下生成优质的图形设计图像。”这表明，研究人员认为COLE有可能让那些没有图形设计培训或专业知识的人能够生成与专业设计师媲美的高质量设计。

尽管目前COLE尚未公开提供，但研究人员表示他们的Github项目网页上将很快发布演示版本，使更多人能够了解和体验这一引人注目的图形设计生成框架。

再见设计师COLEAI系统利用多模型联合生成高质量设计

0001

评论列表

共(0)条

相关推荐

站长资讯
抖音快手微信公布微短剧备案细则获得备案号后方可播出
站长之家(ChinaZ.com)5月21日消息:微信平台近期宣布了对微短剧备案机制的重大调整。从今年5月27日开始，任何制作成本低于30万元的微短剧，都需要提交详细的成本配置比例报告，经过平台审核后才能获得备案号。这一举措旨在确保微短剧制作的透明度和规范性。而对于已通过审查的微短剧，如果需要进行内容变更，也必须遵循相应规定或提交申请。
站长网2024-05-22 00:48:52
0001
站长资讯
YouTube赚钱新思路！教你如何用AI制作儿童动画视频月赚5万美金
在儿童领域创作YouTube视频，尤其是面向儿童的内容，一直以来都是一个备受关注的话题。近期，有一个针对儿童创作的YouTube频道引起了广泛的关注，其粉丝和播放量都非常可观。尽管该频道目前已经停止更新，但第三方对其频道的分析显示，即便长时间没有新内容，单月收入依然可观，至少能达到3万元人民币。儿童方向的创作虽然竞争不激烈，但视频收益却是相当可观的，属于蓝海领域。
站长网2023-11-16 15:49:11
0006
站长资讯
巴黎世家雨中走秀：推出支付宝联名T恤一件4700元
近日，法国高端时尚品牌巴黎世家（Balenciaga）在上海盛大举办了其备受瞩目的春季25系列发布秀，这也是艺术总监DemnaGvasalia首次在亚洲呈现其设计才华。而在这场时尚盛宴中，最引人注目的无疑是支付宝与巴黎世家跨界合作的联名款T恤。
站长网2024-05-31 16:18:02
0003
站长资讯
“西湖心辰”获“汤姆猫”过亿元战略投资正式推出“西湖大模型”
近日，“西湖心辰”宣布获得“汤姆猫”战略投资，投资金额超过亿元。此次融资后，西湖心辰将与汤姆猫加速在通用大模型、垂直领域模型及终端软硬件等方面的合作。汤姆猫表示，与其他大模型相比，西湖大模型具备长期记忆、情感感知和主动对话等功能，并且融合了文字、图片、语音等多种模态，与汤姆猫的场景和未来规划高度契合。双方正在加速大模型的应用落地，共同推出汤姆猫系列产品，实现听、看、说、教学和陪伴的功能。
站长网2023-07-10 18:31:48
0000
春节回家，我发现父母染上了网瘾
春节假期已经结束，坐在工位前的年轻人，除了怀念刚刚过去的8天长假，心里也是五味杂陈。越来越多打工人在本次春节返乡中发现，家里从50岁到80岁的长辈，都染上了“网瘾”，上瘾程度甚至远超小朋友。
站长网站长资讯2025-02-07 03:21:17
0000