多模态SVG生成模型StarVector 视觉质量显著增强
站长网2023-12-21 11:44:260阅
StarVector是一种多模态SVG生成模型,该模型有效地集成了代码生成大型语言模型(CodeLLM)和视觉模型,使得能够生成准确表示图像像素的不受限制的SVG。
StarVector利用CLIP图像编码器从基于像素的图像中提取出视觉表示模块,然后通过适配器将其转换为视觉标记。这些视觉标记预先添加到SVG标记嵌入中,而StarCoder模型使用下一个标记预测对序列进行建模,从而有效地学习对齐标记和代码标记。
论文地址:https://arxiv.org/pdf/2312.11556.pdf
为了评估StarVector的性能,论文引入了SVG-Bench,这是一个用于跨多个数据集和相关指标评估SVG方法的综合基准。在此基准测试中,引入了新颖的数据集,包括SVG-Stack训练(真实世界SVG示例的大型数据集),并使用它来预StarVector作为SVG的大型基础模型。
结果表明,与当前方法相比,视觉质量和复杂性处理有有了显著的增强,引起SVG生成技术的显着进步。因此,StarVector为SVG生成技术带来了新的突破,为网页开发和图形设计领域带来了更多可能性。
0000
评论列表
共(0)条相关推荐
分享一个有利可图的AI副业:用AI图像生成器创作时尚图案
本文将跟大家分享一个有利可图的AI副业,特别适合初学者,涉及一个鲜为人知的AI生成器。那么,这个新的AI副业是什么呢?如果你是时尚达人或热衷于美丽图案,你会喜欢这个消息:你可以几乎不费力地开始自己的时尚系列。是的,我是认真的,而且这个副业不仅仅局限于时尚达人,每个人都有参与的空间。站长网2023-11-24 11:28:010001MIT和谷歌提出新AI框架Health-LLM:利用可穿戴传感器数据为健康预测任务调整LLM
划重点:1.🏥健康领域迎来革命性变革:可穿戴传感器技术不断监测生理数据,与大语言模型(LLMs)交叉,挑战在健康预测中的传统能力。2.🧠MIT和Google研究引入Health-LLM框架,通过可穿戴传感器数据调整LLMs,评估了包括GPT-3.5和GPT-4在内的八种LLMs在健康预测任务中的表现。站长网2024-01-24 14:45:530000短视频网红博主遭小程序“AI换脸” 法院判决后者侵犯肖像权
据江苏高院公众号消息,近日,江苏高院公布了一起因“AI换脸”技术引发的肖像权纠纷。小林是某短视频平台的小网红,拥有一定数量的关注者,日常在平台上发布自己出镜的国风短视频。站长网2023-07-04 14:40:290000谷歌第二季度营收达746亿美元 人工智能成为财报会议主题
谷歌的母公司Alphabet周二收盘后公布了超出预期的第二季度财务业绩。在搜索、广告和移动软件方面长期无可争议的主导地位之后,随着公司面临来自竞争对手的激烈竞争,尤其是微软,后者与OpenAI建立了人工智能联盟,Alphabet的盈利已经成为科技行业的一个备受期待的风向标。Alphabet首席执行官SundarPichai表示:“我们的产品和公司都有令人兴奋的动力,推动了本季度的强劲业绩。”站长网2023-07-26 10:52:180000谷歌内测员工称 Bard 为“病态的骗子”,为追赶 ChatGPT 不顾道德伦理?
站长网2023-04-23 12:14:290000