谷歌Deepmind发布最先进的图像生成模型Imagen 2
谷歌Deepmind宣布了他们最先进的图像生成模型Imagen2。该模型通过参考图片和文本生成新图片和局部编辑的效果比较强大。
这一最新模型的主要特点包括改进的图像描述理解。为了帮助创建更高质量和更准确的图像,Imagen2的训练数据集中添加了更多描述,帮助该模型学习不同的标题风格,并更好地理解广泛的用户提示。
地址:https://deepmind.google/technologies/imagen-2/
此外,Imagen2的数据集和模型在许多领域取得了改进,这些领域通常是文本到图像工具所困扰的,包括渲染逼真的手部和人脸,以及保持图像不受干扰的视觉伪影,从而实现更加真实的图像生成。
Imagen2的扩散技术提供了高度的灵活性,使得更容易控制和调整图像的风格。通过提供参考风格图像并结合文本提示,可以训练Imagen2生成遵循相同风格的新图像。
该模型还支持图像编辑功能,如“修补”和“扩展”。通过提供参考图像和图像蒙版,用户可以使用一种称为修补的技术直接在原始图像中生成新内容,或者使用扩展技术将原始图像延伸到其边界之外。
为了应对潜在的风险和挑战,Google DeepMind在设计和开发过程中设置了严格的防护措施。Imagen2集成了SynthID,这是一种先进的数字水印工具,使Google Cloud客户能够在图像的像素中添加不可察觉的数字水印,而不会影响图像质量。这种数字水印可以在应用修改,如滤镜、裁剪或使用有损压缩方案保存后仍然可检测到。在发布功能给用户之前,Google DeepMind进行了严格的安全测试,以最小化潜在的危害风险。安全检查涵盖了训练数据、输入提示和系统生成的输出,以避免生成潜在有问题的内容。
现在,开发人员和云客户可以通过Google Cloud Vertex AI中的Imagen API使用这一先进的图像生成模型。
生成式人工智能服务管理办法发布:AI生成内容应进行标识
今日午间,国家互联网信息办公室发布关于《生成式人工智能服务管理办法(征求意见稿)》公开征求意见的通知。意见反馈截止时间为2023年5月10日。征求意见稿明确,提供生成式人工智能产品或服务应当遵守法律法规的要求,尊重社会公德、公序良俗,符合以下要求:站长网2023-04-12 14:59:210000研究显示 ChatGPT 提供的医疗保健回应与人类提供的建议几乎无法区分
根据《JMIR医学教育》杂志上发表的一项新研究,ChatGPT对与医疗保健相关的问题的回答很难与人类的回答区分开来。该研究由纽约大学的研究人员于今年1月进行,旨在评估使用ChatGPT或类似的大型语言模型来回答电子健康记录中提出的一长串问题的可行性。研究得出结论,使用像ChatGPT这样的大型语言模型可能是简化医疗保健提供者与患者沟通的有效方式。站长网2023-07-19 07:57:390000DeepMind 联合创始人:AI 行业不应盲目追求「快速行动,打破常规」的发展模式
站长之家(ChinaZ.com)11月1日消息::DeepMind的联合创始人DemisHassabis最近在接受BBC采访时表达了对AI行业发展的担忧,他警告说,与传统科技巨头不同的是,AI行业不应盲目追求「快速行动,打破常规」的发展模式。站长网2023-11-01 11:55:550000【话媒堂】从溯源直播到创立品牌,@盛太雪糕 如何在女装世界独树一帜?
“不要局限风格记住,你喜欢就好”,这是@盛太雪糕主页最新的一条淘宝动态,一定程度上代表着@盛太雪糕和品牌MARONNIE想要传递的价值观。图片中的穿搭或温柔优雅,或软糯可爱,或是日常休闲,风格各异,冬日氛围感十足。站长网2023-12-21 18:18:100000北大提出统一的视觉语言大模型Chat-UniVi 3天训练成果惊艳众人
要点:北大和中山大学研究者提出的Chat-UniVi是一种统一的视觉语言大模型,能够在统一的视觉表征下同时处理图片和视频任务,且仅需三天训练即可获得130亿参数的通用视觉语言大模型。Chat-UniVi采用动态视觉token来统一表示图片和视频,通过最近邻的密度峰聚类算法获取动态视觉token,多尺度表征提高了模型的性能,使其在图片和视频的各种任务中取得卓越性能。站长网2023-11-29 14:42:290001