博舍

生成人工智能研究为创作者提供引导式图像结构控制 人工智能结构有哪些

生成人工智能研究为创作者提供引导式图像结构控制

 

新的研究正在提升人工智能的创造力,通过文本引导的图像编辑工具。这项研究提出了一种使用即插即用扩散特征(PnP-DF)的框架,可以指导真实和精确的图像生成。视觉内容创作者可以通过一个提示图像和几个描述性单词,将图像转换为视觉效果。

可靠而轻松地编辑和生成内容的能力有可能扩大艺术家、设计师和创作者的创作可能性。它还可以加强依赖动画、视觉设计和图像编辑的行业。

“最近的文本到图像生成模型标志着数字内容创作进入了一个新时代。然而,将它们应用于现实世界应用程序的主要挑战是缺乏用户可控性,这在很大程度上被限制为仅通过输入文本来指导生成。我们的工作是为用户提供对图像布局控制的首批方法之一,”NarekTumanyan说,魏茨曼科学研究所的主要作者和博士候选人。

最近在生成人工智能方面的突破为开发强大的文本到图像模型开辟了新的途径。然而,复杂性、模糊性和对自定义内容的需求限制了当前的渲染技术。

该研究介绍了一种使用PnPDFs的新方法,该方法改进了图像编辑和生成过程,使创作者能够更好地控制其最终产品。

研究人员从一个简单的问题开始:扩散模型是如何表示和捕捉图像的形状或轮廓的?该研究探索了图像在生成过程中的内部表征,并考察了这些表征如何编码形状和语义信息。

新方法控制生成的布局,而无需训练新的扩散模型或对其进行调整,而是通过理解空间信息是如何在预训练的文本到图像模型中编码的。在生成过程中,模型从引入的引导图像中提取扩散特征,并将其注入生成过程的每个步骤,从而对新图像的结构进行细粒度控制。

通过结合这些空间特征,扩散模型对新图像进行细化,以匹配制导结构。它迭代地执行这一操作,更新图像特征,直到它降落在最终图像上,该图像保留了指南图像布局,同时也匹配了文本提示。

作者写道:“这产生了一种简单有效的方法,将从制导图像中提取的特征直接注入到翻译图像的生成过程中,不需要训练或微调。”。

这种方法为更先进的受控生成和操作方法铺平了道路。

视频1。“文本驱动的图像到图像翻译的即插即用扩散特征”研究综述2023ConferenceonComputerVisionandPatternRecognition(CVPR)

研究人员利用cuDNN加速PyTorch框架,在NVIDIAA100GPU平台上开发和测试了PNP模型。据该团队称,GPU的大容量使他们能够专注于方法开发。研究人员获得A100的支持,是因为他们参与了NVIDIAAppliedResearchAcceleratorProgram。

该框架部署在A100上,在大约50秒内从引导图像和文本转换出新图像。

这个过程不仅有效而且可靠,可以准确地生成令人惊叹的图像。它还可以超越图像,翻译草图、绘图和动画,并可以修改照明、颜色和背景。

图1。该方法的样本结果保留了引导折纸图像的结构,同时匹配了目标提示的描述(来源:Tumanyan,Narek等人/CVPR2023年)

他们的方法也优于现有的文本到图像模型,在保留制导布局和偏离其外观之间实现了卓越的平衡。

图2:将该模型与P2P、DiffuseIT、具有三种不同噪声水平的SDedit以及VQ+CLIP模型进行比较的示例结果(资料来源:Tumanyan、Narek等人/CVPR2023年)

然而,该模型确实存在局限性。当编辑具有任意颜色的图像部分时,它不能很好地执行,因为模型不能从输入图像中提取语义信息。

研究人员目前正致力于将这种方法扩展到文本引导的视频编辑中。这项工作也被证明对其他利用扩散模型中图像内部表示分析能力的研究有价值。

例如,一项研究利用团队的研究见解来改进计算机视觉任务,如语义点对应。另一个重点是扩大文本到图像生成控制,包括对象的形状、位置和外观。

来自魏茨曼科学研究所的研究小组将在CVPR2023上发表这项作品,该作品也在GitHub上开源。

想要了解更多关于团队的信息,请访问项目页面。阅读研究报告Plug-and-PlayDiffusionFeaturesforText-DrivenImage-to-ImageTranslation。观看NVIDIA研究在CVPR2023上实现的人工智能突破。

 

人工智能的发展对人类有哪些的影响合集

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

人工智能对人类社会的影响

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

蓝廷帅

2010 

什么是人工智能?

 

顾名思义,人工智能就是人造智能,其英文表示是“

Artificial Intelligence

,简称

AI

 

 

然,这只是人工智能的字面解释或广义解释。

目前的“人工智能”

一词是指用计算机模拟或

实现的智能,同时,人工智能又是一个学科名称。

 

一、人工智能对经济的影响

 

1.

专家系统的效益

 

 

成功的专家系统能为它的建造者、拥有者和用户带来明显的经济效益。

 

 

 

 

 

用比较经济的方法执行任务而不需要有经验的专家,

可以极大地减少劳务开支和培养费

用。

由于软件易于复制,

所以专家系统能够广泛传播专家知识和经验,

推广应用数量有限的

和昂贵的专业人员及其知识。

 

 

 

 

如果保护得当,软件能被长期地和完整地保存。

 

领域专业人员

(

如医生

)

难以同时保持

最新的实际建议

(

如治疗方案和方法

而专家系统却能迅速地更新和保存这类建议,使终端

用户

(

如病人

)

从中受益。

 

 

2.

人工智能推动计算机技术发展

 

 

 

 

人工智能研究已经对计算机技术的各个方面产生并将继续产生较大影响。

人工智能应用

要求繁重的计算,促进了并行处理和专用集成片的开发。

 

算法发生器和灵巧的数据结构获得应用,

自动程序设计技术将开始对软件开发产生积极

影响。

所有这些在研究人工智能时开发出来的新技术,

推动了计算机技术的发展,

进而使计

算机为人类创造更大的经济实惠。

 

 

二、人工智能对文化的影响

 

1.

改善人类语言

 

 

 

根据语言学的观点,

语言是思维的表现和工具,

思维规律可用语言学方法加以研究,

人的下意识和潜意识往往

"

只能意会,不可言传

"

。由于采用人工智能技术,综合应用语法、

语义和形式知识表示方法,

我们有可能在改善知识的自然语言表示的同时,

把知识阐述为适

用的人工智能形式。

 

随着人工智能原理日益广泛传播,

人们可能应用人工智能概念来描述他们生活中的日常

状态和求解各种问题的过程。

人工智能能够扩大人们交流知识的概念集合,

为我们提供一定

状况下可供选择的概念,描述我们所见所闻的方法以及描述我们的信念的新方法。

 

2.

改善文化生活

 

 

 

人工智能技术为人类文化生活打开了许多新的窗口。比如图像处理技术必将对图形艺

术、

广告和社会教育部门产生深远的影响。

比如现有的智力游戏机将发展为具有更高智能的

文化娱乐手段。

 

综上分析我们知道,

人工智能技术对人类的社会进步、

经济发展和文化提高都有巨大的

影响。随着时间的推进和技术的进步,这种影响将越来越明显地表现出来。还有一些影响,

可能是我们现在难以预测的。

可以肯定,

人工智能将对人类的物质文明和精神文明产生越来

越大的影响。

 

三、人工智能对人类社会的的影响

 

1.

劳务就业问题

 

 

 

 

 

 

 

由于人工智能能够代替人类进行各种脑力劳动,

将会使一部分人不得不改变他们的工

种,

甚至造成失业。

人工智能在科技和工程中的应用,

会使一些人失去介入信息处理活动

(

规划、诊断、理解和决策等

)

的机会,甚至不得不改变自己的工作方式。

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇