博舍

生成人工智能研究为创作者提供引导式图像结构控制 人工智能应用了哪些技术

生成人工智能研究为创作者提供引导式图像结构控制

 

新的研究正在提升人工智能的创造力,通过文本引导的图像编辑工具。这项研究提出了一种使用即插即用扩散特征(PnP-DF)的框架,可以指导真实和精确的图像生成。视觉内容创作者可以通过一个提示图像和几个描述性单词,将图像转换为视觉效果。

可靠而轻松地编辑和生成内容的能力有可能扩大艺术家、设计师和创作者的创作可能性。它还可以加强依赖动画、视觉设计和图像编辑的行业。

“最近的文本到图像生成模型标志着数字内容创作进入了一个新时代。然而,将它们应用于现实世界应用程序的主要挑战是缺乏用户可控性,这在很大程度上被限制为仅通过输入文本来指导生成。我们的工作是为用户提供对图像布局控制的首批方法之一,”NarekTumanyan说,魏茨曼科学研究所的主要作者和博士候选人。

最近在生成人工智能方面的突破为开发强大的文本到图像模型开辟了新的途径。然而,复杂性、模糊性和对自定义内容的需求限制了当前的渲染技术。

该研究介绍了一种使用PnPDFs的新方法,该方法改进了图像编辑和生成过程,使创作者能够更好地控制其最终产品。

研究人员从一个简单的问题开始:扩散模型是如何表示和捕捉图像的形状或轮廓的?该研究探索了图像在生成过程中的内部表征,并考察了这些表征如何编码形状和语义信息。

新方法控制生成的布局,而无需训练新的扩散模型或对其进行调整,而是通过理解空间信息是如何在预训练的文本到图像模型中编码的。在生成过程中,模型从引入的引导图像中提取扩散特征,并将其注入生成过程的每个步骤,从而对新图像的结构进行细粒度控制。

通过结合这些空间特征,扩散模型对新图像进行细化,以匹配制导结构。它迭代地执行这一操作,更新图像特征,直到它降落在最终图像上,该图像保留了指南图像布局,同时也匹配了文本提示。

作者写道:“这产生了一种简单有效的方法,将从制导图像中提取的特征直接注入到翻译图像的生成过程中,不需要训练或微调。”。

这种方法为更先进的受控生成和操作方法铺平了道路。

视频1。“文本驱动的图像到图像翻译的即插即用扩散特征”研究综述2023ConferenceonComputerVisionandPatternRecognition(CVPR)

研究人员利用cuDNN加速PyTorch框架,在NVIDIAA100GPU平台上开发和测试了PNP模型。据该团队称,GPU的大容量使他们能够专注于方法开发。研究人员获得A100的支持,是因为他们参与了NVIDIAAppliedResearchAcceleratorProgram。

该框架部署在A100上,在大约50秒内从引导图像和文本转换出新图像。

这个过程不仅有效而且可靠,可以准确地生成令人惊叹的图像。它还可以超越图像,翻译草图、绘图和动画,并可以修改照明、颜色和背景。

图1。该方法的样本结果保留了引导折纸图像的结构,同时匹配了目标提示的描述(来源:Tumanyan,Narek等人/CVPR2023年)

他们的方法也优于现有的文本到图像模型,在保留制导布局和偏离其外观之间实现了卓越的平衡。

图2:将该模型与P2P、DiffuseIT、具有三种不同噪声水平的SDedit以及VQ+CLIP模型进行比较的示例结果(资料来源:Tumanyan、Narek等人/CVPR2023年)

然而,该模型确实存在局限性。当编辑具有任意颜色的图像部分时,它不能很好地执行,因为模型不能从输入图像中提取语义信息。

研究人员目前正致力于将这种方法扩展到文本引导的视频编辑中。这项工作也被证明对其他利用扩散模型中图像内部表示分析能力的研究有价值。

例如,一项研究利用团队的研究见解来改进计算机视觉任务,如语义点对应。另一个重点是扩大文本到图像生成控制,包括对象的形状、位置和外观。

来自魏茨曼科学研究所的研究小组将在CVPR2023上发表这项作品,该作品也在GitHub上开源。

想要了解更多关于团队的信息,请访问项目页面。阅读研究报告Plug-and-PlayDiffusionFeaturesforText-DrivenImage-to-ImageTranslation。观看NVIDIA研究在CVPR2023上实现的人工智能突破。

 

人工智能时代下的临床麻醉,你了解哪些

人工智能时代下的临床麻醉,你了解哪些?

谢志高

如今,随着大型临床数据库愈来愈丰富,人工智能在医学领域中得到了快速应用和发展,计算机能够模拟临床医师的思维,利用机器学习并处理复杂的临床数据,辅助医师进行临床诊断与治疗。不过,很多人只知道人工智能在临床中逐渐推广应用,但是并不了解具体的应用实效,本文就围绕临床麻醉进行分析,向大家科普人工智能时代下关于临床麻醉那些事。

关于人工智能那些你不知道的事

大家都知道人工智能是基于计算机系统和技术的计算机科学技术,但是大家不知道人工智能是非常复杂的,其核心是机器学习,通过算法对海量化的数据进行分析,在数据间进行剖析并探索其中的关系,最终产生稳定的输出模型。人工智能的核心是机器学习,而机器学习主要依赖算法的建立。具体算法分析如下所示:

1.经典机器学习算法

这一算法进行时需要人为选择数据特征,然后结合机器算法对数据进行处理,剖析其中的关联性,其中会利用决策树对数据进行处理,处理中会按照属性划分成不同的区域,而每个区域中则会有独立的结构模型,其中通过不断分割子区域直到每个子区域数据集类型相同,其中主要进行执行分类和回归任务。在这一算法中可以利用决策树对患者的麻醉状态、最佳麻醉方式等进行区分,对提升麻醉有效性有着积极的作用。

2.人工神经网络算法

这一算法是较为常用的算法,主要是模仿生物神经系统中的神经元间的联络,由输入层、神经元层、输出层构成,输入层由数据集的特征组成,其中的神经元层会对数据进行处理并构建相应的模型,最终可以产出具体的结果。这一算法可以对麻醉进行深度监测、预测丙泊酚在特殊人群中的药动学、监测低氧血症等。

3.深度学习算法

这一算法是目前人工智能领域中重点研究的内容,这一算法主要通过自我学习数据间的特征、规律,其间不需要人工参与,并利用多层神经网络模拟人脑思维进行模式分析与识别,数据分析更加深入,再加上逐层训练的方式能够应对庞大的计算量,可获得最优解。目前深度学习算法主要分析预测脑电双频指数、小儿困难气道以及住院时间和病死率等。

4.模糊逻辑

这一算法是模仿人类的大脑,借助模糊性信息决策并进行推理,可处理传统方法难以解决的规则问题。

人工智能在临床麻醉应用,你了解吗?

近些年,人工智能在医学领域有了广泛的应用,不仅能够提升临床医疗及护理的质量和效率,而且患者的满意度也因此显著提升。麻醉科作为临床中非常重要的学科,也受到患者以及社会的重点关注,结合日常临床麻醉工作特征分析可发现,由于手术操作的多变性、患者个体差异和临床概率事件的影响,麻醉医生的工作压力较大,长时间下可能会产生疲惫现象,难以保障围术期安全与麻醉效率。针对此,将人工智能应用在临床麻醉中,既能够保障患者围术期的安全,还能够显著提升麻醉效率。具体应用如下:

1.麻醉药物剂量控制

人工智能可以对患者的生理指标进行实时监测和分析,对药物剂量和速度进行即时调整和控制,以达到更好的麻醉效果。具体来说,在人工智能的作用下,麻醉医师能够对麻醉剂的选择和用量进行把控,其中通过分析患者的医疗记录、生理参数、药代动力学等信息,人工智能可以预测患者所需的麻醉剂种类、用量和给药时间,从而提高麻醉的效果、减少副作用。例如在实际的临床麻醉过程中,麻醉医师可以对患者的状态和手术情况进行分析,将具体的数据输入到系统中,就能够获得相应的麻醉剂量和类型,并且医师将相应的数据输入闭环靶控输注系统,其可自动维持患者处于适宜的麻醉状态。

2.麻醉深度检测

通过对患者的脑电图和生理指标进行分析,人工智能可以实时监测患者的麻醉深度,提高麻醉效果和安全性。具体来说,在临床麻醉中结合智能监测设备,如人工智能可以联合智能心电图、脑电图、血氧监测和呼吸系统,可以对患者的生命体征进行实时监测和数据分析,及时发现和处理异常情况,可保障患者的生命安全。与此同时,部分研究者在临床麻醉中对人工智能的应用进行了深入探究,例如借助神经网络预测患者肌肉松弛的恢复情况、结合面部图像识别器官插管困难患者、术前识别输血相关性急性损伤患者等,在人工智能的作用下能够对复杂的数据进行分析处理,对保障患者手术顺利和安全有着积极的作用。

3.图像识别与分类

结合以上观点分析可发现,人工智能在麻醉学中有着显著的临床应用价值,其中人工智能能够实现麻醉风险评估,通过收集和分析患者的临床数据、病历信息和生理指标等数据,可以快速识别患者的麻醉风险因素,提前制定并实施相应的麻醉策略,有助于降低麻醉手术的风险和并发症的发生。

同时人工智能在临床麻醉中还能够凸显图像识别与分类优势,帮助临床医师尽早发现病变的脏器或者组织。结合临床麻醉的应用可发现,相关人员利用人工神经网络帮助识别和分类超声图像,能够精准识别超声下的动脉、静脉、神经丛、硬膜外间隙、左心室等,医师则可以快速定位,可显著提升工作效率和缓解患者的不适感。

4.麻醉质量评估及闭环给药系统在临床中的应用

通过对麻醉手术过程进行在线监测和数据记录,人工智能可以对麻醉质量进行评估和反馈,帮助麻醉医生对麻醉技术进行调整和改进。目前,很多医院采用了AIMS系统,其能够收集来自监护仪、医院信息系统、呼吸机、麻醉工作站等源头的数据,对麻醉医师开展工作有着积极的作用。现阶段,随着人工智能的应用,医学领域中逐渐开发了一种为麻醉医师服务的硬件系统,即临床决策支持系统,这一系统能够显著减少麻醉医师的工作失误现象,并且在术中能够对患者的麻醉质量进行评估,自动识别患者存在的异常现象,提醒麻醉医师处理。

此外,利用麻醉中的镇静、镇痛、血压的闭环给药系统,临床上出现了“麻醉机器人”,能够更好的帮助麻醉医生判断及调整麻醉深度,更好的为外科及病人服务。麻醉机器人在病人麻醉过深或者过浅时,能够用语音播报提示麻醉医生;当病人出现意识恢复、肌松恢复等异常情况时也能够及时给予语音播报。

总之,人工智能在临床麻醉中的应用可以提高麻醉操作的精准性、安全性和有效性,为患者的手术治疗带来更好的保障和效果。

人工智能危险吗哪些工作面临风险

原标题:人工智能危险吗?哪些工作面临风险?

今日份知识你摄入了么?

人工智能技术正在高速发展,并正在改变现代生活的许多方面。然而,一些专家担心它可能被用于恶意目的,并可能威胁到就业。

什么是人工智能,它是如何工作的?

除了数据,人工智能还依赖于算法——必须按照正确顺序遵循的规则列表来完成任务。

人工智能是语音控制虚拟助手Siri和Alexa背后的技术。它可以让Spotify、YouTube和BBCiPlayer建议你接下来可能想播放什么,并帮助Facebook和Twitter决定向用户展示哪些社交媒体帖子。

人工智能可以让亚马逊分析顾客的购买习惯,从而推荐未来的购买行为,该公司还利用这项技术打击虚假评论。比尔·盖茨:人工智能是几十年来最重要的技术进步。

什么是ChatGPT和Snapchat的MyAI?

最近几个月,ChatGPT和SnapchatMyAI这两个强大的人工智能驱动应用程序变得非常引人注目。

人工智能与一个名为聊天机器人的计算机程序相结合,该程序通过文本与人类用户“交谈”。

这些应用程序可以回答问题、讲故事和编写计算机代码。但这两个程序有时会为用户产生错误的答案,并可能再现其原始材料中包含的偏见,例如性别歧视或种族主义。

为什么批评人士担心人工智能可能是危险的?

由于目前几乎没有关于如何使用人工智能的规则,专家警告称,人工智能的快速增长可能是危险的。一些人甚至表示,人工智能研究应该停止。

今年5月,被广泛认为是人工智能教父之一的GeoffreyHinton辞去了谷歌的工作,他警告称,人工智能聊天机器人可能很快就会比人类更聪明。

当月晚些时候,美国人工智能安全中心发表了一份声明,得到了数十名领先技术专家的支持。他们认为,人工智能可能被用来制造可能破坏社会稳定的错误信息。他们说,在最坏的情况下,机器可能会变得非常聪明,从而接管人类,导致人类灭绝。

然而,欧盟技术主管MargretheVestager告诉BBC,人工智能放大偏见或歧视的可能性是一个更紧迫的问题。她特别担心人工智能在做出贷款申请等影响人们生计的决策方面可能发挥的作用,并补充说,人工智能可能被用来影响选举的“绝对存在风险”。

包括科技先驱MarthaLaneFox在内的其他人则表示,我们不应该对人工智能“过于歇斯底里”,并敦促对其能力进行更理智的讨论。

目前关于人工智能有什么规则?

世界各国政府都在努力解决如何监管人工智能的问题。欧洲议会(EuropeanParliament)成员刚刚投票赞成欧盟提出的《人工智能法案》(ArtificialIntelligenceAct),该法案将为人工智能建立一个严格的法律框架,企业需要遵守。

展开全文

MargretheVestager表示,需要“护栏”来应对人工智能带来的最大风险。

这项立法预计将于2025年生效,它将人工智能应用对消费者的风险等级进行了分类,其中支持人工智能的视频游戏或垃圾邮件过滤器属于风险最低的类别。

高风险系统,如用于评估信用评分或决定获得住房的系统,将面临最严格的控制。这些规定不适用于英国,英国政府今年3月公布了人工智能的未来愿景。它排除了设立专门的人工智能监管机构的可能性,并表示现有机构将负责其监管。

但Vestager表示,人工智能监管需要成为一项“全球事务”,并希望在“志同道合”的国家之间达成共识。美国立法者也对现有的自愿守则是否能胜任这项工作表示担忧。与此同时,中国打算让企业在使用人工智能算法时通知用户。

哪些工作会因人工智能而面临风险?

人工智能有可能彻底改变工作世界,但这引发了一个问题,即它可能取代哪些角色。

投资银行高盛(GoldmanSachs)最近的一份报告显示,随着某些任务和工作功能的自动化,人工智能可能会取代全球相当于3亿个全职工作岗位。这相当于目前人类在美国和欧洲所做的全部工作的四分之一。

该报告强调了一些可能受到影响的行业和角色,包括行政工作、法律工作、建筑和管理。但它也发现了许多行业的巨大潜在利益,并预测人工智能可能导致全球GDP增长7%。

一些医学和科学领域已经在利用人工智能,医生利用这项技术帮助发现乳腺癌,科学家利用它开发新的抗生素。

原文作者:ShionaMcCallum

翻译作者:过儿

美工编辑:过儿

校对审稿:Chuang

本周公开课预告

前端工程师面试的五大注意事项

Python:释放效率——轻松简化你的日常工作!

Noteable:自动进行数据分析的ChatGPT插件

MicrosoftFabric对PowerBI的影响如何?

谷歌、Meta和亚马逊的下一个前沿领域:AI生成广告

点「在看」的人都变好看了哦返回搜狐,查看更多

责任编辑:

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇