全球数治|人工智能自动化决策偏见不可避免,该如何应对
作为第四次科技革命的开创性技术,人工智能对人类社会的发展与转型产生了深远影响。其中,以算法和大数据驱动的人工智能自动化决策正不断渗透至政治、经济、社会等治理领域的各层面,并逐步取代许多长期以来由人类决策或组织执行的工作。如今,自动化决策不仅在私人部门和商业活动中被广泛使用,还深度参与到公共部门的政策制定之中。人们每天浏览的资讯、看到的推送广告、申请到的贷款额度、获取的医疗健康建议等等,很大一部分都是电脑程序通过特定算法对收集到的个人行为习惯、兴趣爱好以及经济、健康、信用状况等信息数据进行自动化分析和评估,并进行判断与决策的结果。
鉴于人工智能在纯技术层面是价值中立的,基于算法的自动化决策具有相对客观、公正、高效的优势。然而,在实际应用上,历史数据存在偏差、设计者个人偏见嵌入系统,以及技术本身不完善等因素又会导致人工智能系统不时做出错误或歧视性的自动决策。除了担心“大数据杀熟”等消费者权益被侵害的问题,人们更为忧虑的是透明度缺乏、监管不足的自动化决策可能令社会陷入“算法暴政”和“数据霸权”的泥沼之中。构筑健全的人工智能伦理体系,引导算法向善,防范滥用之恶,成为当前亟需解决的重大治理问题。
为解析人工智能自动决策中偏见和错误的成因,消弭治理鸿沟,今年7月,美国海军研究生院计算机系助理教授约书华·A·克罗尔(JoshuaA.Kroll)在美国布鲁金斯学会官网发表了研究文章《为何目前的人工智能还只是自动化应用而已?》(WhyAIisjustautomation?),探讨了自动化决策过程中准确性、公平性和透明度不足的问题,并提出了社会与技术深度协同的治理思路。
约书华·A·克罗尔(JoshuaA.Kroll)指出,算法偏见造成决策谬误和歧视性结果的主要原因可以从技术和实务两个层面进行分析。首先,从技术层面来看,现有的人工智能治理机制大多还不具备应对自动化决策系统的规模、速度和复杂性的足够能力。当前机器学习的主流技术普遍呈现“黑箱”特征,个人用户很难充分了解数据训练的过程和自动决策的机理,难免令人们对算法的公正性产生怀疑。在医疗、金融、司法等重要领域,“黑箱”容易使自主决策的算法欠缺透明度和可解释性,进而威胁到人们的基本权利,但现实中法律救济和纠正错误的有效途径又不足。同时,由于算法本身就是规则制定者和系统设计者个人意志与偏好的投射,且随着算法对数据的不断学习,又会在人工智能系统中逐渐固化这些选择倾向,从而导致决策偏差的形成。
其次,从实务层面来看,大多数用于公共事务管理的自动化决策系统,其运行规则实际是由官僚行政机构负责制定。然而,官僚行政机构在忙于拥抱新技术、部署新系统时,常常会疏忽新的决策产生方式对所有利益相关者的影响,并且对如何将新决策工具有效融合到现实的行政管理功能之中考虑不足。这就容易导致唯技术论,简单地将“应用人工智能”或“以数据驱动决策”设定为目标,却不重视解决实际问题。一但出现自动化决策错误,则又会归咎于系统遵循的规则本身,回避当中的人为因素。由于人为设定的规则不可能完美适用于每一种情况,服务于公共事业的自动决策系统除了要重视通过预设合理的规则来明确处理具体场景的标准,大幅提升决策的规模和速度之外,还必须认真探索如何实现规则的有效性和规则应用的透明度;规则对优势群体和弱势群体影响的相对公平性;规则遭遇例外情况时的协调办法;当规则出现整体性失败时的监督和问责机制等目标,以避免人工智能系统陷入机械依照既定规则行事,忽略识别新问题并及时纠错的治理困境。
当前,改善人工智能自动化决策治理模式的需求已迫在眉睫。约书华·A·克罗尔(JoshuaA.Kroll)因此提出了三个治理的关键点:首先,要以解决具体问题为导向,重视自动化决策结果的实效,而不是局限于制定技术解决方案本身,将制定决策的责任简单推给技术专家。只有当系统应用是由问题而不是技术解决方案驱动时,才最有可能取得成功。其次,将事前制定合理、公平的规则和建立事后监管与救济机制同时并重,使治理体系的功能更加完善、透明。自动决策发生错误后必须有能够升级处理的渠道和酌情处置的补救途径。相关系统记录要完整保存,以备审计和监管。第三,为了推动人工智能自动化决策系统与应用的可持续发展,尤其需要大力创建包括政府、企业、社会、用户等在内的多方共同开发、协同共治的良性生态,以形成应对人工智能近期、远期问题的建设性共识,弥合灵活变动的实际需求和僵化遵循规则的技术工具之间的断层。在此过程中,人类应作为有远见的参与者来积极介入系统的运行和治理,而不仅仅是技术的被动接受者。唯有如此,才有可能超越部门职能和学科藩篱,突破现有范式,重塑整个系统,而这还有赖于长期的能力建设和人才培养。
约书华·A·克罗尔(JoshuaA.Kroll)强调,在大数据时代,人工智能自动化决策过程中出现算法偏见的情况几乎是无可避免的。尚未解决这一问题的人工智能系统暂时还只能算是一种自动化应用而已。但是,否定或禁用该项技术并非明智之举,关键在于如何矫正和规制。应当看到,由规则驱动的自动化系统的优势在于能够以可预测的方式将具体的事实置入算法模型,进而转化为特定的结论。输入系统的事实模式、决策规则与系统计算输出的结果间的关系和过程可以被完整记录,供日后审查和监管。这为将来实现完善的监督与透明的执行,消除偏见和歧视提供了可能性。当然,成就这一愿景目前最亟需的是社会各界力量深度协同,构建向善的社会技术治理机制,而不是将视野局限于令机器学习各种规则并自动做出决策的技术过程之上。
人工智能驱动的决策是什么样子的
埃里克-科尔森
2019年7月8日
为了充分利用数据所包含的价值,公司需要将人工智能(AI)带入工作流程,有时,让我们人类脱离困境。我们需要从数据驱动的工作流程发展到人工智能驱动的工作流程。这不仅仅是一个自动化的游戏,这是将人工智能整合到决策中的一个边际效益。相反,它允许我们克服我们作为人类处理器的固有限制--低吞吐量和认知偏见--通过分配机器来处理我们产生的大量数据,并让我们人类将判断、文化、价值和背景应用于机器可以产生的决策选项。
许多公司已经适应了"数据驱动"的运营决策方式。数据可以改善决策,但它需要正确的处理器来从中获得最大的收益。许多人认为这个处理器就是人。数据驱动"这个术语甚至意味着数据是由人策划的,并为人总结处理的。
但是,为了充分利用数据所包含的价值,公司需要将人工智能(AI)带入他们的工作流程,有时,让我们人类摆脱困境。我们需要从数据驱动的工作流程发展到人工智能驱动的工作流程。
区分"数据驱动"和"人工智能驱动"并不只是语义上的问题。每个术语反映了不同的资产,前者侧重于数据,后者侧重于处理能力。数据拥有能够促成更好决策的洞察力;处理是提取这些洞察力并采取行动的方式。人类和人工智能都是处理者,具有非常不同的能力。为了了解如何最好地利用每一种能力,回顾一下我们自己的生物进化以及决策在工业中的演变过程是很有帮助的。
就在50到75年前,人类的判断是商业决策的核心处理器。专业人士依靠他们在其领域内多年的经验(和相对较少的数据)形成的高度调整的直觉,例如,为广告活动挑选正确的创意,确定正确的库存水平,或批准正确的金融投资。经验和直觉是辨别好与坏、高与低、风险与安全的主要手段。
也许,这太人性化了。我们的直觉远不是理想的决策工具。我们的大脑受到许多认知偏见的影响,以可预见的方式损害我们的判断力。这是几十万年进化的结果,在那里,作为早期的狩猎采集者,我们开发了一个依赖于简单启发式的推理系统--规避处理大量信息的高成本的捷径或拇指规则。这使得快速的、几乎无意识的决定能够使我们摆脱潜在的危险情况。然而,"快速和几乎无意识"并不总是意味着最佳或甚至准确。
想象一下,我们一群狩猎采集者的祖先蜷缩在篝火旁,附近的灌木丛突然发出沙沙声。需要做出一个"快速和几乎无意识"的决定:断定沙沙声是一个危险的捕食者,然后逃离;或者,询问收集更多的信息,看看它是否是潜在的猎物--比如,一只兔子,可以提供丰富的营养。我们更冲动的祖先--那些决定逃跑的祖先--比他们更好奇的同龄人存活率更高。逃跑和失去兔子的代价远远低于坚持下去并冒着被捕食者杀死的风险的代价。在结果如此不对称的情况下,进化倾向于导致成本较低的后果的性状,即使牺牲了准确性。因此,更冲动的决策和更少的信息处理的特质在后代群体中变得普遍起来。
在现代背景下,生存启发法成为预装在我们固有大脑中的无数认知偏见。这些偏见以偏离理性客观的方式影响我们的判断和决策。我们对生动的或最近的事件给予更多的重视。我们粗暴地将主体分类,引入宽泛的刻板印象,而这些刻板印象并不能充分地解释他们的差异。我们以先前的经验为基础 ,即使它是完全不相关的。我们倾向于为那些实际上只是随机噪音的事件编造出似是而非的解释。这些只是困扰人类判断的几十种 认知偏差中的几种,几十年来,它是商业决策的核心处理器。我们现在知道,仅仅依靠人类的直觉是低效的、反复无常的、易变的,并且限制了组织的能力。
数据支持的决策那么,感谢数据的出现。连接的设备现在捕获了难以想象的大量数据:每一笔交易,每一个客户的姿态,每一个微观和宏观经济指标,所有的信息都可以为更好的决策提供信息。为了应对这种新的数据丰富的环境,我们已经调整了我们的工作流程。IT部门利用机器(数据库、分布式文件系统等)支持信息的流动,将难以管理的数据量减少到可供人类消化的摘要中。然后,人类使用电子表格、仪表盘和分析应用程序等工具对这些摘要进行进一步处理。最终,这些经过高度处理的、现在可以管理的小数据被提交给决策。这就是"数据驱动"的工作流程。人类的判断仍然是中央处理器,但现在它使用汇总的数据作为新的输入。
虽然这无疑比仅仅依靠直觉要好,但人类扮演中央处理器的角色仍然产生了一些限制。
我们没有利用所有的数据。总结后的数据可能会掩盖原始(大)数据集中所包含的许多洞察力、关系和模式。为了适应人类处理器的吞吐量,数据削减是必要的。尽管我们善于消化我们周围的环境,毫不费力地处理大量的环境信息,但在处理表现为数百万或数十亿条记录的结构化数据时,我们的能力明显有限。我们的大脑可以处理销售数字和平均销售价格,并将其扩展到一个区域层面。一旦你开始考虑价值的全面分布,以及关键的是数据元素之间的关系,它就会挣扎或关闭--这些信息在总体总结中丢失,但对良好的决策非常重要。(这并不是说数据摘要没有用。可以肯定的是,它们为业务提供了基本的可见性。但它们在决策中提供的价值很小。在为人类准备的过程中失去了太多的东西)。在其他情况下,总结的数据可能是完全误导性的。混杂的因素会给人以正面关系的印象,而实际上却恰恰相反(见辛普森 悖论和其他悖论)。而一旦数据被汇总,可能就不可能恢复促成因素,以便对其进行适当控制。(最好的做法是使用随机对照试验,即A/B测试)。没有这种做法,即使是人工智能也可能无法正确控制混杂因素)。简而言之,通过使用人类作为数据的中央处理器,我们仍然在以牺牲准确性来规避人类数据处理的高成本。
数据并不足以使我们免受认知偏见的影响。数据总结是由人类以一种容易产生所有这些认知偏见的方式指导的。我们以一种对我们来说很直观的方式来指导总结工作。我们要求将数据汇总到我们认为有代表性的原型部分。然而,我们有这样的倾向,即粗略地将受试者分类为宽泛的刻板印象,这并不能充分解释他们的差异。例如,我们可能会把数据卷到地理等属性上,即使地区之间的行为没有明显的区别。总结也可以被认为是数据的"粗粒度"。这是对数据的一个比较粗略的近似。例如,像地理这样的属性需要保持在一个区域层面上,那里的值相对较少(即,"东"与"西")。重要的是可能比这更细--城市、邮政编码,甚至街道级数据。这对于人类大脑的处理来说,是更难聚合和总结的。我们也喜欢元素之间的简单关系。我们倾向于认为关系是线性的,因为这对我们来说更容易处理。价格和销售之间的关系,市场渗透率和转换率,信贷风险和收入--所有这些都被认为是线性的,即使数据显示并非如此。我们甚至喜欢为数据中的趋势和变化想出详细的解释,即使自然或随机的变化能更充分地解释它。
唉,我们在处理数据时是在迁就我们的偏见。
将人工智能带入工作流程我们需要进一步发展,并将人工智能带入工作流程,作为数据的主要处理者。对于只依赖结构化数据的常规决策,我们最好将决策委托给人工智能。人工智能不容易受到人类认知偏见的影响。(使用有偏见的数据有一个非常真实的风险,可能导致人工智能找到似是而非的关系,这是不公平的。一定要了解数据是如何产生的,以及如何使用它)。人工智能可以被训练来找到人口中最能解释细粒度差异的部分,即使它们对我们人类的认知来说是不直观的。人工智能在处理数以千计甚至数以百万计的分组方面没有问题。而且,人工智能在处理非线性关系时非常自如,无论是指数、幂律、几何序列、二项分布,还是其他。
这种工作流程能更好地利用数据中包含的信息,并在决策中更加一致和客观。它可以更好地确定哪种广告创意最有效,确定最佳的库存水平,或进行哪些财务投资。
虽然人类被从这个工作流程中移除,但重要的是要注意,单纯的自动化并不是人工智能驱动的工作流程的目标。当然,它可能会降低成本,但这只是一个递增的好处。人工智能的价值在于做出比人类本身所能做到的更好的决定。这在效率上创造了阶梯式的改善,并实现了新的能力。
在工作流程中同时利用人工智能和人类处理器将人类从只涉及结构数据处理的工作流程中移除,并不意味着人类被淘汰。有许多商业决策不仅仅依赖于结构化数据。愿景声明、公司战略、企业价值观、市场动态都是信息的例子,这些信息只存在于我们的头脑中,并通过文化和其他非数字通信形式传递。这些信息是人工智能无法获取的,与商业决策极为相关。
例如,人工智能可以客观地确定正确的库存水平,以实现利润最大化。然而,在竞争激烈的环境中,公司可能会选择更高的库存水平,以提供更好的客户体验,甚至以牺牲利润为代价。在其他情况下,人工智能可能决定在营销方面投入更多的资金,在公司可用的选项中具有最高的投资回报率。然而,一个公司可能会选择节制增长,以维护质量标准。人类以战略、价值观和市场条件的形式获得的额外信息可能值得偏离人工智能的客观合理性。在这种情况下,人工智能可以被用来产生各种可能性,人类可以根据他们所获得的额外信息从中挑选出最佳选择。这种工作流程的执行顺序是根据具体情况而定的。有时,人工智能首先是为了减少人类的工作负担。在其他情况下,人类的判断可以作为人工智能处理的输入。在其他情况下,人工智能和人类处理之间可能会有反复。
他们的关键是,人类不是直接与数据打交道,而是与人工智能处理数据所产生的可能性打交道。价值观、战略和文化是我们将决策与客观理性相协调的方式。这最好是在明确和充分了解的情况下进行。通过利用人工智能和人类,我们可以做出比单独使用任何一个更好的决定。
我们进化的下一个阶段从数据驱动到AI驱动是我们进化的下一个阶段。在我们的工作流程中拥抱人工智能,可以更好地处理结构化数据,并允许人类以互补的方式作出贡献。
这种进化不太可能发生在单个组织内,正如自然选择的进化不发生在个人内一样。相反,它是一个在群体中运作的选择过程。更有效的组织将以更高的速度生存。由于成熟的公司很难适应环境的变化,我怀疑我们将看到新公司的出现,它们从一开始就接受人工智能和人类的贡献,并将它们自然地建立在他们的工作流程中。
阅读更多关于企业管理或相关主题的 文章 创新、技术和分析以及组织决策
ECEricColson是StitchFix的首席算法官。在此之前,他是Netflix的数据科学和工程副总裁。@埃里克-科尔森
什么是人工智能人工智能的应用有哪些
什么是人工智能?人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。
人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。
人工智能的应用有哪些实际应用:机器视觉:指纹识别,人脸识别,视网膜识别,虹膜识别,掌纹识别,专家系统,智能搜索,定理证明,博弈,自动程序设计,还有航天应用等。…研究范畴…自然语言处理,知识表现,智能搜索,推理,规划,机器学习,知识获取,组合调度问题,感知问题,模式识别,逻辑程序设计,软计算,不精确和不确定的管理,人工生命,神经网络,复杂系统,遗传算法人类思维方式…应用领域…智能控制,专家系统,机器人学,语言和图像理解,遗传编程机器人工厂等
应用领域语音识别领域。除了大家已较为熟悉的科大讯飞输入法,一家叫作云知声的人工智能公司,最近开发了智能医疗语音录入系统,采用了国内面向医疗领域的智能“语音识别”技术,能实时准确地将语音转换成文本。这项应用不仅能避免复制粘贴操作,增加病历输入安全性,而且可以节省医生的时间。目前,一些医院已应用了这一技术。
金融智能投资领域。所谓智能投(资)顾(问),即利用计算机的算法优化理财资产配置。目前,国内进行智能投顾业务的企业已经超过20家,其面向的服务群体,就是那些并不十分富有、却有强烈资产配置需求的人群。
中国的BAT(百度、阿里、腾讯)都已涉足人工智能。2016年,“百度大脑”项目正式启动,致力于打造综合的人工智能平台;阿里巴巴推出了人工智能项目“ET”,未来将具备感知能力,并在交通、工业、健康等领域输出决策;腾讯已将人工智能的相关技术,应用于QQ、金融、微信业务板块。
而其他诸多企业都在开发人工智能的“对话机器人”(相当于“虚拟助理”),如微软的“小娜”、谷歌的“Allo”、苹果的Siri、百度的“度秘”等。