博舍

2023爱分析・人工智能应用实践报告 人工智能实践报告范文大全图片

2023爱分析・人工智能应用实践报告

报告编委

特别鸣谢(按拼音排序)

报告摘要

人工智能在产业中落地的20大挑战

自2019年起,人工智能的发展进入与产业加速融合的阶段。经过近几年的发展,人工智能已经广泛渗透进金融、零售、工业、能源、医疗、城市管理等多个行业和领域,并且一些行业头部企业已经全面拥抱了智能化转型。

由于可获取和参考的建设经验有限,加上企业所处行业、发展阶段的不同,自身需求以及拥有的资源禀赋各异等因素,人工智能在产业中落地充满挑战。在本报告中,爱分析基于大量调研和过往研究积累,从战略、数据、场景规划、应用解决方案开发、技术基础设施、组织和人才六个维度梳理出了目前人工智能在产业中落地面临的20个主要挑战。

评估AI应用成熟度,因地制宜推进智能化

智能化转型没有统一的路径和方法,不同企业在不同阶段面临的问题通常也各不相同。因此,企业在实施智能化转型之前需要对自身的AI应用成熟度状况进行评估,明确在不同成熟度阶段需要重点提升的能力,从而制定下一步实施计划,高效的推进智能化转型。

在本报告中,爱分析将AI应用成熟度从低到高依次分为早期实验、初步投入、多维布局、深度应用、全面融合五个阶段,并从多个维度列举了每个成熟度阶段企业具备的主要能力特征。此外,爱分析也将目前国内主要行业企业AI应用成熟度各阶段数量占比情况做了展示。

企业智能化转型的方法论

在本章,爱分析从战略、数据、场景规划、应用解决方案开发、技术基础设施、组织与人才六个维度论述企业在应对智能化转型的多种挑战时,可以采取的方法和措施,并从本次调研的案例中选取相关实践经验为企业提供参考说明。同时,本章还对处于不同成熟度阶段的企业在上述六个维度中需要阶段性提升的重点能力分别了给出建议。

同时,爱分析对本次调研的企业智能化转型和AI应用实践案例做了详细梳理,并将案例内容呈现在本章中,其中以字母命名的案例为针对某个特定问题案例,具体包括:

案例1:中新天津生态城构建智慧城市产业大脑,用AI挖掘数据价值案例2:AI数据管理平台助力上汽安吉物流批量化迭代AI模型,让物流管理更智慧案例3:美宜佳打造商业智能决策管理平台,实现线下零售的智能化运营案例4:依托计算机视觉技术,某餐饮连锁企业为饺子品控安上智慧之“眼”案例5:中宏保险构建营销员智能助理,通过保险知识的共享和复用赋能销售案例6:AI算法支撑下,AR虚拟试戴让安克创新用户获得更优的线上互动体验案例7:某银行搭建智能消费者保护中台,助力消费者权益保护监控和预警案例8:海信集团引入AI平台,构建独立自主的AI开发能力案例9:某大型集团搭建AI中台,支撑数智化升级案例A:某大型保险集团制定平台、应用、技术“三个领先”战略和“四个关键举措”推动智能化建设案例B:虚拟数字人助力江南农商银行为客户提供创新性的远程视频柜员服务案例C:某全球头部日用消费品公司在华公司以费用支出为导向规划AI应用场景案例D:某大型国有商业银行构建MLOps体系,实现敏捷的模型迭代,高效的模型交付案例E:某头部家电集团建立面向AI开发和管理的组织架构,全面支持产品的智能化创新

企业智能化趋势展望

爱分析认为,所有的企业未来想要在市场中保持竞争力,一定都需要全面拥抱智能化。预计在接下来的3至5年,国内大量的企业对AI的应用将从单点的AI建设走向全面的智能化转型,企业因此需要针对智能化转型规划完善的路径和方法,同时结合自身AI应用的成熟度,制定符合自身状况的行动计划。

相信随着企业智能化进程的推进,AI在产业中落地仍然会面临许多新产生的问题,爱分析将对这个领域保持持续跟踪研究,对前沿的案例保持关注,为企业智能化转型提供更多的决策参考

目录

1.人工智能在产业中落地的20大挑战

2.评估AI应用成熟度,因地制宜推进智能化

3.企业智能化转型的方法论

4.企业智能化趋势展望

关于爱分析

研究咨询服务

法律声明

1.人工智能在产业中落地的20大挑战

在国家政策、产业需求、数据和技术体系趋于完备三重因素的推动下,人工智能的发展自2019年起进入与产业加快融合的阶段。经过近几年的发展,人工智能已经广泛渗透进金融、零售、工业、能源、医疗、城市管理等多个行业和领域,各种创新性的应用场景层出不穷。尤其在金融、智能制造等领域,一些头部企业已经在各个业务和职能部门中引入了大量的人工智能应用,并且已经构建起了较完善的面向智能化运营的技术能力、组织架构和创新机制。

行业大势叠加头部企业的示范效应,吸引了众多企业纷纷跟进智能化转型。然而,智能化转型仍是一片虽已有众多人涉足,但鲜有人真正实现深耕的新大陆,企业可获取和参考的建设经验有限,加上企业所处行业、发展阶段的不同,自身需求以及拥有的资源禀赋各异,需要针对性地开展人工智能的规划和建设等因素,导致了人工智能在产业中落地充满挑战。

爱分析基于多个国内领先企业的智能化转型和人工智能应用实践案例的深度调研分析,以及过往对产业数字化与智能化的持续跟踪研究,梳理出了当下人工智能在产业落地中会面临的20个主要挑战,这些挑战涉及战略、数据、场景规划、应用解决方案开发、技术基础设施、组织与人才六个维度,具体如下表:

表1:人工智能在产业中落地的20大挑战2.评估AI应用成熟度,因地制宜推进智能化

智能化转型没有统一的路径和方法,不同企业在不同阶段可能面临的问题通常也各不相同。因此,企业在实施智能化转型之前需要首先建立一套企业智能化转型的能力框架,对框架内的多个能力维度进行评估,确认企业自身的AI应用成熟度状况。在此基础上,企业可以明确智能化转型的关键能力要素,以及各维度的能力在不同成熟度阶段需要重点提升的方向,从而制定下一步实施计划,高效的推进智能化转型和AI落地。

基于本次调研和过往研究积累,爱分析将AI应用成熟度从低到高依次分为早期实验、初步投入、多维布局、深度应用、全面融合五个阶段,并且从战略、数据、场景规划、应用解决方案开发、技术基础设施、组织与人才六个维度列举出了每个成熟度阶段主要的能力特征,具体如下表:

表2:企业AI应用成熟度及其评估框架

同时,爱分析综合IDC、红杉的相关数据以及本次调研结果发现,国内金融、零售、工业、医疗等主要行业开展过智能化建设的企业中,约30%处于早期实验阶段,约40%处于初步投入阶段,约20%处于多维布局阶段,约9%处于深度应用阶段,处于全面融合阶段企业不足1%,仅有少数行业超头部公司达到这一水平。

图1:主要行业企业AI应用成熟度各阶段数量占比

考虑到处于早期实验阶段的企业内部对AI规划与建设尚无实质性的进展,该阶段的企业要推进智能化转型可以参照初步投入阶段的方法和实践经验;同时,处于全面融合阶段的企业一方面国内的样本量非常少,另一方面该阶段的企业已基本完成智能化转型,需要更多地关注和解决智能化运营方面的问题。因此,本报告将只对处于初步投入、多维布局和深度应用三个阶段的企业如何开展智能化转型进行详细讨论,并分别提供建议。

3.企业智能化转型的方法论

在本章,爱分析将从战略、数据、场景规划、应用解决方案开发、技术基础设施、组织与人才六个维度论述企业在应对智能化转型的多种挑战时,可以采取的方法和措施,并从本次调研的案例中选取相关实践经验为企业提供参考说明。同时,本章还会对处于不同成熟度阶段的企业在上述六个维度中需要阶段性提升的重点能力分别给出建议。

3.1战略层面

3.1.1方法论

3.1.1.1.明确智能化的目标和路径,并在组织内达成统一

全面的智能化转型需要从顶层开始设计,避免因依靠局部业务需求驱动的AI能力和应用散点建设造成后期难以统一管理和资源浪费。因此,企业应该首先明确智能化转型的关键目标,以及明确为了达到相关目标的建设思路和路径,针对这些问题对智能化转型进行具备前瞻性和系统性的规划。同时,企业需要在组织、治理结构和制度流程等方面达成统一,才能高效地推动智能化建设,达成相应目标。

例如在案例A中,某大型保险集团制定了平台、应用、技术“三个领先”战略,并成立专门大数据和人工智能部门,从项目管理机制、前沿技术研究、国产化方案替代、应用成果孵化等方面开展建设,从而推动智能化转型。

3.1.1.2.建立将新技术用于业务创新的机制,并提供相应的资源支持

AI应用本质上具有实验性和创新性,因此也天然地会伴随着一定的不确定性和失败风险。为了实现AI应用的落地,企业需要首先建立鼓励创新,容忍失败的工作氛围,其次,建立业务创新机制,在内部密切关注AI技术的发展趋势,及时识别将AI技术用于业务创新的机会,以及不断强化组织内的AI开发能力,并推动应用的落地。

3.1.2给不同成熟度的企业的建议

初步投入阶段:企业在该阶段应明确当前需要开发的具体应用,并考虑采取怎样的方式实现落地。

多维布局阶段:企业在该阶段应首先在组织内广泛地鼓励创新,明确智能化转型短期的目标和路径。同时需要对中长期的目标有所考虑和规划。

深度应用阶段:企业在该阶段应建立完善的智能化转型中长期目标和规划,在组织内就智能化转型的方法、流程、创新机制达成了统一,并给予全方位支持。

案例A:某大型保险集团制定平台、应用、技术“三个领先”战略和“四个关键举措”推动智能化建设

某大型保险集团于2019年成立了集团科技中心大数据和人工智能部,由此开启了人工智能技术发展之路。该保险集团拟在人工智能建设方面实现“三个领先”的战略目标。一是领先的平台:持续打造涵盖NLP、语音、OCR、人脸识别、大数据应用子平台的集团统一人工智能技术平台,各项技术指标居于行业领先水平。二是领先的应用:聚焦客服、管理、销售三类机器人突破,机器人研究和应用水平居于行业领先水平。三是领先的技术:核心算法全部自研,关键技术和硬件具备国产化替代方案。在建设思路方面,为了实现“三个领先”的战略目标,该保险集团实施了如下关键举措:1)制定长期规划,营造创新氛围。集团制定了长期人工智能发展规划,和适合科技创新的项目管理机制,营造鼓励创新、容忍失败的工作氛围。2)钻研前沿技术,加快技术落地。密切跟踪人工智能技术的演进趋势,并适当开展前沿技术的研究,缩短前沿技术落地的周期;重点加强多模态AI应用落地的能力,加强大数据和AI深度协同的能力,加强研发人员对业务的理解。3)探索国产化替代方案,实现技术的提前储备和自主可控。探索PaddlePaddle等国产深度学习基础框架,验证国产GPU的实际性能,形成备用方案,确保极端情况下仍然可以开展人工智能的应用和研究。4)加快机器人突破工程成果孵化,探索研发通用机器人。利用机器人研发成果,进行销售和管理机器人嵌入式研发,重点突破人机混合运营下的机器学习;依托各类私域流量和公域流量,实现纯线上化的销售模式和销售管理模式;由小规模、人机协作向全覆盖、无人化演进,并探索研发通用机器人。

3.2数据层面

3.2.1方法论

3.2.1.1.重视数据治理与数据平台建设工作

良好的数据基础是支撑智能化转型的前提,针对数据孤岛、数据质量低、数据广度与深度不足、数据架构老旧等企业数据基础中的问题,企业需要重视数据治理与数据平台建设工作。

在数据治理方面,企业应该组织专门的数据治理工作,制定数据标准和数据治理体系,提高数据质量。如在案例1中,中新天津生态城在利用内部外数据,构建智慧城市产业大脑之前,首先成立专门的数据治理小组,开展相关工作以提高数据的质量。

在数据平台建设方面,企业需要构建统一的大数据平台或数据智能平台,打通各部门、各系统的数据,丰富数据的来源,提高数据的广度和深度。同时,设计面向AI应用的数据架构,方便AI应用开发和运营中对数据的调用。例如在案例7中,某银行为了构建智能消费者保护中台,其首先建设了全口径的投诉管理大数据平台,整合行内10多类异构多模态数据,以打破多业务部门、各区域、各系统数据壁垒。关于数据平台的详细构建方法可参考爱分析于2021年11月发布的《2021爱分析・数据智能平台实践报告》。

3.2.1.2.建立面向AI开发的数据采集、数据处理和数据管理等方面的标准化方法和自动化能力

为了高效地给AI开发提供匹配的数据,支撑AI应用的规模化落地,企业内部需要建立一套面向AI开发的自动化的数据采集、数据处理和数据管理的方法与能力。具体而言,可以在数据采集端如摄像头、传感器内置相应算法自动采集所需数据;采集的数据上传至云端或本地后,设置相应条件,自动触发数据标注任务,交由业务专家标注数据,在某些情况下还需要自动将新标注的数据与原先的数据集进行合并;当平台监测到新的数据版本后,再自动对模型进行训练,并对新的模型进行评估和上线。

例如在案例2中,上汽安吉物流在研发其视觉智能管理系统时,采用了这套标准化和自动化的从数据采集,到数据标注,到模型训练的流程和方法,支撑了平台功能高效和批量化地迭代更新。

3.2.2给不同成熟度的企业的建议

初步投入阶段:企业在该阶段应首先解决的数据基础较差的问题,因此需要积极开展数据治理工作,提高数据治理;并建立统一的数据平台,打破数据孤岛,丰富数据来源。

多维布局阶段:企业在该阶段应已经解决了数据基础较差的问题,同时对于AI开发和运营对数据的要求较明确,初步建立面向AI开发的数据采集、数据处理相关的标准化方法,并考虑如何提高整个流程的自动化能力。

深度应用阶段:企业在该阶段应建立起完善的数据治理机制,并常态化的执行,建立能够支撑AI应用的数据智能平台;同时,企业还应建立起面向AI开发的数据采集、数据处理和数据管理等方面的标准化方法和高度自动化的能力。

案例1:中新天津生态城构建智慧城市产业大脑,用AI挖掘数据价值

中新天津生态城(以下简称“生态城”)是中国与新加坡两国政府战略性合作开发的生态城市,于2008年9月开工建设,总规划面积为150平方公里,旨在打造产城融合、绿色发展、智慧城市、国际合作的示范区。为了构建智慧城市产业,生态城当前重点发展5G创新应用、大数据交易生态、传统产业融合创新应用三大交互应用产业,希望打造从数字生产资料挖掘、到智能产业研发孵化、再到龙头企业牵引的产业链。然而,生态城在产业发展中,其产业规划、招商引资、企业服务工作都面临着一些痛点问题,这些问题包括:产业规划与分析缺乏数据支撑。生态城在做产业规划时,没有每个产业链细分领域的信息和数据支撑;或者有总体数据,但缺乏产业深度分析能力。招商引资方式粗放、单薄。生态城在确定产业招商方向后,由于没有产业链信息,导致招商缺乏针对性的标的;或者有明确的招商标的,但对待招商企业进行评估时缺乏支撑数据和智能评估方法。产业扶持与企业服务缺乏主动能力。生态城在服务园区内的企业时,无法为企业准确匹配合适的扶持政策,也无法主动为企业提供全面、个性化服务。从根本上而言,上述问题都在于生态城在开展产业发展工作的过程中,缺乏以数据为支撑的产业分析工具。事实上,生态城经过多年发展,已经积累了大量的智慧城市公共数据,包括了区域经济运行、内部工商、财税、政策扶持等数据。与此同时,大量公开的数据,如企业工商、业务、专利、招投标、投融资、舆情、风险等数据也能够为生态城的产业发展规划所用。因此,生态城要解决产业规划、招商引资、企业服务工作中面临的问题,就需要首先借助一系列的工具和方法,从海量的结构化和非结构化数据中挖掘出有用的信息,并以体系化的形式呈现出来,为生态的产业规划和发展提供数据支撑和科学的指导。基于知识图谱、NLP等AI技术,构建智慧城市产业大脑解决方案针对上述挑战,中新天津生态城希望通过引入大数据和人工智能技术来构建解决方案。在对厂商的产品、技术和服务能力进行综合评估后,生态城选择与爱数合作共建解决方案。爱数成立于2006年,是一家大数据基础设施提供商,提供结构化数据、非结构化数据、机器数据、知识图谱数据等全域数据能力,为政府、公共事业及企业的数字化转型赋能,帮助各行各业的客户释放数据价值,实现即时、随时、实时的数据服务。爱数为中新天津生态城提供的智慧城市产业大脑解决方案,包含了一个产业知识网络、三个能力平台、N个应用模块的“1+3+N“架构,为智慧城市产业发展中的“产业-招商-服务”全环节提供数据服务。产业知识网络即底层的知识图谱数据湖,其将海量的外部网络数据和智能城市内部数据进行汇总,形成数据湖,为产业大脑提供能力底座。三个平台包括企业主动服务平台、经济运行分析平台和产业精准招商平台。通过三个平台连接政府与企业,为产业大脑提供应用基础。N个应用模块是将产业发展和智慧营商环境分为若干个应用模块,实现产业大脑的实用性和应用性。

图2:中新天津生态城智慧城市产业大脑架构图如前文所述,整个解决方案的核心在于如何从海量数据中提取出有用信息,并构建以产业链、企业图谱为中心的大规模知识网络。为了解决这一问题,爱数项目团队重点开展了如下工作:1)数据治理。生态城内外部大量数据的数据质量状况较低,因此爱数为该项目成立了数据治理小组,制定数据标准和数据治理体系,提高数据质量。2)知识抽取。在构建知识网络前,需要对数据尤其是大量非结构化数据中的知识进行抽取。对此,爱数使用其AnyDATA产品内置的语言模型,同时也为生态城定制了一些自然语言处理模型,比如产业政策、企业基础画像、招投标、投融资等模型,从数据中精准地抽取关键要素或属性。在此基础上,为这些属性设立匹配规则,从而构建知识间的关系。3)构建知识网络。爱数基于AnyDATA产品内置的知识图谱、决策树等技术为生态城构建产业知识网络。同时,提供AnyDATA意图理解、规则、推理、图计算等引擎,可以实现精准的知识搜索、关联分析和辅助决策。最终建成的知识网络主要包含如下类型:产业链图谱:以产品上下游、上下层为关系构建的5000多个产品价值链图谱,并与国民经济、战略新兴产业实现有机对接,可以实现对产业链精准分类和关联分析;企业图谱:基于工商、知识产权等公开数据,构建企业集团关系链、市场布局、产品业务链,实现企业链的精准定位和分析;产品竞争图谱:基于企业产品标签集相似度构建竞争网络,寻找细分领域隐形冠军;政策图谱与规则知识库:省市区多级政策要素自动抽取,形成分类、分级的政策要素与政策适用规则库,以便政策的自动精准匹配推荐;产业及经济运行预测分析:基于产业链、企业链及其他产业要素动态事件的可视化推理及关联分析预测;投融资雷达:基于投融资事件知识与企业链、产业链的匹配,实现焦点招商、以商招商(园区关联企业的投融资线索)。智慧城市产业大脑落地后的价值和效果智慧城市产业大脑在中新天津生态城的招商引资、产业经济、企业服务中产生显著的应用价值和效果。1)招商引资更加精准。产业大脑汇聚了生态内外部的工商、产业等数据,结合知识图谱技术,深度研究行业、企业业务,基于产品标签集相似度,可以寻找到同类企业,然后利用企业画像工具对企业实力进行评估,寻找行业隐形冠军,从而更加精准地进行招商引资。2)产业与经济运行状况了解更及时。产业大脑根据企业产业标签管理,了解生态城产业结构,生态城因此能够紧跟国家发展战略目标;同时,通过多维度分析,生态城可以了解各产业发展情况,掌握产业增长与下降趋势,以及影响产业发展走势的主要企业;并收集宏观经济与区域经济数据,并进行对比,掌握经济发展差距,为宏观调控提供支持。3)企业服务更主动。借助产业大脑,生态城可以从从企业入驻起对企业进行全生命周期管理。对标同行上市企业画像,判断企业发展方向、可能遇到的问题,进行主动培育服务。同时,基于政策试算器,向政策管理用户提供政策匹配企业列表、企业兑现情况清单。智慧城市产业大脑项目经验总结对于企业和政府部门而言,其在业务发展过程中会积累大量的文档和内容数据,这些数据中存在着大量有价值的信息,通过构建知识网络整合这些数据,能够为企业和政府部门的管理、业务发展提供有效的决策支撑。而从数据中挖掘价值,需要借助一系列方法和人工智能技术:首先要收集好各类型的内外部数据,并做好数据治理工作;然后借助NLP技术从数据中精准地抽取知识,建立知识间的关系,并且在此过程中,需要适当根据具体业务需求定制开发NLP模型。最后在此基础上构建知识网络,并利用规则、推理、图计算等引擎从知识网络中获取有效信息。

案例2:AI数据管理平台助力上汽安吉物流批量化迭代AI模型,让物流管理更智慧

安吉智能是上汽安吉物流旗下专注于智能物流解决方案的服务商,服务于上汽安吉物流内部的同时,也向汽车制造、机械电子、医药、冷链、日化、服装等行业企业提供相关技术服务。物流行业向来注重安全管理工作。以上汽安吉物流为例,其业务范围涵盖汽车零部件、整车、港口、快运四个物流业务板块,包括上汽、特斯拉等主要汽车公司的整车仓储与进出口业务,其在全国范围内管理10个港口、300多个网点、5万多名员工。为了保障如此庞大的物流系统能够安全有序地运转,上汽安吉物流每年花费上亿元用于雇佣安保人员。但随着业务规模的增长,过度依赖人力的传统安全管理模式已经无法满足其发展需求。针对物流行业安全管理中的痛点问题,安吉智能自主研发了“安眸智能视觉管理系统”,利用计算机视觉技术对港口、园区、仓库等物流业务场景中的核心元素“人员、货物、设备”进行识别和分析,并对出现的违反安全管理规范的问题及时提醒和采取相应措施,主动化解潜在危险。以仓库场景为例,安眸系统能够对仓库内的叉车超速、禁区出现人员、员工危险动作、着装不规范等行为作出精准识别,并进行管理。由于计算机视觉模型通常只能对预先训练过的场景和物体进行识别,为了满足上汽安吉物流管理的10个港口、300多个网点,以及其对外服务的200多个客户不断提出的各异的功能需求,在安眸系统中不断上线新的识别功能,安吉智能的研发团队就需要不断获取新的样本数据,并在不改变边缘算力的前提下,对AI模型进行不断的更新和运维。因此,安吉智能需要解决AI模型频繁迭代过程中的多个工程化难题。例如,针对迁移学习时模型会产生旧数据遗忘的问题,安吉智能已经通过自研知识蒸馏、混合学习等技术让模型在学习新的数据特征后获得新的识别能力的同时,也保留原先的识别能力。但安吉智能仍然需要应对以下两点主要的问题:1)缺少能对非结构化数据进行精细管理的工具。安吉智能有大的图像数据集,但每个网点或客户提出新的功能需求时,其提供的图像数据的采集时间、采集目标、标注类别等信息都不一致,安吉智能需要将这些数据增补进原先的数据集中,记录数据集的层次结构,并形成不同的数据版本,从而用于模型误差分析和模型反复迭代。然而之前基于文件夹的手动管理方式,不仅很难追踪过去版本的模型和数据集的对应关系,在上百甚至更多个网点和客户都提出需求时,其数据版本就很难以文件夹的形式进行管理。2)算法团队需要深度介入数据处理工作,手动执行效率较低。由于模型开发中数据的收集、标注,以及模型训练等流程存在大量需要算法团队介入的数据处理工作,安吉智能需要依靠算法开发人员对数据处理工作进行层层把控,手动执行各种操作。当模型的迭代更新变得非常频繁时,算法和数据团队的深度绑定会使得模型迭代流程非常耗时耗力,甚至无法完成。依托非结构化数据平台,保障模型迭代中的高质量数据供给和流程自动化面对模型频繁迭代,以及由此带来的大幅增长的数据管理需求,安吉智能选择与格物钛智能科技进行合作,将格物钛的AI数据管理平台作为安眸系统研发中的AI基础设施组件之一,以解决其痛点需求。格物钛智能科技是一家人工智能基础设施提供商,其核心产品非结构化数据管理平台向各类创新企业及团队提供AI数据管理解决方案,以数据引擎为核心技术,解决非结构化数据的发现、管理、利用等难题,实现对海量复杂数据的灵活存取用,从而推动企业的数据资产化和AI工程化落地。针对非结构化数据集管理中的难题,格物钛为安吉智能提供了如下解决方案:第一,在云端对数据进行统一托管。安吉智能各个网点的数据都存储在云端,格物钛的数据平台全面托管了安吉智能的原始数据、标注数据和元信息。在平台的权限管理功能保障数据访问安全的前提下,安吉智能的团队可以在平台上方便地访问数据和进行团队协作。第二,数据版本可追溯。安吉智能每月或每周会在数据集内新增图片和物品类数据,通过格物钛数据平台,安吉智能在新增的数据上做标注,然后合并进原有数据集,并打上标签,从而形成新的标准化的数据集版本。算法工程师只需要根据标签就能找到需要的数据集版本,并比较各个数据集之间的差异。第三,数据集分布特征可视化。格物钛数据平台的可视化组件能让算法工程师从宏观层面查看数据集的特征分布,以及从微观层面查看单个文件和标注数据。安吉智能的算法工程师因此能够在模型训练前直接查看数据标注信息,也可以在模型训练后将预测结果作为一个数据版本,与人工标注的数据版本进行比较,从而判断模型效果和数据标注质量。针对算法和数据团队的深度绑定,手动执行数据处理工作效率低的问题,安吉智能通过使用格物钛数据平台的Action功能,并结合了一些自研算法,对数据收集、数据标注、模型训练等关键流程设置任务自动触发机制,并让整个流程实现自动化。在数据收集阶段,安吉智能通过自研图像相似度和质量分析的算法,当发现符合要求的图像后自动在摄像头中进行抽帧并将图像上传至云端;在数据标注阶段,通过使用格物钛数据平台,当符合需要的图片数据达到一定量级后,平台自动触发数据标注任务,然后通过签约的数据标注公司在平台上对数据进行标注,再与原先的数据集进行合并。在模型训练阶段,当平台监测到数据标注完成形成新的数据版本后,会自动先进行模型训练,然后对更新后的模型的预测结果进行评估,识别预测效果不好的图片,并在平台上对数据标注实时地进行调整。

图3:安吉智能AI模型开发关键流程非结构化数据平台给安吉智能带来的价值和效果首先,格物钛非结构化数据平台为安吉智能实现了模型开发中的高质量数据供给。借助平台的云端托管、版本管理、数据集分布可视化等功能,安吉智能解决了模型迭代中的多种数据痛点,减少了数据收集、数据准备和模型评估中大量手工操作,让算法工程师可以专注于用AI模型去解决业务问题,模型精度能因此能提高30%以上。其次,平台的自动化能力大幅缩短了安吉智能模型迭代的周期,节约单模型训练的人工成本。安吉智能预期因此可以实现每周对模型进行一次迭代更新,从而上线新的识别功能,最终全年能上线50个识别功能,并且单次模型训练能节约25%的成本。安吉智能AI模型开发和迭代经验总结以AI应用的复杂性,其在产业中落地的一大瓶颈通常在于数据的质量和匹配度。对于大部分传统企业而言,其数据量有限,研发能力也相对不足,如果把AI应用开发的重心放在改进算法上,效果往往并不如意。因此,传统企业在AI应用开发中应该把重点放在获得质量更好、匹配度更高的数据上,帮助提高模型效果,让AI应用更好地落地。企业在AI模型开发或迭代频次较低时,其数据管理可以通过文件夹形式手动管理,但随着AI应用的加速落地,企业每年需要开发几十甚至更多个模型的时候,手动管理的方式将难以为继。此时企业应该选择标准化的工具对模型开发中需要的数据进行高效地管理,从而保障模型的持续迭代和更新。同时考虑在流程中引入自动化能力,进一步缩短模型迭代周期。

3.3场景规划层面

3.3.1方法论

3.3.1.1.确定场景规划的流程和方法

通常,企业在确定和规划AI应用的落地场景时有业务需求导向和资金投入导向两种方式。

对于需要快速推进智能化转型,追求AI落地的时间和成本效益的企业,可以考虑业务需求导向的方式。具体而言,企业可以首先由专门的协调管理部门或技术部门联合各业务部门确认业务需求较强的应用场景,而业务需求强的判断标准包括了人员投入大、重复性劳动多、人工操作效率不高或效果不理想等;其次,需要考虑开发该应用所需的数据是否容易获取,如果内部数据不充分,可以考虑是否能从外部厂商引入相应的数据;最后,需要业内已经有针对该应用场景的较成熟的解决方案,降低开发新应用的时间和资金成本。

在上述判断的基础上,企业可以将强业务需求、所需数据能够获取、有较成熟解决方案的场景规划为需要实现AI落地的场景。例如案例3中的美宜佳和案例8中的海信集团都采用该种方式规划和落地AI应用的场景,其中,美宜佳前期根据业务需求确认了门店选址、门店运营和营销优化三类应用场景,并从外部引入了实现这些AI应用所需的时空数据,以及这些领域成熟的AI模型和应用解决方案。

对于需要持续做深智能化转型,且资金和研发实力较强的企业,可以考虑资金投入导向的方式。具体而言,企业可以由专门的协调管理部门或技术部门协同业务部门或相关管理部门确认费用支持较大的业务场景:其次,需要考虑开发该应用所需的数据是否充分和是否容易获取;最后,需要判断在该业务场景中是否能用算法找到数据中的规律,或者是否能用相关AI技术解决解决这一问题。

在上述判断的基础上,企业可以将费用支出大、所需数据能够获取、且能用算法或相关AI技术解决的业务问题规划为需要实现AI落地的场景。例如案例C中,某全球头部日用消费品公司在华公司由其数据科学与人工智能团队对品牌建设、销售管理中费用支出较高的业务场景进行筛选,结合数据和算法能力,最终在媒体规划、广告定位、会员活动设计、促销优化、供应链管理等场景中落地了多个AI应用。

3.3.1.2.定位高价值度应用场景

对于任何类型的企业而言,其在实施智能化转型时都需要考虑AI应用场景落地的先后顺序,集中资源在高价值度场景中优先构建AI应用,因此需要对应用场景的价值度做排序,并对单个AI场景的ROI做事前预估和事后评估。

关于应用场景的价值度,一般从高到低可以分为三类。第一类是能够对业务模式或业务流程进行创新,从而为客户提供创新性的产品或服务的应用场景,这类应用场景价值度通常最高。例如在案例B中,江南农商银行将虚拟数字人嵌入多个业务系统中,从而能够在无人场景中为客户提供多种业务咨询和业务办理;在案例6中,在先进的AI算法的支撑下,安克创新利用AR虚拟试戴解决方案,为其用户提供真实度非常高的线上眼镜试戴功能,不仅为用户提供了创新性的体验方式,也大幅提升了购买转化率;第二类是能够为企业大幅提高运营效率和降低成本的应用场景,通常该应用可以为企业带来数倍甚至更多地运营效率的提升或成本的降低。例如在案例4中,某餐饮连锁企业用计算机视觉对饺子品质做检测,完全代替了原先用大量人工去抽查的方式,为企业大幅提高了运营效率和节约了成本;第三类是能够一定程度提升运营效率和降低成本的应用场景,通常其对运营效率的升和成本的降低在100%以内,这类应用场景可以在企业资源充足的情况下去考虑智能化。

关于ROI的评估,企业主要需要关注在特定业务场景中,投入某项AI应用前后,在该场景中企业的费用成本是否有降低,以及降低的比例。除了在事后评估ROI,事先也可以借助可参考的案例对ROI做预估,确定场景的价值度。例如,在供应链管理中,企业可以评估引入AI应用前后,供应链相关成本是否有得到优化。

3.3.2给不同成熟度的企业的建议

初步投入阶段:该阶段的企业应主要参考高价值度应用场景定位的方法,优先选取价值度最高,且较容易落地的场景去落地。

多维布局阶段:该阶段的企业应先在多个主要的业务部门落地价值度较高的场景,同时要探索并初步建立场景落地的流程和方法。

深度应用阶段:该阶段的企业应建立并常态化执行场景落地的流程和方法,并且做好计划,每年在各主要部门批量化落地一定数量的场景。

案例3:美宜佳打造商业智能决策管理平台,实现线下零售的智能化运营美宜佳控股有限公司是国内第二大连锁便利店集团。自成立以来,美宜佳以广东为中心,并逐步在全国范围进行业务布局。目前,集团拥有美宜佳品牌门店两万多家,每日门店总客流量达2500多万。线下零售的核心逻辑是以“场”为中心去对接“人”和“货”,而“人货场”各自的特征要素以及它们之间的关系都在不同程度上影响着门店经营策略和结果。对于正加快在华东、华北等地区扩张门店的美宜佳而言,经过早期信息化建设,其已建有ERP、PIM、BI等业务系统,在内部积累了较丰富的“人货场”数据。现阶段,美宜佳希望用智能化的方法对人、货、场的特征要素及其关联进行分析和优化,支撑门店的稳步扩张和精细化运营。结合业务需求、智能化可行性等因素,美宜佳决定在门店选址、门店运营、营销优化三类重要场景中引入智能化解决方案。在门店选址方面,美宜佳需要用智能化的方法在城市中确定合适的拓店区域、该区域消费者习惯以及自身定位等情况;在门店运营方面,具体包含门店评估、品店匹配、销量预测、竞品分析等应用场景,帮助美宜佳更好的制定经营策略、提高门店业绩;在营销优化方面,则需要结合人群定向,对广告投放策略做优化。为了在上述场景中实现智能化决策,美宜佳决定打造商业智能决策管理平台。但美宜佳在相关数据的完备性、以及AI算法能力上存在不足,具体如下:1)数据层面,美宜佳仅掌握店内经营数据和自有供应链体系的后端数据,但缺乏外部的地理位置、周边人群、周边竞品相关的数据。同时,在与外部厂商共同探索解决方案时,美宜佳需要分享内部数据时保证其数据的隐私和安全。2)AI算法层面,选址、选品、消费者画像、营销的智能化分析需要大量AI模型支撑来实现,美宜佳需要外部厂商提供相关的AI模型,并用模型解决业务问题。此外,不同地区的数据分布会有较大区别,通用的模型很多时候不能直接适用,需要根据区域、环境等因素对模型做调整和迁移。以时空数据为基础,AI模型为支撑,美宜佳为门店经营各环节提供智能化决策在对厂商的数据、AI算法、应用解决方案等方面的能力进行评估后,美宜佳选择与维智科技合作,建设商业智能决策管理平台。维智科技是一家时空人工智能平台提供商,专注于线下场景的数字化和线上线下的时空融合,通过时空AI技术打造数字孪生体,为城市、交通、金融、地产、零售和品牌等提供精细化场景服务和智能解决方案。基于维智Phy-gital飞吉特时空智能平台,美宜佳构建了商业智能决策管理平台,其架构上分三层:底层是联合数据仓库,包含维智科技提供的时空数据和美宜佳提供的门店数据;中间是技术服务层,包括AI模型、时空知识图谱、业务计算逻辑等;上层是各类分析应用,包括门店选址评分、门店绩效评级、归因分析、人群画像、销量预测、价格预测、竞品分析等。

图4:美宜佳商业智能决策管理平台架构针对数据层面的问题,平台通过联合数仓的形式整合了维智科技的营销智能基础数据与美宜佳的门店数据。维智科技的营销智能基础数据包含客流、画像、人群流动偏好、周边生态、交通情况、商业环境、竞合关系等类别的数据,具体包括了路网、交通、AOI(区块),POI(点位)等静态数据,以及测绘相关的人流、画像、场景、企业、经济等动态数据。在此基础上,通过梳理“人、货、场”之间的特征管理,形成时空知识图谱。为了保护美宜佳的数据隐私,维智科技将其时空数据、模型服务与美宜佳的内部数据结合,以一体机的形式部署在美宜佳的受限环境中,模型的构建、训练、管理和发布均在一体机完成,确保美宜佳的数据不出库。

图5:商业智能决策管理平台预训练模型仓库逻辑针对AI算法层面的问题,平台基于分类、排序、聚类、异常发现、回归预测、溯因推理分析等技术模型,结合特征工程、自动特征计算等服务,形成画像、选址、选品、营销等方面的预测分析模型。同时,对于通用模型需要针对区域数据特征有变化进行适配的问题,维智科技通过匹配可适配的用例或特征来做模型迁移,并通过数据增强或者小样本学习来解决数据量少和样本稀疏的问题。商业智能决策管理平台落地的价值与效果美宜佳落地商业智能决策管理平台,用数据智能赋能门店开拓与运营,实现了以下业务价值。1)门店选址方面,平台为美宜佳在广东、以及华东地区选址拓店,提供了数据支持和智能化的决策依据。具体而言,通过分析当前地区用户的习惯、常驻和流动人员的习惯、场本身的特性(是周边是医院、社区、商业中心等)、周边竞争态势(供需饱和度)、交通便利性等数据,判断某个地点是否适合开店,并给出关于在该地店的评分,以及影响评分的因子。这比传统的依靠调研和专家经验的方式大幅提高了决策效率和准确率,可以支持美宜佳每年3000家门店的开店合关店决策。2)门店运营方面,该平台有效帮助美宜佳品牌门店和加盟门店总计4w+门店,进行数字化智能化运营。在门店评级、销售预测、归因分析、运营优化和营销优化等方面,提供线下大数据和智能预测结果辅助决策,有效指导门店运营优化。商业智能决策管理平台的项目经验总结第一,线下零售业涉及的数据量大、维度多、动态更新也相对频繁,在选址选品、供应链配货以及营销等业务中需要依据这些数据做出相对实时的决策,因此复杂度和难度很大。但零售数据核心上还是围绕人货场及其关联,面对复杂的数据场景,可以考虑运用知识图谱技术,将各维度数据按人、货、场梳理,再形成场与场、人与场、货与场的关联;同时考虑运用AI模型来刻画复杂的变化规律、分析思路和决策经验。第二,只有店内数据无法在线下零售场景中实现智能化,因此还需要引入店外的时空数据,将地理位置、周边人群、周边竞品等外部数据与内部数据结合,才能实现1+1>2的效果。并且,在将内外部数据进行结合时,需要考虑通过相应的技术或产品设计方式保障数据的隐私安全。

案例B:虚拟数字人助力江南农商银行为客户提供创新性的远程视频柜员服务

在银行业积极探索更丰富、更精细化的客户服务方式,消费者对银行服务的效率和便捷性也有了更明确的需求,以及疫情常态化对银行远程服务能力要求更高等因素的推动下,江南农商银行于2021年12月与京东科技合作推出的国内首个业务办理类数字人“言犀VTM数字员工”。区别于以往咨询问答式机器人,VTM数字员工的创新之处在于,其采用拟人化的形象与用户进行对话交互,为用户提供了良好的沉浸式体验;同时,VTM数字员工与江南农商行的业务系统深度耦合,从而支持VTM数字员工从业务系统中调用数据支撑用户问答与交互,并代替业务人员在各类交易场景中帮用户闭环完成咨询、查询、导览,以及取款、开户、密码重置等业务。而支撑虚拟数字人与银行的业务交易场景打通,为银行实现创新性业务模式的是京东科技在NLP、TTS、ASR、虚拟形象、图像识别等多种自研AI技术上深厚的积累,通过将这些AI技术有机结合,VTM数字员工具备了音唇精准同步、表情丰富逼真、交互流畅自然等高度拟人化的特征,以及高准确率的语音语义识别能力,并能精准识别数字连读和方言,也为适老化能力的建设和乡村金融服务的街乡级渗透提供新路径。VTM数字员工的投入使用,不仅大幅提升了江南农商银行远程银行的接待能力与服务效率,降低了运营成本,还勾勒出银行服务的未来发展的新形态:即通过运用人工智能等先进科技,银行可以构建无人场景下的服务能力,重塑服务模式与体验,为客户提供更便捷的服务。这将成为未来银行业甚至整个服务产业的发展趋势,具备大规模推广的潜力。

案例C:某全球头部日用消费品公司在华公司以费用支出为导向规划AI应用场景

某全球头部日用消费品公司在华公司为保持其市场领先地位,需要在品牌建设、销售管理优化等方面实现全面的智能化。因此,其数据科学与人工智能团队采用了资金投入导向的方式对AI应用进行了规划。具体而言,该团队筛选应用场景的标准有三个:第一,优先考虑费用支持较大的场景;第二,重点考虑数据层面的问题,包括数据的充足度、数据获取的难易程度、数据的有效度;第三,能够用算法从数据中找到规律,从而解决该业务问题。基于上述方法,该公司如下五类方向落地了多个AI应用,显著降低了公司的费用支出。第一,媒体规划,即将媒体预算以最优的方式分配投入给不同的媒体形式,如视频、站内、电视、户外广告等。第二,精准广告定位,即把广告投向更精准、更有可能产生购买行为的用户。第三,会员活动设计,即针对会员的过往的表现设计合理的会员活动。第四,促销优化,即根据历史数据来优化未来促销活动的规划,减少促销费用的投入。第五,供应链管理,包括仓库的分布、送货路线的规划、库存的管理等。

3.4应用解决方案开发层面

3.4.1方法论

3.4.1.1.明确自研和引入外部能力的条件

对于处于早期投入阶段,尚无AI应用构建能力和经验的企业而言,企业构建AI应用应该主要考虑外采。

对于处于多维布局或者成熟度更高阶段的企业,其已经具备了一定技术能力、专业人员和AI应用开发经验,此时企业构建AI应用应该以自研为主。但是当企业在构建AI应用时,面临以下一个或多个问题时,需要考虑和外部厂商合作联合开发或者完全外采解决方案。这些问题包括:(1)应用解决方案复杂度较高,需要多种底层AI技术的支撑,自研难度大、成本高、时间长;(2)企业内部缺乏应用开发所需的数据;(3)企业自身不具备特定应用场景的业务知识或AI应用开发实践经验。

例如在案例9中,某集团科技公司由于在搭建供应链管理相关的AI应用时面临智能调度、仓配算法开发难度大,搭建智能营销应用时缺乏市场客户数据,搭建园区安全时缺乏实践经验,便选择与京东云合作在这些领域联合开发AI应用。

3.4.1.2.在AI开发团队中引入业务专家,提供业务知识方面的专业指导

AI应用最终需要解决的是业务的问题,而精通技术的算法工程师或数据科学家往往对业务问题缺少了解,因此在AI应用开发中,AI开发团队需要寻求业务专家的帮助和指导。

在开发应用解决方案之前,要协调内部资源,对精通业务的人员进行深入调研,针对具体场景梳理业务流程,理清每个环节的业务需求。如在案例5中,中宏保险在搭建营销员智能助理解决方案之前,首先对保险营销员的需求进行了充分调研,了解营销员需要询问哪些保险知识,对知识的呈现有哪些要求,在问法上有哪些独到的习惯等问题。

在开发应用解决方案过程中,企业需要业务专家协助,确定业务的标准。具体而言,包括了在计算机视觉相关的应用开发中,由业务专家帮助确定图像的分类、图像是否符合要求的标准;在自然语言处理相关的应用开发中,由业务专家对词性、词语分割、情感等进行标注,提高语义理解的准确度。例如在案例4中,某餐饮连锁企业为了在饺子质检应用中确定饺子是否合格的标准,便由其业务专家与开发人员一起确定了饺子“白鼓”、“偏皮”等维度判断标准,并在图片中做相应的标记用于模型训练。

3.4.1.3.依靠经验丰富的AI开发人员将业务问题转化为算法可解决的问题

企业在探索性的AI应用开发中经常会受困于如何将业务问题转化为算法可解决的问题,通常这类问题的只能借助精通技术的同时能对业务也非常了解的数据科学家或算法工程师来解决。比如,需要经验丰富的数据科学家或算法工程师能够判断某个业务问题是属于分类问题,还是回归问题;特征工程的特征和目标是否有因果关系等。在此基础上,企业在具体执行中,还可以进一步参考案例4中明略科技在帮某餐饮连锁企业开发饺子质检解决方案时的做法,即通过多种可能的业务标准标注多个数据集,再对照多个算法不断测试,最终得出效果较好的模型。

3.4.1.4.提高小数据集的数据质量以支撑AI应用开发

传统企业在开发AI应用时,通常会面临样本数据量较小的问题,比如,制造企业想开发针对某个零部件的智能质检应用,其样本数据可能不足100个,或者医疗机构想要构建一个罕见病的疾病预测模型,其样本数据可能只有几十个。此时,企业一种方式是可以考虑采用较前沿的小样本学习技术开发此类AI应用,另一种方式是提高样本数据的数据质量,不仅是前期做数据采集时要考虑通过用一些定制化的方法让采集到的样本数据与需求尽量高度匹配,同时也要借助业务专家提高数据标注的准确度,从而能够以较小的样本数据集开发出AI模型。

3.4.1.5.采取先以最少的数据让AI应用可用即上线,后续再维护更新的策略

为了让AI应用能早日上线发挥价值,企业可以在开发AI模型或AI系统时先用最少的数据量去训练模型或系统使其达到初步可用的状态即在业务中部署,后续在运营过程中再针对新收集的数据,对模型进行增量学习,或对系统进行更新,从而使AI应用更加聪明,功能更完善。例如在案例5中宏保险智能助理案例中,由于保险行业知识体系庞杂,为了让智能助理能够早日上线发挥价值,中宏保险采取了在知识库中先加入营销员最关心的问题,后续再利用平台的AI自学习能力从新的数据中学习新的知识,并逐渐丰富知识库的策略。

3.4.1.6.综合考虑算力、带宽等需求,设计合理的“云边端”协同部署方式

针对在业务系统中部署AI应用会面临各种场景化适配的问题,如果应用解决方案对计算实时性、数据安全的要求都不高,数据量相对有限,以及追求更低的计算成本,可以主要考虑在边缘端通过算法控制采集所需数据,在云端部署解决方案的方式。例如在案例4某餐饮连锁企业的饺子质检解决方案中,其在摄像头中内置过线检测算法采集到每一盘经过出餐口的水饺图片数据,这些图片数据的数据量相对有限,对带宽、存储和计算要求都不高,然后将图片数据上传至云端,通过定制的质检算法判断饺子的品质。

而如果解决方案需要实时生效,且数据量大,上传云端对带宽、存储和计算资源要求都很高时,企业需要考虑将解决方案部署在边缘或设备端,同时要对算法和SDK包体积的大小以及边缘或设备端的算力资源进行优化,以保证算法能够在边缘或设备端有效运行,并产生实时的计算结果。例如在案例6中,火山引擎在其AR虚拟试穿试戴解决方案中内置了3D关键点识别、惯性检测、人脸属性等多种AI算法,以保障用户的试戴体验的真实性,而为了让这些算法能够在移动终端运行和实时生效,火山引擎在保证模型精度不降低的前提下,对模型大小进行了压缩,对移动终端的算力资源也做了相应优化。

3.4.2给不同成熟度的企业的建议

初步投入阶段:由于企业自身研发实力暂时有限,建议主要考虑跟有成熟解决方案的厂商合作,构建相关应用。同时,企业需要对上述问题,如协调业务人员参与、开发部署中的重点问题有知晓,在过程中给予应用开发项目组资源支持。

多维布局阶段:明确企业自身的能力和资源,对应用是否自研、合作开发、外采,设立明确的标准;重视内部业务专家对应用开发的作用,建立业务和技术人员的协作机制;参照上述方法,加快应用开发到部署的效率。

深度应用阶段:建立较完善的自研能力,尤其重视技术人才队伍和技术基础设施的建设;在应用开发团队中常态化地引入业务专家资源,由统一的部门进行协调管理;建立标准的解决方案开发、部署和后续运营的方法和流程。

案例4:依托计算机视觉技术,某餐饮连锁企业为饺子品控安上智慧之“眼”

某餐饮连锁企业是国内知名的水饺餐饮连锁公司,总部管理机构设于辽宁大连。目前,该餐饮企业在全国40多个城市拥有700多家连锁门店,员工8000多人。发展至今,该餐饮企业所有门店都为直营,为的是能够控制水饺出品的品质。而当该餐饮企业在往南方扩展后,由于南方鲜有吃饺子的饮食习惯,出现了南方门店的饺子品质和北方门店有较明显差距的状况。为了严格统一不同地域门店出品的水饺的质量,该餐饮企业最初采取了神秘访客的方式对门店进行抽查。但由于其门店众多,该餐饮企业只能不断加大神秘访客的抽查密度,最终付出了高昂的时间和人力成本,但收效并未达到预期。在此背景下,该餐饮企业决定引入数字化技术对水饺品质进行管理。具体而言,该餐饮企业希望对每一份经过出餐口的饺子都进行拍照,并利用计算机视觉技术对饺子图像进行分析,判断和管理水饺的品质。然而,不同于常规的工业质检,“饺子质检”是一个创新性的应用场景,业内尚无成熟的解决方案。要产生实际的效果,就需要重点解决以下问题:1)稳定地获取高质量的饺子图像。通常,饺子在被服务员端到顾客餐桌之前,会被统一放置在出餐口下停留1秒左右。因此,摄像头需要在1秒钟内完成高清装盘饺子照片的抓拍,同时要克服出餐口下方空间狭小、光线不足,以及饺子热气蒸腾模糊镜头等困难。2)将业务问题转换成算法可以执行的客观任务。视觉检测通常用到的是目标检测算法,包括了位置检测以及对检测内容的分类。饺子质检场景中要对检测内容进行分类,就需要首先确定饺子好坏的客观标准,通过数据标注,让算法能依据这个标准去学习对饺子的分类。然而饺子好坏的标准包含了很多行业知识,且其描述通常非常主观和抽象,难以统一。3)样本数据要覆盖尽量全面的情形,并兼顾控制冷启动成本。在该饺子质检场景中,由于场景很固定,训练模型所需的数据量未必要很大,但样本数据要覆盖尽量全面的情形,以保证模型能够识别各种特殊情况。同时,初期要用少量的数据让模型可用,尽快上线,后续再对模型进行优化。

打造集定制相机、云端视觉识别、品质管理系统的整体解决方案

基于对明略科技数字化技术和服务能力的认可,该餐饮企业选择与明略科技合作,为其定制开发“饺子质检”解决方案。明略科技是一家企业级数据分析和组织智能服务提供商,为政府、金融、零售、工业等行业企业提供基于大数据和人工智能技术的产品与解决方案。经过和该餐饮企业的深度沟通,明略科技智能硬件和深度学习算法团队为其定制了一套端云协同的综合解决方案,在出餐口下安装定制相机,通过这一边缘设备获取饺子的实时图片数据,上传至云端对图片进行深度学习算法的识别分析,对每盘出餐的饺子给出优秀、合格、不合格的评级,最后在品质管理系统中生成统计分析报告,供管理者及时全面地掌握出品情况。为了稳定地获取高质量的饺子图像,明略科技项目组为该解决方案定制了摄像头。镜头、补光灯等都做了个性化的定制,从硬件上解决出餐口下方空间狭小、光线不足,以及热气蒸腾模糊镜头等问题。同时,摄像头内置了过线检测算法,当区域内有物体移动,且移动区域超过一定界限,摄像头会快速抓拍物体,从而获得清晰的饺子图像。为了确定判断饺子好坏的客观标准,明略科技项目组与该餐饮企业的业务专家合作,分批引入了外观上的白鼓、偏皮、饱管,以及摆放上的是否顺等判断饺子品质好坏的维度。而其中每一个维度的判断标准,例如白鼓,项目组排除了图像的角度、光线、饺子馅等干扰因素,筛选出了多个相对客观的白鼓标准,让不同的人标注同一批数据,结果能够统一,并依次用不同算法测试这些标准是否能区分饺子好坏,最终确定了分类方法和所用的模型。针对样本数据量以及冷启动成本的问题。项目组在前期主要考虑了样本数据能够覆盖更多的情形。比如,样本数据尽可能包含多几种出餐口拍的饺子,光线也有更多变化等。而由于该场景比较固定,样本数据量选择在上百左右,这样可以用最少量的数据标注就能让模型达到可用状态,上线达到初步效果后,再用一定时间收集长尾情况的数据并优化模型,从而降低了冷启动的成本。

饺子质检落地后的价值与效果

第一,通过饺子质检解决方案,该餐饮企业的管理人员能够在管理系统中查看实时生成的饺子品质统计分析报告,了解每家店每天甚至每个时间段的饺子的品质情况,具体到合格与不合格的饺子的数量,从而提高了该餐饮企业对饺子品质管理的效率。第二,该方案目前已在该餐饮企业大部分门店推广使用,有效识别了水饺饱满、摆盘等问题,识别准确率在90%以上,其门店的菜品优秀率因此提高了20%。

饺子质检项目经验总结

用计算机视觉技术感知现实世界中各种情形,并将其数字化,为企业解决各种业务问题提供了有效的技术手段。随着人工智能在产业中的加速落地,计算机视觉也将被应用在更广泛的场景中,甚至无所不在。而在用计算机视觉技术解决具体的业务问题时,企业要重点考虑数据、算法和冷启动成本三方面的问题:1)数据方面的问题主要涉及数据采集和数据标注。在数据采集阶段,由于视觉场景通常差别很大,因此图像数据的采集往往需要针对特定场景定制相应的相机以确保图像数据采集的效果,并且要保证采集的数据包含尽量全面的情形。而在数据标注阶段,企业首先借助业务专家的经验,确认统一的标准,确保不同的人标注结果能够一致,并且算法能够识别和区分这些标准。2)对于算法的选择,企业可以结合标注数据的各种标准,选择不同算法多做测试,根据测试结果选择有效的标准的同时,也确认效果更优的算法。3)初期为了降低冷启动成本,企业可以用少量数据让模型达到可用状态即上线,后续再收集更多长尾情况的数据,对模型进行更新和优化。

案例5:中宏保险构建营销员智能助理,通过保险知识的共享和复用赋能销售

中宏人寿保险有限公司(以下简称“中宏保险”)是国内首家中外合资人寿保险公司,由加拿大宏利旗下的宏利人寿保险(国际)有限公司和中国中化核心成员——中化集团财务有限责任公司合资组建于1996年11月,现已拥有逾2000名员工和17000名营销员,为240万客户提供金融保险服务。保险产品作为专业的金融产品,客户对其通常缺乏了解,这导致在选购保险产品时,客户需要考虑很多需求和因素,整个决策周期也很长。因此,保险行业为了提高业绩,就需要保险营销员能够向客户持续输出产品、条款规则、政策等专业知识,基于复杂信息,以最快的方式有效处理客户的实际问题,展示出专业性和解决问题的能力,才能将潜在客户最终转变成为现实客户。多年来,中宏保险一直注重对营销员的咨询支持和培训管理工作,然而随着其业务范围的扩展,营销员的咨询支持和培训管理工作变得越来越来繁重,消耗了大量内部资源,并且实际效果也不够理想。一方面,中宏保险营销员原先主要依赖向主管领导和营业网点服务台的工作人员咨询关于保险产品的问题,然而这些问题有约50%都是较常见的问题,对常见问题重复的询问不仅消耗了主管大量的时间,也占用了营业网点宝贵的客户服务资源。另一方面,保险业的营销员人员更替较频繁,新的营销员入职后也需要对一些常见问题进行询问和学习,人员不停地轮转也进一步增加了内部培训的压力。基于上述原因,中宏保险希望利用自然语言处理、知识库、对话机器人等技术,打造一个线上的保险营销员智能助理,用于解答营销员的常见问题,并具备对新员工的培训能力。中宏保险对于营销员智能助理解决方案有如下两点最重要的要求:1)保险行业涵盖的知识体系很庞杂,不同的专业知识有11大类,因此在构建智能助理的知识库时,需要尽量全面地覆盖营销员会咨询和学习的知识类型,并且知识库上线后也要方便持续地维护更新;2)准确理解营销员的问题是给出正确答案的前提,因此需要对话机器人内置丰富的AI能力模块,使其具备出色的自然语义理解能力,能够与营销员进行流畅对话。同时,需要底层的机器学习平台具备良好的扩展能力,让普通业务人员也能以可视化的方式对特定业务场景进行算法模型的调优调参,以达到更高的语义理解准确度。

打造以智能知识库为核心,智能交互为途径的营销员智能助理解决方案在对多家厂商的语音语义、知识管理产品,以及建设和运维方案做了较长时间的评估后,中宏保险选择与竹间智能合作来搭建营销员智能助理解决方案。竹间智能成立于2015年,公司以自然语言处理、深度学习、知识工程、文本处理、情感计算等人工智能技术为基础,将AI能力整合到企业业务中,为金融、制造、政务、智能终端等行业提供端到端解决方案。基于对中宏保险需求的理解,竹间智能为其提供了营销员智能助理解决方案。从用户使用方式的角度,智能助理内置在中宏保险的内部营销工具中,营销员咨询产品或进行业务培训都可以点击进入智能助理界面,通过文字或语音输入问题,从而获取所需信息。从解决方案架构的角度来看,其底层包含了机器人建设、运营工具、机器学习平台等解决方案的开发和运营工具,构成对话机器人的多个AI模块,以及丰富的自然语言处理基础技术,最上层则是与营销员进行直接交互的界面。

图6:中宏保险营销员智能助理解决方案架构中宏保险与竹间智能联合搭建的智能知识库涵盖了丰富的信息,包括:运营规则(包括新单投保、保单服务、保单理赔等)、营销员基本法、保险热销产品、营销员荣誉竞赛、客户活动与增值服务、数字化工具使用等信息类型。而为了使知识库覆盖尽量全面的知识类型,保障后续的迭代更新,双方组建起项目组,在中宏保险的领导下,重点开展了如下工作:1)在项目前期充分调研营销员需求。了解一线营销员需要了解哪些知识,对知识的呈现有哪些要求,在问法上有哪些独到的习惯等问题。2)高度自动化的知识图谱构建。基于竹间智能的Gemini知识工程平台,项目组从中宏保险的保险条款、产品文档等非结构化数据中自动解析和抽取保险产品名称、以及与之相关联的犹豫期、等待期、保险责任等产品属性。在此基础上,在Gemini平台上将抽取的知识进行自动关联,形成保险产品的知识图谱,从而实现知识推理、产品检索等功能。比如将知识推理用于回答产品的保障内容、产品的比较、符合要求的产品有哪些等问题。3)利用自动化的自然语言学习技术,在智能助理上线前后进行高频问题识别和更新。通过竹间智能BotFactoryA+H人机协同平台的自监督学习能力,项目组一方面在智能助理上线前对中宏保险的客服录音和聊天记录做聚类分析,自动识别出已知的客户高频问题及其对应语料,视需要由人工核对,从而为营销员应对高频的产品和业务问题提供标准答案。另一方面,在智能助理上线后,通过自监督学习从营销员新提问的众多未得到回复的问题中识别出高频问题,中宏保险的业务专家随后对这些问题给出标准答案,自动加入知识库,从而实现对知识库的持续更新。平台的AI自学习能力使之能够以较低的运营成本不断提升机器人的模型与会话能力。为了让智能助理能够准确地理解语义,实现与营销员的流畅对话。竹间智能在对话机器人中内置了多个AI功能模块,包括语义解析、FAQ、多轮对话、意图识别、情感识别、知识推理、智能话术等。例如,多轮对话引擎通过向营销员连续反向提问获得确认具体问题所需的全面信息;意图识别引擎内置50多类、3000多种开箱即用的意图模型,用于识别营销员的询问意图;情感识别引擎能识别25种情绪,从而使对话更有同理心和温度。同时,平台内置了一个对话管理框架,当营销员向智能助理提出问题时,对话管理框架会结合业务场景,对不同AI模块的优先级、权重、分流策略进行调整,从而在其中选择最匹配的模块对营销员的问题进行准确应答。为了让中宏保险能够对智能助理进行二次开发,使智能助理具备针对特定业务场景的扩展能力,竹间智能在对话机器人底层提供了自动机器学习平台,平台内置了多种前沿算法,当上层的AI模型对特定场景的语义识别不够准确时,开发人员可以在自动机器学习平台上以可视化的方式对算法模型进行自动化测试、自动调参、算法融合,让语义理解准确度在复合式算法、仅需要少量数据的条件下,自动迭代学习。保险营销员智能助理落地后的价值与效果营销员智能助理落地以后,中宏保险在营销员的咨询支持和培训管理上实现了以下显著的效果:第一,在对营销员的咨询支持方面。首先,智能助理能够7x24小时不间断且秒级响应营销咨询需求,对营销员常用问题实时给出正确回复,高解决率有效减轻了主管和营业网点服务台客服的咨询服务压力。自智能助理上线以来,平均回复准确率保持在95%以上,得到了一线销售人员普遍认可。其次,智能助理上线后也作为运营平台,可直观了解未知问题和营销员关心的热门问题,帮助丰富智能助理知识库和填补营销员业务未知领域,未来结合智能化的培训练习,帮助营销员提升技能,增长业绩。第二,在对新营销员的培训方面。实时智能助理能帮助新营销员快速且全方位地掌握产品、服务、规则、政策等全量信息与内容,缩短了新人成长过程中知识储备的周期,让新人能快速开展业务。保险营销员智能助理项目经验总结第一,在金融、制造等专业知识密集的行业,保障知识的高效学习与传承是提高其生产和服务质量的关键。而如果只能依靠行业“老师傅”去传授企业在长期业务发展过程中沉淀的大量专业知识,不仅耗费大量时间精力,也很难保证质量。因此,金融、制造等行业的企业可以考虑应用人工智能技术解决专业知识管理与共享的问题。第二,在用AI对知识进行管理并以问答形式对外输出的过程中,企业需要重点考虑构建智能知识库以及具备高度语义理解能力的对话机器人。对知识库的构建需要采用自动化的知识解析和知识图谱构建工具,以及用无监督学习从海量语料中自动学习新知识,从而提高知识库构建和后续运营维护的效率;对于对话机器人则需要其内置丰富的AI功能模块,完善的对话管理框架,以及方便二次开发的自动机器学习平台,使机器人能准确理解语义,实现与用户的流畅对话。

案例6:AI算法支撑下,AR虚拟试戴让安克创新用户获得更优的线上互动体验

安克创新科技股份有限公司(以下称“安克创新”)是一家全球化的消费电子品牌企业,主要从事智能配件和智能硬件的设计、研发和销售,为消费者提供充电、无线音频和智能创新等品类的消费电子产品。安克创新的销售渠道覆盖国内外各大主要的电商平台和一些线下合作伙伴,在Amazon、Ebay等境外电商平台上占据行业领先的市场份额。安克创新旗下的音频品牌Soundcore声阔,于2021年末推出了新产品“声阔智能眼镜”,并计划重点在欧美市场对该产品做市场营销和线上产品推广,但安克创新此时需要应对较复杂的市场环境。一方面,在购物线上化和海外疫情常态化的大环境下,品牌商在线上推广产品普遍会面临营销手段单一,业绩增长乏力的问题。另一方面,年轻群体是消费电子的主力用户人群,为了吸引这类用户群体,品牌商需要通过不断的业务和场景创新提升消费体验,让消费者感受到品牌的活力和创新力。在此背景下,安克创新决定引入AR虚拟试戴解决方案来推广其智能眼镜产品,让用户能足不出户进行眼镜试戴,模拟真实穿戴智能眼镜的效果。对于AR虚拟试戴解决方案的要求,安克创新有如下具体考量:1)AR试戴的效果要足够好,以保证用户获得较真实的试戴体验,包括:眼镜的质感、材质、光泽度等产品细节的还原度要高;试戴时,眼镜要能够跟随人脸的运动与面部正确位置高度贴合;所有试戴效果要能够实时生效。2)在保证试戴效果良好的前提下,解决方案要能够同时支持在移动端和Web端使用,从而满足不同偏好的用户使用习惯,获得范围更广的社交传播效果。3)需要厂商具备完整的解决方案的交付能力,提供从商品建模到交付上线全链路的产品服务,让安克创新能快速上线有效的解决方案。先进的AI算法和实时渲染引擎助力实现多端一致、效果真实的虚拟试戴效果在对比了国内外多家厂商的AR试戴解决方案的技术水平、使用效果和落地方案后,安克创新选择与火山引擎合作,为其提供能满足上述要求的AR眼镜试戴解决方案。火山引擎是字节跳动旗下的企业级技术服务平台,将字节跳动快速发展过程中积累的增长方法、技术工具和能力开放给外部企业,提供云、AI、大数据技术等系列产品和服务,帮助企业在数字化升级中实现持续增长。基于自研技术,火山引擎为眼镜、美妆、鞋帽、手表、首饰、美甲等行业客户提供AR虚拟体验场景建设,可应用于品牌营销、新零售、电商购物等场景。在线上,其解决方案可提供SDK/API,快速进行商城(Web)、APP、小程序等第三方集成上线,为消费者实现从浏览商品-线上试穿/试戴-购买的线上购物体验闭环。在线下,可将虚拟体验产品应用于实体店,通过创新的互动手段吸引消费者进店,提升消费者的购物体验,进而促进消费行为的发生。通过线上线下体验和流程的打通,辅助客户解决传统零售行业面临的高库存、高销售成本、低转化等诸多棘手问题。为了保障安克创新的用户能够获得较真实的试戴体验,火山引擎从3D素材制作、人脸关键点识别算法、实时渲染三方面着手为安克创新提供解决方案。火山引擎基于其自研的3D引擎为安克创新定制了10款声阔智能眼镜和8款预热款眼镜的3D素材,在对原始素材做基础建模后,对材质的诸多细节如高光、反光、半透明等做进一步优化。例如,对于镜片透明度的处理,传统的素材处理只考虑透明度效果,而火山引擎进一步针对镜片在半透的情况下与欧美不同人群的肤色相融合的效果做了优化,使效果更自然和真实。为了让眼镜在用户试戴过程中能紧贴面部轮廓,获得很高的跟随度。火山引擎在解决方案中采用了自研的人脸关键点识别算法对人脸的3D关键点进行识别,精细化定位五官和面部轮廓,并用3D拟合算法实时生成人脸的3D模型,从而使眼镜模型能够很好地跟随和贴合人的面部。同时,解决方案中还采用了运动补偿和运动估计等惯性检测算法,保证在连续运动和极端角度下试戴效果的稳定性。火山引擎的3D引擎具备实时渲染的能力,并且对图形渲染的性能做了优化,保障了为安克创新定制的细节度很高的3D素材也能够实时生效。针对安克创新需要同时支持移动端和Web端的需求,火山引擎通过对算法和算力进行优化,实现解决方案多端运行的稳定性和效果一致性。在移动端,火山引擎根据手机硬件性能做了算法适配和硬件加速,保证在多算法并行的情况下的真实效果和超低延迟。在Web端,火山引擎也通过相应的优化能够应对浏览器资源调用、算力需求诸多限制。同时,火山引擎对算法本身进行优化,使得达到同样的模型精度,其模型大小比业内平均水平低几十倍,从而降低了包体大小方便多端适配,也更节省了算力。针对完整的解决方案的交付能力要求,火山引擎提供了包括体验设计、技术解决方案建立、项目管理、数据检测、市场进入的端到端解决方案,让AR眼镜试戴解决方案能够在安克创新快速落地和有效应用。

图7:火山引擎AR虚拟试戴解决方案交付链路AR虚拟试戴解决方案落地后的价值与效果从用户试戴效果的角度,安克创新通过采用AR眼镜虚拟试戴解决方案,让用户能够不用到店接触实物,在线上就能获得很真实的眼镜试戴效果,并且了解商品的外观、特点等诸多细节的信息,更好的帮助购买决策。从业务价值的角度,虚拟试戴解决方案提升了安克创新用户的线上消费体验,从而促进商品的购买转化。该功能在安克创新官网上线4周就吸引超100万海外用户体验了该功能,对安克创新的品牌推广及购买转化都产生了很明显的实际效果。因此,安克创新在中国区推出智能眼镜后,也同样选择了火山引擎研发的AR虚拟试戴解决方案。AR虚拟试戴解决方案的借鉴意义AR虚拟体验带来的交互、场景、终端体验正在催生体验式消费的新升级,而为了保证更真实和稳定的虚拟体验,需要用人工智能技术从两个层面发挥作用,解决相应的问题。第一,先进的计算机视觉算法是提升虚拟体验效果真实性的关键。要让虚拟体验达到更加真实的效果,就需要通过采用更加先进的计算机视觉算法对现实中的物体和环境进行感知、识别和重建,从多个层面还原和模拟现实中的情形。第二,人工智能在实际落地过程中需要重点突破算力的瓶颈。开发出先进的算法通常只解决了问题的一半,要让算法能够实际运行,尤其是在消费者终端运行,就需要对其算力消耗、硬件资源进行大量的优化,保证算法在生产环境中可用。

案例7:某银行搭建智能消费者保护中台,助力消费者权益保护监控和预警

某股份制商业银行(以下简称“M行”)是国内金融零售业头部银行,该行注重对消费者的全流程陪伴和打造最佳用户体验,践行消费者权益保护工作。在金融产品与服务体系日益丰富且复杂的背景下,我国政府与金融监管部门愈发重视金融消费者合法权益的保护,陆续出台了《中国人民银行金融消费者权益保护实施办法》等各类监管文件,要求各大银行建设或加强消保全流程管控机制,从产品开发设计、定价管理、合同协议、营销宣传、纠纷解决等各方面保护金融消费者合法权益。此前,M行已使用传统的IT系统实现消保审查和投诉处理线上化,例如消保审查系统是由业务部门提交申请、各级消保专职部门审批,完成各项消保审查;投诉管理系统是包含客服接听电话-记录-分类-转办-处理等环节的工作流系统。但此类系统由分行或业务部门各自建设和使用,且没有覆盖全渠道投诉、反馈和跟踪情况。总行没有统一的投诉处理风险反馈机制,导致投诉风险主要依靠各层级消保部门进行人工分析,信息流转过慢,管理层无法对消保工作进行全过程的监控和管理。出于在全流程业务中有效保护消费者合法权益的需求,M行希望通过建设智能消费者保护中台,运用语义理解、语音识别、机器学习等技术增强对消保业务全过程管控,智能排查潜在的投诉风险,以数字化手段提升工作质效。M行对智能消保中台解决方案有三点核心需求:1)现有的消保审查、投诉管理、服务监督检查和舆情监测等系统存在数据孤岛问题。需要通过中台建设打破多业务部门、各区域、各系统数据壁垒,拉通“事前审查-事中管控-事后监督”全周期消保数据。2)各项业务系统产生海量的非结构化文本数据,全人工处理和分析的效率低。需要借助OCR、NLP等智能技术进行信息挖掘,用于辅助投诉处理和进一步的风险智能分析。3)管理层缺少对全行消费者投诉、处理反馈和跟踪情况进行实时掌握和风险排查的有效手段。智能消保中台应提供针对潜在投诉风险的智能排查工具,形成适配消保业务的知识图谱和标签体系,输出较为准确的风险研判结果。基于认知智能技术,打造银行智能消费者保护中台解决方案M行经过对解决方案公开比选,基于对拓尔思认知智能技术和客户服务经验的认可,选择与拓尔思合作建设智能消费者保护中台。拓尔思是一家人工智能和大数据技术及数据服务提供商,核心技术是语义智能,即基于语义理解的认知智能,为客户提供从数据洞察到智慧决策的解决方案。拓尔思为M行提供的智能消保中台解决方案,覆盖消保业务的事前审查、事中预警、事后督办的消保全生命周期智能管理,提供投诉升级预警、重大投诉推送提醒、外部舆论分析等功能,实现潜在风险由人工排查向系统自动排查转型。解决方案有三个核心要点:一是拉通各业务系统的数据;二是对非结构化数据进行处理和信息提取;三是多维度的知识挖掘和分析应用。针对数据孤岛问题,M行通过建设全口径的投诉管理大数据平台,整合行内10多类异构多模态数据,包括全渠道的消保审查、客户投诉、服务监督检查、舆情、政策数据等。针对海量非结构化数据处理问题,运用OCR、NLP等智能技术从文本中提炼出具有概括性和精确性的字段,再根据字段的意义和内容,结合标签体系生成信息挖掘结果。标签体系包含客户特征、投诉原因、投诉诉求、投诉渠道等近20个维度3000个标签,在消保审查、投诉处理等需要分析大量文本的场景中,能够有效提高工作效率;并且,平台可以进一步对标签化分析结果进行统计,为消保工作常态化监管提供数据支撑。针对风险智能排查需求,一方面,拓尔思基于情感分析、机构识别、语义识别、标签提取、观点抽取、行为分析等核心算法,根据M行消保业务需求封装了行业区域分析引擎、动态追踪引擎、产品分析引擎、聚类分析引擎、归因分析引擎、投诉用户画像引擎等多维度分析模型,支撑投诉预警、舆论监测等前端应用;另一方面,运用知识图谱技术进行关联分析,辅助消保全过程的监督审查工作。以消保审查中的营销内容审查为例,平台将经过整合的产品图谱、服务图谱和相关投诉数据可视化展示,为营销内容审查提供更全面的参考信息,提高审查质效。

图8:M行智能消费者保护中台架构智能消保中台落地后的价值与效果基于认知智能技术的智能消费者保护中台上线以后,对M行的消费者权益保护监控和预警工作带来以下了显著价值和成效。第一,通过建设大数据平台消除了M行内数据孤岛,实现全口径、多渠道消保大数据整合,每月自动化处理的消保数据超10万条。第二,完整的数据为消保工作全环节线上跟踪管理和统计、整改、考核评价、责任追究提供基础依据,保障统一的消保审查工作体系在全行持续落地,有助于实现消保工作规范化标准化的科学管理,有助于落实监管要求。第三,充分挖掘消保数据价值,采用六大客服分析因子,覆盖超3000个标签,消保数据处理分析效率较过去提升20倍,每年节约500万人力成本。基于自然语言理解技术,消保专家知识库积累超5000个知识点,适配超两万个意见模板,提升20倍审查效率。实现潜在投诉风险的智能化自动排查,有效提高工作质效,降低因投诉、诉讼或舆情事件造成的声誉损失,也让消费者权益保护更加及时有效。智能消保中台项目经验总结随着人工智能在产业中的深入,企业内部出现了大量需要对分文、专业知识进行深度分析以解决业务问题的AI应用场景,而这类应用场景只靠计算机视觉、智能语音等感知智能技术已无法解决,此时就需要引入认知智能技术,让业务系统具体思考能力。而要实现认知智能需要重点解决多个方面的问题:首先,数据,尤其是相关非结构化数据要足够丰富,并且整合完备;其次,认知智能的实现要结合多种技术手段,包括OCR、智能语音对信息的提取,NLP对文本的解析、知识图谱对知识的挖掘和分析、机器学习对数据的分析等;此外,在不同的专业领域需要引入标签体系以便对信息进行高效的分类和调用。

3.5技术基础设施层面

3.5.1方法论

3.5.1.1.实现AI系统与不同业务和IT系统的融合

为了弥合老旧的业务和IT系统架构与AI开发和部署之间的缺口,企业需要构建新的技术体系以支撑智能化的实施。具体而言,企业需要在业务和IT系统中引入智能应用编排、业务指标监控、数据存储和处理系统、创新实验系统、各类中间件或产品等,为企业智能化应用提供基础技术能力。同时,企业需要考虑在IT系统中引入基于云的微服务架构,实现更加敏捷和灵活的应用构建方式,最大限度地利用智能技术。

3.5.1.2.使用低门槛的平台化工具赋能企业内AI应用的开发

大中型企业的AI开发需求较广泛,如果仅依赖数据科学家和算法工程师等专业人员开发应用,不仅成本高,且很多业务部门发起的需求不能得到很好的满足,因此企业需要引入低门槛的AI开发平台赋能企业内的业务和普通IT人员,使其具备一定AI开发能力。具体而言,对于专业能力较弱的业务人员,需要开发平台具备自动化的数据准备、模型训练等功能,业务用户只需选择场景和相应的数据集即可对模型进行自动训练;对于具备一定专业能力的业务和IT人员,需要平台能够将算法模型封装成算子,用图形化的方式将算子组合成工作流,从而完成模型训练过程。并且,这种方式也让企业内部人员可以更方便地复用其他人员在开发过程中沉淀的模型和经验,从而进一步降低AI开发的门槛。在案例8和案例9中,海信集团和某集团科技子公司都引入了低门槛的AI开发平台让企业内的业务和IT人员具备了一定的AI开发能力。

3.5.1.3.通过引入成熟模型,以及提高模型泛化能力等方式降低大规模AI应用开发的成本

AI应用开发的时间和资金成本都很高,为了提高AI应用落地的效率、降低大规模AI应用开发的成本,企业可以在AI开发平台上引入相关的能力应对这一问题。

第一,在构建AI开发平台时,尽量选择与在自己的业务领域有大量成熟AI模型和应用实践积累的厂商合作,在AI平台中内置相关只需适当配置即可使用的AI模型,加速AI落地,减少自研成本。例如在案例9中,某集团科技子公司需要快速推进智能化转型,在考虑到有外部厂商在工业质检、园区安全、供应链管理等领域有成熟AI模型后,便选择与该厂商合作,引入其智能中台产品。

第二,在构建AI开发平台时,尽量在平台中引入算子和“白盒”的模式,将模型的工作流沉淀下来,使得开发人员后续能够针对相似场景对模型做适当修改,实现模型的泛化能力,企业因此能将模型快速迁移至相似场景,避免从头重新开发,从而降低了模型的开发成本。例如在案例8中,海信集团在AI平台中引入该模式,成功将原先只能识别大尺寸冰箱四条成剪刀形的打包带的质检模型,通过增加类似场景的标注数据,对原模型的算子做了适当修改,成功让模型扩展到3条类似产线。

3.5.1.4.建立统一的模型开发和模型管理能力,提高AI资源的利用率

大型企业在智能化建设早期,各个部门通常会独立地建设AI能力,这会造成AI开发工具、AI模型的重复建设和不能复用,这种“烟囱式”开发的状况到了企业智能化建设的深入阶段会造成大量的资源浪费,并阻碍智能化的推进。因此,企业需要引入统一的模型开发和模型管理工具供相关人员共同使用,尤其要重视对AI模型和服务的统一管理,提供如模型版本维护、模型更新、模型发布服务、对模型服务调用情况查看等能力,通过平台实现AI能力的复用,提高资源利用率。

例如在案例9中,某集团科技子公司通过智能中台构建了统一的模型开发和模型管理能力,使得集团的管理人员可以对平台上的所有模型进行统一管控,简化运维工作,提高管理效率。业务和IT等人员也可以通过平台查看集团现有的模型资产和AI能力,并根据需要直接调用。

3.5.1.5.构建覆盖模型全生命周期MLOps体系,缩短模型迭代周期,并持续地保障模型质量

当AI建模进入需要大规模生产和交付的阶段,其运营和用例扩展对于大部分公司来说都是一个巨大挑战。此时,企业可以考虑在机器学习和AI系统中,借鉴软件工程领域DevOps相关框架、工具链和流程,以及持续集成、持续交付、持续部署的理念,为机器学习和AI开发提供MLOps体系和相关工具,即提供系统化的协作工具将AI开发和部署中的业务、数据、算法、运维等角色连接起来,建立一个标准化的数据准备、模型开发、部署与运维流程,解决机器学习模型生命周期各环节的工程化问题,从而实现其核心目标:缩短模型开发部署的迭代周期,并持续地保障模型质量。MLOps的主要功能和优势包括:统一发布、自动测试、敏捷迭代、自动化的模型和数据集管理、降低建模门槛、流水线式管理、资源集成监测、组织高效协作。

例如在案例D中,某大型国有商业银行AI应用实践中构建了MLOps体系,一方面,通过一站式的AI开发平台降低开发门槛,另一方面,建立了“信息统一管理、实体统一流转、管理信息与实体流转保持一致”的AI全生命周期管理机制,从而实现了敏捷的模型迭代,高效的模型交付。

3.5.2给不同成熟度的企业的建议

初步投入阶段:该阶段的企业当前仅有少数几个AI应用落地,因此需要重点解决如何将AI应用在现有IT系统中的部署和运营的问题。

多维布局阶段:该阶段的企业需首先构建适应智能化要求的IT系统架构;其次,建立统一的AI开发平台,让组织初步构建独立自主的AI开发能力,并对AI开发能力进行统一管理。

深度应用阶段:持续完善面向智能化运营的IT系统,并在AI开发平台中建立一站式的从数据准备、数据标注,到模型训练、部署和运营的能力,并降低AI开发的门槛。同时,需要考虑构建覆盖模型全生命周期MLOps管理体系,缩短模型迭代周期,并持续地保障模型质量。

案例8:海信集团引入AI平台,构建独立自主的AI开发能力海信集团是知名的大型电子信息产业集团,旗下有海信、东芝电视、科龙、容声、ASKO、Vidda等品牌,业务涵盖多媒体、家电、IT智能信息系统和现代服务业等多个领域,并且在全球拥有13个厂区。近年来,在面对国内人口红利锐减以及国际上欧美国家挤压的双重挑战下,海信集团实施了数字化转型战略,希望实现降本增效,并重塑海信在全球制造业领域竞争优势。具体而言,海信集团自2019年全面建设了5G网络和工业互联网平台,涉及云、边、端协同,并集成了现有的IT系统、OT系统、大数据平台等系统,平台建成后产生和汇聚了海量的工业数据。而为了充分挖掘和发挥这些工业数据的潜在价值,海信集团需要进一步实施智能化升级战略,推动人工智能在集团业务中的广泛应用,从而提升运营效率、创新业务模式。由此,海信集团需要从应用场景、技术平台、组织AI素养三个层面构建人工智能能力:1)在应用场景层面。首先,海信集团希望在智能制造、营销、研发、财务等多个业务领域集成智能化应用,但集团内部尚未建立AI应用场景落地的评估机制。其次,海信集团需要首先选取几个高价值度的场景落地AI应用,解决业务问题的同时,探索并验证集团内AI应用落地的方法和能力。2)在技术平台层面。海信集团此前只有少数外部采购的AI应用解决方案,几乎没有自主的AI建模能力,因此需要搭建统一的AI技术平台,并且平台需要满足易于使用、功能完备、方便协作等要求,使集团内部人员可以在该平台上自主搭建AI应用。3)在组织AI素养层面。海信集团的业务和IT人员之前的AI能力较薄弱,不具备开发复杂的计算机视觉、机器学习模型的能力,因此需要针对性地提高其AI能力素养。从场景规划、技术平台、人员培训着手,全面提升海信集团的AI能力在经过前期充分的调研论证后,海信集团选择与九章云极DataCanvas进行合作,为其提供人工智能相关产品和服务。九章云极DataCanvas是一家人工智能基础技术服务公司,其核心产品自动化数据科学平台,能够帮助业务分析师和数据科学家快速协同开发,实现自动化模型创建、管理和应用支持,为政府和企业智能化升级提供配套服务。基于海信集团在智能化升级中的需求,九章云极DataCanvas为海信提供的解决方案包括了应用场景规划、三个应用场景的模型定制开发、信智AI平台建设以及平台的推广和培训。针对应用场景层面的问题,海信集团在九章云极DataCanvas的协助下建立了一套AI应用场景筛选的评估标准,并定制了三个较复杂的AI应用。1)基于九章云极DataCanvas在客户服务过程中总结的最佳实践方法论,以及海信集团的实际情况,双方建立的应用场景筛选的评估标准包括以下三点:应用场景需要是强业务需求,解决的是最痛点的问题;应用开发所需的数据要比较容易获取,最好具备现成的数据;用AI解决该业务问题的方法要相对成熟,能直接调用模型的相关代码更佳。2)在考虑海信集团的业务需求、应用代表性等因素后,海信集团合和九章云极DataCanvas合作定制开发了如下三个AI应用场景:冰箱打包带检测,检测打包带是否存在多打、少打或歪斜超出工艺质量规定范围;电视机铭牌检测,检测铭牌是否存在错贴、漏贴、倒贴等问题;遥控器图案检测,检测按键字符/图案/颜色、丝印、底部Logo/型号是否有印错。为了构建自主的AI开发能力,海信集团在九章云极DataCanvas的协助下搭建了信智AI平台。信智AI平台是以九章云极DataCanvas自动机器学习平台APS为基础,结合了海信集团定制的一些功能和算子,而构建的AI技术平台。该平台满足了海信集团对AI平台的易用、功能完备、方便协作等要求,具体如下:1)平台将模型开发全流程的功能都封装成算子,并支持用图形化、拖拉拽的形式将算子组合成工作流,从而降低了建模门槛。而平台上包含的算子有200多个九章云极DataCanvas的标准化算子,以及数十个根据海信集团的需求定制的数据处理、NLP算子。同时,平台采用“白盒”模式,所有内置以及后续场景开发中(包括三个定制场景)沉淀的算子,其代码都可以被查看和修改,以便组织内成员学习、复用,或做一定修改后迁移至其它场景。2)针对模型上线过程复杂的问题,九章云极DataCanvas将数据预处理、深度学习模型、以及模型后处理都打包成Pipeline,并提供在生产环境中调用的接口,从而简化了海信集团的模型推理工作。3)为了满足海信集团的应用开发协作需求,平台支持业务人员、算法工程师、数据科学家等人员登陆平台并各自完成自动建模、数据处理、算子调整、搭建工作流、模型上线等工作。同时,根据海信集团的需求,九章云极DataCanvas为该平台定制了单点登录、标注平台、以及能够显示检测后产品合格率的报表平台等不同人员所需要的功能。针对组织AI素养较薄弱的问题,海信集团首先通过和九章云极DataCanvas合作定制开发三个高价值应用场景的形式,让海信集团的业务和IT人员熟悉平台的功能以及建模流程,并且将三个场景的工作流沉淀在平台中供海信集团的人员学习和复用。其次,九章云极DataCanvas对海信集团的相关人员进行了约20次培训,包括针对三个定制的应用的使用和后续运维、工业检测、平台的使用方法等方面的专题培训。信智AI平台落地后的价值与效果信智AI平台落地后产生的价值包括对业务场景的价值、对构建自主的AI开发能力的价值和对降低建模成本的价值三个层面。1)在对业务场景的价值层面。双方基于AI平台定制开发的三个应用场景都产生了明显的效果:三个场景都因为智能质检应用的上线,将不良率降低了95%以上。2)在对构建自主的AI开发能力的价值层面。通过搭建易于使用、功能完备和方便协作的信智AI平台,以及相应的培训推广,海信集团具备了自主开发AI应用的能力。在平台上线后一年内,海信集团基于该平台自主开发了电路板测试优化、门店地址相似度评估以及一些智能质检等多个应用。3)在对降低建模成本的价值层面。由于信智AI平台采用算子、工作流以及“白盒”模式,用户可以通过修改算子,将模型迁移至高度相似的场景中,解决模型不易泛化的问题,从而将模型的建设成本降低60%。例如,九章云极DataCanvas定制的冰箱打包带检测模型,该模型原先识别的是大尺寸冰箱的四条成剪刀形的打包带的问题,海信集团通过增加类似场景的标注数据,对原模型的算子做了适当修改,成功让模型扩展到3条类似产线。信智AI平台的项目经验总结第一,企业的智能化升级是项系统工程,除了AI战略、数据基础外,企业还需要重点考虑场景规划、技术平台建设和组织AI素养提升等方面的问题。在场景规划层面,需要首先建立标准化的场景筛选流程和方法,其次,企业在智能化升级早期,可以考虑跟外部厂商合作开发几个高价值场景的应用,为企业后续的应用开发提供借鉴经验。在技术平台建设层面,企业要充分结合内部现状,搭建能在组织内广泛使用的平台,重点考虑平台的易用性、功能完备性、协作便利性等。在组织AI素养层面,除了外部人才的引进,也要重视人员的培训工作,包括模型开发、模型使用、模型运维等方面的培训。第二,模型的泛化能力是企业AI开发中需要重点关注和解决的问题。通过模型的泛化,企业能将模型快速迁移至相似场景,避免从头重新开发,从而降低了模型开发成本。而在AI开发平台中引入算子和“白盒”的模式,将模型的工作流沉淀下来,使得开发人员后续能够针对相似场景对模型做适当修改,从而快速实现模型的泛化。

案例9:助力某大型集团搭建AI数据智能平台,支撑数智化升级某大型集团旗下科技公司为行业及集团提供数字化转型整体服务,通过构建物联网、大数据和AI平台等数字基础设施,将生产、流通和消费等环节的数据、算法和应用打通,更高效地赋能业务。在本次合作中,该集团希望通过建设AI平台解决以下三点AI开发和管理中的难题:1)“烟囱式”开发建设造成的资源浪费。该集团在以往的AI建设中,各个工厂和部门都有独立开发或采购一些AI应用,因此带来了集团内数据不能共享,AI开发工具重复建设,以及模型不能复用等问题。这种数据、开发工具、模型的“烟囱式”开发建设浪费了集团的AI资源,也阻碍了数智化的推进。2)AI模型开发门槛高。该集团以往的单点AI应用多由数据科学家、算法工程师开发,但此类人力成本高,当要在全集团广泛地落地AI应用时,就需要提供平台工具降低AI开发的门槛,让业务和IT人员也具备一定的AI开发能力。3)大规模的AI应用开发技术难度大、成本高昂。为了尽快建设完善的AI数智平台,该集团需要在园区安全、供应链管理、智能营销等领域同时推进多个AI应用的开发,如果都从零开发如此大量的AI应用,成本高昂,统一管理较为困难。因此该集团科技公司希望借助在上述领域有成熟AI模型积累的厂商,以较低的成本快速落地多个AI应用。搭建智能中台,提供统一的AI开发、AI管理和成熟的AI模型服务能力在对多家厂商的产品成熟度、客户案例、合作深度、团队配置等方面情况进行考察后,该集团科技公司选择与京东云合作,为集团搭建智能中台并共建应用。京东云是京东集团旗下专注于产业数字化服务的业务板块,依托人工智能、大数据、云计算、物联网等技术能力,为各行业企业和政府部门提供全链路的产品与解决方案。该集团的智能中台是基于京东云Foundry智能中台产品而构建,智能中台提供了一站式的AI开发平台、统一的AI模型管理平台、以及大量预置的标准化AI模型。同时,京东云也在智能中台搭建过程中为该集团提供了场景共建、算法定制、人员培训等服务。为了解决AI应用“烟囱式”开发的问题,该集团借助智能中台,从数据、开发工具、模型管理三个层面对其进行统一建设和管理。在数据层面。该集团科技公司联合京东云搭建的大数据平台对集团的数据进行统一的存储和处理,打破了数据孤岛。同时,智能中台提供了统一的数据标注和数据集管理工具,使得AI开发中所需的数据能够在不同的AI开发人员间共享和协作。在开发工具层面。智能中台提供了一整套包含数据标注-模型开发-模型训练-服务发布等全链条的AI开发工具,算法工程师及应用开发等人员都可以统一基于该平台进行AI模型的开发。在模型管理层面。智能中台提供了模型仓库功能以便集团对模型服务进行统一管理,如模型版本维护、模型更新、模型发布服务、对模型服务调用情况查看等。因此,集团的管理人员可以对平台上的所有模型进行统一管控,简化运维工作,提高管理效率。业务和IT等人员也可以通过平台查看集团现有的模型资产和AI能力,并根据需要直接调用。为了降低AI开发的门槛,使得集团的业务和IT人员也具备AI开发能力,智能中台将算法代码封装为组件,因此具备一定开发能力的用户能够通过拖拉拽快速构建工作流的方式开发模型,实现对前人经验的复用。同时,智能中台也提供更简单的自动化模型训练功能,业务用户只需选择场景和相应的数据集即可对模型进行自动化训练。针对大规模的AI应用开发技术难度大、成本高昂的问题,智能中台内置了京东集团在长期业务发展过程中积累的大量成熟的AI算法,包含语音语义、图像及视频理解、文字识别、机器学习等类别,该集团在接受京东云适当的培训后,能够自行选择算法组件,并做好数据准备,即可在工业质检、园区安全、供应链管理、智能营销等领域快速构建AI应用。图9:Foundry智能中台框架智能中台落地后的价值与效果智能中台为该集团带来的价值包括业务价值和管理价值两方面。从业务价值的角度,智能中台提供的低门槛开发工具和AI模型服务让该集团的业务和IT人员也能够开发一定的AI模型,从而提升了应用开发效率,降低开发成本。该集团因此能够充分利用了自身沉淀的数据资产,在智能中台上线半年内,即在园区安全、智能营销等领域构建了多个适配业务需求的AI应用及解决方案,显著提高了集团的数智化水平以及业务创新能力。从管理价值的角度,该集团通过智能中台对AI模型和服务的统一管理,实现了AI能力自主掌控、运行状况可查可看以及AI服务的精细化运营,从而简化了模型运维工作,提高了管理效率,并且通过AI模型和服务的复用提升了资源利用率。智能中台项目经验总结第一,京东云同该集团科技公司合作建设大数据与AI模型训练平台能力,共同为集团带来从数据管理、模型应用等方面的技术工具,从而进一步辅助业务创新和发展。通过引入统一的数据管理、模型开发和模型管理工具供相关人员共同使用,利用平台实现AI能力的复用,提高资源利用率。第二,为了提高AI应用落地的效率,加速智能化升级,企业可以选择与自身业务匹配度较高,且在这些业务领域有大量成熟AI模型和应用实践的厂商合作。通过复用这类厂商的模型,及其最佳实践方法论,企业能够以较低的成本在多个关键领域快速构建AI应用,赋能业务。

案例D:某大型国有商业银行构建MLOps体系,实现敏捷的模型迭代,高效的模型交付某大型国有商业银行经过近几年的智能化建设,已经搭建了完善的人工智能生态体系,在数据、算法、算力、技术框架等多领域实现了技术领先,并且已在各业务领域落地了500多个AI应用。该银行在AI应用实践中,为协同模型构建团队、业务以及运维团队,建立起一个标准化的模型开发、部署和运维流程,使得组织能更好的利用AI的能力促进业务增长,于近年构建了MLOps体系。该银行的MLOps体系主要从降低开发门槛和提升模型管理流转效率两个方面出发。在降低开发门槛方面,该银行构建了从需求分析、数据准备、模型构建、模型发布,到模型运营的一站式AI工作站,为建模人员提供可视化、低门槛的流水线建模服务。在提升管理效率方面,该银行建立了“信息统一管理、实体统一流转、管理信息与实体流转保持一致”的AI全生命周期管理机制,以提升模型生命周期管理水平。具体而言,该银行将AI工作站作为统一的模型全生命周期管理平台收集模型的元数据信息,实现全流程管控;同时,构建了涵盖一个模型基础版本库+开发、测试、生产等各套环境的模型调用库,以及模型加密单向同步机制,实现模型实体的统一存储、管理和在各模型库间不落地的安全流转,此外还建立了增存结合的入库管理机制,加强模型入库管控能力。在此基础上,将AI工作站的模型管理信息与DevOps平台的版本交付信息联动,DevOps版本交付机制调用AI工作站的服务,控制模型库间的实体流转,保证账实相符,支持各应用全生命周期模型管理。图10:某国有商业银行MLOps体系该银行通过构建MLOps体系,取得了良好的实施效果,模型研发周期从之前的平均3个月最短压缩到两周,模型部署的周期缩短至1天以内,常规模型后评价和模型更新最快2天即可完成,自学习模型可根据实际效果实时更新。

3.6组织与人才层面

3.6.1方法论

3.6.1.1.建立适应AI开发和管理需求的组织架构,明确部门权责和协同机制

AI的开发和管理是项复杂的系统性工作,需要组织内各部门和人员能够紧密协作,共同完成。企业在智能化早期通过设立单个项目组推进的方式在智能化深入阶段将不能维继。此时,企业需要在整个组织内部建立统一的AI组织架构,设立核心部门统筹协调各相关部门开展AI开发和管理工作,并明确各部门的权责。

例如在案例E中,某头部家电集团为保持其AI能力的领先性,构建了以AI技术委员会为核心部门,下辖多个技术研发部门分别负责特定方向的AI能力建设,并统筹协调技术研发部门为产品部门提供应用开发服务。

3.6.1.2.内外兼顾,培养AI人才队伍

智能化转型成败的核心要素之一是人才,企业一方面要注重从外部不断引进优秀的数据科学家、算法工程师等专业人才;另一方面,需要加强组织内的培训,提升业务和IT人员的AI开发能力,以及提升管理人员的AI素养。从而帮助企业构建起能支持智能化转型所需的人才队伍。

3.6.2给不同成熟度的企业的建议

初步投入阶段:该阶段的企业当前以单点应用建设为主,无需在组织架构层面为AI应用做太多调整,但需引进关键的AI人才,指导应用落地和后续维护。

多维布局阶段:该阶段的企业在核心部门都有建设一定的AI开发和管理团队,建议由公司层面对各部门的AI开发进行统一协调部署,做到信息互通;同时要加大对数据科学家、算法工程师等专业人才的外部引进工作。

深度应用阶段:该阶段的企业需要构建完善的面向AI开发和管理的组织架构,各部门之间的权责和协同机制要明确;同时,除了专业人才的引进,企业也需要在组织内加大培训力度,提升组织内相关人员的AI素养。

案例E:某头部家电集团建立面向AI开发和管理的组织架构,全面支持产品的智能化创新某头部家电集团在AI研发和应用方面处于业内领先的地位。为了保持集团AI技术的领先,保证其家电产品在智能化方向的持续创新能力,集团近两年在AI研发上加大了投入,并对集团的AI组织架构做了调整和统一部署,明确了各部门AI相关的职责与各部门之间的协调机制。整体而言,该家电集团成立了AI技术委员会,下辖AI创新中心、中央研究院、集团IT、IOT事业部智能研发部、以及空调、冰箱、洗衣机等各产品事业部的技术研发部门。图11:某头部家电集团AI组织架构其中,AI技术委员会的成员为各相关部门负责人,委员会的职责是统筹协调各部门AI建设需求、AI能力输出,并做到各部门之间的信息互通;AI创新中心为集团新成立的部门,集团对该部门的人员和资金做了重点投入,希望在计算机视觉、语音基础算法、家庭服务类机器人等方向做研发并具备自主技术,一是为了降低外采技术的成本,二是为了赋能产品线打造差异化功能;中央研究院主要负责智能制造、工业互连网相关的能力建设;集团IT负责供应链管理和部分智能制造领域的AI能力建设;IOT负责图像、大数据、语音相关的AI应用开发,为家电产品服务。AI创新中心、中央研究院、集团IT、IOT事业部智能研发部的AI能力会赋能空调、冰箱、洗衣机等各产品事业部,并提供应用解决方案,同时各产品事业部也会在一些特定的重要业务领域根据需求独立开发或外采AI应用解决方案。该集团基于良好的AI研发和应用基础,在扩大AI优势的过程中,重视调整组织架构来适应AI能力发展需求,为集团明确分工、优化协作、降低AI研发成本、提高产品智能化能力提供了机制保障。

4.企业智能化趋势展望

人工智能在为企业创新产品服务、优化经营决策、提升管理效率等方面已经取得了广泛的效果,并展现出了更加巨大的潜力,因此,爱分析认为所有的企业未来想要在市场中保持竞争力,一定都需要走向全面的智能化。但如前文中所述,国内主要行业目前已经开展过智能化建设的企业中约70%仍处AI应用的早期实验或初步投入阶段,仅约30%的企业进入多维布局或深度应用阶段,真正在组织内实现AI应用与业务全面融合的企业不足1%。

爱分析认为,在接下来的3至5年,国内大量的企业对AI的应用将从单点的AI建设走向全面的智能化转型。在这个过程中,企业将会需要解决智能化建设过程中涉及的战略、数据、场景规划、应用解决方案开发、技术基础设施、组织与人才等多方面的挑战。因此,企业需要针对智能化转型规划完善的路径和方法,具体的措施包括:制定明确的智能化战略;完善数据基础设施,构建面向AI开发的自动化数据采集、数据处理能力;建立场景规划的流程和方法论;提升解决方案的自研能力;建立了标准化的解决方案开发、部署、和后续运营的方法和流程;重构面向智能化运营的IT系统;引入AI平台、AI中台;构建MLOps体系;建立面向AI开发和管理的组织架构;重视AI人才队伍的建设等。同时,企业需要结合自身AI应用的成熟度,对上述举措更细化的方法和步骤,实施时间点等方面问题制定符合自身需求的计划。

人工智能在产业中的落地正在如火如荼地推进,也还有很多未知的领域有待企业去探索,进一步释放AI的价值。相信随着这个进程的推进,AI在产业中落地仍然会面临许多新产生的问题,爱分析将对这个领域保持持续跟踪研究,对前沿的案例保持关注,为企业智能化转型提供更多的决策参考。

人工智能调查报告(18篇)

2023-07-07人工智能-多种模式识别的调研报告

郑州科技学院郑州科技学院本科毕业设计论文题目多种模式识别的调研报告姓名闫永光专业计算机科学与技术学号20xx15025指导教师郑州科技学院信息工程系二一四年六月1郑州科技学院摘要信息技术的飞速发展使得人工智能的...

2023-07-10人工智能研究报告

人工智能研究报告成员:XXX基本信息概念各个蚂蚁在没有事先告诉他们食物在什么地方的前提下开始寻找食物。当一只找到食物以后,它会向环境释放一种挥发性分泌物pheromone(称为信息素,该物质随着时间的推移会逐渐…

2023-07-07关于人工智能技术的专业调查报告

关于人工智能技术的专业调查报告前言随着现代科学技术的飞速发展先进的技术在各个领域都得到了广泛的应用使得生产力获得了大幅度的提高为改善人民生活水平作出了巨大贡献下一次生产力飞跃的突破口在哪里目前越来越多的科学家把...

2023-07-07人工智能报告

人工智能报告论人工智能的应用及发展姓名学号班级计算机1202学院计算机与通信工程学院老师人工智能的应用及发展摘要人工智能ArtificialIntelligence是研究开发用于模拟延伸和扩展人的智能的理论方法...

2023-07-05人工智能报告

语音识别及控制技术在智能家居中的应用摘要随着生活水平不断的提高人们对家庭住宅需求的概念也发生着变化智能家居利用先进的计算机嵌入式系统和网络通讯技术提供安全舒适宜人的高品位家庭生活语音识别控制技术在智能家居中的运...

2023-07-05人工智能实验报告

人工智能第二次实验报告一实验题目遗传算法的设计与实现二实验目的通过人工智能课程的学习熟悉遗传算法的简单应用三实验内容用遗传算法求解fxx2的最大值x031x取整数可以看出该函数比较简单只要是为了体现遗传算法的思...

2023-06-09人工智能实验报告

西南大学实验报告人工智能院系计算机与信息科学学院专业学号姓名指导老师

2023-07-05人工智能报告

人工智能学习报告学习人工智能后的报学号20xx09040209姓名班级指导老师朱江日期20xx李进威机械二班年1月5日成都理工大学I告人工智能学习报告目录人工智能学习报告1一引言2二人工智能概述2三人工智能的发...

2023-05-31湖南大学人工智能实验2报告

人工智能实验二使用Prolog的一阶逻辑推理实验20xx08070124易雪媛智能1201一实验目的1学会使用Prolog语言2用Prolog语言巩固一阶逻辑知识3能够使用prolog语言实现一阶逻辑的证明二实...

2023-05-22人工智能读书报告知识及推理

人工智能读书报告知识及推理摘要人工智能的目标是使机器能够成为具有和人类一样智能的系统而知识和推理一直被认为是智能最集中的体现在实际运行的系统中实现智能的知识推理是具有非常重要的意义知识表示是人工智能领域中非常重...

2023-06-18人工智能实验报告

人工智能实验报告实验名称模糊方法实现电热箱的闭环控制实验模糊逻辑控制FuzzyLogicControl简称模糊控制FuzzyControl是以模糊集合论模糊语言变量和模糊逻辑推理为基础的一种计算机数字控制技术1...

2023-07-07人工智能实验报告02邹维韬

实验2TSP问题的遗传算法实现1001120620xx302516邹维韬12内容结合家乡交通网络图作业实现基于遗传算法的遍历方案要求熟练掌握遗传算法的原理及应用访n个城市他必须选择所要走的路径路径的限制是每个城...

2023-07-05《人工智能导论》课程研究报告总结

人工智能导论课程研究报告题目BP神经网络的非线性函数拟合班级自动化1303班姓名汪洋房亮彭正昌蔡博刘航范金祥学号20xx年1月1日目录第一章人工智能相关介绍11人工神经网络与matlab312人工神经网络的研究...

2023-06-10八数码问题安徽大学人工智能实验报告

人工智能实验八数码一实验目的掌握八数码问题求解二实验内容使用启发式搜索算法求解8数码问题1编制程序实现求解8数码问题A算法采用估价函数wnfndnpn其中dn是搜索树中结点n的深度wn为结点n的数据库中错放的棋...

2023-06-10Prolog人工智能实验报告

华北电力大学科技学院实验报告实验名称课程名称人工智能及应用学生姓名号成绩指导教师刘丽实验日期专业班级学实验报告如打印纸张用A4左装订页边距上下25cm左29cm右21cm字体宋体小四号125倍行距验证性综合性实...

2023-07-07智能家居社会调查报告

智能家居行业的调查报告目录一智能家居的概述二智能家居行业的前景展望三对福建省科正智能科技有限公司的访问四对智能家居的相关调查五个人感想及导师评价一智能家居概述1智能家居的定义智能家居是利用先进的计算机技术网络通...

2023-07-07人工智能实验报告-八数码(1)

人工智能实验一题目实验一启发式搜索算法1实验内容使用启发式搜索算法求解8数码问题编制程序实现求解8数码问题A算法采用估价函数wnfndnpn其中dn是搜索树中结点n的深度wn为结点n的数据库中错放的棋子个数pn...

2023-05-30科研公司有关智能的开发计划调查报告

科研公司有关智能的开发计划调查报告题目智能科学与技术和信息产业发展的关系目录前言3调查方法3调查结果31IBM智能开发计划311智慧的地球412从深蓝到沃森42微软智能开发计划43思科智能开发计划54联想智能开...

人工智能

人工智能-多种模式识别的调研报告时间:2023.7.7

人工智能-多种模式识别的调研报告

摘要

信息技术的飞速发展使得人工智能的应用范围变得越来越广,而模式识别作为其中的一个重要方面,一直是人工智能研究的重要方向。在介绍人工智能和模式识别的相关知识的同时,对人工智能在模式识别中的应用进行了一定的论述。

模式识别(PatternRecognition)是人类的一项基本智能,着20世纪40年代计算机的出现以及50年代人工智能的兴起,模式识别技术有了长足的发展。模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理 的研究有交叉关系。模式识别的发展潜力巨大。

关键词:模式识别;人工智能;多种模式识别的应用;模式识别技术的发展潜力

引言

随着计算机应用范围不断的拓宽,我们对于计算机具有更加有效的感知“能力”,诸如对声音、文字、图像、温度以及震动等外界信息,这样就可以依靠计算机来对人类的生存环境进行数字化改造。但是从一般的意义上来讲,当前的计算机都无法直接感知这些信息,而只能通过人在键盘、鼠标等外设上的操作才能感知外部信息。虽然摄像仪、图文扫描仪和话筒等相关设备已经部分的解决了非电信号的转换问题,但是仍然存在着识别技术不高,不能确保计算机真正的感知所采录的究竟是什么信息。这直接使得计算机对外部世界的感知能力低下,成为计算机应用发展的瓶颈。这时,能够提高计算机外部感知能力的学科——模式识别应运而生,并得到了快速的发展。人工智能中所提到的模式识别是指采用计算机来代替人类或者是帮助人类来感知外部信息,可以说是一种对人类感知能力的一种仿真模拟。它探讨的是计算机模式识别系统的建立,通过计算机系统来模拟人类感官对外界信息的识别和感知

1、模式识别

什么是模式和模式识别?

模式可分成抽象的和具体的两种形式。前者如意识、思想、议论等,属于概念识别研究的范畴,是人工智能的另一研究分支。我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。

模式识别(PatternRecognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(SupervisedClassification)和无监督的分类(UnsupervisedClassification)两种。二者的主要差别在于,各实验样本所属的类别是否预先已知。一般说来,有监督的分类往往需要提供大量已知类别的样本,但在实际问题中,这是存在一定困难的,因此研究无监督的分类就变得十分有必要了。

2、人工智能

人工智能的定义可以分为两部分,即“人工”和“智能”。“人工”比较好理解,争议性也不大。有时我们会要考虑什么是人力所能及制造的,或者人自身的智能程度有没有高到可以创造人工智能的地步,等等。但总的来说,“人工系统”就是通常意义下的人工系统。

关于什么是“智能”,就问题多多了。这涉及到其它诸如意识(consciousness)、自我(self)、思维(mind)(包括无意识的思维(unconscious_mind)等等问题。人唯一了解的智能是人本身的智能,这是普遍认同的观点。但是我们对我们自身智能的理解都非常有限,对构成人的智能的必要元素也了解有限,所以就很难定义什么是“人工”制造的“智能”了。因此人工智能的研究往往涉及对人的智能本身的研究。其它关于动物或其它人造系统的智能也普遍被认为是人工智能相关的研究课题。

人工智能目前在计算机领域内,得到了愈加广泛的重视。并在机器人,经济政治决策,控制系统,仿真系统中得到应用。

人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,主要包括计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用。人工智能将涉及到计算机科学、心理学、哲学和语言学等学科。可以说几乎是自然科学和社会科学的所有学科,其范围已远远超出了计算机科学的范畴,人工智能与思维科学的关系是实践和理论的关系,人工智能是处于思维科学的技术应用层次,是它的一个应用分支。从思维观点看,人工智能不仅限于逻辑思维,要考虑形象思维、灵感思维才能促进人工智能的突破性的发展,数学常被认为是多种学科的基础科学,数学也进入语言、思维领域,人工智能学科也必须借用数学工具,数学不仅在标准逻辑、模糊数学等范围发挥作用,数学进入人工智能学科,它们将互相促进而更快地发展。

3、多种模式识别的应用

3.1文字识别

汉字已有数千年的历史,也是世界上使用人数最多的文字,对于中华民族灿烂文化的形成和发展有着不可磨灭的功勋。所以在信息技术及计算机技术日益普及的今天,如何将文字方便、快速地输入到计算机中已成为影响人机接口效率的一个重要瓶颈,也关系到计算机能否真正在我过得到普及的应用。目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种。其中人工键入速度慢而且劳动强度大;自动输入又分为汉字识别输入及语音识别输入。从识别技术的难度来说,手写体识别的难度高于印刷体识别,而在手写体识别中,脱机手写体的难度又远远超过了连机手写体识别。到目前为止,除了脱机手写体数字的识别已有实际应用外,汉字等文字的脱机手写体识别还处在实验室阶段。

3.2语音识别

语音识别技术技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安验证方式。而且利用基因算法训练连续隐马尔柯夫模型的语音识别方法现已成为语音识别的主流技术,该方法在语音识别时识别速度较快,也有较高的识别率。

3.3指纹识别

我们手掌及其手指、脚、脚趾内侧表面的皮肤凹凸不平产生的纹路会形成各种各样的图案。而这些皮肤的纹路在图案、断点和交叉点上各不相同,是唯一的。依靠这种唯一性,就可以将一个人同他的指纹对应起来,通过比较他的指纹和预先保存的指纹进行比较,便可以验证他的真实身份。一般的指纹分成有以下几个大的类别:leftloop,rightloop,twinloop,whorl,arch和tentedarch,这样就可以将每个人的指纹分别归类,进行检索。指纹识别基本上可分成:预处理、特征选择和模式分类几个大的步骤。

3.4图像模式识别

图像模式识别的方法很多,从图像模式识别提取的特征对象来看,图像识别方法可分为以下几种:基于形状特征的识别技术、基于色彩特征的识别技术以及基于纹理特征的识别技术。其中,基于形状特征的识别方法,其关键是找到图像中对象形状及对此进行描述,形成可视特征矢量,以完成不同图像的分类,常用来表示形状的变量有形状的周长、面积、圆形度、离心率等。基于色彩特征的识别技术主要针对彩色图像,通过色彩直方图具有的简单且随图像的大小、旋转变换不敏感等特点进行分类识别。基于纹理特征的识别方法是通过对图像中非常具有结构规律的特征加以分析或者则是对图像中的色彩强度的分布信息进行统计来完成。

从模式特征选择及判别决策方法的不同可将图像模式识别方法大致归纳为两类:统计模式(决策理论)识别方法和句法(结构)模式识别方法。此外,近些年随着对模式识别技术研究的进一步深入,模糊模式识别方法和神经网络模式识别方法也开始得到广泛的应用。在此将这四种方法进行一下说明。

3.5句法模式识别

对于较复杂的模式,如采用统计模式识别的方法,所面临的一个困难就是特征提取的问题,它所要求的特征量十分巨大,要把某一个复杂模式准确分类很困难,从而很自然地就想到这样的一种设计,即努力地把一个复杂模式分化为若干较简单子模式的组合,而子模式又分为若干基元,通过对基元的识别,进而识别子模式,最终识别该复杂模式。正如英文句子由一些短语,短语又由单词,单词又由字母构成一样。用一组模式基元和它们的组成来描述模式的结构的语言,称为模式描述语言。支配基元组成模式的规则称为文法。当每个基元被识别后,利用句法分析就可以作出整个的模式识别。即以这个句子是否符合某特定文法,以判别它是否属于某一类别。这就是句法模式识别的基本思想。

句法模式识别系统主要由预处理、基元提取、句法分析和文法推断等几部分组成。由预处理分割的模式,经基元提取形成描述模式的基元串(即字符串)。句法分析根据文法推理所推断的文法,判决有序字符串所描述的模式类别,得到判决结果。问题在于句法分析所依据的文法。不同的模式类对应着不同的文法,描述不同的目标。为了得到于模式类相适应的文法,类似于统计模式识别的训练过程,必须事先采集足够多的训练模式样本,经基元提取,把相应的文法推断出来。实际应用还有一定的困难。

3.6统计模式识别

统计模式识别是目前最成熟也是应用最广泛的方法,它主要利用贝叶斯决策规则解决最优分类器问题。统计决策理论的基本思想就是在不同的模式类中建立一个决策边界,利用决策函数把一个给定的模式归入相应的模式类中。统计模式识别的基本模型如图2,该模型主要包括两种操作模型:训练和分类,其中训练主要利用己有样本完成对决策边界的划分,并采取了一定的学习机制以保证基于样本的划分是最优的;而分类主要对输入的模式利用其特征和训练得来的决策函数而把模式划分到相应模式类中。

统计模式识别方法以数学上的决策理论为基础建立统计模式识别模型。其基本模型是:对被研究图像进行大量统计分析,找出规律性的认识,并选取出反映图像本质的特征进行分类识别。统计模式识别系统可分为两种运行模式:训练和分类。训练模式中,预处理模块负责将感兴趣的特征从背景中分割出来、去除噪声以及进行其它操作;特征选取模块主要负责找到合适的特征来表示输入模式;分类器负责训练分割特征空间。在分类模式中,被训练好的分类器将输入模式根据测量的特征分配到某个指定的类。统计模式识别组成如图2所示。

图2统计模式识别模型

4、模式识别技术的发展潜力

模式识别技术是人工智能的基础技术,21世纪是智能化、信息化、计算化、网络化的世纪,在这个以数字计算为特征的世纪里,作为人工智能技术基础学科的模式识别技术,必将获得巨大的发展空间。在国际上,各大权威研究机构,各大公司都纷纷开始将模式识别技术作为公司的战略研发重点加以重视。

3.1语音识别技术

语音识别技术正逐步成为信息技术中人机接口的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。中国互联网中心的市场预测:未来5年,中文语音技术领域将会有超过400亿人民币的市场容量,然后每年以超过30%的速度增长。

3.2生物认证技术

生物认证技术本世纪最受关注的安全认证技术,它的发展是大势所趋。人们愿意忘掉所有的密码、扔掉所有的磁卡,凭借自身的唯一性来标识身份与保密。国际数据集团(IDC)预测:作为未来的必然发展方向的移动电子商务基础核心技术的生物识别技术在未来10年的时间里将达到100美元的市场规模。

3.3数字水印技术

90年代以来才在国际上开始发展起来的数字水印技术是最具发展潜力与优势的数字媒体版权保护技术。IDC预测,数字水印技术在未来的5年内全球市场容量超过80亿美元。

结语

综上所述,模式识别从20世纪20年代发展至今,人们的一种普遍看法是不存在对所有模式识别问题都适用的单一模型和解决识别问题的单一技术,我们现在拥有的只是一个工具袋,所要做的是结合具体问题把统计的和句法的识别结合起来,把统计模式识别或句法模式识别与人工智能中的启发式搜索结合起来,把统计模式识别或句法模式识别与支持向量机的机器学习结合起来,把人工神经元网络与各种已有技术以及人工智能中的专家系统、不确定推理方法结合起来,深入掌握各种工具的效能和应有的可能性,互相取长补短,开创模式识别应用的新局面。

参考文献

1边肇祺,张学工等编著.模式识别(第二版).北京:清华大学出版社,2000.

2王碧泉,陈祖荫.模式识别理论、方法和应用.北京:地震出版社,1989.

3赵陵滋,甘云祥.统计模式识别算法的MATLAB语言实现.应用科技

4语音识别理想与现实的距离 

5人类形象思维模式识别与机器模式识别之探讨  

6指纹认证方法应注意的问题 

第二篇:人工智能与模式识别

人工智能与模式识别

摘要:信息技术的飞速发展使得人工智能的应用范围变得越来越广,而模式识别作为其中的一个重要方面,一直是人工智能研究的重要方向。在介绍人工智能和模式识别的相关知识的同时,对人工智能在模式识别中的应用进行了一定的论述。模式识别是人类的一项基本智能,着20世纪40年代计算机的出现以及50年代人工智能的兴起,模式识别技术有了长足的发展。模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。模式识别的发展潜力巨大。

关键词:模式识别;数字识别;人脸识别中图分类号;

Abstract:Therapiddevelopmentofinformationtechnologymakestheapplicationofartificialintelligencebecomemoreandmorewidely.Patternrecognition,asoneoftheimportantaspects,hasalwaysbeenanimportantdirectionofartificialintelligenceresearch.Intheintroductionofartificialintelligenceandpatternrecognitionrelatedknowledgeatthesametime,artificialintelligenceinpatternrecognitionapplicationswerediscussed.Patternrecognitionisabasichumanintelligence,theemergenceofthe20thcentury,40yearsofcomputerandtheriseofartificialintelligenceinthe1950s,patternrecognitiontechnologyhasmadegreatprogress.Patternrecognitionandstatistics,psychology,linguistics,computerscience,biology,cyberneticsandsohavearelationship.Ithasacross-correlationwithartificialintelligenceandimageprocessing.Thepotentialofpatternrecognitionishuge.

Keywords:patternrecognition;digitalrecognition;facerecognition;

1引言

随着计算机应用范围不断的拓宽,我们对于计算机具有更加有效的感知“能力”,诸如对声音、文字、图像、温度以及震动等外界信息,这样就可以依靠计算机来对人类的生存环境进行数字化改造。但是从一般的意义上来讲,当前的计算机都无法直接感知这些信息,而只能通过人在键盘、鼠标等外设上的操作才能感知外部信息。虽然摄像仪、图文扫描仪和话筒等相关设备已经部分的解决了非电信号的转换问题,但是仍然存在着识别技术不高,不能确保计算机真正的感知所采录的究竟是什么信息。这直接使得计算机对外部世界的感知能力低下,成为计算机应用发展的瓶颈。这时,能够提高计算机外部感知能力的学科——模式识别应运而生,并得到了快速的发展,同时也成为了未来电子信息产业发展的必然趋势。

人工智能中所提到的模式识别是指采用计算机来代替人类或者是帮助人类来感知外部信息,可以说是一种对人类感知能力的一种仿真模拟。近年来电子产品中也加入了诸多此类的功能:如手机中的指纹识别解锁功能;眼球识别解锁技术;手势拍照功能亦或是机场先进的人耳识别技术等等。这些功能看起来纷繁复杂,但如果需要一个概括的话,可以说这都是模式识别技术给现代生活带来的福分。它探讨的是计算机模式识别系统的建立,通过计算机系统来模拟人类感官对外界信息的识别和感知,从而将非电信号转化为计算机可以识别的电信号。

2人工智能和模式识别

人工智能(ArtificialIntelligence),是相对与人的自然智能而言的,它是指采用人工的方法及技术,对人工智能进行模仿、延伸及扩展,进而实现“机器思维”式的人工智能。简而言之,人工智能是一门研究具有智能行为的计算模型,其最终的目的在于建立一个具有感知、推理、学习和联想,甚至是决策能力的计算机系统,快速的解决一些需要专业人才能解决的问题。从本质上来讲,人工智能是一种对人类思维及信息处理过程的模拟和仿真。

模式识别,即通过计算机采用数学的知识和方法来研究模式的自动处理及判读,实现人工智能。在这里,我们将周围的环境及客体统统都称之为“模式”,即计算机需要对其周围所有的相关信息进行识别和感知,进而进行信息的处理。在人工智能开发,即智能机器开发过程中的一个关键环节,就是采用计算机来实现模式(包括文字、声音、人物和物体等)的自动识别,其在实现智能的过程中也给人类对自身智能的认识提供了一个途径。在模式识别的过程中,信息处理实际上是机器对周围环境及客体的识别过程,是对人参与智能识别的一个仿真。相对于人而言,光学信息及声学信息是两个重要的信息识别来源和方式,它同时也是人工智能机器在模式识别过程中的两个重要途径。在市场上具有代表性的产品有:光学字符识别系统以及语音识别系统等。

在这里的模式识别,我们可以将之理解成为:根据识别对象具有特征的观察值来将其进行分类的一个过程。采用计算机来进行模式识别,是在上世纪60年代初发展起来的一门新兴学科,但同样也是未来一段实践中发展的必然方向。在生活节奏相当之快的今天人们希望电子产品可以为我们的生活提供更多的便利条件。因此在未来相当一段时间内模式识别技术依然是发展的必然趋势。

模式识别的定义是借助计算机,就人类对外部世界某一特定环境中的客体、过程和现象的识别功能(包括视觉、听觉、触觉、判断等)进行自动模拟的科学技术。随着20世纪40年代计算机的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在20世纪60年代初迅速发展并成为一门新学科。

模式识别(PatternRecognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(SupervisedClassification)和无监督的分类(UnsupervisedClassification)两种。二者的主要差别在于,各实验样本所属的类别是否预先已知。一般说来,有监督的分类往往需要提供大量已知类别的样本,但在实际问题中,这是存在一定困难的,因此研究无监督的分类就变得十分有必要了。

此外,模式还可分成抽象的和具体的两种形式。前者如意识、思想、议论等,属于概念识别研究的范畴,是人工智能的另一研究分支。我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。

模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。

模式识别与很多学科都有联系,它与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。例如自适应或自组织的模式识别系统包含了人工智能的学习机制;人工智能研究的景物理解、自然语言理解也包含模式识别问题。又如模式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式识别的技术。

模式识别的方法主要有决策理论方法和句法方法,模式识别方法的选择取决于问题的性质。如果被识别的对象极为复杂,而且包含丰富的结构信息,一般采用句法方法;被识别对象不很复杂或不含明显的结构信息,一般采用决策理论方法。这两种方法不能截然分开,在句法方法中,基元本身就是用决策理论方法抽取的。在应用中,将这两种方法结合起来分别施加于不同的层次,常能收到较好的效果。

模式识别的应用非常广泛,比较典型的有:1文字识别:在信息技术及计算机技术日益普及的今天,如何将文字方便、快速地输入到计算机中已成为影响人机接口效率的一个重要瓶颈,也关系到计算机能否真正在我过得到普及的应用。目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种。其中人工键入速度慢而且劳动强度大;自动输入又分为汉字识别输入及语音识别输入。从识别技术的难度来说,手写体识别的难度高于印刷体识别,而在手写体识别中,脱机手写体的难度又远远超过了联机手写体识别。到目前为止,除了脱机手写体数字的识别已有实际应用外,汉字等文字的脱机手写体识别还处在实验室阶段。2语音识别:语音识别技术技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安验证方式。而且利用基因算法训练连续隐马尔柯夫模型的语音识别方法现已成为语音识别的主流技术,该方法在语音识别时识别速度较快,也有较高的识别率。3指纹识别:每个人的指纹是唯一的,依靠这种唯一性,就可以将一个人同他的指纹对应起来,通过比较他的指纹和预先保存的指纹进行比较,便可以验证他的真实身份。一般的指纹分成有以下几个大的类别:环型(loop),螺旋型(whorl),弓型(arch),这样就可以将每个人的指纹分别归类,进行检索。指纹识别基本上可分成:预处理、特征选择和模式分类几个大的步骤。除了这几个眼下热门的方向,模式识别还在遥感和医学诊断领域发挥了重要的作用。

最后介绍下模式模式识别的发展潜力,模式识别技术有着近乎无限的发展潜力,模式识别技术是人工智能的基础技术,21世纪是智能化、信息化、计算化、网络化的世纪,在这个以数字计算为特征的世纪里,作为人工智能技术基础学科的模式识别技术,必将获得巨大的发展空间。在国际上,各大权威研究机构,各大公司都纷纷开始将模式识别技术作为公司的战略研发重点加以重视。模式识别发展潜力较大的技术有1语音识别技术,语音识别技术正逐步成为信息技术中人机接口(HumanComputerInterface,HCI)的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。中国互联网中心的市场预测:未来5年,中文语音技术领域将会有超过400亿人民币的市场容量,然后每年以超过30%的速度增长。2生物认证技术,生物认证技术(Biometrics)本世纪最受关注的安全认证技术,它的发展是大势所趋。人们愿意忘掉所有的密码、扔掉所有的磁卡,凭借自身的唯一性来标识身份与保密。国际数据集团(IDC)预测:作为未来的必然发展方向的移动电子商务基础核心技术的生物识别技术在未来10年的时间里将达到100亿美元的市场规模。3数字水印技术90年代以来才在国际上开始发展起来的数字水印技术(DigitalWatermarking)是最具发展潜力与优势的数字媒体版权保护技术。IDC预测,数字水印技术在未来的5年内全球市场容量超过80亿美元。

模式识别从20世纪20年代发展至今,人们已经形成了一种普遍看法,那就是不存在对所有模式识别问题都适用的单一模型和解决识别问题的单一技术,我们现在拥有的只是一个工具袋,所要做的是结合具体问题把统计的和句法的识别结合起来,把统计模式识别或句法模式识别与人工智能中的启发式搜索结合起来,把统计模式识别或句法模式识别与支持向量机的机器学习结合起来,把人工神经元网络与各种已有技术以及人工智能中的专家系统、不确定推理方法结合起来,深入掌握各种工具的效能和应有的可能性,互相取长补短,开创模式识别应用的新局面。

3人工智能在模式识别中的应用

(一)数字识别及语音识别。在数字识别的过程中,对于手写体的识别一直是一个难题,而其又在邮政编码的识别、银行业务等方面具有较为广泛的应用,但是其字体形式变化较大,导致提高对其的识别率成为了一个难题,精准的识别存在着较大的困难。而采用人工智能中的神经网络技术后,系统可以利用神经网络的学习及快速并行功能来实现对手写数字的快速识别,有力的提高相关运用领域的工作效率。

而语音识别,简单的将就是能使得计算机能听懂人所说的话,一个典型的例子就是七国语言(中、日、英、意、韩、法、德)口语自动翻译系统,它可以将人说的话翻译成为机器所设定的目的语言,在整个过程中不需要翻译人员的参与。其中的中文部分实验平台设置在中科院自动化所的模式识别国家重点实验室中,这标志着我国的机器口语翻译研究已经跨入世界先进行列。在这个系统的功能实现之后,出国旅行需要预定旅馆、购买机票、就餐等需要和外国人进行对话时,只需要利用电话网络或者是国际互联网就能够顺利的和对方进行通话,进行语言交流。

在数字识别的过程中,对于手一83一写体的识别一直是一个难题,而其又在邮政编码的识别、银行业务等方面具有较为广泛的应用,但是其字体形式变化较大,导致提高对其的识别率成为了一个难题,精准的识别存在着较大的困难。而采用人工智能中的神经网络技术后,系统可以利用神经网络的学习及快速并行功能来实现对手写数字的快速识别,有力的提高相关运用领域的工作效率。而语音识别,简单的将就是能使得计算机能听懂人所说的话,一个典型的例子就是七国语言(中、日、英、意、韩、法、德)口语自动翻译系统,它可以将人说的话翻译成为机器所设定的目的语言,在整个过程中不需要翻译人员的参与。其中的中文部分实验平台设置在中科院自动化所的模式识别国家重点实验室中,这标志着我国的机器口语翻译研究已经跨入世界先进行列。在这个系统的功能实现之后,出国旅行需要预定旅馆、购买机票、就餐等需要和外国人进行对话时,只需要利用电话网络或者是国际互联网就能够III~I的和对方进行通话,进行语言交流。

(二)人脸立体识别模式。人脸识别的过程主要包括这样三个主要的部分:

其一,人脸模式库,即与所采集的实时图像进行对比,判断其是否存在于人脸模式库当中,若存在,则给出每个人脸的位置和大小等相关的脸部信息;

其二,对面部特征进行定位,即对每一个人脸的主要器官进行检测,包括对其的具体位置和形状等特征进行具体的信息收集,然后将之进行归一化的处理;

其三,比对,即根据所采集到得人脸面部特征来和人脸模式库中的图像进行对比,之后对该人脸的身份进行核实。

常见的人脸识别技术大部分可以归为这样三个类型:采用基于几何特征的方法,基于模板的方法以及基于模型的方法。其中,基于几何特征的方法最为常见,它通常需要与其他的算法进行结合之后才能形成比较好的识别效果;而基于模板的方法又能够分为基于匹配的方法、脸部特征的方法、线性判别分析的方法、神经网络方法以及奇异值分解方法等;再次,基于模型的方法主要包括基于隐马尔可夫模型、主动外观模型和主动形状模型方法等。

采用人脸识别模式来进行身份验证具有明显的有点,诸如:易用性好、准确度高、隐私性能好、稳定性好,且能被大部分的用户容所接受。人脸二维图像的识别已经基本实现,但是基于三维的立体图像人脸识别技术却处于研发阶段。人脸的二维及三维模型所反映的脸部外部信息是不同的,二维图像中的灰度值反映的是人脸表面亮度的差异,而三维图像中添加了深度信息,它能够表达脸形的信息数据,使得脸部的信息量更加丰富,能提高脸部的识别概率。

人脸立体识别模式。人脸识别的过程主要包括这样三个主要的部分:其一,人脸模式库,即与所采集的实时图像进行对比,判断其是否存在于人脸模式库当中,若存在,则给出每个人脸的位置和大小等相关的脸部信息;其二,对面部特征进行定位,即对每一个人脸的主要器官进行检测,包括对其的具体位置和形状等特征进行具体的信息收集,然后将之进行归一化的处理;其三,比对,即根据所采集到得人脸面部特征来和人脸模式库中的图像进行对比,之后对该人脸的身份进行核实。常见的人脸识别技术大部分可以归为这样三个类型:采用基于几何特征的方法,基于模板的方法以及基于模型的方法。其中,基于几何特征的方法最为常见,它通常需要与其他的算法进行结合之后才能形成比较好的识别效果;而基于模板的方法又能够分为基于匹配的方法、脸部特征的方法、线性判别分析的方法、神经网络方法以及奇异值分解方法等;再次,基于模型的方法主要包括基于隐马尔可夫模型、主动外观模型和主动形状模型方法等。采用人脸识别模式来进行身份验证具有明显的有点,诸如:易用性好、准确度高、隐私性能好、稳定性好,且能被大部分的用户容所接受。人脸二维图像的识别已经基本实现,但是基于三维的立体图像人脸识别技术却处于研发阶段。人脸的二维及三维模型所反映的脸部外部信息是不同的,二维图像中的灰度值反映的是人脸表面亮度的差异,而三维图像中添加了深度信息,它能够表达脸形的信息数据,使得脸部的信息量更加丰富,能提高脸部的识别概率。

4蚁群算法与物流配送4.1物流配送的优化方法

随着物流配送向集约化、一体化方向发展,常将配送的各环节综合考虑,其核心部分是配送车辆的集货、配货和送货过程。配送系统优化,主要是配送车辆的优化调度(包括集货路线优化、货物装配和送货路线优化),以及集货、配货和送货一体化优化。车辆路径问题(VehicleRoutingProblem,VRP)是配送环节的重要组成部分。合理安排车辆数和车辆路线是减少浪费、提高经济效益的重要手段,不但可以降低商品的物流成本,还可以提高客户的满意度,扩大潜在市场,这对于整个物流运输速度、成本、效益有着重要的影响。

近年来,国内外专家对VRP问题的研究日趋深入,但多数集中于对某个单一目标的优化研究,并假设满足某些约束条件。而在实际车辆调度过程中,经常涉及到时间或空间各方面的约束。因此,多目标问题比单目标问题就更常见。VRP问题有多种模型,其中:带时间窗的车辆路径问题(VehicleRoutingProbtemwithTimeWindows,VRPTW)是一个具有代表性的带约束多目标问题。与典型的旅行商问题(TravelingSalesmanProblem,TSP)相比,增加了车容量、时间窗等约束条件,其中两个目标维度分别为车辆数与总时间耗费(或总路径长度当速度定义每单位时间耗费为1时),其目标是在满足空间容量限制和时间限制的条件下,求使总成本最小的最优解。

目前,VRP问题的求解算法很多,可大致分为精确算法和启发式算法两大类。精确算法的计算量一般随着问题规模的增大而呈指数增长,所以多用于规模较小的问题。而对于求解大规模的NP(Non-deterministicPolynomialProblem)难题,则较常用模拟退火算法(SA)、禁忌搜索算法(TS)、遗传算法(GA)、神经网络(NN)、蚂蚁算法(AS)等现代启发式算法。

蚁群算法最初由意大利科学家Dorigo.M于1991年提出,是一种基于群体、用于求解复杂组合优化问题的通用搜索技术。该方法首先被应用于TSP,并在一系列阃题中得到应用,诸如二次分配、Job—shop、图着色问题、VRP问题、集成电路设计以及通信网络负载等离散优化问题等。但蚁群算法搜索时间长、易于停滞(即搜索到一定程度后所有个体所发现的解完全一致),存在不能扩大对解空间继续搜索的缺陷。

4.2蚁群算法研究现状

蚁群算法(AntSystem,AS)是一种新生算法,具有很强的通用性和鲁棒性。从提出到现在,仅短短十余年的时间,但其在离散型组合优化问题的求解中,表现出强大的优越性,所以引起人们的关注。目前蚁群算法的研究学者主要集中在比利时、意大利、德国等国家,美国和日本在近几年也开始了对蚁群算法的研究。国内的研究始于1998年末,主要在上海、北京、东北少数几个学校和研究所开展了此项工作。蚁群算法作为一种新型的智能优化算法,与其它优化算法相比,具有正反馈、分布式计算以及贪婪的启发式搜索等主要特点。正反馈过程使得该算法能够发现较好解;分布式计算使得该算法易于并行实现,更快得到较好解;与启发式算法相结合,使得该算法易于发现较好解,这些特点为更好解决复杂的组合优化问题提供了可能。由于在蚁群算法中所有个体都要进行信息素更新,造成了信息素分配的浪费和分配畸形,所以蚁群算法的性能并不很理想。Dorigo.M等人在蚁群算法又提出了改进的蚁群系统(AntColonySystem,简称ACS),在蚂蚁选择下一城市时使用的转移概率中加入伪随机分配概率,以避免出现蚁群算法中的信息素分配畸形。尽管蚁群系统与蚁群算法相比提高了算法的性能,但它仍然使用蚁群算法中的全局信息素更新原则和局部信息素更新原则,即对所有个体进行信息素更新,造成了信息素的大量冗余,弱化了好信息素的强度。

目前,所有蚁群算法的改进基本上都是建立在蚁群算法基础之上。自1998年,第一届蚂蚁优化国际研讨会召开以来,已经是第三届了,大大推动了蚁群算法的发展。蚁群算法已经引起越来越多的关注,尽管还缺乏完善的理论分析,对它的有效性也没有给出严格的数学解释,但回顾模糊控制的发展历史,理论的不完善并不妨碍应用,有时应用是超前于理论的,并推动理论的研究,伴随着研究的不断深人,蚁群算法必将迎来一个光明的前景。

5心得体会

在经济全球化快速发展的进程中,物流作为“第三利润源”对经济活动的影响越来越强,而它作为当前经济最重要的竞争领域,在优化国内外两个市场的资源配置中起着尤为重要的作用。随着电子商务的发展,出现了一些新的配送模式,使得储存不再是必然的环节,国外有巨头如ebay,国内也有阿里巴巴这样的电子商务帝国,他们的崛起,彻底改变了人们的生活方式。而电子商务的发展,离不开物流配送行业的快速发展。模式识别是一门与生活密切相关的学科,是今后电子产品发展的必然趋势。想想看我们现在身边的电子产品诸如手机、电脑乃至第三代身份证中无不存在模式识别技术的影子。手机电脑中的例子有很多,但与我们密切相关的三代身份证都需要录入指纹,为的是在未来的破案过程中警方可用提取道德指纹在指纹库中寻找到嫌疑人的身份信息。这会大大缩短破案时间提高治安水平,为人民的安居乐业提供前提。

的确模式识别这门学科设计了相当广泛的领域,是未来相当一段时间内飞速发展的领域,这门学科为大四还在迷茫的我指引了一个明确的前进方向。虽然这门学科暂时结业了,但我相信学无止境,在今后的日子里我也有了自己确定的研究方向。我会将一些工具学科的方法利用到这门学科中,或许我在段时间内做不出新的产品或者是项目,但我可以从头做起,先去学习已有的实例而后做相应的应用。

更多相关推荐:调研报告与调查报告的区别

调研报告与调查报告的区别及写作技巧说到调研报告就不能不先说调查报告有许多人把这两种文体混为一谈在写作中不加以区分其实是错误的调查报告是对某一情况某一事件调查研究后将所得的材料和结论加以整理而写成的书面报告调查报...

调研报告与调查报告的区别及其写作技巧、样本及格式要求-志文工作室编辑

调研报告与调查报告的区别及其写作技巧样本及格式要求一什么是调研报告为了对某件事情作比较深入全面的了解我们就需要进行一番调查研究然后形成书面文字这就是调研报告二调研报告与调查报告的区别说到调研报告就不能不先说调查...

调研报告与调查报告的区别

调研报告与调查报告的区别调查报告是对某一情况某一事件调查研究后将所得的材料和结论加以整理而写成的书面报告调查报告的使用范围很广制定方针政策解决各种实际问题弄清事情真相扶植新生事物推广典型经验都离不开调查报告调查...

调查报告与调研报告的区别

调研报告与调查报告的区别及写作技巧说到调研报告就不能不先说调查报告有许多人把这两种文体混为一谈在写作中不加以区分其实是错误的调查报告是对某一情况某一事件调查研究后将所得的材料和结论加以整理而写成的书面报告调查报...

调研报告与调查报告的区别及写作技巧

调研报告与调查报告的区别及写作技巧说到调研报告就不能不先说调查报告有许多人把这两种文体混为一谈在写作中不加以区分其实是错误的调查报告是对某一情况某一事件调查研究后将所得的材料和结论加以整理而写成的书面报告调查报...

调研报告与调查报告的区别及写作技巧

调研报告与调查报告的区别及写作技巧说到调研报告就不能不先说调查报告有许多人把这两种文体混为一谈在写作中不加以区分其实是错误的调查报告是对某一情况某一事件调查研究后将所得的材料和结论加以整理而写成的书面报告调查报...

调研报告与调查报告的区别及写作技巧

调研报告与调查报告的区别及写作技巧说到调研报告就不能不先说调查报告有许多人把这两种文体混为一谈在写作中不加以区分其实是错误的调查报告是对某一情况某一事件调查研究后将所得的材料和结论加以整理而写成的书面报告调查报...

实体店与网店优劣比较的调查报告

关于在消费者购买决策过程中实体店与网店优劣比较的调查报告调查者10广策绝对印象小组调查课题实体店与网店在消费者购买决策过程中的优劣比较调查时间20xx年3月26日调查方式问卷调查调查报告内容调查目的通过进行问卷...

关于导学案使用与否的效果区别的调研报告

关于是否使用导学册的课堂教学效果区别研究调查黄苏珍在课改的背景下我校与时俱进精心筹划从改变教学方式入手改革课堂模式于上学期试行导学案在实践中探索在探索中完善如今已在学校全面推开根据学校的具体要求一是确保导学案的...

关于城乡教育差异的调查报告(整理完整版)

思想道德修养与法律基础实践课教学成果报告题目姓名吴鸿展学号51122902120xx142xxxxxxxx120xx135班级完成日期指导教师关于城乡教育差异的调查报告成国森张展通伍炯城萧海彬林士祺511229...

关于男女购物行为差异的调查报告

关于男女购物行为差异的调查报告为了了解男女消费者购物的心理和行为差异我们进行关于男女消费者购买心理和行为差异的调查我们调查了男女消费者各50人虽然过程不是非常顺利但也还算成功因为在分发调查问卷的过程中肯定会遇到...

课题研究中西方饮食文化差异调查报告

中西方饮食文化差异调查报告张志玲孙静文方璐一调查目的中国饮食文化历史悠久博大精深影响深远风靡世界它经历了几千年的历史发展已成为中华民族的优秀文化遗产世界饮食文化宝库中的一颗璀璨的明珠西方的一些国家曾为一些国家的...

调研报告和调查报告的区别(25篇)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇