博舍

艾瑞:2023年中国人工智能行业发展观察 人工智能研发是什么行业

艾瑞:2023年中国人工智能行业发展观察

导语:2021年,中国人工智能产业继续大踏步前进,计算机视觉核心产品市场规模接近千亿元,智能语音市场亦保持高速增长。

导语:自2010年人工智能在语音和视觉两个领域产生突破性进展以来,技术突破工业红线就成为社会的共同期待。经过了近年来的高速发展,中国人工智能产品技术已经广泛出现在决定企业产生经济效益的各个环节,推动传统行业启动效率变革、动能转换之路。人工智能作为创业企业标签的属性在变弱,而越来越成为千行百业的经营主体都在积极尝试和运用的生产要素。2021年,中国人工智能产业继续大踏步前进,计算机视觉核心产品市场规模接近千亿元,智能语音市场亦保持高速增长。在未来的发展中,如何像人类一样将多模态信息融合分析、突破依赖数据输入的局限、与知识和常识结合解决高层次问题以及主动感知与适应复杂变化等都将是人工智能技术可期待的下一次拐点。

一、2021年中国人工智能发展概述

1.人工智能将成为数字经济时代的核心生产力

数字经济是以数据为关键生产要素、以现代信息网络为重要载体、以数字技术应用为主要特征的经济形态。发展数字经济,微观上可能重塑传统的企业经营模式和经营理念;宏观上,数据作为生产要素的重要性不断提升,将对现有基于要素比较优势而形成的国际分工格局带来影响。近年来,我国数字经济发展迅速,2020年我国数字经济规模为39.2万亿元,占GDP比重达到38.6%,较2019年提升2.4个百分点,对整体经济产值的影响进一步加大。发展数字经济,将打通供应链上下游、产业链的不同环节与服务链的各个节点,通过产业的数字化升级,实现效率变革、动力变革、质量变革,助力新发展格局的形成与发展。2021年3月我国十四五规划纲要出台,提出“打造数字经济新优势”的建设方针并强调了人工智能等新兴数字产业在提高国家竞争力上的重要价值。人工智能作为关键性的新型信息基础设施,被视为拉动我国数字经济发展的新动能。

2.人工智能于各环节提升经济生产活动效能

人工智能技术及产品在企业设计、生产、管理、营销、销售多个环节中均有渗透且成熟度不断提升。同时,随着新技术模型出现、各行业应用场景价值打磨与海量数据积累下的产品效果提升,人工智能应用已从消费、互联网等泛C端领域,向制造、能源、电力等传统行业辐射。以计算机视觉技术主导的人脸识别、光学字符识别(OCR)、商品识别、医学影像识别和以对话式AI技术主导的对话机器人、智能外呼等产品的商业价值已得到市场充分认可;且除感知智能技术外,机器学习、知识图谱、自然语言处理等技术主导的决策智能类产品也在客户触达、管理调度、决策支持等企业业务核心环节体现价值。

3.资本回暖,过会企业二级市场融资通道即将打开

经过2020年新冠疫情的行业洗牌后,2021年以来,资本回暖,资金流入更为成熟的企业(C轮及以后)的同时,也流入了众多A+轮及以前的初创企业,投资者重拾对人工智能创业回报的信心。此外,多家AI企业集中进行IPO使得行业融资实现了跨越,云从科技、旷视科技、格林深瞳、云天励飞均顺利过会,并拟在科创板上市,其人工智能融资即将打开二级市场的通道。

二、中国计算机视觉赛道发展现状及发展趋势

1.市场规模:市场规模接近千亿元,计算机视觉赛道仍是AI商业化主阵地

自人工智能第三次浪潮兴起以来,计算机视觉一直是商业化落地进程最快的赛道,近年来,在深度学习算法的加持与带动下,计算机视觉技术及软硬件产品在泛安防、金融、互联网、医疗、工业、政务等领域得到广泛应用。通过对下游行业需求统计测算,2021年,中国计算机视觉核心产品的市场规模达到990亿元,已接近千亿元大关。此外,与计算机视觉相关的计算机通信设备销售、工程建设、传统业务效益转化等带动相关产业规模超过3000亿元。

2.投融资市场:随着赛道逐渐趋于成熟,投融资热度出现下滑

2017年至2021年11月,计算机视觉类相关融资事件共计282起,涉及融资总金额达820亿元。2018年是计算机视觉赛道的融资爆发期,融资金额高达273亿元。而2019年以来,受疫情影响以及市场饱和度不断提升,赛道融资热度有所降低,融资轮次与金额再未达到2018年的水平。2021年,计算机视觉赛道融资金额下滑至75亿元,但融资次数较2020年明显提升。计算机视觉头部厂商在部分应用领域深耕多年,市场格局趋于稳定,留给初创企业的机会逐渐减少,因此新进入厂商尝试进入工业、医疗等想象空间大且技术成熟度相对较低的市场,预计新一轮的融资热潮有望在未来2-3年到来。

3.发展特征:工业与医疗成为近年来计算机视觉最受关注领域

2017年至2021年11月,国内共有198家计算机视觉企业获得投资,其业务领域遍布公安、交通、金融、工业、医疗等各行各业。近年来,计算机视觉产品技术在工业与医疗领域的应用受到极大关注,制造业是国民经济的支柱,对计算机视觉的使用包括智慧现场安监、智能辅助运输、工业视觉质检以及智能工业机器人等方向,链条长且场景多样,孕育了一批新兴AI企业;医疗领域,以计算机视觉为核心技术的医学影像辅助诊断产品已经由实验室走进各大医院之中,AI医学影像辅助诊断的普及对于减轻医生负担、提升基层医疗机构诊断水平有着重要意义与价值,也是近期资本市场关注的焦点。

4.发展趋势:多模态信息融合分析以及主动感知将是计算机视觉实现飞跃的下个关口

计算机视觉作为商业化程度最高、应用场景最广的人工智能赛道,从技术层面来看,在分类、定位、检测、分割等基本语义感知研究任务上已经取得很好的表现,在真实场景中也能够较好应对实战考验。在未来的发展中,如何像人类一样将多模态信息融合分析、适应三维世界、突破依赖数据输入的局限、与知识和常识结合解决高层次问题以及主动感知与适应复杂变化等都将是计算机视觉技术可期待的下一次拐点。

从未来市场发展来看,通用技术的平台化输出以及公安、金融等具备明确政策支持且产品普及度已经较高的领域目前已基本被互联网巨头、安防头部企业以及AI上市企业或独角兽等玩家占据,市场格局已逐步明朗;而工业、医疗和能源等极具战略意义的新兴领域还拥有极大的发展空间,但对于上述或陷入长审批周期、或限于审慎性难以快速释放需求的行业,计算机视觉企业的主要机遇则在于抢先打通产品进入行业生态圈的渠道和链条,以及谋划通过政府、行业生态圈的核心集团企业等途径,积极参与公共服务平台建设,建立从上向下拓展的先发优势,抢先获得大量训练数据与场景理解,形成产品提升的护城河。

三、中国智能语音赛道发展现状及发展趋势

1.市场规模:垂类语音核心产品规模近60亿,AI语音助手算法产值约24亿

智能语音技术可通过声音信号的前端处理、语音识别(ASR)、自然语言处理(NLP)、语音合成(TTS)等形成完整的人机语音交互。智能语音技术落地分为三类应用场景,分别为以语音识别、语音合成和语音转写为主的垂类应用、消费级智能硬件中加载的语音助手和ChatBot对话机器人产品。2020年,垂类语音核心产品规模约为58亿,AI语音助手算法产值约为24亿。未来随着疫情催化和产业的数智化转型加速,垂类语音应用在教育、公安和医疗等领域加速场景落地,且智能硬件搭载AI语音助手的功能性定位让其随着智能终端的规模扩大具备强需求增长动能。两类智能语音应用未来增长态势趋显,2021年至2026年的五年CAGR将分别达到21.3%和35.4%。

2.投融资市场:资本市场回归平稳,2021年垂类初创企业较为活跃

2018年至2021年11月,智能语音类相关融资事件共计120起,涉及融资总金额达153亿元。从融资热度来看,智能语音赛道在2018年进入快速发展期,2019年进入融资爆发期,而后进入平稳发展阶段。从融资轮次来看,智能语音企业融资阶段多集中在A+轮及以前和PreB到B+轮,两者占比高达72%。2021年,切分垂类场景的智能语音初创企业较为活跃,新进入厂商纷纷瞄准以医疗、招聘、工业等为代表的智能语音市场,期望获取行业经验和细分场景加成下的竞争性优势。

3.发展特征:智能语音与语义理解、知识图谱、行业应用的创新发展

在技术侧,智能语音行业发展仍然面临着声纹识别的不稳定性、语音识别的鲁棒性以及训练场景的长尾性的落地挑战;而在应用侧,智能语音技术已逐步从纯技术形式应用,转向“语音+AI技术+行业“的创新式发展。受供给侧的业务增长突破和需求侧的客户诉求推动,智能语音技术调用不仅是单纯为转写“人说了什么”或者输出“机器要说什么”,而是正逐步与语义理解、知识图谱等AI技术融合,让使用智能语音技术的机器本体更加具备认知性和行业关联性,结合行业Know和甲方需求输出整体性、结果导向性的实用解决方案。

4.发展趋势:智能语音加速产业落地融合,硬件中语音交互入口的功能性定位带来强需求增长动能

目前,智能语音的语音识别、语音合成和语音转写能力已落地应用在互联网、医疗健康、司法、教育和工业等多行业领域。基于智能语音技术实现文本到语音、语音到文本的快速转换,在各产业应用中实现语音文本的信息同步,让资料整理和信息检索都更加方便快捷,让机器与人类的交互更加快速直接。从规模占比来看,互联网、司法和教育仍占据三大头部应用领域。从业务增长性来看,国家颁布教育“双减”政策,课后服务学生的自主阅读学习给智能语音应用产品带来较大市场;另外在医疗信息化背景下,医疗加速智能应用体系建设,以语音应用为入口切入电子语音病历、导诊机器人、辅助诊断治疗等领域,已从三甲医院逐步向下渗透。未来,消费级硬件所搭载的AI语音算法将成为硬件智能化的基础标配门槛,随着物联网和5G的技术发展,智能硬件带来强大增长动能,AI语音助手的算法产值也将不断升高。

四、中国AI企业典型案例解析

1.易道博识:聚焦文字、人脸与图像识别的AI技术研究与应用开发服务商,以一站式机器学习训练平台为底座,打造高效的AI模型应用

易道博识由来自中科院、清华大学、北京大学等的多名顶尖人工智能专家共同组建,是国家级高新技术企业及专精特新企业,拥有发明专利、实用新型专利50余项,计算机软件著作权35项,商标知识产权30余个。公司致力于人工智能领域的技术研究与应用开发,基于自主研发的赛博(CyberBot)机器学习平台,实现文字识别、人脸识别、图像识别三大核心技术功能,为证券、银行、保险、互联网、汽车金融、地产多个行业量身打造AI+智能OCR识别解决方案,现已与600多家知名企业和机构建立合作。

赛博(CyberBot)学习平台是易道博识自主研发的一站式机器学习训练平台,集智能数据管理、数据标注、模型训练和模型部署应用功能于一身,提供计算机视觉、OCR和NLP等领域数据驱动模型应用的高效解决方案。该平台可有效缓解B端、G端逐渐增长的、从感知到认知多类型的AI应用模型开发、训练到部署的完整需求,输出AI技术服务能力,提高AI应用模型在各行业的渗透速率与价值空间。赛博平台可以根据客户需求整体部署到客户的私有化环境里,实现内部循环,一方面保证了数据安全性,一方面大大降低了编程工作量和使用门槛、节约了AI开发时间、减轻了对专业数据科学家与算法工程师的依赖,按需柔性匹配生产。

2.慧算账:以平台为内部开发管理工具,对外提供AI智慧财税服务,助力客户实现数字化转型

慧算账致力于使用AI工具为中小微企业提供AI智慧财税服务,以改善并解决数字经济背景下国内财税服务市场面临的业务痛点即中小企业需记账报税、但外聘会计成本高,部分代理记账公司数字化程度低且记账服务专业性差等问题。慧算账SaaS财税服务平台集成了记账报税、知识库、智能客服与CRM等模块,采用了RPA的自动化技术与OCR、ML、KG、NLP等AI技术,针对财税服务市场的业务痛点做通用与定制化的应用开发,目前已开发出票据识别、智能记账等应用。从服务模式看,慧算账以SaaS财税服务平台为内部开发管理工具,对外输出AI智慧财税服务与工具,助力记账报税的自动化、释放人力,为中小微企业的数字化与智能化转型提供了便捷灵活的创新型财税服务。

以票据识别与记账、智能会计核算、知识图谱问答为例,慧算账提供了便捷高效的AI智慧财税服务。票据识别方面,可实现自动化的格式统一与图像质量矫正,识别出票据类型(发票、回单、交通票、费用票等),并自动导入数据信息。智能会计核算方面,可自动将文字转化为词向量、实现数据归一,并根据输入信息搭建业务模型,输出指定的结果。知识图谱方面,可自动提取问题中的关键词,更新知识存储,基于知识库回答会计问题,提升记账的专业性。从效果上看,慧算账为下游的中小企业提供的智慧财税服务覆盖数百个科目、近千个业务场景,业务自动化能力超95%,助力客户实现数字化转型;同时,慧算账也为其他代理记账公司提供AI工具,提升其记账服务的数字化与智能化水平。

(本文为艾瑞网独家原创稿件转载请注明出处)

人工智能:从“作坊式”走向“工业化”新时代

对于普通人来说,人工智能是一个既熟悉而又神秘的词。在我国“十四五”规划中,多次提到要推动人工智能产业发展。当前产业现状如何?正在走向何方?哪些领域最有可能取得突破?带着这些问题,记者采访了中国科学院自动化研究所所长徐波。

中国科学院自动化研究所所长徐波。受访者供图

人工智能创新不断“一体两翼”快速发展

人民网:当前,人工智能技术创新不断,应用层出不穷。它究竟走到了哪一步?能否谈谈您是如何看待我国人工智能技术发展现状的?

徐波:人工智能是一个高度交叉复合、快速发展的领域。如果要对其发展现状作一个全面概括,可以从人工智能“一体两翼”构成来着手分析。

其中“一翼”是指人工智能的基础理论。人工智能快速发展无疑受益于大数据和大算力发展,但基础还是15年前深度学习基础理论和方法的突破。人工智能越发展,其计算、生物、数学、材料、心理学和社会学等交叉复合特性就越明显。我国人工智能高水平论文发表数量已经位居世界一二,人工智能基础研究发展态势良好,已经成为人工智能基础研究大国。但成为人工智能基础研究强国,还需要在需求牵引下,按照问题导向继续弘扬“十年磨一剑”的科学家专注精神。

另外“一翼”就是人工智能的应用。人工智能具有无所不在的广阔应用场景,技术落地需要和工业制造、农业发展、医疗制药、社会治理等领域深度结合。我国有市场、人才、规模、数据等方面的优势,在应用方面走得比较快,对各行业的渗透深度和广度前所未有,具有世界上独一无二的优势,已经走在世界发展最前列。

人工智能中间非常关键的“一体”,指的是人工智能的基础软硬件,包括芯片、算法、软件硬件协同、开源框架、应用开发接口等等。它作为一个桥梁,把人工智能基础研究成果和场景应用广泛地结合在一起。目前,我们的基础软硬件研发已经从“可用”走到基本“好用”的阶段,发展了自主可控的人工智能基础软硬件生态。

人民网:产业应用是技术发展中很重要的部分。您认为我国要发展人工智能产业,占领关键技术高地,未来的突破口在哪里?

徐波:随着我国新一代人工智能的发展,人工智能应用呈现出遍地开花的良好发展态势。但人工智能落地中,也碰到很多问题,例如对数据质量要求高、缺乏相应标准、落地周期长成本高、人才昂贵等。

我认为可以从这几方面寻找突破口。

首先是复合型人才的培养。智能社会发展过程中需要培养一批既懂行业需求流程、又懂人工智能的专业人才。人工智能还完全没有发展到可以通过调几个参数就能上线替代部分人工作的水平。其中行业数据的获取、清洗和加工,以及如何按照业务需求建立相应的应用模型都需要一些这样的复合型人才支撑。

其次要降低人工智能的应用门槛。现在按照专用人工智能技术发展的应用,在很多时候发现还不如用个人更省成本。所以,如何从专用型的人工智能,逐步向更具泛化能力的人工智能技术发展,是一个重要的技术突破口,也是未来5-10年人工智能技术发展的主流。

这个过程中,从推动产业发展的角度选择一些超级场景对于牵引人工智能应用发展非常关键。例如,自动驾驶会是人工智能在单一领域里最大的产业场景,也是汽车工业发展的必争之地。类似的还有人工智能+医疗,也是一个特别大的场景。中国有四百万医生、全世界最大的临床海量医疗数据,最适合人工智能去发挥智能化优势。所以,要选择一些这样的超级场景,作为推动人工智能进步的突破口。

加快原始创新策源努力占据制高点

人民网:中科院自动化所作为我国“国家战略科技力量”的重要组成部分,“十四五”期间在人工智能领域的研究和应用方面,有哪些相应的目标和计划?

徐波:我们按照“两加快一努力”要求,加快原始创新策源和关键核心技术突破,努力占据人工智能科技创新制高点。

中国科学院自动化研究所始终关注人工智能中长远发展布局。十年前在深度学习刚刚开始应用于语音、图像并产生技术突破时,我们意识到感知类人工智能应用将逐渐由产业界为主导,于是开始布局更前瞻性的类脑智能,推动人工智能和脑科学的交叉研究实现,并与科学院神经所成立脑科学与智能技术交叉研究中心。目前这个方向已经成为研究所三大主力研究方向,相信在下一代人工智能发展中也将扮演重要角色。

人工智能想要在经济发展、社会治理、大工程系统等复杂问题的决策中发挥作用,需要人工智能与复杂系统进行交叉融合,这也是人工智能从感知、认知走向决策的必然发展趋势。因此,研究所进一步布局了可自主进化智能方向,研究建模人、环境和机器之间的演化、合作和竞争等关系,并通过交互提升人和机器对环境的认识和认知。这项技术可广泛应用于大量复杂问题的智能辅助决策。

这儿要重点谈一下我们最近研发的“紫东太初”多模态大模型。这是基于我们多年基础积累形成的面向关键技术攻关的研究方向。我们人类对世界的认识天然是多模态的。举个例子,我说“猫”这个字,你马上脑子里能想到猫的图片、猫叫的声音、猫的文字。我们大脑里面把猫有关的声音、图像和文字关联在一起,共同组成了“猫”这样一个语义。这个语义是跨模态存在的。模拟人的多模态认知特点,自动化所推出了全球首个千亿参数的三模态大模型“紫东太初”,把图像、文本和语音结合起来,它采用了多层次、多任务、自监督、预训练的学习方式,不仅可以实现跨模态理解,还能实现跨模态生成。这是我们在已有多个很好技术积累基础上,通过多模态把人工智能众多方向加以融合创新的研究成果,服务于产业和国民经济主战场。

人民网:在人工智能创新链中,科研院所在扮演怎样的角色?自动化所又是如何面向国民经济主战场,为我国人工智能产业链发展赋能?

徐波:人工智能包括智能和智能化。智能即智能科学内涵、基础理论和模型算法等,智能化则是智能与各个领域行业的结合。研究所发展规划一方面要承担主责主业,大力探索智能本身。同时,需要考虑智能怎么去和社会、和企业、和政府合作,政产学研结合,面向国民经济主战场,为人工智能产业链发展赋能。无论从科研还是产业化,我们始终秉持在低潮时坚守、在高潮时冷静的理念,努力成为默默的开拓者和引领者。

六年前,人工智能落地应用刚刚萌芽,基于人工智能自身发展特点,研究所及时推出了“离岗创业”制度,鼓励已在智能应用领域深耕多年的团队进行转化。制度实施以来,已经诞生了在工业视觉、融媒体、生物特征识别等垂直行业里多家有影响力的企业。离岗创业,这是一种人工智能技术转化1.0版本形式。

作为一种赋能千行百业的技术,我们不能止步于此。我们正在探索人工智能技术转化的2.0版。2.0核心就是要利用研究所力量,以核心创新为抓手,以构建创新生态为目标,做一个大的人工智能平台。如上所述,目前人工智能存在落地周期、成本、人才等问题,同时国产基础软硬件从基本“好用”到非常“好用”,都需要协同各方力量共同努力。

为了解决这一行业痛点,今年5月,中国科学院自动化研究所、华为技术有限公司、武汉东湖高新区管委会签署《人工智能技术开发合作备忘录》,三方共同筹建武汉多模态大模型人工智能平台。该平台以自动化所的“紫东太初”大模型为核心,以全国产的昇腾AI基础软硬件为底座(包含昇腾AI处理器、异构计算架构CANN和全场景AI框架昇思MindSpore等),通过合作支撑当地产业实现智能升级。大模型、大底座、大数据形成了一个天然的合作模式,来为各个行业赋能。这是我们技术转化2.0的一个开始的初步尝试。

打破应用门槛解决人工智能“落地难”痛点

人民网:您如何看待这个平台的未来发展?

徐波:这是人工智能向更加通用化方向迈出的重要一步。以前的人工智能是属于“作坊式”的。想要做一个应用,需要从算法开始进行开发,类似于我们常说的“重复造轮子”。多模态大模型人工智能平台,是人工智能从“作坊式”向“工业化”转型升级的一次重要探索。通过对多模态大模型人工智能平台的持续研发、应用、优化、升级等,大大降低应用门槛和对应用人才要求,同时推动全自主可控软硬件体系的形成。

这个过程中大模型技术持续创新研发是我们的主责主业。例如现在计算量还比较大、成本和能耗也比较大,未来大模型在现有基础上还会有很多突破。需要我们不断融合类脑等智能新机制,使得大模型的运营成本越来越低,越来越好用。

目前,我们也正在同步研究大模型基础上蒸馏出小模型技术,这也非常重要。对于不想上云的,或者是应用场景不那么复杂的,其实并不需要用到大模型。因为大模型的参数特别多,使用成本非常高。这个时候,就可以用大模型中蒸馏出一个小模型,小到可能只有几兆的大小,不但降低成本,而且实现从通用向专用的进一步优化。

打个比方来说,大模型类似于一个知识非常渊博的老师,他学了无数多的数据,但是如果从事一件具体的工作,就不需要那么渊博的知识,这时候,我们可以根据需求,自动蒸馏出一个小模型,教出一个小徒弟来做这项工作。

人工智能要迈上工业化阶段,必须要满足以下几个条件,批量化,成本低,易访问,轻能耗以及最大程度的开源开放。未来,“云端的大模型+末端小模型”很可能会成为人工智能应用的重要模式。

人民网:这个平台,目前是否有一些成功的应用?

徐波:我们已经有一些应用,效果很好。以前解决不了或者解决不好的现在有了全新的技术手段。

我们在智慧媒体方面做了一些探索。和头部视频网站合作,针对其海量的短视频、电影和电视剧,做到了跨模态内容的检索。比如输入一段文字,就能定位到视频中的某一个片段;可以根据电视剧的简介自动生成1分钟的视频摘要;还可以指定某个特定演员出现的场景、某件事的前因后果等内容进行“跳播”。

工业视听觉已经进行了应用尝试。过去,人工智能在工业领域的应用是一个痛点,因为样本非常少,而且很多时候数据是多模态的。比如发动机的质检,往往是靠老师傅们“听”出来的。用人工智能怎么做呢?我们把各种各样的工业缺陷数据混合在一起,首先让机器进行模型自学,应用的时候只需要给两个样本,就可以达到很高的质检精度。这方面我们已经实验过了,原来可能需要一万个样本才能做到90%以上的识别率,现在只要用几个或几十个样本,精度就能达到90%,大幅降低了人工智能的应用门槛。

另外一个应用案例是具像化的教学,可以在打手语的同时生成对应图片,辅助学生理解,更好地达到教学目的。

类似的应用还有很多,只靠自动化所一家单位去落地,会错失大量的助推产业升级的机会,也会比较慢,所以一定要在推广模式上创新,吸引更多的人、更多的机构来实践,来应用。我刚才说的“2.0”就是这个意思。现在我们自己先做一些样例出来,然后进一步完善模型,通过标准化、流程化等一系列手段,将门槛降下来。未来越多人用,这个模型就会越完善,也越好用。

近期,自动化所联合大学、产业界等在积极推进“多模态人工智能产业联盟”的建设,这个联盟的成立就是为了让产学研各界都能更好的应用我们创新的成果,并基于这些成果再去推广、完善。12月18日即将在武汉举行的“2021东湖国际人工智能高峰论坛”上,我们也会就推动人工智能通用化、技术应用国产化和参会嘉宾进行进一步的探讨与合作。

人民网:多年来您在研究人工智能的过程中,有没有觉得它的发展速度超越了您的想象?

徐波:有句话说,“大多数人高估了他们一年所能做的事情,却低估了他们十年所能做的事情。”

这句话来描述人工智能的发展也很适用。它的影响是潜移默化的。目前人工智能落地碰到一些困难,但过了十年以后回头来看,人工智能的发展速度会比你原来想象的要快。

目前,全世界很多优秀的人在研究人工智能,每个人都从不同的角度攻克其中一块砖,最终合力去建立起一座人工智能的高楼大厦。人工智能的发展非常激动人心。

这里的每一块砖可能就是一个很小的研究或者应用领域,它们正在以飞快的速度不断迭代和突破。人工智能研究离终极目标还有很远的距离,但人类正在朝着它光明前景的快速道上大步前进,并看到沿途一路风景。

(责编:赵竹青、吕骞)

分享让更多人看到

行业图谱——人工智能在药物发现与研发中的应用

「行业图谱系列」是清华大学国家金融研究院资本市场与公司金融研究中心基于科技成果转化研究的一项子课题,聚焦于科技成果这一核心要素,从技术链视角切入展开的研究项目。通过行业图谱的研究,既为科技成果转化提供了专业性知识体系支撑,也有助于指导城镇产业化发展布局、推动产业链融通创新、引导创业投资基金对“硬科技”的积极性及鼓励金融支持创新体系的建设。本报告为行业图谱的第一个系列——生物医药领域:人工智能在药物发现与研发中的应用。

药物发现和研发是制药企业和化学科学家的重要研究领域。人工智能和机器学习技术使制药领域实现了现代化。机器学习和深度学习算法已被应用于多肽合成、虚拟筛选、毒性预测、药物监测和释放、药效团建模、定量构效关系、药物重定位、多药理和生理活性等药物发现过程。

新药研发存在周期长、费用高和成功率低等特点,人工智能作为药物研发领域的一个热点方向,已被应用到药物研发的各个阶段。本研究从人工智能在药物发现与研发中的应用出发,剖析人工智能在药物发现与研发中的应用技术和方法流程,并探讨该领域下国内外的市场竞争情况和最新研究成果。

人工智能在药物发现与研发中的应用

人工智能(ArtificialIntelligence,AI),指的是计算机系统从输入或过去的数据中学习的能力。根据《人工智能:现代方法》中的讨论,人工智能有七种分类(图1-1)。

图1-1人工智能的分类

如图1-2所示,在新药研发中,第一步也是最重要的一步是确定与疾病病理生理学有关的适当靶点(如基因、蛋白质),然后找到可以干扰这些靶点的药物或类药物分子。人工智能的发展可以帮助提取这些大型生物医学数据集中存在的有用特征、模式和结构。在确定和验证了合适的靶点之后,下一步是寻找合适的药物或类药物分子,这些分子可以与靶点相互作用并引起所需的反应。在大数据时代,通过支配海量的大型化学数据库,协助寻找针对特定靶点的完美药物。

图1-2大数据在药物设计和发现中的应用

人工智能在药物发现与研发中的应用技术和方法流程

在新药研发过程中,常遇到的瓶颈问题有:①寻找合适的、具有生物活性的药物分子;②药物分子难以通过第二阶段临床试验和其他监管批准。利用基于人工智能的工具和技术,提升药物研发的效率,解决上述所面临的药物研发问题。为此,下面将详细介绍人工智能在药物发现与研发中的应用技术和方法流程,如图2-1所示。

图2-1人工智能在药物发现与研发中的应用

肽合成与小分子设计

多肽是一种由大约2至50个氨基酸组成的生物活性小链,由于它们具有跨越细胞屏障的能力并可以到达所需的靶点,因此越来越多地被用于治疗。深度学习于肽合成与小分子设计的应用概念图如图2-2所示。

图2-2人工智能在肽合成与小分子设计的应用

分子通路的鉴定与多重药理学

人工智能和最大似然算法在药物发现和开发中的重要成果之一是预测和估计疾病网络、药物—药物相互作用和药物—靶点关系的总体拓扑和动力学。如图2-3所示,数据库如DisGeNET、STRTCH、STRING分别被用于确定基因—疾病关联、药物—靶标关联和分子途径。

图2-3人工智能在分子通路的鉴定与多重药理学的应用

蛋白质折叠和蛋白质相互作用的预测

分析蛋白质—蛋白质相互作用(Protein-ProteinInteraction,PPI)对于药物开发和发现至关重要,如图2-4所示。比如使用贝叶斯网络(BayesianNetwork,BN)预测PPI,其本质是利用基因共表达、基因本体(GeneOntology,GO)和其他生物过程相似性,集成数据集产生精确的PPI网络。

图2-4人工智能在蛋白质折叠和蛋白质相互作用的预测

基于结构和基于配体的虚拟筛选

在药物设计和药物发现中,虚拟筛选(VirtualScreening,VS)是CADD的重要方法之一,是从化合物库中筛选出有前景的治疗化合物的有效方法(如图2-5所示),以针对目标筛选具有所需活性的化合物。

图2-5人工智能在药物虚拟筛选的应用

药物重定位

在新药研发中,先导化合物的筛选是至关重要的,人工智能在识别新的和潜在的先导化合物方面发挥着巨大的作用。在化学空间中有大约1.06亿个化学结构,他们来自不同的研究,如基因组研究、临床和临床前研究、体内分析和微阵列分析。利用机器学习模型,根据活性位点、结构和靶结合能力可以筛选出这些化学结构。

定量构效关系建模与药物再利用

在药物设计和开发中,研究化学结构和理化性质与生物活性之间的关系是至关重要的。定量构效关系(QuantitativeStructure-ActivityRelationship,QSAR)建模是一种计算方法,通过它可以在化学结构和生物活性之间建立定量的数学模型,并针对其他疾病情况进行重新定位(如图2-6所示)。

图2-6人工智能在定量构效关系建模与药物再利用的应用

化合物的作用方式和毒性预测

药物毒性是指化学分子由于化合物的作用方式或新陈代谢方式而对生物体产生的不利影响。如图2-7所示,人工智能可以预测药物分子与靶点结合和未结合时的效应,以及体内安全性分析。

图2-7人工智能在化合物的作用方式和毒性预测的应用

理化性质和生物活性的预测

众所周知,每一种化合物都与溶解度、分配系数、电离度、渗透系数等物理化学性质有关,这可能会阻碍化合物的药代动力学特性和药物靶向结合效率。因此,在设计新的药物分子时,必须考虑化合物的物理化学性质。为此,已经开发了不同的基于人工智能的工具来预测这些性质(如图2-8所示),包括分子指纹、SMILES格式、库仑矩阵(Coulombmatrices)和势能测量,这些都用于深度神经网络(DeepNeuralNetworks,DNN)训练阶段。

图2-8人工智能在理化性质和生物活性的预测的应用

药物剂量和给药效果的识别

给病人任何不适当剂量的药物都可能导致不良和致命的副作用,多年来,确定能够以最小毒副作用达到预期效果的药物的最佳剂量一直是一个挑战。随着人工智能的出现,许多研究人员正在借助ML和DL算法来确定合适的药物剂量,如图2-9所示。

图2-9人工智能在药物剂量和给药效果的识别应用

生物活性物质预测与药物释放监测

最近研究已经开发了多种在线工具来分析药物释放,以及选定的生物活性化合物作为载体的可行性,其概念图如图2-10所示。利用人工智能研究人员可以确定用于与疾病相关的特定靶点的生物活性化合物。

图2-10人工智能在生物活性物质预测与药物释放监测的应用

病毒疫苗的制备及抗体检测

由于数据量巨大,并且需要自动抽象特征学习,人工智能在疫苗发现领域有着重大贡献(图2-11)。COVID-19冠状病毒疾病疫苗的深度学习和机器学习模型主要集中在人工神经网络、梯度提升决策树和深度神经网络等预测算法模型中。

图2-11人工智能在病毒疫苗的制备及抗体检测的应用

人工智能在制药行业开发新药中的应用

最近对药物开发人工智能的大量投资意味着这些初创公司拥有开发技术的人力和资源。与医疗成像领域的人工智能相比,总投资已经增长了四倍多,尽管两个行业的初创企业数量相当。图3-1显示了基于人工智能的新药研发所需要的条件及关键性技术竞争点。

人工智能成为国际竞争的新焦点。针对基于人工智能的新药研发,企业必须把人工智能发展放在企业战略层面系统布局,打造竞争新优势、开拓市场新空间。

图3-1基于人工智能的新药研发所需要的条件及关键性技术竞争点

①数据质量:构建有效且可解释的药物发现模型的方法之一是使用与药物相关的实体来构建神经网络模型。

②算法设计:大多数研究中使用的低水平穷举对接算法在寻找具有局部最小值的受体—配体相互作用时遇到困难,导致高度的亲和力可变性。因此,对接算法的选择、算法结构的设计和评价标准的设置都需要系统地改进。

③临床试验:药物或疫苗开发与临床应用的计算工作之间的转化差距是计算生物学和医学领域的一个主要且被广泛认可的瓶颈。许多预测的药物和疫苗尚未进入临床试验。

④硬件设施:目前,云端和边缘设备在各种人工智能应用中通常是配合工作的,随着边缘设备能力不断增强,越来越多的计算工作负载将在边缘设备上执行。新型人工智能芯片主要包括神经形态芯片、近内存计算芯片等,目前仍处于探索研发阶段。

国际顶级医疗公司在人工智能新药研发的最新研究成果

全球已上市的制药企业见下表3-1,重点关注美国、德国、英国和中国。

表3-1全球已上市或进入临床的人工智能制药企业

 

国外相关技术早在2000年左右即开始进行院校的科技成果转化。相对而言,我国该领域的研发跟随国际,在新冠疫情之后研究团队开始增加,并注重成果转化的同步进行。基于中国国内院校学者的调研及文献报道,国内学者的研究重点同样集中在递送系统上,如表3-2所示:

表3-2AI制药中国学者定位

作者

朱雅姝清华大学国家金融研究院资本市场与公司金融研究中心高级研究专员

安砾清华大学五道口金融学院副教授、清华大学国家金融研究院资本市场与公司金融研究中心副主任

邮箱rccmcf@pbcsf.tsinghua.edu.cn

感谢资本市场与公司金融研究中心的实习生许喜远(清华大学医学院2022级博士生)对本报告的助研工作。

点击“阅读原文”获取报告全文

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇