人工智能产业的应用场景和发展模式
1、基础层面:主要有AI芯片、传感器、云计算、减速器等四类核心产品
(1)AI芯片——主要包括GPUFPGA等加速硬件与神经网络芯片、为深度学习提供计算硬件,是重点底层硬件。
(2)传感器——主要对环境、动作、图像等内容进行智能感知,是人工智能的重要数据输入和人机交互硬件。
(3)云计算/大数据——主要为人工智能开发提供云端计算资源和服务,以分布式网络为基础,提高计算效率,包括数据挖掘、监测、交易等,为人工智能产业提供数据的收集、处理、交易等服务。
(4)减速器——作为一种相对精密的机械,主要为人工智能产品降低转速,增加转矩,以满足不同场合下的工作需要,是重要的底层硬件。
2、技术层面:主要有计算机视觉、自然语言处理、语音识别、机器学习等四类核心技术
(1)计算机视觉——包括静动态图像识别与处理等,对目标进行识别、测量及计算。主要应用在智能家居、语音视觉交互、ARVR、电商搜图购物、标签分类检索、美颜特效、智能安防、直播监管、视频平台营销、三维分析等场景。
(2)自然语言处理——基于数据化和框架化,研究语言的收集、识别理解、处理等内容。主要应用在知识图谱、深度问答、推荐引导、机器翻译、预料处理、模型处理等场景。
(3)机器学习——主要以深度学习、增强学习等算法研究为主、赋予机器自主学习并提高性能的能力。主要应用在压缩技术、安防、数据中心、智能家居、公共安全等场景。
(4)语音识别——通过信号处理和识别技术让机器自动识别和理解人类口述的语言,并转换成文本和命令。主要应用在智能电视、智能车载、电话呼叫中心、语音助手、智能移动终端、智能家电等场景。
3、应用层面:主要分为智慧城市、智慧生产、智慧生活三大类应用场景
(1)智慧城市:智慧城市涉及到交通、教育、医疗、零售等与用户生活息息相关的场景,把这些场景集合在同一平台上,增强用户使用习惯将会增强,粘性就会提升。各类场景互联互通,最终达到提升城市运维效率、提升资源管理效率、提升居民生活品质的目的。
典型智慧城市应用场景
(2)智慧生产:形成产品生产导向向需求生产导向转变的智慧生产流程体系
(3)智慧生活:涵盖智慧居住、饮食、健康监护管理、家庭管理等应用场景
人工智能属于面向未来的新事物,应用场景是人工智能发展的主要驱动力。下面简要分析医疗、交通、教育、金融、生活、零售、安防、园区、环保、政务等10个细分领域的人工智能应用场景及商业模式。
典型应用1:AI+医疗——中国医疗人工智能处于风口期,医学影像和疾病风险管理为热点
智能医疗,从技术细分角度看,主要包括使用机器学习技术实现药物性能、晶型预测、基因测序预测等;使用智能语音与自然语言处理技术实现电子病历、智能问诊、导诊等;使用机器视觉技术实现医学图像识别、病灶识别、皮肤病自检等。从应用场景来看,主要有虚拟助理、医学影像、辅助诊疗、疾病风险预测、药物挖掘、健康管理、医院管理、辅助医学研究平台等八大AI+医疗市场应用场景,其中医学影像和疾病风险管理为热门领域。
典型应用2:AI+交通——中国市场规模庞大,形成四类无人驾驶主流商业产品
智能驾驶其涉及的领域包括芯片、软件算法、高清地图、安全控制等。目前主要商业产品有无人驾驶出租车、无人驾驶卡车、无人巴士和无人驾驶送货车;无人驾驶车辆将设计拥有更高的安全性且能极大地降低人力成本,成为诸多相关企业的关注的焦点。
(1)无人驾驶出租车:人驾驶出租车因为其安全性更高,因此被很多汽车服务业关注,目前,无人驾驶出租车已经处于测试阶段。2015年软件公司NuTonomy在新加坡开始无人驾驶出租车测试,计划2018年完成整个无人驾驶服务的商业化
(2)无人驾驶卡车:无人驾驶卡车能有效降低司机因长时间、长距离运输而疲惫导致的安全事故。2016年11月,中国福田汽车联合百度在上海发布了国内首款无人驾驶卡车。
(3)无人巴士:固定的行驶路径、固定的停靠车站,使得无人驾驶巴士成为解决公众出行的新办法。2017年10月,百度联合金龙客车合作生产无人公交车,预计在2018年实现整车量产。
(4)无人驾驶送货车:货物运输最后一公里为运输行业的瓶颈,无人送货车能够全天候工作,加大增加工作效率。2017年7月,英国杂货电商公司Ocado在伦敦东部测试了无人送货车。
典型应用3:AI+生活——以IoT为基础的家居生态圈,主要有八大市场热点领域
智慧生活是一个以IoT为基础的家居生态圈,其主要包括智能照明系统、智能能源管理系统、智能视听系统、智能安防系统等。市场热点集中在硬件支持、智慧场景应用、产品、平台等方面,主要有机器学习、无线模块、智能家庭平台、智能家居娱乐系统、家居安防、健康家庭医疗系统等智能家居市场八大热点。
典型应用4:AI+金融——智能金融变革金融业务全流程
AI技术赋能金融领域,主要包括智能风控、智能投顾、智能投研、智能支付、智能营销和智能客服等。从金融角度来讲,智能的发展依附产业链涉及资金获取、资金生成、资金对接到场景深入的资金流动全流程,主要应用于银行、证券、保险、p2p、众筹等领域。
典型应用5:AI+教育——千亿庞大市场规模,三大应用主体与十三大应用场景
智能教育可分为学习管理、学习评测、教学辅导、教学认知思考四个环节,全面覆盖“教、学、考、评、管”产业链条,并已在幼教、K12、高等教育、职业教育、在线教育等各类细分赛道加速落地。围绕教育机构、教师、学生等三大主体,智能教育产品主要应用于教育评测、拍照答题、智能教学、智能教育、智能阅卷等十三大场景。
典型应用6:AI+零售——实现零售购物的无人化、定制化、智能化,提升购物体验
AI+零售将实现零售购物的全面无人化、定制化、智能化,实现消费者购物体验的全面升级。典型的应用场景主要有智能提车和找车、室内定位及营销、客流统计、智能穿衣镜、机器人导购、自助支付、库存盘点等场景。
(1)智能停车和找车。为智能停车模块,帮助用户解决“快速停车及找车”的痛点。如阿里巴巴推出的喵街App中包含智能停车及找车模块,目前已经应用于几十家购物中心。
(2)室内定位及营销。在用户购物及浏览过程中快速根据用户需求、物品位置实现精准匹配。如北京大悦城等商场已经实现了室内导航及定位营销,iBeacon的技术解决方案颇受青睐。
(3)客流统计。实时统计客流、输出特定人群预警、定向营销及服务建议。如图普科技,利用开发客流统计解决方案,为天佑城的活动策划和招商部门提供客观数据佐证。
(4)智能穿衣镜。为用户提供个性化的定制服务,增加用户实际购物体验。智能虚拟穿衣镜已经在Lily、马克华菲等诸多品牌门店中部署。
(5)机器人导购。增加用户购物过程的趣味性,从而提升销售。如零售机器人“豹小贩”实现从“人找货”到“货找人”的转变,自动走到人流量大的地方,主动推荐商品。
(6)自助支付。收银服务机提供屏幕视频、文字、语音三种指引方式,引导自助支付。如国内阿里的刷脸支付尝试。
(7)库存盘点。库存盘点机器人替代仓库管理员,提升工作效率。如德国MetraLabs推出机器人Tory,为德国服装零售商AdlerModemrkte提供库存盘点服务。
典型应用7:AI+安防——平安城市、园区、校园、家居、金融等一体化智能安防建设
智能安防是人工智能最先大规模应用,并持续产生商业价值的领域,主要依托低速无人驾驶、环境感知、目标检测、物体识别、多模态交互等技术,实现目标跟踪检测与异常行为分析,视频质量诊断与摘要分析,人脸识别与特征提取分析,车辆识别与特征提取分析等,实现平安城市、园区智能安防、校园智能安防、家居智能安防、金融智能安防等一体化智能建设。
(1)平安城市——开展城市监控报警联网系统建设,公安机关建监控系统,省级监控平台,地市级平台,实现城市智能公安联网监测检查。
(2)园区智能安防——工业园区安防系统由视频监控系统、入侵报警系统、门禁管理系统、电子巡更系统、停车管理系和综合管理平台等构成。
(3)校园智能安防——主要构建透明食堂监控、校园车辆卡口系统、手机移动监控等系统,实现技防各子系统高度集成联动、海量数据智能化分析并自动导出,实现安保工作基础平台信息化。
(4)家居智能安防——家居安防系统主要包括报警控制主机、无线传感器网络节点两大模块,负责对采集的信号进行分析和处理,以及安防情况进行远程监控。
(5)金融智能安防——金融安防系统包括技术防范系统和实体防护设施,技术防范系统主要包括视频安防监控系统、出入口控制系统、入侵报警系统和监听对讲系统等,实体防护设施主要包括专用门体、防弹复合玻璃、提款箱、运钞车、保管箱和ATM自动柜员机等。
典型应用8:AI+园区——实现物业硬件互联信息化、服务智慧化、产业智能化
在智慧园区场景下,从硬件设施到系统软件,从智慧物业到智慧服务,实现物业硬件信息化互联,服务智慧化、产业智能化。园区形成微型智慧生态,物业信息化互联,并为园区企业提供智慧化办公生产相关服务,吸引智慧产业入驻发展。
(1)园区互联信息化。园区安防、管网、能源等硬件设施互联互通,信息化自动化。场景构建主要打造智能化信息系统、智能门禁系统,集成园区智能硬件系统。
(2)园区服务智慧化。为园区企业提供智慧化科技创新、办公智慧化、园区生活智慧化相关服务。商务办公智慧化场景构建主要依托智能会议系统、智能客服系统、办公场景语音系统实现;科创孵化智慧化场景构建主要打造智慧产业孵化器。
(3)产业发展智能化。集聚信息技术、智能制造企业,推动产业化升级和智慧城市发展。场景构建主要依托导入相关产业资源,形成产业集聚。
典型应用9:AI+环保——实现环境监测实时动态化、环保装备智能化、管理智慧化
智慧环保场景下,从监测到管理,从环保硬件到服务平台软件,实现环保装备智能化、环保管理智慧化,并融合机器学习、机器人、人机交互、智能语音、大数据等技术,在智能环保机器人、环保服务平台领域发力,构建场景新生态。
典型应用10:AI+政务——打造政务部门数据集成共享,实现政务决策IT化
(1)城市全景精细呈现。打造GIS地理信息技术平台,依托智能化城市基础设施建设,展现城市数据。
(2)部门数据融合互通。引入信息技术集成服务商,集成市政、警务、交通、电力、等部门数据库系统,开辟数据接口,实现数据融合互通。
(3)智能化统计分析。构建城市政务管理云服务平台,实现智能化数据分析,为城市智慧化精细化管理提供决策依据和建议。
(4)对话数据,交互查询。建设统一查询系统,引入系统开发服务商,设计实现交互查询的查询系统,非隐私数据可民用开放。
(5)可视化部署、指挥调度。通过数据可视化云平台打造,实现突发事件应急联动,有效结合各部门数据资源,达到高效决策、部门联动、信息共享的指挥调度系统。
根据东滩产业内参《人工智能产业投资趋势及发展模式》的研究,中国人工智能产业空间集聚模式主要呈现智慧城市、产业集聚区/创新区、产业小镇/产业园区等三种形式。智慧城市建设、产业集聚区/创新区、产业小镇/产业园区三个层面互为促进,成为推动人工智能产业发展的主要路径。
(1)智慧城市
通过打造人工智能创新应用示范区/产业集聚区/小镇/园区等形式,形成深度应用场景,建设应用示范项目;促进人工智能在智慧政务、智慧交通、智能医疗、智能健康和养老等领域深化应用。典型的案例有上海、杭州、北京、深圳等智慧城市的建设。
(2)产业集聚区/创新区
依托区域较好的智能制造基础及信息技术优势,集聚人工智能、大数据、云计算、区块链、VR/AR等数字产业项目,将技术和应用扩散至周边区域,与其他产业交叉融合发展。典型的案例有上海张江人工智能岛、杭州高新区(人工智能)优势产业集聚地等。
(3)产业小镇/产业园区
作为大型经济开发区里的专业园区,或是以人工智能产业为特色的产业小镇,与周边科技、制造、新一代信息技术等产业协同发展。典型案例有苏州工业园人工智能产业园、杭州人工智能产业园、沧州高新技术产业开发区人工智能科技产业园等。
案例链接1:智慧上海
打造六大人工智能创新示范区
上海将着力打造6个人工智能创新应用示范区,形成60个深度应用场景,建设100个以上应用示范项目。构建“一带一区多点联动”的产业空间布局,包括“徐汇滨江-漕河泾-闵行紫竹”人工智能创新带、“张江-临港”人工智能创新承载区、华泾北杨人工智能特色小镇、上海松江洞泾人工智能特色产业基地。
上海人工智能产业空间格局
专业园区——上海张江人工智能岛
项目概况:上海张江人工智能岛位于张江科学城中区,占地面积6.6万平方米,建筑面积10万平方米,由张江集团负责开发运营的人工智能产业新标杆。产业方向以语音识别、视觉识别技术世界领先,信息处理、智能监控、生物特征识别、工业机器人、无人驾驶为主。目前吸引了包括微软、阿里巴巴、同济大学、云从科技在内的跨国巨头、BAT龙头、科研院所和独角兽企业入驻园区。成为上海市首批人工智能应用场景,并成为唯一的“AI+园区”实施载体。
产业发展策略:
(1)基金政企合作,打造开放创新平台。与龙头企业共建孵化器、共设投资基金,并搭建集创新转型工坊、创新实验室、项目实战空间、应用演进与运营四维一体的人工智能“能力开放工场”,塑造产业垂直生态。
(2)集聚世界创新大脑,引领高端发展。加强前瞻性研究,集聚世界一流科学家、学者开展人工智能基础理论、核心算法以及脑科学、基础系统等方面的基础研究,实现高端引领发展。
(3)技术与场景联合试验,助推远期产品落地。围绕智能安防、语音识别、机器视觉、深度学习等人工智能新技术,与应用场景进行深度融合,并在岛上进行联合试验和交互体验,并将技术和应用扩展至整个张江科学城。
典型案例2:智慧杭州
打造十大人工智能应用示范区
杭州人工智能产业发展规划建设10个人工智能应用示范园区和特色小镇,构建数据驱动、人机协同、跨界融合、共创分享的智能经济生态圈。构建“一廊一区多点联动”的产业空间布局。打造杭州城西科创大走廊,构筑杭州高新区(滨江)优势产业集聚地,人工智能产业基地多点布局。
专业园区——杭州人工智能产业园
项目概况:位于杭州高新技术开发区滨江区江虹路,与阿里巴巴、浙江大学等比邻而居,规划面积3.43平方公里,总建筑面积8万平方米,由四幢主体建筑合围而成。项目定位于打造集专业化服务功能、创新型孵化功能、多资源聚合功能、产学研转化功能于一体的人工智能产业新平台,成为省级人工智能技术研发、应用、产业化的示范基地,重点打造产业资源交换、孵化研发、传媒、生活等四大中心。以人工智能为特色,覆盖大数据、云计算、物联网等业态,集中力量招引机器人、智能可穿戴设备、无人机、虚拟/增强现实、新一代芯片涉及研发等领域。
产业发展策略:打造全球创客中心人工智能集聚区,广泛集聚以人工智能为代表的智慧产业创客极客,发挥创业创新集聚效应,在引领区域创新上发挥重要的作用与市场影响力,着力构建“一主三化五平台”产业发展服务体系及综合运营管理服务体系。
(1)一大生态——打造有利于人工智能产业快速发展的生态系统;
(2)三化产业载体——人工智能技术成果化(孵化器)、人工智能成果产业化(加速器)、人工智能产业资本化(倍增器);
(3)五大发展平台——产业产学研合作平台、产业技术成果交易平台、产业公共服务平台、产业企业家交流平台、产业投资发展平台;
(4)运营管理体系——建立人工智能产业联盟,与投资行业协会、国内知名投资机构、金融服务机构、投融资服务组织等建立紧密的合作关系,为创新创业者提供全面专业的资本服务。
总的看来,中国人工智能产业集聚创新发展主要体现在四方面,即集中展示AI在特点场景下的纵向应用,如:学校、医院、工厂、家庭等,整合各类AI技术,打造整体式的解决方案;体现AI在特定行业中的创新应用,如:交通、政务、安防、环保、教育、金融等行业,推动人工智能对行业产生显著的带动作用;通过AI跨领域跨行业的集中应用,如:园区、社区等,实现人工智能对区域的全面赋能;通过龙头企业的带动,搭建AI产业发展开放平台,集聚产业链上下游资源,实现区域人工智能产业的协同创新发展。
▌说明:东滩顾问·廖义桃原创文章,转载请注明出处!
▌编辑:波波
▌关注:请搜索“东滩顾问”公众号关注我们哦!返回搜狐,查看更多
医药研发领域大数据和人工智能的应用探讨
声明:本文为火石创造原创文章, 欢迎个人转发分享,网站、公众号等转载需经授权。
人工智能(AI) 技术应用的重要场景之一是助力药物研发,相比传统的药物研发耗时耗力、成功率低, AI技术的应用 可 大大缩短药物研发时间、提高研发效率并控制研发成本。
近年来,人工智能技术(AI)与医疗健康领域的融合不断加深。AI 在医疗领域主要应用场景包括语音录入病历、医疗影像辅助诊断、药物研发、医疗机器人和个人健康大数据的智能分析等。随着语音交互、文本识别、图像识别和大数据分析,以及智能终端等技术的逐渐成熟, AI 的应用场景越发多样。
图1 人工智能在医疗领域的应用
药物研发是AI技术应用的重要场景之一。药物研发要经历靶点的发现与验证、先导化合物的发现与优化、候选化合物的挑选及开发和临床研究等多个阶段。传统的药物研发耗时耗力,且成功率低。 AI 助力药物研发,可大大缩短药物研发时间、提高研发效率并控制研发成本。
图2 新药开发流程图
一、AI助力新药研发的六大应用场景
目前制药企业纷纷布局AI领域,主要应用在新药发现和临床试验阶段,主要有以下六大应用场景:
1.海量文献信息分析整合
对于药物研发工作者来说,最让他们头疼的事如何去甄别每天产生的海量科研信息。而人工智能技术恰恰可以从这些散乱无章的海量信息中提取出能够推动药物研发的知识,提出新的可以被验证的假说,从而加速药物研发的过程。
英国生物科技公司BenevolentBio(隶属于BenevolentAI),利用技术平台JACS(JudgmentAugmentedCognitionSystem),从全球范围内海量的学术论文、专利、临床试验结果、患者记录等数据中,提取出有用的信息,发现新药研发的蛛丝马迹。
2017年,借助JACS的分析能力,BenevolentBio标记了100个可用于治疗肌萎缩性侧索硬化症(ALS)的潜在化合物,从中筛选出5个化合物。经过英国谢菲尔德神经转化研究所的小鼠试验,证实4个化合物在治愈运动神经衰退方面确有疗效。4/5的有效筛选率,这是研究人员之前从未想过的。
位于英国伦敦的BenevolentAI成立于2013年,是一家致力于AI技术开发和应用的公司,是欧洲大的AI初创公司。他们的目标是建立人们期盼已久的“制药企业2.0”,利用AI助力新药开发,降低临床试验的失败率。 自2013年以来,BenevolentAI已经开发出24个候选药物,且已经有药物进入临床IIb期试验阶段。
国际制药巨头之一的强生公司已经与BenevolentAI达成合作协议,强生将一些已经进入临床阶段的试验药物连带一起特许给BenevolentAI,而BenevolentAI将利用人工智能系统来指导临床试验的进行和数据的收集。
2.化合物高通量筛选
化合物筛选,是指通过规范化的实验手段,从大量化合物或者新化合物中选择对某一特定作用靶点具有较高活性的化合物的过程。而要从数以万计的化合物分子中筛选出符合活性指标的化合物,往往需要较长的时间和成本。
AI技术可以通过对现有化合物数据库信息的整合和数据提取、机器学习,提取大量化合物与毒性、有效性的关键信息,既避免了盲人摸象般的试错路径,还可以大幅提高筛选的成功率。
典型代表是硅谷公司Atomwise。 Atomwise公司成立于2012年,其核心产品为AtomNet是一种基于深度学习神经网络的虚拟药物发现平台。AtomNet就像一位人类化学家,使用强大的深度学习算法和计算能力,来分析数以百万计的潜在新药数据。目前,AtomNet已经学会识别重要的化学基团,如氢键、芳香度和单键碳,同时该系统可以分析化合物的构效关系,识别医药化学中的基础模块,用于新药发现和评估新药风险。
图2 AtomNet通过训练能够识别抗生素中常见的化合物结构—— 磺酰基
AtomNet在抗肿瘤药物、神经系统疾病药物、抗病毒药物、抗寄生虫药和抗生素药物的药物筛选方面表现出色。例如,2015年AtomNet仅用一周模拟出2种有潜力用于埃博拉病毒治疗的化合物。Atomwise正与全球知名药企和大学院校进行合作,其中包括辉瑞、默克、abbvie和哈佛大学等。
类似于Atomwise,现在有一系列人工智能公司专注于药物分子筛选,包括RecursionPharmaceuticals、BenevolentAI、TwoXAR、Cyclica和ReverieLabs等。
3.发掘药物靶点
现代新药研究与开发的关键是寻找、确定和制备药物靶点。靶点是指药物在体内的作用结合位点,包括基因位点、受体、酶、离子通道和核酸等生物大分子。
典型代表是Exscientia公司 ,Exscientia与葛兰素史克(GSK)在药物研发达成战略合作。Exscientia通过AI药物研发平台为GSK的10个疾病靶点开发创新小分子药物。
Exscientia开发的AI系统可以从每个设计周期里的现有数据资源中学习,其原理与人类的学习方式相似,但AI在识别多种微妙变化以平衡药效、选择性和药代动力学方面要更加高效。其AI系统完成新药候选的时间和资金成本只需传统方法的1/4。目前该公司与国际多家知名药企形成战略合作,包括强生、默克和赛诺菲等。
图3 Exscientia药物研发流程图示
4.预测药物分子动力学指标(ADMET)
ADMET包括药物的吸收、分配、代谢、排泄和毒性。预测ADMET是当代药物设计和药物筛选中十分重要的方法。过去药物ADMET性质研究以体外研究技术与计算机模拟等方法相结合,研究药物在生物体内的动力学表现。目前市场中有数十种计算机模拟软件,包括ADMETPredicator、MOE、DiscoveryStudio和Shrodinger等。该类软件现已在国内外的药品监管部门、制药企业和研究院所得到了广泛应用。
典型的代表包括晶泰科技 (XtalPi ) 、Numerate 等。 为了进一步提升ADMET性质预测的准确度,已有生物科技企业探索通过深度神经网络算法有效提取结构特征,加速药物的早期发现和筛选过程。其中 晶泰科技通过应用人工智能高效地动态配置药物晶型,能完整预测一个小分子药物的所有可能的晶型, 大大缩短晶型开发周期,更有效地挑选出合适的药物晶型,减少成本。
图4 晶泰科技提供的晶型筛选服务
5.病理生物学研究
病理生物学(pathophysiology)是一门研究疾病发生、发展、转归的规律和机制的科学。病理生物学研究是医药研发的基础,至今许多疾病尚无治疗方法,是由于在病理生物学研究方面没有取得进展。
肌萎缩侧索硬化(ALS)是一种破坏性的神经退行性疾病,发病机制至今不明。ALS的一个突出病理特征是,一些RNA结合蛋白(RNAbindingproteins,RBPs)在ALS中发生突变或异常表达/分布。人类基因组中至少有1542种RBPs,目前已发现17种RBPs与ALS相关,除此以外,其他RBPs是否与ALS相关呢?
图6 IBMWatson鉴定RBPs
典型案例是IBM 公司开发的 Watson 系统 ,通过 阅读了 2500 万篇文献摘要, 100 万篇完整论文和 400 万专利文献,并 基于相关文献的大量学习,建立了模型预测 RBPs 与 ALS 相关性。有 研究者 为了测试其模型的预测能力,首先将 IBMWatson 的知识库限制在 2013 年之前的学术出版物上,并要求 Watson 使用这些可用的信息来预测与 ALS 相关的其他 RBPs 。在 2013— 2017 年期间, Watson 在 对 4 个导致突变的 RBPs 给出了高度评价,证明了模型的有效性。而后, Watson 对基因组中所有的 RBPs 进行筛选,并成功鉴定在 ALS 中改变的 5种新型 RBPs 。
6.发掘药物新适应症
利用深入学习技术,将临床药物与新的适应症相匹配。这样可以绕过动物实验和安全性实验。
例如,沙利度胺曾用来治疗麻风病,后来研究人员发现其对多发性骨髓瘤具有疗效。由于该药物已经积累了大量的安全性与剂量数据,研究人员能够绕过第一阶段的安全性和剂量试验。
根据实验结果,FDA在2012年批准沙利度胺治疗多发性骨髓瘤。据彭博预测,这个过程总共花费了4000~8000万美元。如果从零开始,一个新药所需的平均费用为20亿美元。
图7 药物再利用与新药研发的成本对比
典型代表为LamTherapeutics、NuMedii、Healx和InsilicoMedicine等 人工智能公司,他们已经在“老药新用”这个领域进行了深度探索。
二、AI新药研发公司
中国在AI领域的论文发表数量位居全球第一。在医学领域,我们在放射影像、病理、自然语言处理和智能语音录入等领域的研究与欧美并驾齐驱,但在AI+新药研发领域,却差距较大。部分AI新药研发公司名单见表1。
表1部分人工智能药物研发公司名单
2014年,晶泰科技创立于麻省理工学院校园。其核心总部位于深圳,并在北京、波士顿设有分部。晶泰科技目前已与多家世界顶级药企与科研机构建立深度合作,其药物固相筛选与设计平台是行业最先进的解决方案。凭借团队的技术优势与项目广阔的市场空间,晶泰科技已获得腾讯、真格基金、峰瑞资本数千万元的A轮投资,以及来自红杉、Google、腾讯的数千万美金B轮融资,成为全球AI+制药领域获得融资最高的创业公司之一。
2018年12月,天津国际生物医药联合研究院与北京天云大数据签署战略合作协议,双方将在人工智能医药研发平台建设领域联手,为京津冀乃至全国提供服务。根据协议,双方将共同建设人工智能医药研发平台,立足京津地区,为药物研发等大健康行业创新发展赋能,致力于人工智能与大数据技术在医药行业内的推广和应用。同时,双方各自发挥优势,共同开展人工智能医药研发平台的推广工作,推动建立京津冀医药智能技术创新联盟。
三、AI药物研发领域的关键要素
中国在AI药物开发领域已经开始起步,但远未成熟,还有非常大发展空间。在笔者看来,我国进行AI药物研发需要在人才培养、数据共享和商业模式创新等方面进行发力。
1.培养高端人工智能人才,探索跨学科人才合作机制。
创业的竞争归根结底是人才的竞争,这在人工智能领域表现得愈加明显。在全球范围内,大约有2.2万名具有博士以上学历的人工智能从业人员和研究人员,中国仅600名左右。国内人工智能人才几乎被几大头部企业垄断,比如商汤有150多名人工智能博士,占比全国人工智能博士总数1/4。
数据显示,未来中国人工智能人才缺口高达500万,唯一的解决办法就是成体系地培养人工智能人才。
2018华为全联接大会上,华为云推出了“沃土AI开发者计划”,投入10亿人民币培养高校和研究所的AI人才,并与清华大学、中科院、中国科学技术大学、浙江大学等达成AI合作。
2018年8月,商汤科技携手香港中文大学、亚马逊、南洋理工大学、悉尼大学联合举办的首届WIDERFaceandPedestrianChallenge2018(简称:WIDERChallenge)挑战赛,包括中科院计算所、微软亚洲研究院、北京大学、卡耐基梅隆大学、香港大学以及雅虎、京东、旷视、科大讯飞、滴滴等科技公司参赛。
此外,AI应用于药物研发需要若干个垂直领域的专家共同参与才能有所突破。既需要物理学家、化学专家、药物学家、药企研发高管,又需要人工智能科学家、云计算工程师等跨学科人才。通过在多个领域人才和经验的积累,整个团队需要紧密合作,这样才更容易获得突破性的思路和好的成果。
2.建立研发数据标准体系,完善数据共享机制。
AI药物研发需要高质量数据支持。国内创新药研发起步较晚,与国外相比,对于优质数据的积累还有一定差距。
制药产业的专业门槛高、链条长,加之国内长期以来的“多头管理”体制,造成了国内的药品数据极度割裂,标准不统一、数据孤岛现象严重;另外,医药领域的监管政策与机构改革频繁,造成历史药品数据衔接难度较大。这些都会导致医药数据统计在完整度和精准度上的不足,从而影响相关决策。
当前国内企业“大数据化”采取的一个路径,便是以“专业人工+机器辅助”方式建立数据标准词典(包括药品、企业、靶点、疾病等),持续进行数据清洗、识别、匹配和挖掘算法,将市场上分散的数据全面重构,形成一系统标准数据模块仓库,根据用户场景对数据模块进行组合。比如国内的医药魔方、米内数据、药渡等医药大数据服务公司。
3.定位产业链角色,创新商业模式。
目前人工智能医药研发领域存在三种商业模式:
(1)开放和反馈模式。 晶泰科技一开始就明确了初期主要客户群,在地域设置上形成国内研发,国际业务拓展的模式。在有效控制研发成本的同时,起步阶段就努力在国际范围内寻求合作者。
基于药物研发流程的复杂性,人工智能在药物研发中的大规模应用依赖于整个产业链的共同努力。晶泰科技主导开放和反馈模式,其长处是为传统研发人员提供最先进的计算软硬件工具,帮助他们更好更快地完成科研任务。
(2)虚拟筛选团队外包验证模式。 虚拟筛选团队外包的主要方式有是与利益相关者或非利益相关者合作。
与入利益相关者合作,比如一个更大的医药公司,公司将受益颇多,比如激励一致、与已有临床生产线的整合、致力于特定疾病团队带来的专业知识等。虽然公司需要割舍部分控制力或所有权,但是有利于项目研发成功率的提升。
与非利益相关者合作(例如CRO),公司保留完全的知识产权,执行速度快但是成本高。而且在实验设计上有可能面对控制权的损失,所以为了保证高质量的结果必须给予特殊的关注。
这个模式的好处是成本低,速度快,特别是工业界的合作伙伴在新化合物后期验证和临床研发中具有巨大机会。合作伙伴能够理解这些验证实验的动机和设计是至关重要的,因为他们在后续的临床研发中充当重要角色。NimbusTherapeutics,TwoXAR,Atomwise等公司就采用这种模式。
(3)独立的药物研发团队和虚拟筛选团队的合作模式。 在这个模式中,公司团队专注于计算机虚拟筛选,而其他团队给予实验药物研发的支持。和通常专注于特定的配体受体、生物现象或者疾病领域的团队的良好合作,使项目研发团队有独特的专业性。
虽然配合程度没有一个完全整合团队那么强,但这种模式的优势在于,提供的处理结构的可变性和合作者的可选择性。具有广泛应用平台的虚拟筛选团队可以考虑用这个结构,在使资本成本最小化的同时处理很多研发项目。
四、小结
1.新药研发存在环节多、 研发费用高、研发周期长和研发成功率低等问题 。
新药研发从上游到下游的几个环节包括药物靶标的确定,先导化合物的筛选,先导化合物的优化和最终的临床实验。研发费用高、研发周期长、研发成功率低一直是压在制药企业身上的“三座大山”。
塔夫茨药物开发研究中心(TuftsCenterforTheStudyofDrugDevelopment)的数据显示:开发一种新药的平均成本为26亿美元;一种新药上市的平均时间约为12年;大约只有10%的候选药物能从第一阶段测试走向市场。德勤的数据显示:2017年,美国最大的生物制药公司的投资回报率下降至3.2%。
2.AI技术的崛起,为新药研发带来了新方向。
过去20年,计算机处理能力的持续快速增长,大量数据集的可用性和先进算法的开发,大大推动了机器学习的发展。新药研发领域数据密集,这让人工智能有了用武之地。AI不仅能够挖掘出不易被发现的隐性关系,构建药物、疾病和基因之间的深层次关系。同时,可对候选化合物进行虚拟筛选,更快地筛选出具有较高活性的化合物,为后期临床试验做准备。
目前, AI在新药研发领域主要应用于靶点发现、化合物合成、化合物筛选、晶型预测、患者招募、优化临床试验设计和药物适应症开拓等场景。 来自TechEmergence的一份报告研究了所有行业的人工智能应用,结果表明:人工智能可以将新药研发的成功率从12%提高到14%,可以为生物制药行业节省数十亿美元。
自2017年以来,AI在制药领域的应用可谓如火如荼,国际制药巨头纷纷入局AI开发,用于提高新药的研发效率。据统计,有100多家初创企业在探索用AI发现药物,传统的大型制药企业更倾向于与采用合作的方式,如阿斯利康与Berg,强生与BenevolentAI,默沙东与Atomwise,武田制药与Numerate,赛诺菲和葛兰素史克与Exscientia,辉瑞与IBMWatson等。同时,AI应用于新药研发仍需面对人才短缺、数据标准化与共享机制、商业模式创新等诸多问题。
在制药和生命科学中, 数据是AI的关键。 AI被应用于药物研发的各个阶段,但若是数据质量不高,即便使用非常可靠的算法,也不会取得好结果,反而会浪费大量的资源和时间。鉴于此,IBM 曾在2016年斥资26亿美元收购医疗数据公司Truven;罗氏曾在2018年以19亿美金收购肿瘤大数据公司FlatironHealth的全部股份。也有专家表示,通过知识共享开展合作和提高已有数据的质量比积累数据更为重要,关键是建立一套切实可行的数据标准,与风险利益共担的数据分享机制。
3.AI和药物开发的模式,主要包括AI研发外包、企业内部组建AI研发部门,但每种模式都有各自的优缺点。
AI研发外包。 由制药公司提供特定的研究数据和生物靶点信息,然后由AI驱动的药物发现初创公司依靠这些数据建立模型。一旦成功筛选出候选药物,制药公司会根据协议进行授权或自行拥有这种药物。这种策略灵活性高且成本较低,但AI公司做为服务方需要获取制药公司整个药物开发流程中最“隐私”的情报,因此,选择合适的合作伙伴是重中之重。
在企业内部组建AI研发部门。 在与外部积极合作的同时,制药公司也在培养内部AI专业技能,并建立数字基础设施,以提高数据使用效率。这种方式的挑战在于如何建立内部专业的AI算法和自动化流程,以及高效的运算平台。
无论哪种模式,AI和药物开发的结合,与其说是对IT技术人员的挑战,不如说更是对药学人员的挑战。一个运营良好的AI药物发现团队,应该是能够让IT技术人员和药学科学家保持沟通无障碍,彼此交流更明晰,清楚对方的意图。
(责任编辑:老姜)
— END —
文 | 孙翔宇
欢迎个人转发分享,网站、公众号等转载请联系授权
人工智能在无人驾驶中的应用
引用自:人工智能在自动驾驶领域的应用及启示吴琦,于海靖,谢勇,刘贝
1引言 人们越来越期望通过无人系统代替人类进行一些活动。小到帮助人们自动清扫地面的扫地机器人,大到协助有人机进行战场态势感知协同作战的无人机,无人系统已经渗透到人类活动的方方面面。无人车作为其中之一,其市场需求非常广泛,从战场作战、港口货运到乘用车驾驶林林总总。近年来随着需求的推动,自动驾驶汽车领域取得很多技术突破,同时吸引更多投资以及科技力量的投入其中,使其成为一个朝气蓬勃的新兴技术领域[1-3]。
自动驾驶是通过自动驾驶系统,部分或完全的代替人类驾驶员,安全地驾驶汽车。汽车自动驾驶系统是一个涵盖了多个功能模块和多种技术的复杂软硬件结合的系统。在机器学习、大数据和人工智能技术大规模崛起之前,自动驾驶系统和其他的机器人系统类似,整体解决方案基本依赖于传统的优化技术。随着人工智能和机器学习在计算机视觉、自然语言处理以及智能决策领域获得重大突破,学术和工业界也逐步开始在无人车系统的各个模块中进行基于人工智能和机器学习的探索[4-6],目前已取得部分成果。而自动驾驶系统作为代替人类驾驶的解决方案,其设计思路和解决方法背后都蕴含了很多对人类驾驶习惯和行为的理解。现在,自动驾驶已经成为人工智能最具前景的应用之一。
2自动驾驶硬件系统架构 自动驾驶系统一般是在传统汽车上进行加装来构建整个系统。下面引用通用汽车公司的Cruise自动驾驶汽车的硬件系统架构[7](图1)进行介绍,其他公司方案类似[8-9]。从图1中可以清晰地看出,自动驾驶硬件系统主要包含五部分:感知模块、自动驾驶计算机、供电模块、信号通信模块、执行和制动模块。
2.1感知模块 无人车的感知模块非常完备,是传统车辆所没有的。这部分主要代替有人驾驶汽车的驾驶员的眼睛和“车感”。通常由摄像头、激光雷达、毫米波雷达和GNSS/IMU组成。
摄像头主要用于获取图像信息,用于识别行人、车、树、红绿灯、信号牌,进行定位等。
激光雷达用于获取激光扫描反射数据,用于识别行人、车、树等障碍物,进行定位等。其三维测距原理是通过测量激光信号的时间差、相位差确定距离,通过水平旋转扫描测角度,并根据这两个数据建立二维的极坐标系,再通过获取不同俯仰角度的信号获得第三维的高度信息。图2为激光获取的数据信息经过识别分类标注不同颜色处理后得到的图。
毫米波雷达获取反射数据,主要用于识别障碍物,测距,在传统汽车上安装用于辅助避障。GNSS/IMU组合用于实时获取全局位置信息。在感知模块中,最重要的当属激光雷达,因为它精度高,可靠性高,满足了自动驾驶高精度定位、识别等功能,可以说直接加速了自动驾驶技术的工程应用。
2.2自动驾驶计算机 自动驾驶计算机顾名思义是进行自动驾驶相关的计算处理,一般主要包含五部分:CPU、GPU、超大内存、超大硬盘存储空间和丰富的硬件接口。
其中,CPU根据其性能特点用于处理含有逻辑判断、流程等控制、规划功能软件;GPU根据其性能特点用于获取传感器数据,进行大量同类型数据计算,例如识别、分类处理,执行感知、定位功能软件;超大内存用于大量数据处理、加载高精度地图;超大硬盘存储空间用于存储高精度地图;丰富的硬件接口,例如串口、CAN、以太网、USB等,用于多种传感器连接。
2.3执行与制动模块 执行与制动系统也在随着自动驾驶技术向前发展。执行系统接收自动驾驶控制模块操作车辆的执行指令,控制车辆动力(油门和档位)、底盘(转向和制动)和电子电器等系统的执行,实现自动驾驶的速度和方向控制。而传统的汽车底盘制动系统是液压、气压制动,为了实现车身结构的稳定并将智能驾驶功能延伸,线控制动将是汽车制动技术的长期发展趋势,线控制动可以深度融合智能驾驶功能模块。这类似于航空领域飞行操纵系统由液压逐步转换为电传操纵系统的过程。
3自动驾驶软件系统架构 如果说自动驾驶硬件系统是在传统车辆上进行了加装升级,那么软件系统可谓是全新的。自动驾驶软件按功能主要分四个模块:定位、感知、规划、控制。其中定位模块被普遍认为是基础,各模块包含内容见图3。
其中,定位解算离不开高精度地图的辅助,基于定位信息可以开展环境感知、路径规划驾驶行为决策以及汽车运动控制等内容,而路径规划、行为决策以及运动控制又是三个逐渐具体化、底层化的问题,前一个输出可以作为后一个的输入条件来使用。也就是说控制模块可以将决策规划的动作作为输入,计算应该执行的转弯角和油门。
4定位与感知4.1定位 为满足汽车驾驶需求,目前自动驾驶定位精度需求为10cm左右,如此高精度的定位系统采用的定位方案一般是多传感器以及高精度地图融合的方式,具体为GNSS、IMU、激光雷达、相机、高精度地图融合。其中卫星导航系统(GlobalNavigationSatelliteSystem,GNSS)主要提供粗略的绝对位置(经纬度),然后根据采集自身所在环境的激光雷达数据和相机数据与高精度地图匹配得到更精确的定位。IMU(InertialMeasurementUnit)惯性器件提供状态估计算法中状态方程(预测)中的加速度、角速度。
百度无人车团队[10]采用的定位方案框图见图4。这是目前比较常见且有效的定位算法架构。定位算法的精妙之处在于,一些微小的处理与改变也能引起较大的精度差距。所以,不断有学者在定位算法上深耕突破。
4.2高精度地图 在定位方案中,高精度地图起了举足轻重的作用[11]。高精度地图(HDMap)是通过高精度激光雷达、相机、GNSS等传感器获取道路信息数据。传感器数量越多、信息覆盖越全面、精度越高,高精度地图就越精确。在自动驾驶使用时,可将其表示为计算机语言的形式存储在自动驾驶计算机的硬盘当中。驾驶过程中通过实时与高精度地图比对来获得高精度定位。
高精度地图需事先建立,一辆建立高精度地图外业车造价高达800万人民币,多数开销在传感器系统上。由于采集的数据庞大,必须通过人工智能算法进行数据处理。高精度地图主要包含:车道经纬度、车道宽、曲率、高程;车道交叉口位置、宽度、曲率、道口数;标牌位置以及含义;信号灯位置等。高精度地图的建立过程中存在大量的分类问题,计算机视觉领域采用卷积神经网络(ConvolutionNeuralNetwork,CNN)使问题得到很好的解决。
卷积神经网络由一个或多个卷积层和全连接层(对应经典的神经网络,可有可无)组成,卷积层执行的计算包含卷积操作和池化操作。卷积计算是通过不同窗口数据和滤波矩阵(一组固定的权重)做内积(逐个元素相乘再求和)的操作得到卷积后的数据;池化计算将数据分块,每块找最大或求平均作为数据块的代表值。具体操作示意图见图6。
卷积神经网络算法还有一个特点是权值共享,对于一幅图片上每个点,在某一层的卷积操作权值是相同的,卷积神经网络训练的参数转化为训练滤波矩阵(卷积核),参数大大减少。卷积神经网络就是通过多个卷积层得到不同方向上的几何信息特征,通过提取这些特征,得到输入数据的相关性,通过考虑这些相关性减少训练复杂度,该方法在图像和语音处理上具有很好的应用。
4.3感知在线进行环境感知的方法类似高精度地图的构建过程,对采集的数据进行在线实时识别、分类,区别在于输入数据是动态的,具有新的挑战。
5规划与控制5.1规划规划问题是根据感知的动态环境与对运动体的预测情况进行运动序列决策[12]。这个决策问题在复杂环境下非常复杂,可以设想通过一个极其复杂的路口对规划问题的考验,是体现自动驾驶智能程度的关键问题。传统A*、Dijkstra等路径规划算法可实现车辆保守的驾驶,但复杂动态环境不适用,时间复杂度高,而强化学习是解决序列决策问题的好方法,目前在解决自动驾驶规划问题上有很好的仿真验证。
强化学习是与监督学习、无监督学习平级的机器学习的一个分支,来源于动物学习心理学,最早可追溯到巴普洛夫的条件反射试验,通过反馈获得成效的评价来不断提高学习效果。
强化学习问题的基本结构是交互[13],一个智能体处于一个环境中,在每一个时间,智能体做出一个动作(a),然后从环境中获得观测量(状态量s)以及回报(收益r),强化学习的学习目标是:如何在未知环境中采取一系列行为,来最大化智能体收到的(总)累积回报(收益)。这个交互过程在一个时间段内状态、动作、回报的迭代关系如图7所示。强化学习具有以下特点:本质上是闭环系统,输入和输出相互依赖;反馈是延时的,不是即时的,一个动作的影响可能几步之后才会体现;没有直接的指导告诉该怎么做,只有回报函数;时间很关键,观测量、回报等是关于时间的序列,不满足独立同分布假设;智能体的动作直接影响到它之后收到的数据。
基于以上特点,假设环境状态的集合是S,动作集合是A,强化学习有四个要素:
策略(π):从环境状态到动作的映射学习,这个映射叫做策略,记为π:S→A。回报(R):*由状态和动作产生的影响的量化表示,记作R:S×A→R。价值函数:由未来h步回报组成,最大化价值函数的策略π成为强化学习目标。模型:模型已知(白箱):系统转移到下一步状态S’的概率G已知,动作a产生的回报r已知;模型未知(黑箱):系统转移到下一步状态S’的概率P未知,动作a产生的回报r未知,大部分场景模型都是未知的。强化学习理论比较深奥,入门门槛较高。强化学习解决问题实施方法是离线训练学习(试错)+在线推断决策。由于神经网络擅长人类很容易完成但是很难去给出规范(解析)的描述,所以在机器学习领域广泛使用,将学习到的策略用神经网络作为函数近似器(神经网络可以认为是一种非线性拟合)的强化学习方法,称为深度强化学习[14-15]。深度强化学习被认为是走向通用人工智能的必经之路[16]。目前,采用深度强化学习解决自动驾驶的路径规划问题的理论研究和仿真试验表明其卓有成效[17]。
5.2控制 控制的任务是消化上层动作规划模块的输出轨迹点,通过一系列动力学计算转换成对车辆油门、刹车以及方向盘控制信号,从而尽可能地控制车去实际执行这些轨迹点。该问题一般转化为找到满足车辆动态姿态限制的方向盘转角控制(车辆横向控制),和行驶速度控制(车辆纵向控制)。对这些状态量的控制可以使用经典的PID控制算法,但其对模型依赖性较强,误差较大。智能控制算法,如模糊控制、神经网络控制等,在无人车控制中也得到广泛研究和应用。其中,神经网络控制利用神经网络,把控制问题看成模式识别问题,被识别的模式映射成“行为”信号的“变化”信号。甚至可以用驾驶员操纵过程的数据训练控制器获取控制算法。
参考文献[1]陈晓博.发展自动驾驶汽车的挑战和前景展望[J].综合运输,2016(11):9-13.[2]余阿东,陈睿炜.汽车自动驾驶技术研究[J].汽车实用技术,2017(2):124-125.[3]朱敏慧.逐步实现自动驾驶5个层级[J].汽车与配件,2016(11):4.[4]高洪波,张新钰,张天雷,等.基于云模型的智能驾驶车辆变粒度测评研究[J].电子学报,2016,44(2):365-373.[5]郭旭.人工智能视角下的无人驾驶技术分析与展望[J].电子世界,2017(20):64-65.[6]王科俊,赵彦东,邢向磊.深度学习在无人驾驶汽车领域应用的研究进展[J].智能系统学报,2018,13(1):55-69.[7]2018Self-drivingsafetyreport[R].GeneralMotorsCooperation,February2018.[8]Ontheroadtofullyself-driving-modelingthefuturechallenge[R].WaymoSafetyReport,October2017.[9]Apollopilotsafetyreport2018[R].July,2018.[10]WanG,YangX,CaiR,etal.Robustandprecisevehiclelocalizationbasedonmulti-sensorfusionindiversecityscenes[C].2018IEEEInternationalConferenceonRoboticsandAutomation(ICRA),Brisbane,QLD,2018.[11]SeifHG,胡晓龙.智能城市中自动驾驶汽车工业的关键挑战:高清地图[J].Engineering,2016(02):27-35.[12]薛建儒,李庚欣.无人车的场景理解与自主运动[J].无人系统技术,2018,1(2):24-33.[13]LillicrapTP,HuntJJ,PritzelA,etal.Continuouscontrolwithdeepreinforcementlearning[J].ComputerScience,2015,8(6):A187.[14]VanHH,GuezA,SilverD.Deepreinforcementlearningwithdoubleq-learning[J].ComputerScience,2015.[15]刘全,翟建伟,章宗长,等.深度强化学习综述[J].计算机学报,2018,41(1):1-27.[16]赵冬斌,邵坤,朱圆恒,等.深度强化学习综述:兼论计算机围棋的发展[J].控制理论与应用,2016,33(6):701-717.[17]ScottP,HansA,XinxinD,etal.Perception,planning,control,andcoordinationforautonomousvehicles[J].Machines,2017,5(1).
CAS Authentication wanted!
CASAuthenticationwanted!YoushouldalreadyhavebeenredirectedtotheCASserver.Clickheretocontinue.
phpCAS1.3.1usingserverhttps://www.medlive.cn/auth/(CAS2.0)