百度:持续打造人工智能领域的中国标杆
从创建百度的第一天起,百度董事长兼CEO李彦宏对百度的期待始终如一:相信技术可以改变世界。“10年前,我们意识到,人工智能技术可能已经成熟到可以解决搜索问题,以及搜索以外的很多问题,我们开始大举投入人工智能技术的研发,期待用技术让复杂的世界更简单。”李彦宏说。
探索人工智能的“先行者”
搜索的核心是更好地理解用户的搜索查询,并通过匹配搜索结果中最相关的信息来回答问题的能力。
2010年,百度开始探索人工智能,以期通过AI技术更好地将用户的搜索意图与海量互联网信息匹配。
如今,百度使用人工智能和大数据等新兴技术,通过学习关键词搜索与搜索结果之间的紧密联系来最好地满足用户意图。意图洞察力,加上大数据软件技术大量处理及索引海量互联网信息,帮助百度创建庞大的知识图谱,以改善用户体验。
据百度首席技术官王海峰介绍,百度构建了大规模知识图谱,通过融合大规模知识,研发知识增强的深度学习方法,在解决语义理解问题上,参数规模相同的情况下可以取得语义理解效果的大幅提升。同时,基于知识和语义表示关联并统一表示跨模态信息,在知识增强语义理解的基础上,百度实现了语音、视觉和语言跨模态的语义理解。
截至2020年12月,百度AppMAU已达5.44亿。同时通过引入百家号账户、智能小程序及托管页等AI支柱进一步加深百度对用户的深刻了解,成为中国领先的搜索加信息流应用。
人工智能领域的中国标杆
目前,我国的人工智能等新兴技术发展已经跻身世界前列。而百度是国内可提供从芯片设计到深度学习框架及应用层面全栈式AI能力的公司,基础设施包括人工智能芯片、深度学习框架、核心人工智能能力(例如自然语言处理、知识图谱、语音识别、机器翻译、计算机视觉和增强现实等)及开放式人工智能平台已广泛应用及使用。
“最近10年,我们在深度学习、对话式人工智能操作系统、自动驾驶、AI芯片等前沿领域投资,让我们成为一个拥有强大的互联网用户基础的AI生态型公司。”李彦宏说道。2020年,百度的总收入为人民币1,071亿元,同期研发投资为人民币195亿元,占总收入的18%。
百度的核心业务由人工智能驱动,其AI技术创新获得了全球社区的高度认可。例如,自然语言处理框架ERNIE是首个在GLUE(通用语言理解评估,被广泛认为是测试AI语言理解的基准)上得分超过90分的AI模型,获得2020年世界人工智能大会最高荣誉奖项SAIL(卓越AI引领者)奖。
得益于提前布局,百度如今已成为中国人工智能领域的领头羊。截至2020年10月30日,百度拥有中国最多的人工智能专利数量以及人工智能专利申请数量,百度全球AI专利申请量已超过1万件,其中中国专利7000多件,并在语音识别、自然语言处理、知识图谱和自动驾驶4个细分领域排名第一,展现出深厚的技术底蕴以及持续的创新能力。据中国信通院《全球人工智能产业数据报告》显示,百度是唯一一家在语音语义技术领域专利申请量和授权量均上榜全球前十的中国企业。
攻占产业智能化高地
目前,百度正通过深度学习框架、通用算法、基础算法库、数据分析挖掘和分布式计算等人工智能和大数据软件提供在线营销技术服务,支持智慧城市、智能交通等系统建设。
随着AI技术的应用的越来越频繁,百度也在通过核心人工智能技术引擎——“百度大脑”不断拓展新的人工智能业务,成绩斐然。百度依托百度大脑、飞桨、芯片、智能云、数据中心等在内的新型AI基础设施,推动智慧城市、智能交通、智慧金融、智慧能源、智慧医疗、智能制造(含工业互联网)等产业智能化升级。
同时,百度的AI解决方案已成为关键垂直行业的标准。例如,在智能交通行业,百度是发展车路协同(V2X)道路基础设施的先锋。百度已于十多个城市(包括北京、上海、重庆及广州)落地智能交通项目,用AI技术帮助现代化城市改善交通状况、道路安全及空气质量。百度的V2X道路基础设施亦用作智能车辆道路协调平台。例如,其可为智能车辆(自动驾驶服务、智能EV、robotaxis及联网车辆)提供有关周围交通及道路状况的信息,因此为交通相关应用程序定义标准,继而推动行业采纳应用。
在智能驾驶领域,Apollo自动驾驶业务投入7年、面市3年多以来,已经与10家中国及全球车企达成战略合作,在美国加州及国内北京、长沙等地均获得无人驾驶测试许可,测试车队规模已达500辆,获得专利数2900件,测试里程总计超过700万公里。另外面向公众,百度也在北京、长沙和沧州推出了无人出租车服务Robotaxi。
AI持续赋能生态
人工智能是引领新一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的“头雁”效应。
百度正通过其AI能力的独特广度及深度为百度所有业务提供了差异化的技术基础。百度将领先的AI技术开放给开发者及合作伙伴,以AI赋能生态。
“近年来,人工智能已经越来越多渗透到各行各业,人们期待通过新技术解决各行业难题。人工智能技术需要与场景深度融合,这是未来人工智能技术发展的一大重点。”王海峰说。
人工智能开始应用于各行各业的时候,不是每个行业都有足够多精通人工智能算法的专家。因此,需要有便捷易用的平台,能够让开发者专注于应用的开发,加速产业创新。如百度研发的飞桨平台,解决了基础的开发、训练、部署和模型库、开发套件等问题,并开源开放,让开发者无需每一个人都从第一行算法代码写起,可以直接调用。大幅降低了应用的门槛,更快推进产业智能化。目前,百度飞桨已凝聚超265万开发者,服务10万家企业,基于飞桨平台创建了超过34万个模型,在城市、工业、电力、通信等很多关乎国计民生的领域都有飞桨在发挥作用。百度所提倡的“融合创新”更进一步强化了AI的这种“头雁”效应。
“开放是百度与生俱来的基因,百度做AI,无论是阿波罗自动驾驶,还是小度助手、飞桨深度学习框架,我们都坚定地推动开源开放,为的是让大家都少走弯路,让整个赛道更宽广,让技术发展更快,让应用普及更快。”李彦宏说道。
【纠错】【责任编辑:陈听雨】2023百度人工智能专利白皮书(附下载)
报告下载:添加199IT微信公众号【i199it】,回复关键词【2022百度人工智能专利白皮书】即可
百度发布《百度人工智能专利白皮书2022》(以下简称“白皮书”),首次披露高价值专利成果。其中,2021年,百度深度学习专利申请量、自动驾驶专利族数量均排名全球第一。
“十四五”规划和2035年远景目标纲要提出,实施知识产权强国战略,更好保护和激励高价值专利。近年来,高科技企业都在创造和储备高价值专利,高价值专利具有更好的技术价值和经济价值,极大促进人工智能技术成果的转化。这对我国科技自立自强、关键核心技术突破,具有重大的战略意义。
本次发布的白皮书显示,截至2022年4月,百度全球人工智能专利申请超过2.2万件,其中,中国专利申请量超过1.6万件,中国授权专利超过4600件。根据相关报告,在中国人工智能高价值专利及创新驱动力评测结果中,百度位列第一。2021年,百度荣获人工智能交互领域的唯一中国专利金奖,成为人工智能领域获得中国专利奖奖项最多、获奖级别最高的高科技企业。2022年4月15日,国家知识产权局公示第二十三届中国专利奖评审结果,百度5件专利预获中国专利奖,其中,自动驾驶、计算机视觉2件专利预获中国专利奖银奖。
百度在人工智能领域取得多项突破,得益于持续高强度研发投入。白皮书中也写道,2021年,百度核心研发占百度核心收入23%,研发强度位列中国民营500强首位。
近几年来,百度打造了国内首个自主研发、功能丰富的产业级深度学习开源开放平台飞桨,服务406万开发者、15.7万家企事业单位;联合鹏城实验室共同研发的全球首个知识增强千亿大模型——“鹏城–百度·文心”,参数规模达2600亿,是目前全球最大的中文单体模型。此外,百度还发布了全球首个百亿参数预训练对话生成模型PLATO-XL,参数达到110亿。
百度CTO王海峰表示,百度坚持不懈推进技术创新和应用,同时持续沉淀创新成果,人工智能专利申请量和授权量蝉联中国第一,专利的运用和转化不断增强。这些创新成果一方面支撑着百度业务不断进化、可持续发展;另一方面也通过开源开放技术平台,赋能千行百业的转型升级。
2021年,百度申请的人工智能专利技术,90%以上应用到公司及合作伙伴的产品和服务中,并通过专利合作赋能合作伙伴,推动人工智能技术大规模落地应用。2021年,百度承建北京人工智能产业知识产权运营中心,牵头发起成立中国专利保护协会人工智能专业委员会,组建人工智能产业专利池,与厨电、短视频等龙头企业达成专利许可合作协议。
报告下载:添加199IT微信公众号【i199it】,回复关键词【2022百度人工智能专利白皮书】即可
更多阅读:IPlytics:2000-2018年美国有1139项人工智能诉讼专利Accenture:调查显示企业不愿花钱对员工进行人工智能培训全球人工智能相关领域高层次女性学者报告:美国占比超6成,中国23人入围清华大学:2018人工智能芯片技术白皮书(附下载)埃森哲:印度经济增长与人工智能白宫人工智能报告:为了人工智能的未来(附下载)机器的崛起:中国高管眼中的人工智能(附下载)IBM:零售和消费品行业即将迎来人工智能革命(附下载)斯坦福:2018年度人工智能AI指数报告人工智能驱动型企业:后人工智能时代的工作、就业与雇佣关系赛迪译丛:中美人工智能教育对比评估(附下载)亿欧智库:2018中国医疗人工智能发展研究报告(附下载)世界经济论坛:释放制造业中人工智能的价值麦肯锡:2017人工智能影响中国报告2018年人工智能标准化白皮书(附下载)人工智能的十大应用
导读:人工智能已经逐渐走进我们的生活,并应用于各个领域,它不仅给许多行业带来了巨大的经济效益,也为我们的生活带来了许多改变和便利。下面,我们将分别介绍人工智能的一些主要应用场景。
作者:王健宗何安珣李泽远
来源:大数据DT(ID:hzdashuju)
01 无人驾驶汽车
无人驾驶汽车是智能汽车的一种,也称为轮式移动机器人,主要依靠车内以计算机系统为主的智能驾驶控制器来实现无人驾驶。无人驾驶中涉及的技术包含多个方面,例如计算机视觉、自动控制技术等。
美国、英国、德国等发达国家从20世纪70年代开始就投入到无人驾驶汽车的研究中,中国从20世纪80年代起也开始了无人驾驶汽车的研究。
2005年,一辆名为Stanley的无人驾驶汽车以平均40km/h的速度跑完了美国莫哈维沙漠中的野外地形赛道,用时6小时53分58秒,完成了约282千米的驾驶里程。
Stanley是由一辆大众途锐汽车经过改装而来的,由大众汽车技术研究部、大众汽车集团下属的电子研究工作实验室及斯坦福大学一起合作完成,其外部装有摄像头、雷达、激光测距仪等装置来感应周边环境,内部装有自动驾驶控制系统来完成指挥、导航、制动和加速等操作。
2006年,卡内基梅隆大学又研发了无人驾驶汽车Boss,Boss能够按照交通规则安全地驾驶通过附近有空军基地的街道,并且会避让其他车辆和行人。
近年来,伴随着人工智能浪潮的兴起,无人驾驶成为人们热议的话题,国内外许多公司都纷纷投入到自动驾驶和无人驾驶的研究中。例如,Google的GoogleX实验室正在积极研发无人驾驶汽车GoogleDriverlessCar,百度也已启动了“百度无人驾驶汽车”研发计划,其自主研发的无人驾驶汽车Apollo还曾亮相2018年央视春晚。
但是最近两年,发现无人驾驶的复杂程度远超几年前所预期的,要真正实现商业化还有很长的路要走。
02 人脸识别
人脸识别也称人像识别、面部识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。人脸识别涉及的技术主要包括计算机视觉、图像处理等。
人脸识别系统的研究始于20世纪60年代,之后,随着计算机技术和光学成像技术的发展,人脸识别技术水平在20世纪80年代得到不断提高。在20世纪90年代后期,人脸识别技术进入初级应用阶段。目前,人脸识别技术已广泛应用于多个领域,如金融、司法、公安、边检、航天、电力、教育、医疗等。
有一个关于人脸识别技术应用的有趣案例:张学友获封“逃犯克星”,因为警方利用人脸识别技术在其演唱会上多次抓到了在逃人员。
2018年4月7日,张学友南昌演唱会开始后,看台上一名粉丝便被警方带离现场。实际上,他是一名逃犯,安保人员通过人像识别系统锁定了在看台上的他;
2018年5月20日,张学友嘉兴演唱会上,犯罪嫌疑人于某在通过安检门时被人脸识别系统识别出是逃犯,随后被警方抓获。随着人脸识别技术的进一步成熟和社会认同度的提高,其将应用在更多领域,给人们的生活带来更多改变。
03机器翻译
机器翻译是计算语言学的一个分支,是利用计算机将一种自然语言转换为另一种自然语言的过程。机器翻译用到的技术主要是神经机器翻译技术(NeuralMachineTranslation,NMT),该技术当前在很多语言上的表现已经超过人类。
随着经济全球化进程的加快及互联网的迅速发展,机器翻译技术在促进政治、经济、文化交流等方面的价值凸显,也给人们的生活带来了许多便利。例如我们在阅读英文文献时,可以方便地通过有道翻译、Google翻译等网站将英文转换为中文,免去了查字典的麻烦,提高了学习和工作的效率。
04声纹识别
生物特征识别技术包括很多种,除了人脸识别,目前用得比较多的有声纹识别。声纹识别是一种生物鉴权技术,也称为说话人识别,包括说话人辨认和说话人确认。
声纹识别的工作过程为,系统采集说话人的声纹信息并将其录入数据库,当说话人再次说话时,系统会采集这段声纹信息并自动与数据库中已有的声纹信息做对比,从而识别出说话人的身份。
相比于传统的身份识别方法(如钥匙、证件),声纹识别具有抗遗忘、可远程的鉴权特点,在现有算法优化和随机密码的技术手段下,声纹也能有效防录音、防合成,因此安全性高、响应迅速且识别精准。
同时,相较于人脸识别、虹膜识别等生物特征识别技术,声纹识别技术具有可通过电话信道、网络信道等方式采集用户的声纹特征的特点,因此其在远程身份确认上极具优势。
目前,声纹识别技术有声纹核身、声纹锁和黑名单声纹库等多项应用案例,可广泛应用于金融、安防、智能家居等领域,落地场景丰富。
05智能客服机器人
智能客服机器人是一种利用机器模拟人类行为的人工智能实体形态,它能够实现语音识别和自然语义理解,具有业务推理、话术应答等能力。
当用户访问网站并发出会话时,智能客服机器人会根据系统获取的访客地址、IP和访问路径等,快速分析用户意图,回复用户的真实需求。同时,智能客服机器人拥有海量的行业背景知识库,能对用户咨询的常规问题进行标准回复,提高应答准确率。
智能客服机器人广泛应用于商业服务与营销场景,为客户解决问题、提供决策依据。同时,智能客服机器人在应答过程中,可以结合丰富的对话语料进行自适应训练,因此,其在应答话术上将变得越来越精确。
随着智能客服机器人的垂直发展,它已经可以深入解决很多企业的细分场景下的问题。比如电商企业面临的售前咨询问题,对大多数电商企业来说,用户所咨询的售前问题普遍围绕价格、优惠、货品来源渠道等主题,传统的人工客服每天都会对这几类重复性的问题进行回答,导致无法及时为存在更多复杂问题的客户群体提供服务。
而智能客服机器人可以针对用户的各类简单、重复性高的问题进行解答,还能为用户提供全天候的咨询应答、解决问题的服务,它的广泛应用也大大降低了企业的人工客服成本。
06智能外呼机器人
智能外呼机器人是人工智能在语音识别方面的典型应用,它能够自动发起电话外呼,以语音合成的自然人声形式,主动向用户群体介绍产品。
在外呼期间,它可以利用语音识别和自然语言处理技术获取客户意图,而后采用针对性话术与用户进行多轮交互会话,最后对用户进行目标分类,并自动记录每通电话的关键点,以成功完成外呼工作。
从2018年年初开始,智能外呼机器人呈现出喷井式兴起状态,它能够在互动过程中不带有情绪波动,并且自动完成应答、分类、记录和追踪,助力企业完成一些烦琐、重复和耗时的操作,从而解放人工,减少大量的人力成本和重复劳动力,让员工着力于目标客群,进而创造更高的商业价值。当然智能外呼机器人也带来了另一面,即会对用户造成频繁的打扰。
基于维护用户的合法权益,促进语音呼叫服务端健康发展,2020年8月31日国家工信部下发了《通信短信息和语音呼叫服务管理规定(征求意见稿)》,意味着未来的外呼服务,无论人工还是人工智能,都需要持证上岗,而且还要在监管的监视下进行,这也对智能外呼机器人的用户体验和服务质量提出了更高的要求。
07智能音箱
智能音箱是语音识别、自然语言处理等人工智能技术的电子产品类应用与载体,随着智能音箱的迅猛发展,其也被视为智能家居的未来入口。究其本质,智能音箱就是能完成对话环节的拥有语音交互能力的机器。通过与它直接对话,家庭消费者能够完成自助点歌、控制家居设备和唤起生活服务等操作。
支撑智能音箱交互功能的前置基础主要包括将人声转换成文本的自动语音识别(AutomaticSpeechRecognition,ASR)技术,对文字进行词性、句法、语义等分析的自然语言处理(NaturalLanguageProcessing,NLP)技术,以及将文字转换成自然语音流的语音合成技术(TextToSpeech,TTS)技术。
在人工智能技术的加持下,智能音箱也逐渐以更自然的语音交互方式创造出更多家庭场景下的应用。
08个性化推荐
个性化推荐是一种基于聚类与协同过滤技术的人工智能应用,它建立在海量数据挖掘的基础上,通过分析用户的历史行为建立推荐模型,主动给用户提供匹配他们的需求与兴趣的信息,如商品推荐、新闻推荐等。
个性化推荐既可以为用户快速定位需求产品,弱化用户被动消费意识,提升用户兴致和留存黏性,又可以帮助商家快速引流,找准用户群体与定位,做好产品营销。
个性化推荐系统广泛存在于各类网站和App中,本质上,它会根据用户的浏览信息、用户基本信息和对物品或内容的偏好程度等多因素进行考量,依托推荐引擎算法进行指标分类,将与用户目标因素一致的信息内容进行聚类,经过协同过滤算法,实现精确的个性化推荐。
09医学图像处理
医学图像处理是目前人工智能在医疗领域的典型应用,它的处理对象是由各种不同成像机理,如在临床医学中广泛使用的核磁共振成像、超声成像等生成的医学影像。
传统的医学影像诊断,主要通过观察二维切片图去发现病变体,这往往需要依靠医生的经验来判断。而利用计算机图像处理技术,可以对医学影像进行图像分割、特征提取、定量分析和对比分析等工作,进而完成病灶识别与标注,针对肿瘤放疗环节的影像的靶区自动勾画,以及手术环节的三维影像重建。
该应用可以辅助医生对病变体及其他目标区域进行定性甚至定量分析,从而大大提高医疗诊断的准确性和可靠性。另外,医学图像处理在医疗教学、手术规划、手术仿真、各类医学研究、医学二维影像重建中也起到重要的辅助作用。
10 图像搜索
图像搜索是近几年用户需求日益旺盛的信息检索类应用,分为基于文本的和基于内容的两类搜索方式。传统的图像搜索只识别图像本身的颜色、纹理等要素,基于深度学习的图像搜索还会计入人脸、姿态、地理位置和字符等语义特征,针对海量数据进行多维度的分析与匹配。
该技术的应用与发展,不仅是为了满足当下用户利用图像匹配搜索以顺利查找到相同或相似目标物的需求,更是为了通过分析用户的需求与行为,如搜索同款、相似物比对等,确保企业的产品迭代和服务升级在后续工作中更加聚焦。
关于作者:王健宗,博士,某大型金融集团科技公司资深人工智能总监、高级工程师,中国计算机学会大数据专家委员会委员、高级会员,美国佛罗里达大学人工智能博士后,曾任美国莱斯大学电子与计算机工程系研究员、美国惠普公司高级云计算解决方案专家。
何安珣,某大型金融集团科技公司高级算法工程师,中国计算机学会会员,中国计算机学会青年计算机科技论坛(YOCSEF深圳)委员。拥有丰富的金融智能从业经验,主要研究金融智能系统框架搭建、算法研究和模型融合技术等,致力于推动金融智能的落地应用与价值创造。
李泽远,某大型金融集团科技公司高级人工智能产品经理,中国计算机学会会员,长期致力于金融智能的产品化工作,负责技术服务类的产品生态搭建与实施推进。
本文摘编自《金融智能:AI如何为银行、保险、证券业赋能》,经出版方授权发布。
延伸阅读《金融智能》
点击上图了解及购买
转载请联系微信:DoctorData
推荐语:这是一部讲解如何用AI技术解决银行、保险、证券行业的核心痛点并帮助它们实现数智化转型的著作。作者从金融智能一线从业者的视角,深入剖析了传统金融行业的痛点与局限,以及金融智能的特点与优势,阐明了人工智能等技术在金融业的必要性,并针对金融智能在银行、保险和证券业的诸多应用场景,给出了具体解决方案。
划重点????
干货直达????
有了中台,那后台还剩下什么?(图解中台架构)
关于读书,我发现每一个技术大牛都有这个怪癖
2020福布斯中国富豪榜发布!10年来谁是中国最有钱的人?
34秒看完200余年美国总统大战:民主党vs共和党谁是赢家?
更多精彩????
在公众号对话框输入以下关键词
查看更多优质内容!
PPT | 读书 | 书单 | 硬核 | 干货 | 讲明白 | 神操作
大数据 | 云计算 | 数据库 | Python | 可视化
AI | 人工智能 | 机器学习 | 深度学习 | NLP
5G | 中台 | 用户画像 | 1024 | 数学 | 算法 | 数字孪生
据统计,99%的大咖都完成了这个神操作
????
百度度秘智能电视方向产品负责人李静:未来已来,唤醒万物的AI产品经理是什么样的
由人人都是产品经理与腾讯大讲堂联合主办的2017中国产品经理大会:解码未来产品经理在深圳宝立方国际博览中心如期举行。百度度秘智能电视方向产品负责人@李静分享的话题是“未来已来,唤醒万物的AI产品经理是什么样的”,她从AI落地实例出发,带大家了解AI产品经理的工作,并给产品经理带来三点建议。
分享嘉宾:百度度秘智能电视方向产品负责人李静
嘉宾分享视频已经在起点社员频道上架,免费观看。详情请戳:https://vip.qidianla.com/course/detail/tssqd.html
以下内容为嘉宾分享实录,由人人都是产品经理社区媒体组@Ella依据嘉宾分享内容整理,编辑有修改,嘉宾已确认:
我们身边的很多设备都具备了对话的能力,智能音箱、智能电视、智能冰箱等等;Siri也好,小冰也好,都可以对话;对话拉近了人与设备的距离,也拉近了人和服务的距离。
今天我分享的主题是:未来已来,唤醒万物的AI产品经理是什么样的。我会跟大家一起看一个AI在电视场景的落地实例,通过这个实例看一下:人工智能的产品经理是怎样的,在做什么样的事情。
为什么人工智能会爆发我们回想一下,在PC时代,要操控一台电脑,似乎还是一件有些难度的事。我们花了很长时间去学习如何跟机器对话:人类要学习由0和1组成的机器语言,要学习编程,要学会使用电脑,电脑还需要一个外接键盘,我们在学校里还有计算机课,这样才能学会和机器取得沟通。
到了移动互联网时代,随着技术的发展,我们有了全触屏手机,抛开键盘,我们可以用手指去和机器交互,划一划、点一点,即可在手机里找到我们想要的内容。
那么现在,对话式人工智能出现了,我们用人和人之间这种最自然的交互方式,可以和机器这样自然地对话了。
随着科学技术的发展,交互方式越来越自然,设备的使用门槛越来越低,用户用这些设备就越来越方便。
每一次人机交互系统的更迭,都在推动整个时代的变革。
今年,我们一起迎来了对话式人工智能的元年,我们生活中许多电器、许多设备,都开始具备了对话的能力——这种跨越式发展的根本驱动力来自算法、计算能力、数据的突破。深度学习算法突破,使AI达到商业化水平;GPU芯片快速发展、云计算技术产生突破和广泛应用;移动互联网和传感器技术引爆大数据井喷。
今年开始,政府开始关注人工智能,很多政府将人工智能纳入自己的国家战略;各大巨头公司也将自己的算法开源;而且投资市场也很活跃;不管是在C端消费级的智能硬件,还是B端市场都很活跃,这也是促成这场浪潮的直接原因,是人类需求和技术进步共同促成了这场变革。
对话式人工智能的出现也促进了实体产业的革命。
还记得这样的电视机吗?屏幕很小,有两个旋钮,特别简单:一个调台一个调音量,然后还有个开机键和天线。打开电视机就有画面播放,还可以一圈一圈找到你愿意看的频道——那个时候的硬件操作特别简单,硬件设计也特别简单,但是人们的快乐感也是比较强的。
随着科技的进步,电视机硬件的发展,电视机越来越薄了,屏幕也越来越大。随着互联网的发展,互联网走进了电视机,电视在软件能力上有了翻天覆地的变化。在这个时代,电视机有了操作系统,也有了非常丰富的内容。
但是我们发现:设备更迭了,内容更丰富了,但是交互方式并没有变化——手机是安卓系统,你能用手指找到你想要的东西;电视机也是安卓系统,却不行。
对话式人工智能产品的三要素语言是人与人之间交流的最本能、最简单的方式,也是最没有学习成本的方式,那人与机器之间也应该是这样的。
让一个设备拥有对话能力有三个核心要素:听清、听懂和满足。
一个设备需要和用户对话,硬件上必须要有“听”的能力,我们要用语音识别技术让它可以听清用户在说什么。
语音技术积累发展了这么多年,主要就是在做“听清”这件事;经过这么长时间的积累和优化,我们近场语音识别在“听清”上面都还做得不错,基本上满足了听清的需求。
但是现在语音交互,不再是像拿着手机对Siri说话一样必须近距离;在很多场景下,比如车载场景、双手被占用的场景,还需要解放双手,实现远场语音交互。
听清之后,我们要做的就是“听懂”——让设备理解人类的意思。
人能听懂另一个人说的话,是因为具备知识能力——我有知识积累,有对话经验,看过很多东西,这些都在脑海里形成了印象;而且我对沟通的对象有所了解,我知道沟通的背景等等。
对于设备也是同样。机器能够理解一个人的意思,背后有深度学习、自然语言处理、多轮对话、搜索等相关的技术,还有知识图谱、上百亿次的搜索请求,语音调用、多轮对话的调用等等,这些数据的积累及经验能够让它更聪明,越来越明白人类的意思。
但是知识“听懂”还不够,需要理解人类表达的目的,满足人类的需求。而人类在不同场景,对不同的设备需求是不一样的;如何挖掘和满足用户要求,给用户切实可行的服务,做实在有用以及好用的服务和产品,这些就是产品经理应该去落实和思考的事情。
给大家分享几个案例:
1.影片搜索在智能电视这个场景,我们做了哪些满足用户的事?
大家都知道,做一个产品最核心的是:抓住用户使用它的核心功能,也就是用户的核心诉求是什么。用户看电视的时候,核心需求就是:看片,以及找到片。
以往,用户只能通过具体的影片名称、影片类型找到影片;但是大部分情况下,当用户疲惫地倒在沙发上,对看什么影片是没有一个特别明确的需求;怎么让用户更爽地找到影片——这是我们要解决的最核心的问题。
所以在我们的解决方案里,把影片检索服务维度扩充到20多个,同时也支持这些维度的组合检索:
我们希望用户可以直接说“我想看孙俪主演的,最近特别火的叫什么花开的电视剧”这种你和家人才会表达的一种方式,你对机器也可以这样表达。这需要对视频有深度理解,有丰富的标签以及自然语言理解的能力,才能够支持用户这样的表达——这是我们在影片搜索上的目标,也是我们在智能电视这个场景里核心要做好的事情。
2.这个人是谁看电视时,看到一个你不认识的明星,你有没有问过身边的人这个人是谁?或者你肯定被身边的人问过。
现在,你可以直接问电视,“这个人是谁?”,明星脸识别、人脸识别是百度积累了很多年的技术。我们把它放到电视上。当用户看到不认识的演员,就可以问电视,电视识别之后会告诉你“这个人叫王子文”,然后还有一些相应的百科信息。
人与设备之间的距离可以靠语言逐渐拉近,找到需求最核心的句子,需求就不只是在搜索引擎上才可以满足,任何可以对话的设备上都可以满足。
3.我想看《人民的名义》里唱智斗的那一集我们在看百度搜索数据的时候发现一个特别有意思的现象:有很多热播的电视剧精彩片段会行成话题传播,用户看到这些话题,会很想去看这个片段或者这一集。所以用户会在搜索里面提问,找到那一集再去播放——这是我们用户搜索的路径。
现在,我们直接让电视机满足需求。用户可以直接和电视说“我要看《人民的名义》里唱智斗那一集”,那么电视就会直接把这一集找出来并播放——这就是我们在听清、听懂之后在满足层面做的更多设计。
当我们身边的每一个设备都有了对话的能力,这些设备就活了起来。
做一款好用的AI产品,源于产品经理对行业、对用户、对产品细节的深刻思考,对技术、软件、硬件如何结合的深度思考。
唤醒万物的AI产品经理是什么样的?这张图里是我们刚才讲到的所有模块,我们通过这个图带大家了解,一个做对话式人工智能的团队,有哪些产品经理,他们在做什么样的事情。
语音产品经理——让设备能听得见、听得清。
听清是对话的第一步,做语音的产品经理,必须要了解语音识别的相关知识、知道人机交互的基本逻辑,需要有处理大批量数据的能力。
语音产品经理有很多时间都是在做测试、录音,不停地测试、优化、再测试、再优化,效果就是这样一点一点提升起来的。如果做远场语音,你还应该了解唤醒、如何唤醒设备,如何训练唤醒词,了解麦克风阵列、了解不同结构对识别的影响、甚至了解些声学。
对话的第二步是听懂,这一步有很多产品经理在做着很细致的工作。比如有自然语言理解、自然语言处理的产品经理,有座对话的产品经理,有对话管理、自然语言生产、搜索的产品经理,知识图谱、需求图谱、网页图谱的产品经理等等,这些产品经理的工作组合起来,设备才能达到能“听懂”的状态。
有一个名词大家可能会比较陌生:策略产品经理。策略产品经理。以数据分析为工具,制定产品策略,为效果负责。
策略产品经理要对行业、对用户、对当前所处的阶段特别了解,才能制定合理策略;并与策略RD紧密配合,一起验证效果。
策略PM的方法论:“发现问题、提出问题、判断决策、推进落实、效果确认、再循环”。所以这些产品经理应该很了解发现问题的方法有哪些,通过线上效果评估发现问题、线上监控等等。应该了解如何构建合理的测试集,黑盒测试集、白盒测试集、随机集合、监控集合等等。
听清、听懂之后,就是满足用户需求。我们在不同设备上提供了很多的云端能力,这些就是云端服务产品经理要做的事情。比如视频服务、音乐服务或者新闻服务等。
不同类型的服务我们把它叫做垂类(垂直品类)的产品经理,他们负责建设某个垂直的类目,让这些内容在不同场景下有不同的表现——让最好的服务,返回最好的内容,有最好的表现方式,这些是垂类的服务。垂类产品经理往往还需要相关行业的经验。
还有一种是解决方案的产品经理。我们希望更多的设备、更多合作伙伴能用到我们的能力;我们要把这些产品变成解决方案开放出去,所以会有电视场景、音箱场景等不同场景的解决方案的产品经理。
这些产品经理要考虑:解决方案的易用性、性能,对不同场景应该有不同的方案。
现在我们有很多场景的解决方案,也有一个开放平台,平台是用户了解我们的重要窗口。开放平台的产品经理也是这整个环节中非常重要的——他需要建设一个大平台,需要对我们所有场景的解决方案都很了解;知道这些场景的解决方案对接的流程是怎样的,上线下线的流程是怎样的;以及如何才能更好地展现这些能力。
正是这些产品经理工作的组合,才有了我们看到的对话式人工智能的产品。
很多人觉得AI神秘,觉得人工智能的工作也应该是很高端的,但并不是这样;实际具体到每个人身上的工作都是很细节的、繁琐的。大家看到的那些炫酷的伟大的产品,无不源于细节,源于细致的工作。
给大家一些建议如果你在其他行业想要转型做AI产品经理,我给大家几点建议:
1.一定要关注行业动态,找到适合自己的切入点。
不光是关注整个AI大行业的动态和趋势,要找到这个趋势里适合自己切入的领域——你具体对哪一个方面感兴趣,擅长那个方面,你可以把自己以前的经验应用到哪个方面。找到这个领域,深刻去了解它,了解你感兴趣的这个行业的这群用户,了解这个行业的历史。
2.产品经理一定要清楚技术的边界。
你可以不对技术特别精通,但是你一定要知道技术的边界在哪里。这样你才知道,当你设计了一个产品,这个产品中那些设计是这个阶段能实现的,那些设计是下个阶段才能实现的;你也要知道你的方案如何才能打造壁垒,有没有可以打造壁垒的点;如何设计才能在这个阶段用产品去弥补技术的不足,让用户体验更好。
3.继续积累,脚踏实地
不论你之前是那个行业,你之前积累的产品功底都是非常有用的,都不会白费。一定要持续积累,脚踏实地,无论什么时候,踏踏实实地做好每一件事,都是最重要的。
以上就是演讲的内容。
2017中国产品经理大会·深圳|系列文章解码未来产品经理|2017中国产品经理大会现场报道
迅雷创始人程浩:人工智能创业的6大核心问题
SpeakInCOO、前迅雷智能产品中心总经理易鹏宇:AI生态未来10年的产品人定位
神策数据CEO桑文锋:如何用数据驱动产品决策?
饿了么联合创始人&产品负责人汪渊:互联网+的产品建设
QQ运营总监刘凌:从问「问题」出发
讯飞输入法创始人翟吉博:人工智能的未来,带给产品的4种变化
喜马拉雅副总裁李海波:语音时代,内容平台的产品逻辑
优信集团CTO邱慧:消费升级下的产品经理
小米开发者生态团队负责人李晓璐:如何从0到1构建开放生态
网易严选产品总监李天宇:我们应该如何升级,以应对新消费时代
本文为2017中国产品经理大会:解码未来产品经理嘉宾分享整理总结,未经本站许可,禁止转载。谢谢合作