博舍

从0开始,智能助手该如何进行产品定位 人工智能产品定位

从0开始,智能助手该如何进行产品定位

笔者在本文中为我们介绍了当今智能助手的市场情况,并分析了如何进行产品定位做出差异化产品。

小米小爱、天猫精灵、苹果Siri、微软小冰等众多的智能助手已经在我们的生活中出现;大家调戏小冰,对话机器人,还会用小米小爱来开启智能家具。这一切仿佛都是熟悉而自然的事情。

但是,如果作为一名产品经理,假如我们也要做一款智能助手产品,面对现阶段的市场,该如何避开市场上极具竞争力的产品,进行产品定位,走差异化路线呢?

今天给大家做一款案例分析,为智能助手产品定位:

一、智能助手市场分析1.全球市场

智能语音助手的历史从2011年起苹果发布Siri开始。Siri的问世实现了语音识别,语义理解,并且能够回答人类问题。

很快,各大公司紧随其后:2014年,微软发布个人助手Cortana;同年的11月,亚马逊发布Echo(Echo是一个智能硬件,搭载在Echo上的智能软件系统为Alexa);谷歌也不甘示弱,很快发布了GoogleHome,它的经典语录你还记得么——”Hi,HowcanIhelp?”。

从全球智能助手产品的市场占有情况来看:亚马逊的Alexa遥遥领先。

eMarketer(2017)研究报告指出:Alexa占据了美国70%的市场份额;GoogleHome占据了24%。这两款产品几乎横扫了美国的智能助手市场。

PCMagazine(2018)指出:GoogleHome已经集成了200多个第三方能力;亚马逊的Alexa更有超过3万个第三方能力。

Gartner预估到2020年:智能助手会有20亿的市场估值。

另一方面,智能助手之所以能够普及,也得益于其价格的亲民:

亚马逊的Echo和GoogleHomeMini只要49美金,相当于小棕瓶精华一半的价格。从50美金到200美金的产品种类更加丰富,包括:亚马逊Echo二代,EchoPlus,EchoSpot,GoogleHome,微软HarmanKardonInvoke(搭载了微软的Cortana),索尼等。超过200美金的产品则有一些更加炫酷的技能,比如:拥有7英寸大屏幕的亚马逊的EchoShow,10小时续航能力的JBLLink300等。2.中国市场

纵观国内的智能助手市场,大家最为熟悉就是车载导航和淘宝客服机器人。

我们可以通过语音指令告诉车载导航我要去的地方,避开拥堵路段;也可以与淘宝客服机器人更加高效的聊天。

艾瑞咨询对国内的智能语音助手进行了调研:C端应用场景有移动设备、汽车导航、智能家具等;B端应用包括目前最常见的客服机器人、金融业务办理和其他行业的业务办理等。

但是,目前智能助手也有非常明显的局限性:回答不够准确,依赖语料库,难以机敏的针对不同情况帮助到客户,也是智能助手目前使用受限的主要原因。

3.用户调研

除了以上的概览信息,我还做了一个在线调研问卷,看看周围朋友们对智能助手的使用情况:

调研群体为本科以上,年龄在20-40岁之间,属于较能够接受新鲜事物的青年群体。

在线问卷总共获得82份回答,我们一起来看看他们对智能助手的接受程度如何:

目前,大家对智能助手还是以娱乐为主,样本群体最为熟悉的有Siri、微软小冰、小米小爱、天猫精灵。

Siri作为一款历史最悠久,面向c端客户的产品,嵌入到苹果手机,价格免费,使用度也是最高的。

我专门设计了一个问题:“如果停止使用智能助手,你是否会觉得可惜或者难过?”这个问题是为了获取客户对产品满意度的真实回答。

不过从结果来看:对智能助手满意的用户还非常少,大家对智能助手最大的担忧是——回答结果不准确,不够智能。

智能助手在语义识别和语义理解上还有很长的路可以走。

用户的反馈

在国外生活的用户:

在国内生活的用户:

智能助手在语音识别和语义理解方面,英文的难度比较低,所以产品也较为成熟;而中文解析难度大,给智能助手的研发带来了很大挑战。

此外,与其他产品打通互联也是智能助手的关键能力。

这也是为什么亚马逊的Alexa有超过3万个第三方应用,横扫美国70%的智能助手市场了。

总结一下该群体智能助手的使用情况:

62.2%的用户曾经使用过智能助手只有19.23%的人对目前的智能助手产品满意智能助手的娱乐功能被使用最多国内也出现了不错的智能助手产品,包括小米小爱,天猫精灵等4.智能助手市场总结

通过上面的分析,我们可以知道智能助手比较被人熟知的是面向C端的产品,当然竞争也非常激烈:

C端产品包括:国外AppleSiri,AmazonEcho,Googlehome;国内小米小爱,天猫精灵等,都是很强的竞品。语音识别仍然是技术的关键:不同语种的识别,上下文的理解,个人体验(例如:识别爸爸的声音,知道爸爸在问行程的时候,能够对应上爸爸的行程安排)。赋能:集成第三方能力,真正“助手化”。智能助手的留存率普遍较低,产品需要考虑如何提高产品的留存。

所以,如果我们要从0到1做一款智能助手产品,个人智能助手的市场竞争已经非常激烈。我们需要另择其道:

我们将智能助手产品定位在SaaS行业,让SaaS企业更好的连接自己的用户。

为什么要针对SaaS企业,智能助手能够为SaaS公司提供什么样的解决方案,SaaS有什么普遍的痛点是智能助手能够解决的?

我来为大家一一解析:

二、智能助手的产品定位1.中国SaaS市场分析

国内SaaS行业的整体发展进程落后美国5-10年。

当国内SaaS开始萌芽时,美国SaaS市场已经随着巨头的入场迅速开始了商业化的争夺。而随着市场逐渐走向成熟,美国SaaS市场整体发展空间受限,中国成为近两年全球SaaS市场发展最受瞩目的地区。

从艾瑞的分析报告中可以看出:中国不仅在SaaS市场规模的增速上持续跑赢全球增速,而且占全球市场的比例将从2014年的3.6%上升到2020年的9.4%,成为全球saas市场不可忽视的一股力量。

而中国SaaS行业的崛起有两个因素:

1.新技术

新技术的发展人工智能、大数据、物联网、云计算等“后互联网时代”的新兴技术发展逐渐成熟,进入商用阶段。

当美国的Salesforce兼有50亿美金的年收入和每年30%的增速时,中国年收入几十亿人民币的传统企业服务公司却增长缓慢。巨头空缺,为新入场的玩家、新兴技术的渗透创造了机会。

2.需求增加

中国的工业界和制造业的劳动力成本正在显著提高。

根据德勤的一项研究:从2005年到2015年,中国劳动力成本上升了5倍。劳动力上升成为企业切肤之痛,减员增效已成为更多企业的迫切需求。

人口要素的另一个变化是:随着消费级互联网逐渐覆盖到全人群,C端市场出现了流量红利耗尽的势头。C端不好做了,高回报难再求,资本开始转向寻找新猎场,toB又回到了聚光灯下。

与此同时,中国有庞大的企业用户:中国工商登记的企业数量近3000万家,其中中小企业占比90%以上,整体数量超过美国,且仍在持续增加。中小企业是SaaS模式和B2B平台的理想客户。

而在能给toB服务商高客单价和高利润的大型企业方面:由于2012年以来的供给侧改革,优化产业结构、淘汰落后产能,包括:工程机械公司、电器设备公司、大型银行与保险机构等在内的大型企业在2017年普遍取得大幅增长。

国家统计局数据显示,2017年1月到11月,41个工业大类行业中,39个行业实现了利润总额的同比增长,产业与企业规模进一步集中与提升。

企业多了,盘子大了,toB的目标市场自然就大了。

另一方面,随着互联网的普及和教育水平的提高,新一代工作群体80后、90后更能接受信息化工作方式(为什么说中国toB时代终于来了?)。

2.SaaS企业的普遍痛点

对于这样一个崛起的SaaS行业来说,企业家们并没有觉得SaaS能够像C端市场一样快速获利。相反,SaaS行业需要企业精雕细琢,深根服务。

上图的艾瑞咨询针对中国SaaS行业的研究报告指出:对于SaaS行业来说,单个客户在购买产品12个月后,企业才能收回成本开始盈利;而每月新增客户数越多,前20个月亏损也越大。

这是因为SaaS企业在盈利模式上有别于传统软件厂商:客户的付费需分期确认收入,形成递延收入。而企业当期投入的获客营销成本、实施服务成本等在短期内难以收回,导致SaaS企业在前期往往面临持续亏损且亏损不断扩大的局面。

除了销售,客服的人力成本也越来越高。

究其原因:市面上大多数SaaS产品在各自的细分领域内都面临严重的同质化竞争,而产品在功能层面却难以做到差异化,因此最终拼的是服务,导致客服成本居高不下。

所以对于SaaS企业来说,获客成本高、客服人工服务成本高成为其普遍且切身的痛点。

三、智能助手在SaaS行业的解决方案

智能助手在SaaS行业恰好能针对SaaS行业的痛点,提供解决方案。

1.产品定位

针对上诉情况,我们智能助手的产品定位也就出来了:

产品slogan:“智能助手,连接你和你的客户”。

目标市场:中国SaaS公司

产品价值:帮助企业高效的连接客户,降低获客成本,降低企业培训成本。

我们从销售漏斗图中可以看到:销售从最初与客户第一次联系,到安排见面、介绍产品、培训、到签、闭单,转给客服团队的整个流程中,智能助手都能帮助企业更好的联系客户、安排会议、共享材料,帮助企业用户新手入门等。

我们介绍几个具体的用户场景:

用户场景1

小李公司采购了我们的智能助手软硬件产品。

因为他明早和杭州的客户安排了一个产品演示,于是今天晚上他就在家设置了闹钟,告诉助手“美芽”明早6点要起床。第二天一早6点,“美芽”按时叫醒了他,并帮他预约了出租车送他去火车站。出租车的费用由“美芽”自动连接了小李公司的财务系统进行了结算,不需要小李支付。

小李准时到达火车站准备前往杭州。火车上,他收到客户Angel的短信,告诉他会议的地点。到达Angel公司后,小李拨打了Angel的电话,见面后他们相互问好并进入会议室。

小李打开“美芽”,让大家一起连接“美芽”的wifi,并填写公司的邮箱地址,小李开始让“美芽”共享文件,并开始演示。用户对小李公司的产品非常感兴趣,当场,小李就让“美芽”自动开通试用账号给客户(依据用户开始填写的公司邮箱),并发送给在场的人。小李演示完毕后,客户开始使用产品,并提出很多问题与小李讨论。

会议结束后,小李又叫车去了火车站准备回家。路上,他让“美芽”打开家里的热水器和空调,准备回家泡个澡,并且让“美芽”总结今天收到的新邮件内容,待他泡澡的时候播放。

当然,上面的场景是一个非常理想的情况,虽然目前想要实现这个场景比较困难,但这是我们对智能助手多年后的期许。

用户场景2

大家在安排会议的时候,对于找多人共同的空闲时间是否很头疼,尤其需要安排公务繁忙的领导和老板参加的时候。

这个时候,打开智能助手“美芽”,告诉“美芽”找一个客户张老师、老板和我共同可以的时间。

智能助手会提供时间建议给我们。

用户场景3

按照以往的工作方式,当产品新功能发版时,需要客服团队人工去联系很多客户,告诉他们我们新的功能有哪些,请他们使用。

或者客服团队手工编辑一些发版邮件给到客户,让客户了解新功能的价值。等到新功能发版几个月后,客服团队还要打电话回访,请用户对新功能作出评价。

而现在有了智能助手“美芽”,可以让她更加智能地帮我们解决这个问题:

当产品有新功能上线的时候,让“美芽”总结发版ppt并发送给用户,公司客服人员可以对“美芽”的总结进一步优化和编辑,随后批量发送。在此邮件中还可以嵌入反馈入口,让用户对新发版功能进行评价、反馈。“美芽”还能定期统计这些反馈,进行分析,生成报告发送给客户团队进行分享。2.第三方能力集成

因为这是一款为SaaS提供的解决方案,所以我们也要考虑与国内其他SaaS产品进行集成,提供更多的能力给到客户。比如艾瑞咨询列举出来的中国SaaS行业图谱:

举例来说:

(1)如果“美芽”与钉钉集成,可以自动打通公司人事架构。在文件推送、会议邀约的场景下,我们可以实现按项目组/部门来推送和安排。

比如:安排一个产品宣讲大会,需要销售,市场,客服三个部门的同事参加。“美芽”就可以自动地加入这些组的员工。

(2)如果“美芽”与销售易集成,可以实现客户信息的自动关联。

比如:“美芽”根据上次的客户拜访记录,推荐下一次见面的主题给到销售。并基于拜访记录,计算订单的成交可能性、预估订单金额等。

让智能助手“美芽”更多地与第三方SaaS产品集成,就会有更多更强的能力,更好地让公司连接客户、连接客户服务。

四、总结

在面对当今C端智能助手众多,竞争激烈的情况下,本篇智能助手的产品定位,提供了一套智能助手在SaaS行业的解决方案,为企业更好的连接客户,降低获客成本而服务。

 

作者:张圈圈,微信公众号:lovepm

本文由@张圈圈原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Unsplash,基于CC0协议

超越GPS:人工智能技术探索定位技术的替代方案

如今,导航技术已成为人们日常生活中不可或缺的一部分。智能手机可兼作汽车导航设备,智能手表可充当徒步旅行向导等等,不一而足。但这些设备是如何确定我们的位置呢?在诸多定位技术当中,应用范围最广的当属全球定位系统(GPS)。

在我们头顶上方几百公里,GPS卫星正环绕地球运行,并发射电磁(EM)信号。通过检测电磁信号到达时间的微小差异,GPS设备能够精确锁定人们所处的地表位置。尽管这项技术可免费使用,无需订购,却离不开一台能够读取GPS信号的设备。

GPS技术的核心是卫星,这是我们无法控制的外部事物。没有卫星,GPS技术就是纸上谈兵。虽然人眼无法看到卫星,但卫星视距却是GPS运转的关键。因此,在隧道、地下停车场等场所,又或在森林茂密、树木高大的山区,高楼林立、建筑密集的城市中,卫星视距受限,导致GPS导航时常失灵。GPS信号还容易受到第三方的攻击和干扰。不过,只要GPS能够正常工作,它提供的结果就相对准确。将GPS估计的当前“位置”叠加在地图上,就构成了最基础的导航系统。剩下的工作是反复执行“定位”并更新地图上的显示结果。

不过在通常情况下,“定位”是否需要一直借助于GPS卫星等外部设备?对人类来说,答案是否定的,我们在晨跑时并不依赖外部电磁波导航。即便是从没去过的地方,如果我们有一张静态地图,无论是根据过往经验还是依靠纸质地图,都可以在这张地图上正确定位,然后找到特定地点,如朋友的新家。我们可以感知自身的移动速度,距离参照点有多远,距离判定点(例如转弯、地标或目的地)有多近。也就是说人类自身拥有完全整合的自给定位系统,无需时刻依赖外部资源。

自动驾驶汽车和扫地机器人等新兴电子设备已在模仿这种基于视觉的定位方法,甚至利用人眼看不见的光谱,如红外线、激光和射频波,更好地对环境进行“可视化”。然而,这种视觉系统的不足之处在于需要通过视觉传感器收集和解读数据。根据视觉数据推断运动的方向和速度并非易事,它承担着庞杂的计算负载任务,需要功能强大的处理器以及海量的数据存储和内存。此外,计算过程功率大、能耗高。种种条件累积起来,使得整套系统的成本过于高昂。

下载图片

更直观的定位解决方案

是否有一种无需大量计算且更为便捷的定位方法?理论上,我们可以使用日常生活中最常见的一种传感器——加速度计。与视觉方法相比,加速度计作为一种基于运动的传感器,在确定位置时需要的计算负载几乎可以忽略不计。同时,加速度计非常便宜,工作原理直观明了。根据定义,加速度是速度在一段时间内的变化(a=Δv/Δt),速度是位置在一段时间内的变化(v=Δs/Δt)。将这两个公式合并并推广至非线性运动中,就得到了加速度与位置的表达式:

这个简单的关系表明,位置的二次微分必然是加速度。通过掌握一段时间内的位置数据,我们可以进行二次微分,并准确确定行程中的加速度,从“s”得出“a”。

鉴于这是一个数学公式,还可以通过逆运算从“a”得出“s”。在这种情况下,需要进行二重积分:

从理论上来说,这表明如果拥有一段时间内的加速度数据(例如加速度计给出的数值),就可以通过二重积分获得位置数据。然而,这同时意味着基于此原理的自给惯性导航技术无法避免的巨大挑战。为更好理解这一点,我们接下来回顾学生时代的的课程。微分缩小内部表达式并消除常量,而积分则增大内部表达式并生成常量。“二重”微分将消除线性项,而二重积分则会让常量快速增大。

简言之,这项技术的挑战源自二重积分和加速度数据样本中不可避免的微小误差。随着时间的推移,微分可以减小误差的影响,二次微分(如从s到a)更是如此。与之相反,测量数据中的微小误差会随着积分而增大,而二重积分导致误差增大的速度加快,例如从a计算出s。捕获的加速度数据中始终会存在各种误差,例如量化误差、加速度计中的机械偏差、校准错误,甚至小于制造公差的不可检测缺陷等。

为得到定位数据,要对加速度进行二重积分,那么这些微小的误差也会经过二重积分,且没有上限。如果我们采用这种方法开始进行二重积分,哪怕桌面上的一个静态物体也会开始生成移动轨迹。观察时间越长,积分时间越长,这个物体就会在三维空间不断加速,离你越来越远。在几秒钟内,二重积分后的数据就会显示该“静态”物体已到达月球。对于航位推算式自给惯性导航来说,这种积分误差随时间推移而产生的“漂移”是一个灾难性的问题。

如何减少惯性导航的误差

人们一直在努力减小每次采样中可能产生的误差,例如通过基于物体的物理限制(例如人类的步距不可能超过一定范围),以及确定可能的运动范围(例如将加速度计、陀螺仪和磁强计等多种惯性测量装置(IMU)放置在移动物体周围的多个位置,以检测和排除不可能的运动轨迹)。这些方法在一定程度上卓有成效,因为误差至少受到既定“规则”的约束,物体就不会以极快的速度从你身边加速远离。然而,积分过程中误差滚雪球式增大的问题仍然存在,并且从根本上影响了定位的精确度(例如无法准确定位静止物体的问题)。

为彻底限制误差范围,传统方法是投入更多硬件,特别是非运动传感器,如视觉和激光传感器。随着此类传感器的使用,仅凭借运动传感器进行惯性导航的优势(计算复杂度小、价格低、功耗少等)就大打折扣了。因此,惯性导航系统主要局限于航天器和飞机应用。此类应用能在短时间内满足相关要求,并将位置估计误差限制在一定水平下。例如,阿波罗号宇宙飞船、波音747飞机和美国军用飞机搭载了惯性导航系统,将其作为飞机自动导航系统的补充。

待添加飞机或航天器图片

下载图片

在实际应用中,加速度数据的积分通常在卡尔曼滤波器中进行,其中额外的传感器输出(如陀螺仪或磁强计)可以进一步提高位置估计的精确度。当“预测值”或“估计值”与输入数据高度非线性相关时,例如二重积分,则使用扩展卡尔曼滤波器(EKF)。“误差”或“噪声”表征将包含在EKF系统中,并被视为系统的自然输入。噪声表征将以最高精度建模,原则上消除(或精确计算)二重积分产生的影响。然而,上述测量中的“微小”噪声,如量化误差、加速度计中的机械偏差、校准错误,甚至小于制造公差的不可检测缺陷,可能在传感器工作期间和多次工作之间动态变化,对这些误差源进行精确建模几乎是不可能完成的任务。

下载图片

下载图片

基于人工智能辅助的航迹推算

随着近期人工智能(AI)技术和深度神经网络的蓬勃发展,人们得以实现“噪声参数”的自主学习以及相关定制化,进而完善基于惯性测量装置(IMU)的自己惯性导航系统。图1显示的是应用IMU测量、噪声建模和EKF的传统方法论,图2显示的是不含噪声建模的趋势方法论。该方法充分利用机器学习引擎自动化噪声表征的体现。图3摘自“AI—IMU航迹推算”报告1,显示的是自动驾驶汽车应用领域的发展前景。

下载图片

出于验证目的,我们用标记“GPS”的黑色实线代表地面真值。蓝色曲线代表“IMU”,是对加速度直接二重积分的结果。正如预期的那样,蓝色曲线受逐渐增大的积分误差影响,在初始阶段就偏离了地面真值。标记“人工智能引擎”的绿色虚线代表应用了人工智能引擎辅助产生自适应噪声参数的EKF系统结果。与使用GPS定位系统得到的地面真值相比,通过人工智能方法所得结果的高效准确令人惊叹。图中有意思的一点是,GPS在这次导航过程中发生了一次故障,即图中标注了“GPS中断”的位置。事实上,“地面真值”并不完全真实,因为在GPS定位中断期间无法报告精确的位置。然而,AI增强的IMU航迹推算在GPS中断期间仍提供了精确的位置。实际上,这种基于人工智能的航迹推算在性能上甚至可以与激光雷达和基于视觉的方法相媲美。与之相对的是,基于激光雷达和视觉的定位系统的物理尺寸、功耗和成本都大得让人难以承受,使基于人工智能的航迹推算方法优势更加明显。

需要注意的是,图3只是全三维行程的二维体现,且基于车辆级别的运动假设,适用单位为千米、千米/每小时和米级别分辨率。若测量对象拥有行人级别的运动速度和范围,人工智能引擎的设计和传感器能力将需要满足与图3案例截然不同的要求;这在定位功能所要求的的最小分辨率上尤为突出。学术界也正在积极研究各类导航系统以应对不同需求。

下载图片

定位技术不可忽视的影响力

基于人工智能的航迹推算技术有着极为广泛的影响力和适用性。与现有导航技术相比,应用这项技术的导航系统能够自给自足,其功耗极低、性价比高且不受外界环境(如天气、电磁干扰、树木、建筑、视线等)影响。自主运动的物体(如车辆、机器人或自行车)可以在其他导航辅助设备的基础上应用精确独立的导航技术,而成本问题基本可以忽略不计。人类、宠物、手推车和其他物体的室内导航也将有多个用例组合。同样,这项技术也可以轻松嵌入现有设备中,因为定位引擎纯粹只涉及到软件。以智能手机为载体,我们身边已然存在大量的加速度计和陀螺仪,利用这一快速进步的技术开发出的酷炫应用程序可能不久就会问世。

如今,人工智能软件技术正在以意想不到的方式攻克最具挑战性的工程问题。半导体技术的最新进展以较低的成本极大地提升了计算能力和存储容量,从根本上推进了此类创新。包括SK海力士在内的硬件制造商将力行不怠,致力于满足人工智能软件技术对关键硬件设备永无止境的需求,其中包括为深度神经网络的大量训练数据提供大容量存储设备,如集成NAND闪存的固态硬盘,以及包括动态随机存取存储器(DRAM:DDR4、DDR5、HBM2E、GDDR6等)在内的高速、大容量存储解决方案等。

 

1M.Brossard,A.BarrauandS.Bonnabel,“AI-IMUDead-Reckoning,”inIEEETransactionsonIntelligentVehicles,vol.5,no.4,pp.585-595,Dec.2020,doi:10.1109/TIV.2020.2980758.

文真永博士

助理教授电器与计算机工程佛罗里达农工大学与佛罗里达州立大学工程学院

TAG(#)文真永教授佛罗里达州立大学惯性导航GPS定位技术

全流程攻略:如何构建人工智能产品

人工智能产品的构建过程分为三个阶段,每个阶段都有着不同的思考方式。从挖掘行业属性到模型的建立与调优,作者对每个阶段需要注意的问题进行了分析说明,供大家一起参考学习。

在人工智能产品构建过程分为很多阶段,从最顶层的商业思考到下层的模型研发都有着不同的思考方式。

第一阶段是商业模式设计,任何产品早期都会对商业模式进行细致的考虑,商业模式的设计牵扯到方方面面,我们需要重点突出产品的行业属性与产业价值。

第二阶段是数据洞察与业务转化,我们需要去收集有意义的数据并将转化为模型的输入。

第三阶段是产品建模与评估,需要前两阶段的准备对产品模型进行开发与测试。

(1)行业洞察:首先对行业需要有深刻的理解与洞察。

(2)价值分析:针对于产品具体分析给用户带来什么价值,什么样的价值能够使用户认可。需要以用户的视角来分析产品的价值所在。

(3)数据分析:针对行业的特点分析数据应如何整理,如何利用,如何构成产品。

(4)资源评估:评估是否有足够的数据与人员支持人工智能产品的开发。

(5)资源收集:通过各种渠道购买、收集数据,以及各类人员的资源分配。

(6)设计研发方案:根据以上结论设计人工智能产品的模型搭建与评估方案。

一、深度挖掘行业,探究产品价值1.深刻挖掘行业属性

当前产业互联网恰逢其时,AI技术也更多的应用于行业之中。我们开发人工智能产品首要问题就是需要深刻理解行业痛点,做出有价值的产品。如何了解一个行业也有一些实用的方法可以借鉴。

构建产品之初首先需要充分了解这个行业,而且也要充分了解自己。了解自己主要从自身的所学专业、兴趣程度、个人性格等方面综合考量。当今社会所做的行业与自身专业不匹配的状况时有发生,只有充分认识自我并且充分认知行业,才能做出成熟的判定。我们先不谈对自己的了解,首先给出如何快速认识一个行业的切入路径。

第一步:行业认知——行业分解认知、行业组合认知

第二步:行业分析——业务流程、产业链、商业模式

第三步:行业常识——业内典型企业与领导者

对于行业切入路径仍然需要作一些说明,这个方法只是一个初步了解行业的路径。由于大家教育背景不同专业不同,各个行业壁垒有有高有底,并不要指望通过某个方法就能够立刻深入到某个行业中,想真正深入某个行业还需要系统的学习行业知识,并真正在行业中沉淀一段时间,才能够深入体会。

行业认知是切入行业的第一步,在行业认知的过程中分为2个步骤:行业分解认知与行业组合认知。

(1)行业分解认知

研究某个行业不能囫囵吞枣,首先要对行业进行分解。所谓行业分解认知是将行业细分成一个个子领域,针对这些子领域再进行一一分析的过程。对于一个未细分的行业是无法拿来研究的,只有将其分解才能各个击破。用大家熟悉的互联网产品经理来举例,现在产品经理行业也产生了很多子领域,包括数据产品经理、后台产品经理、人工智能产品经理等。尽管这些产品经理在职能方面可能有所交叉,但是分解的越细代表对产品经理这个行业了解的越深入。

(2)行业组合认知

在行业分解认知之后,我们已经对行业有了一个初步的了解,之后我们需要通过行业组合认知对行业进行综合分析。行业组合认知是指将之前行业分解得到的子领域,统一回归到整体行业的框架下思考,思考的重点是每个子领域对整体行业的贡献,以及研究各个子领域在产业中的关系与地位。因此,分析好每个细分子领域对行业整体的贡献,才能更加透彻地审视全局。

2.探究产品价值

无论何种产品都必须要体现价值才能赢得商业,AI产品当然更是如此。对于一个成功的AI产品,并不是重视其使用了多么先进的AI技术,而是通过技术能否真正得到行业价值。

例如,在过构建工业知识图谱时,如果只强调知识图谱可以将不同的知识连接起来,则不能突出其价值。工业知识图谱真正的价值根据不同项目,概括为在生产产生偏差时,快速寻找到相关原因。或将所有工序文件相关联,确保生产过程的合规性检查。产品的价值必须符合行业属性,并使用户有清晰的辨识度。

针对产业互联网而言,产品价值主要体现以下2个方面。

(1)效率价值

人工智能技术应用于产业,最重要的一点就是提升产业效率。人工智能技术是对人的模仿技术,人工智能产品可以提供某个工序的工作效率,降低人员的参与程度,降低人员成本,提高工作准确率。

(2)创新价值

在效率产生大幅度提升时,则意味着创新。但是创新并不是仅仅是通过效率提升而产生的。随着人工智能技术的发展,大规模逻辑网络的形成,知识图谱的大规模应用,已经能够运用此类技术构建新知识新发现。

人工智能产品的研发,首先可以先以实现效率价值为目标,在逐步实现创新价值。需要以行业诉求为最终的价值判别依据。

二、数据洞察与处理1.需求与数据

当今是一个数据爆炸的时代,数据积累的规模远远超过了之前人类社会数据积累规模的总和。在大数据这个概念出现之前,计算机并不能很好的解决需要人去做判别的一些问题。如今人工智能利用用大量的数据作导向,能够使机器完成一些之前机器所不能完成的功能,使之前无法满足的需求得以满足。人工智能技术离不开数据,数据与需求之间首先应该搭建起一个桥梁。

(1)从数据到需求

我们首先将经历聚焦到数据上来,认真分析这些积累下来的数据都有哪些?思考这些数据都能够做些什么?哪些与我们的业务关联性高,哪些关联性低?例如一个外贸公司积累了之前5年的销售流水数据,那我们可以考虑用这些数据推测第六年的销售流水。从数据到需求的阶段,我们只需要考虑数据能够做什么,暂时无需考虑数据的产出是否与业务相关。

(2)从需求到数据

当我们完成对数据的聚焦后,开始对需求进行聚焦。对需求的聚焦需要分析业务,重点分析的内容是满足这些需求都需要哪些数据来支撑。满足一个业务需求,可能需要很多数据支持,这些数据有些已经被积累,有些则没有被积累。

例如一个外贸公司需要预测下一年的销售额,需要前10年的公司销售额,除此之外还需要上一年股市大盘的走势数据,同时也需要公司前5年的用户数据。从需求到数据的过程是为了使公司清楚针对某一个特定需求,哪些数据已经保留,哪些数据需要外购,哪些数据在以后的公司发展中需要保留下来。

首先从数据到需求,再由需求到数据。数据与需求是一个相互渐进、反复循环的过程,如图所示。从数据到需求是一个数据价值提升的过程,这个过程首先数据赋予了价值;从需求到数据是一个数据升级的过程,更多围绕需求的数据被挖掘,也更加明确了数据与需求的联系。

数据的来源主要有2种方式,可以自己采集也可以购买。采集来的大多是用户与业务数据,这部分数据可以用来完善产品或者制作数据分析报告;购买的标注数据可以作为训练集,用于构建模型。

对于非监督学习可以使用未标注过的训练集进行训练,不过在实际真正的产品构建中,大家应尽量少的使用非监督学习。非监督学习学习效率较低,无法快速得到较好的模型效果,产品也就无法落地实用。非监督学习可以更多的应用于科研或者课题研究方面。

2.数据标注

数据质量是影响人工智能产品准确性的关键所在,一个具有高质量标注的数据集对于模型的提升效果,远远高于算法优化带来的效果。数据标注是通过人工或半自动的方式,将原始数据打上相应的标签,打好标签的原始数据称为标注数据或者训练集数据。

数据标注过程有2个意义:其一,使人类经验蕴含于标注数据之中;其二,使标注数据信息能够符合机器的读取方式。标注的数据的难度越高价格越昂贵,以此训练出的模型价值就越高。

数据标注的流程通常分为五个步骤。

(1)业务分析

产品经理与算法工程师要对业务进行理解,明确原始数据的意义与数据标注的价值。业务理解是所有产品工作的基础。

(2)确定原始数据与标注结果

产品经理需要与算法工程师共同确认原始数据及数据标准结果,并确定标注工具。数据标注的结果必须得到算法工程师确认,确保后续建模过程的顺利开展。

(3)撰写标注教程

在确认原始数据与标注结果后,产品经理需要撰写标注教程。标注教程就好像软件说明书,需要将标注过程按顺序一一列出。标注教程包含4个要素:标注软件(平台)、标注要求、标注对象、标注流程。撰写的标注教程同样需要得到算法工程师确认。

(4)数据标注

该过程为数据标注过程,产品经理需要不定时进行标注结果抽查。

(5)标注结果验收

产品经理与算法工程师共同对标注结果进行质量验收,验收不合格需要搞清异常原因并重新标注。对于有行业壁垒的数据,标准准确性需要行业专家进行判断。

针对不同的数据类型有不同的标注工具。图像类标注可以使用LabelMe,文本标注可以使用Brat或DeepDive等,当然还有很多后期开发的标注平台可以使用。

三、模型建立与调优

早期的人工智能系统,被称为专家系统。专家系统通过学习或总结人类经验获得智能,并可以恰当应用这些经验来解决实际问题。如今随着大数据的发展,新生事物不断增加,各种知识层出不穷。很多领域的经验已经无法总结成系统化的专家经验,而这些经验被包含在大量产生的数据之中,所以说数据是人工智能发展的基础。

由此可见,建模的根本在于寻找人类经验。但根据寻找人类经验的方式不同,可以分为知识建模、非知识建模、混合建模3种。

知识建模属于早期专家系统的建模方法,重点在于如何将总结好的知识转化为机器可以识别、储存、运用的形式。知识建模适用于数据难以收集,或业务逻辑相对容易总结的问题。

非知识建模不需要提取人类经验,甚至不需要模型具有可解释性,通过数据特征得到对应的模型。非知识建模适用于业务逻辑难以总结,而业务数据容易获得的情况。

混合建模结合了知识建模与非知识建模2种方式,根据特定问题进行建模。

建模过程是一个系统而复杂的工程,需要根据业务类型、数据情况等多方面情况才能够完成。据笔者了解,当前很多人工智能工作者只重视非知识建模的方式,认为知识建模过时了,不适用于当今人工智能的发展。这样的认识是偏颇的,必须根据实际问题将不同建模方式结合起来才能达到较好效果。

1.知识建模

知识建模源于人工智能起源的一大学派,该学派称为符号主义。符号主义认为人工智能源于数理逻辑,也可以说以一种高级的推理过程。从符号主义的观点来看,知识是信息的一种形式,知识逻辑体系是构成智能的基础。

人工智能的核心在于知识表示、知识推理、知识运用,知识可用符号进行描述,认知是符号的处理过程,推理是基于知识与搜索对问题的求解过程。推理过程同样可以用符号化的语言来描述,也就构成了我们认知的模型。符号主义认为可以建立起人类智能与机器智能的统一理论体系。

在知识建模中,有两个重要问题。其一是知识的符号表示,其二是推理方法。知识的符号表示是将知识转化为机器所能识别、储存、运用的数据化形式。推理方法是机器运用知识解决实际问题的能力。

(1)知识的符号表示

常见的知识符号表示有方法有谓词逻辑法、状态空间法、问题规约法等。由于知识建模构建的是一种推断逻辑,所以谓词逻辑法使用较为普遍。

谓词是用来描述或判定客体性质、特征或者客体之间关系的词项。例句“小明是我的朋友”中,“是”就是谓词,该句中只有“小明”一个客体,这样的谓词我们称为一阶谓词;例句“5大于4”中,“大于”就是谓词,该句中“大于”涉及到两个客体,这样的谓词称为二阶谓词。

使用谓词表示知识有两个步骤:

①确定每个谓词的个体以及确切含义。

②利用逻辑符号连接谓词,对知识进行表达。

[例]利用谓词逻辑法表述以下语句

人人学雷锋

①确定每个谓词的个体以及确切含义。

个体:人

谓词:学、是(“人人”隐含了“是人”的客观事实)

定义谓词:

people(x):x是人

learn(x,y):x学y

②利用逻辑符号连接谓词,对知识进行表达。

(表示对于任意)

(2)推理方法

推理方法是研究机器如何模拟人类进行知识选择,并运用这些知识分析和解决实际问题的逻辑方法。我们也可以理解为推理是依据一定的原则,从已有事实推出结论的过程。推理系统主要由谓词逻辑组成的知识库和控制推理过程的机构组成。

常用的推理方法有3种:正向推理、逆向推理、双向推理。

正向推理是由条件出发,向结论方向进行的推理过程。它以当前的事实出发,根据输入的推理规则,向结论进行推理。例如我们知道发烧、咽痛、关节酸痛具有较高概率能够推理出的结论是感冒。这种推理方式就是典型的正向推理。正向推理是早期专家系统解决问题的一个重要特征,即专家在解决问题时,首先是发现问题提供了什么信息,根据提供的信息再借助推理规则推导出新的信息,从而加深对问题的了解。

逆向推理是指从问题的目标状态出发,按照目标组成的逻辑顺序逐级向初始状态递归的问题解决策略。简单来讲,当一件事结果是正确的或客观的,那么可以根据这一结果进行反向推理从而得到原因。当我们已经知道患者得了感冒,可以推想他可能是受凉、感染流感病毒等多个原因导致感冒,这就是逆向推理的思维模式。

双向推理结合正向推理与逆向推理,它是构成推理网络的理论基础。

知识建模是早期人工智能技术的代表,由知识建模而构建的专家系统为医学、教育、工业领域做出巨大贡献。知识建模的优点可以总结为以下3个方面:

知识高效表达:通过知识的符合表示方法,可以高效准确地表达难以用数学方法描述的复杂、定性的人类经验知识。灵活性:知识的表达相对独立,方便进行知识的修改和扩充,系统也可以快速获得新的规则。可解释性:知识建模最大的特点是可解释性。所有的推理逻辑与公式,都可以经过严谨的数理证明进行解释。这一点与当前非常流行的神经网络模型相比,具有非常大的优势。

任何建模方法同样有缺点,知识建模的缺点同样可以总结为以下3个方面:

知识获取的困难:专家的经验知识加以提取、整理、转换成各种符合表示,还要考虑知识之间的相容性等问题,这本身就是一项困难的工作。高复杂度问题:对于复杂的知识体系,知识之间的关系以及知识库中的节点会变得异常复杂。推理中对知识的搜索和运用分支将呈几何级数的增加。容错能力差:由于知识推理具有非常严密推理条件与推理逻辑,知识的不完备可能会导致推理出现困难,从而降低了系统的精度。同时,如果出现错误的规则,可能导致整个推理的错误,并且这种错误不易更正。2.非知识建模

非知识建模是当前大数据时代的主流建模方式。由于数据中蕴含着人的知识或经验,但是建模过程并不需要将这种知识提取出来,而是直接通过获取大量数据去训练模型。非知识建模避免了知识提取的过程,也回避了建模人员对专业知识的理解问题。

由于非知识建模中不涉及到对知识的提取,所以非知识建模中最重要是数据准备工作。这些数据准备是为了构成模型的训练集,我们需要准备存储格式统一、真实性高、标注明确合规的数据作为模型的训练集。

在准备好训练集后,我们可以根据具体业务进行模型的选型,根据选择模型的特点对训练数据进行微调,以满足不同模型的训练要求。对于数据特征不明显的数据集,我们也可以通过特征工程来提取数据特征,使训练出的模型更加高效准确。模型训练的过程如下图所示。

在进行模型训练时,我们需要通过某个学习算法,得到我们的目标模型。模型是否能够得到较好效果,主要在于训练数据的质量,所以数据才是整个算法构建的核心要素。非知识建模主要就是通过数据使机器自动提取某些内在的业务特征,从而达到模型效果。模型的选择种类也根据不同的业务,以及不同算法工程师的偏好灵活选择。

3.模型的评估:分类任务评价

分类最常见的机器学习任务,主要目的是数据划归为不同类别。分类问题包括二分类与多分类问题。识别垃圾邮件或判定是否为潜在用户就是典型的二分类问题,用户画像、辅助诊断系统等属于多分类问题。分类问题的评估指标主要有准确率、损失函数、精准率-召回率、曲线下面积(AUC)等。

(1)准确率

准确率是一个非常直接的评价指标,指的是分类正确的个数占总体个数的比。但是准确率并不能够公正的评价一个模型。主要原因有2个:

第一原因是两种分类重要程度不同。例如在癌症诊断中,确诊癌症患者中未患有癌症的情况(假阳性)与确诊未患有癌症患者中患癌的情况(假阴性),这两种情况对于患者的意义截然不同;

第二个原因是数据分布不均,如果两个分类个数相差过大,占有大样本的一方会主导准确率的计算。

(2)平均准确率

为了处理每个类别样本数量不一致的情况,使用平均准确率来进行度量。平均准确率将多个分类的准确率取平均值来对模型进行评价。平均准确率是对整体模型进行的评价,而并不等于某一个分类的准确率。在某个类别数量很少时,会造成该类别准确率的方差过大,使准确率可靠性降低。

(3)对数损失函数(Log-loss)

对数损失函数很像Logistic回归的损失评价函数,这些评价标准都基于概率估计。对数损失通过惩罚错误的分类,实现对分类器的准确度(Accuracy)的评价。损失函数最小意味着分类器具有最佳的性质,分类器提供的是输入样本所属类别的概率值。对于多分类问题对数损失函数表示如公式(3.5.1)所示。

(4)精确率-召回率(Precision-Recall)

精确率-召回率其实是两个评价指标,但是它们经常同时使用。精确率是指分类器分类正确的正样本的个数占该分类器所有分类为正样本个数的比例。召回率是指分类器分类正确的正样本个数占所有的正样本个数的比例。具体解释在后面混淆矩阵中详细介绍。

(5)AUC(AreaundertheCurve,AUC)

AUC的意义为曲线下的面积,所描述的是ROC曲线(ReceiverOperatingCharacteristic,ROC)。首先我们需要了解ROC曲线是如何绘制的。

ROC曲线的x与y轴的含义:

横轴:负正类率(FalsePostiveRate,FPR),分类器分类错误的负样本个数占总负样本个数的比例。纵轴:真正类率(TruePostiveRate,TPR),分类器分类正确的正样本个数占总正样本个数的比例。

对于设定一个阈值,就可以对应算出一组(FPR,TPR)从而在平面中得到对应坐标点。随着阈值的逐渐减小,越来越多的实例被划分为正类,但是这些正类中同样也掺杂着真正的负实例,即TPR和FPR会同时增大。阈值最大时对应坐标点为(0,0),阈值最小时对应坐标点(1,1)。

以下面一个例子解释ROC曲线绘制过程,如图所示数据。

如图有20个样本依次编号,属性是样本的类别,p代表正样本,n代表负样本,得分代表样本被判定为正样本的概率。在绘制ROC曲线时,每给定一个阈值计算一次(FPR,TPR)点。对于二分类器,我们可以设定阈值,认为样本中得分大于等于这个阈值为正样本。由于有20个样本,阈值可以按照20个样本的得分依次进行选取。

假设阈值1=0.9,正样本数量为10个,负样本数量为10个。

即认为大于等于0.9的样本为正,其余为负样本。根据图3-36所示数据与FTR、TPR定义可知

FTR=0(未出现误判的样本)

TPR=0.1

我们得到第一个点为(0,0.1)。

假设阈值3=0.7,正样本数量为10个,负样本数量为10个。

即认为大于等于0.7的样本为正,其余为负样本。根据图3-36所示数据与FTR、TPR定义可知

FTR=0.1(有一个负样本被判定为正样本)

TPR=0.2

我们得到第3个点为(0.1,0.2)。

如此通过设定阈值可以得到20个(FPR,TPR)点,从而绘制ROC曲线如图3-36所示。可见最好的分类器是FPR=0%,TPR=100%,当然这是一种极端情况。如果同时比较多个分类器性能,通过ROC曲线较难实现,我们便选取了曲线下面积(AUC)作为指标进行度量。分类器效果越好,AUC面积越大。大多数情况AUC值在0.5-1之间。

使用AUC对分类器进行评价可以避免样本不均衡的影响。在真实情况下样本不均衡的现象经常出现,有时正样本个数远远大于负样本个数,或正负样本个数可能随时间而改变,在使用AUC进行评价时可以有效避免。

(6)混淆矩阵(ConfusionMatrix)

混淆矩阵可以关联上述的所有概念,也作为分类结果评价的常用手段。混淆矩阵是一个分类的正误表,对于二分类问题则是一个2*2矩阵,对于多分类问题是一个n*n矩阵,以二分类问题为例,如表所示。

表-二分类问题的混淆矩阵

真正(TruePositive,TP):分类正确的正样本。即本来是正样本,分类为正样本。从混淆矩阵中直接提取的成为一级指标,具体含义如下:

假负(FalseNegative,FN):分类错误的正样本。即本来是正样本,分类为负样本。

假正(FalsePositive,FP):分类错误的负样本。即本来是负样本,分类为正样本。

真负(TrueNegative,TN):分类正确的负样本。即本来是负样本,分类为负样本。

通过明确混淆矩阵的一级指标的含义,可以定义二级指标,如表3-3所示。

混淆矩阵可以将诸多概念加以串联,在模型评价中具有重要地位。除此之外,混淆矩阵在试验评价等诸多领域还有广泛的用途。

最后把封面的人工智能产品经理流程图配上,具体的内容将在下一篇文章说明。

上述就是一个人工智能产品的整体构建流程,如果还希望能够了解的更详细,可以关注我的新书《手把手构建人工智能产品》,书中会有更详细AI产品经理项目方案。

#专栏作家#

白白,公众号:白白说话(xiaob-talk)。人人都是产品经理专栏作家,医药行业资深产品专家,负责人工智能行业类产品综合架构与技术开发。在行业云产品架构,药物设计AI辅助、医疗知识图谱等领域有深入研究。

本文原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Unsplash,基于CC0协议

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇