博舍

步态识别技术的优势和潜在的应用场景 人工智能步态识别的创新性

步态识别技术的优势和潜在的应用场景

如今,随着人工智能、视觉技术、智能传感器等技术的快速革新,作为生物识别技术的后起之秀,步态识别正凭借远距离识别、无需硬性配合、环境适应性强等优势,获得了人们的青睐。作为人脸、指纹、虹膜识别等之外的补充,其既可满足一些寻常场景的应用需求,也能填补一些特殊场景的应用缺口。

电影《碟中谍5》中的步态分析系统,资料图

步态识别的优点

所谓步态,是指人们行走时的方式,是一种复杂的行为特征,而步态识别正是利用该特征进行对人的身份识别,其能通过人们走路时的姿态,采集并分析出各种生物信息,从而识别出对象的具体身份。

由于每个人走路的步态都是独一无二的,包括足跟触地时间、足尖离地时间、左右摆动幅值、脚离地高度等都有区别。比起人脸、指纹、虹膜等,步态识别的距离更远,属于非受控识别,无需识别对象主动配合。

总的来说,相比人脸识别、指纹识别及虹膜识别,步态识别有其独特优势:应用成本更低;识别距离更远;特征不易伪装;环境适应更强。

常用的生物识别方法,资料图

其中,应用成本更低,是指对硬件装备的要求不高,采集信息的摄像机用一般的即可,设备成本不是很高;而识别距离更远,是因为步态在50米之内都能识别,而人脸识别需要目标在3米以内,虹膜识别需要目标在60厘米以内。

此外,步态难以伪装有两层意思。一是指步态由长期习惯养成,很难改变。再者,它是一种全身识别技术,由体型、肌肉力量、运动神经灵敏度、走路姿态等共同决定,局部变化并不会影响识别结果;而环境适应更强,是因为步态识别不会受到光照、光源、地面环境等的干扰。

借助上述提到的这些对比优势,步态识别技术可在以下主要领域或场景中获得潜在应用。

安防监测

可将装有步态识别功能的摄像机,安装于工厂、医院、居民楼甚至野外开放等环境之中,能像人脸识别一样发挥出防盗、防窃等功能,通过全面有效的安防布控,保证生命财产安全。

比如,石油行业的野外设施此前主要依靠人类安防力量进行巡检、防护,虽然有摄像头等监控设备,但是受限于客观原因,识别有效性不足。而步态识别技术可加强、完善油田的防控网络,及时发现隐患,保护位于野外露天环境的石油设施。

刑侦监测

大多数情况下,罪犯视频往往不会露脸、或者清晰度不高,办案警察很难从中获取有效信息,而步态识别技术应用之后,上述现象将得到明显改观,降低办案难度,节约办案时间和成本。

公共领域

步态识别可用于公交车、旅游景区等公共领域。在这些领域,步态识别能实现对安防的布控,实现无卡出行,以及对人群密度的预测或进行超流量预警,从而有效防护公共安全。

7月18日,国内步态识别技术公司银河水滴,获得了一种利用步态识别控制空调的专利授权。采用该技术的空调,可依据用户步态信息,自动进行温湿度、风力、风向等的操作。图为步态识别空调运行示意图。

智能家居

在该领域,步态识别可作为一种控制手段。人们可通过自己的步态,对家居设备进行智能控制。比如,步态识别可提升空调智能水平,根据家庭成员的步态特征,空调可及时识别老人、小孩等特殊人群的活动范围,根据不同人群调整空调的出风角度、出风量及温度,让温度控制更适合人群需求。

市场发展潜力巨大

从2009年到2016年,全球生物识别市场规模由30多亿美元急速增长至120多亿美元,年均增速异常惊人。与此同时,据权威机构预测,到2020年全球生物识别市场有望突破250亿美元大关,火热态势将持续上升。

不过,总的来说,步态识别的技术发展仍处于初级阶段,其距离规模化商用还有很长一段距离。目前,由于核心算法构建能力的不足,我国从事步态识别技术研发的企业屈指可数,市场发展还远远不够。不过,该新兴市场发展潜力巨大。

延伸阅读:深圳研发团队欲用步态识别技术解锁可穿戴设备

日前,深圳先进院数字所李烨研究院团队正研发将步态识别技术用于解锁可穿戴设备。团队介绍,可穿戴设备大多轻便,不具有指纹录入、摄像头、按键等较为复杂的器件,但一般都会带有微型化的加速度传感器。研发团队基于传感器采集到的步态信息,提出了一种新的可穿戴设备“解锁”方法,有助于提升其安全性。

研究团队提出了速度自适应步态周期检测方法和个体化判别阈值生成方法,解决了步速变化及步态波动性,对基于步态身份识别性能的影响。与同行前期研究成果相比,所提方法在步态识别和身份认证准确率上分别提升了25.8%和21.5%,平均认证准确率为91.75%,相关研究成果发表在计算机技术领域顶级期刊IEEE Internet of Things Journal上。

图为团队采集数据时,所用的一套可穿戴传感器监测设备。资料图

目前,团队主要将这一成果应用于可穿戴设备的身份认证和身份识别。通过利用可穿戴设备集成的运动传感器,设计步态检测和身份认证算法,保证了设备的轻便。同时,健康成年人穿上设备后走几步,大约3到4秒便可完成身份认证,且能实现连续认证,防止信息泄露。

据悉,目前可穿戴设备越来越多,而其采集和存储的大量个人信息需要得到安全保护。在设备上安装安检、摄像头、指纹录入等设备会影响其穿着体验,因此,基于步态的身份认证方法,更加适用于体积小、质量轻的可穿戴设备。

目前,团队还在开发步态识别的进一步研究,例如网络接入控制、跑步姿势监测等,将进一步挖掘和利用人的步态、姿态信息,增加穿戴式设备的使用体验。

科学网—普洛克路斯忒斯之床: 步态识别与创新思维

普洛克路斯忒斯之床:步态识别与创新思维

已有13798次阅读2019-3-207:57|系统分类:科普集锦|人工智能,创新思维,生物认证,步态识别

一、普洛克路斯忒斯之床 

         在古希腊神话里,有个强盗,叫普洛克路斯忒斯(Procrustes)。他开了家黑店,经常拦截来往的客人,并按自己的标准来安排住宿。如果客人长得比较矮,他就会安排睡长的铁床,并强行把客人的身体拉长,以适应铁床的长度。如果个子比较高,就安排短的铁床,直接用利斧把伸出床外的四肢砍掉。直到希腊神话英雄忒修斯在寻父的途中,被他拦截后想依法泡制时,忒修斯奋起反抗,击败了普洛克路斯忒斯,反过来把强盗伸出床外的腿砍掉,才为民除了此害(见图1)。

图1:普洛克路斯忒斯之床

     因为这一神话寓言假定了有个设定的内在标准,并要根据这一标准来匹配相应的模型,现代的统计学就借用了这个强盗的名字来命名统计形状分析,称为普洛克路斯忒斯分析(Procrustesanalysis)。它可用于分析一组形状的分布。如果这组形状能通过平移、放缩和旋转变成相同或相近的某个形状时,就可以认为是属于同一形状[1]。类似地,拓扑学在研究目标拓扑结构的不变性时,事实上也能借用这一思路。

 而这一形状分析与我们日常生活联系最紧密的,则是身份认证的步态识别。其大致思路是先把人的走路或步态轮廓提取,然后用普洛克路斯忒斯分析来与步态训练库中已知的候选者的步态轮廓对齐。对得最齐整的,则可以判定为同一人[2]。

 但如果用对齐标准来思考创新研究,则我们的思维容易被限制在那张“铁床”上,不容易跳出来形成颠覆性思维。要形成创新或颠覆性的成果,这里我想分享下我的研究小组在步态识别的研究经历。希望通过这一分享,能探讨下在科研和教育中,形成创新思维可能需要解开的束缚。在此之前,我先简要的科普下步态识别以及它的意义和特点。 

二、步态识别 

        在生物认证领域,人的各种外在和内在特征如图2所示的人脸、虹膜、指纹、掌纹、静脉、声纹、步态等可用来识别人的身份,它在社会安全、反恐和维稳、打卡系统等都有着重要的应用价值。而步态识别则是生物认证中未来最有前景的应用方向之一。原因是现有的人脸识别技术尽管已经全面走向应用级,但其在可识别距离上存在局限,最多7至8米,且易被遮挡、易受光照和摄像头关注焦点的影响,也存在被3D伪人脸模型攻击的风险。而虹膜识别容易受美瞳等隐形眼镜产品的影响,指纹和掌纹识别也存在依赖设备和距离受限的问题。

图2:生物认证特征示例,从左到右:指纹、声纹、虹膜、人脸、掌纹、步态轮廓 

        相比而言,步态就具有得天独厚的优势,可远距离识别、不需特定设备、不需要测试者的配合,也不容易隐藏。心理学的研究也表明,步态具有唯一性,可用于身份认证,所以2015年《碟中碟5》中的犯罪分子就用了如图3所示的步态识别系统来做门禁。

图3《碟中碟5》的剧照(视频链接:https://v.qq.com/x/page/j0833a66jfw.html)

    另外,人的轮廓加上步态也是人类在进行身份识别时优先级最高的方式,即按距离远近,步态是在远距离时第一个能帮助人进行快速身份识别的生物认证特征。这与人在认知上存在“大范围优先”机理有关,也与我在《爱犯错的智能体》中提到的“由粗到细”认知模型及视力的发育机制有关[3]。它的好处之一是,在预防潜在的恐怖袭击或犯罪时,与其它生物认证特征相比,步态能提供最早的预警和最长的反应时间。

         要验证人具有快速识别步态的能力也很容易。比如本周三,我上数字图像处理课的时候,就给台下的40位本科生演示过一段几个行人在一个视角约30秒的走路视频。再接着放多段不同地点不同角度的视频时,同学们都能很快从视频中发现这些行人并准确认证。然而,几乎没人能回忆出行人的长相。因为在这些视频中,待辨识的行人要么出现在离摄像头较远的位置,要么出现在视频的角落位置,可见的人脸尺寸偏小,缺乏能记忆的人脸细节。         

         然而,要让机器来实现步态识别,则不是那么容易了。因为现有的计算机视觉、机器学习算法尚不具备人类的快思维[4]和稀少样本下的学习能力。另外,外界因素如发型、穿着、背包、阴影甚至地面的材质(如水泥地或草地)都对步态识别的性能有一定的影响。 

三、步态识别与创新思维

     要利用计算机进行步态识别,在还不能完全明了人类识别机理的前提下,则需要另辟蹊径。Procrustes分析是一种策略。经典的步态识别方法还有两大类,一类是把步态周期(跨出脚到收回脚,算一个周期)分解成连续的帧,然后逐帧比较,或构造类似时序模型的马尔可夫链,将时序性的步态特征学习出来。由于人的行走姿态在不同视角下外形相差甚远,这类用“铁床”做标本的方法很难适应步态的变化。而且由于模型建构复杂,这类方法大多需要多个步态周期,如图4右图所示。另一种做法就简单粗暴些,直接把视频拍成或坍缩成一张图,即取步态序列的平均,来形成一张步态模板图像。它的优势是速度快,因为每个人的步态只用一张图表示了,如图4中图所示。而且这种方式使用起来也较为灵活,需要的帧数较少,对步速、帧率等外界因素也不敏感。但是与步态相关的时间信息丢失了,所以精度也较难有所突破。

 

图4   从左至右:步态轮廓图、常规步态模板(GaitEnergyImage,称为步态能量图)以及我们小组提出的CGI(Chrono-GaitImage,称为时间保持步态图)[5]

很多步态识别方法都是分别从这两条线出发提出的。我们小组对此领域的研究可追溯至2006年。最初有过一些小的成果,但不显著。2009年的时候,我们小组希望能将这两条线合二为一,既有模板的速度优势又有序列的精度优势。比较幸运地是,我们发现可视化领域有一种可以在2D图像上展示3维视频效果的研究成果。而这一成果似乎与我们希望实现的目标一致。于是,我们将其移植到了步态识别领域,通过对时间信息着色的方式,提出了如图4右图的时间保持步态模板(Chrono-GaitImage,简称CGI)。这一成果提交到2010年的计算机视觉著名会议ECCV后,三个评审都认为没有见过,对创新性进行了肯定。后经过扩展,该成果于2012年全文发表在计算机视觉与模式识别顶级期刊IEEETransactionsonPatternAnalysisandMachineIntelligence上[5]。值得一提的是,该文章被全文发表时,一作王晨当时还是刚进大四的本科生。后来,该方法在2012年为第三方在步态公用数据集OU-ISIR进行了测试,被该文列为当时的六个state-of-the-art算法之一,并获得排名第三的成绩[6]。

        不过,创新有的时候并非是有了闪光点,你就能奋起直追,一而再、再而三的在一个点上连续出成果。多数时候,灵感就像到了一个山的顶峰,然后过了这山就没那山了,尤其对于学校这种以流动性强、难以固定的研究生为主力组成的科研队伍时,情况更是如此。事实上,我们沿着这条思路走了很长一段时间,尝试了一些可能的改进,但并没有找到创新性特别强又能有优异性能的思路。

        不知不觉就这么过了六年时间,直到去年,我研究小组的两位硕士研究生巢汉青和何逸炜又考虑了步态识别方法的另一个特点,即步态模板在平均序列的时候其实没有依赖步态的序列。这个特点赋予了它一定的灵活性,但他只有一张图,很难完整保留信息;而基于序列的则一般假定帧与帧之间具有时间的连续性,这使它能保留更多的时间信息,但却对帧的数量、帧之间的顺序、帧率等外界因素很敏感。

     既然一方面不依赖序列能使模型变得灵活鲁棒,另一方面多张图能带来更丰富的信息,且在深度学习框架下,可以形成对步态更合理的学习表示,那么有没有可能在步态模板和步态序列之间找到一种折衷的选择,提出一种利用多图但又不依赖序列的多步态图方法呢。基于这一想法,我们小组再次碰到了幸运之神,发现在生物认证领域以外有一种刚提出不久的、研究点云计算的集合方法。

图5、步态集合模型网络图[7]

图6、步态集合模型在使用有限样本下的性能,仅使用7帧识别率就能达到82.5%[7]。

         于是,我们和复旦大学类脑研究院院长冯建峰教授一起合作,将步态序列看做一帧帧步态轮廓图组成的集合,提出了步态集合(GaitSet)的方法[7]。这一改进大幅度提升了步态识别的性能。在步态识别公用数据集CASIA-B上[8],此方法使用74个人进行训练,达到了可进入实用级的指标性能–识别率95%,超过同样采用单个模型的当前最好性能3个百分点。同时,该方法允许输入任意多个视角的步态图像,且能在少量步态图像输入前提下也获得很高的识别性能。该项工作发表于人工智能顶级会议AAAI2019上,并于2019年2月2日进行了口头报告[7]。从某种意义来看,它为步态识别走向实用化打开了新的视角,它也将有助于研究智能体大范围优先和由粗到细的认知模型。

          值得指出的是,有了灵感到转变成成果,这之间实际上有着巨大的技术鸿沟需要去跨越,并非想当然就能有的。如时间步态模板的想法,虽然2009年夏天我们就有了雏形,但在摸索如何提升步态识别的性能时,中间费了许多周折。比如时间信息到底是着色在整个模板上、还是步态的轮廓上,步态周期的检测到底是依赖于已知的成熟方法,还是自己提一套能更精确提取周期的办法,诸如此类。期间,也经历了很多次的失败。类似的经历,我们小组在研究步态集合方法时,也碰到了。有了想法,但实现的细节并非一开始就明了的,两位同学经历了近五个月的尝试和停滞,比如模型反复调整都不收敛。最后,在小组其他同学都认为该放弃的情况下,他们仍然坚持下来,最终找到了真正能行之有效的模型。

        试想想,如果我们小组在研究步态问题时,在一开始就像普洛克路斯忒斯一样,把手头的问题都尽量往我们已经的知识上去靠,而不是多看看领域外的进展、多想想细节上的差异,用他山之石来攻玉,通过合作研究来优势互补,也许就很难有这两个还算不错的创新性成果了。

        事实上,教育也是一样。现在的应试型教育从某种意义来看,或多或少都在做普洛克路斯忒斯之床,试图将绝大多数的学生都往同一标准上靠,并以此来评判学生的学习水平。

         这种同质化的培养,好处是总体上比较稳定可靠,简单好操作。但同时,它也有可能把一些有创新潜力的学生的“能力”给抹杀掉,让其习惯于按标准定制的思维模式和努力向统一的标准对齐。其后果是学生会习惯了用分数评价自己的学习甚至科研能力,结果在考取研究生后,高分低能的屡见不鲜。因为他们很有可能不知道如何跳出固有的“铁床”,找到有创新性的灵感。

        如果我们有条件在初高中甚至更早的时期发现那些有创新潜力的学生,则我们应该花更多的时间和耐心,帮他们定制化更适合他们发展的培养模式。

         而灵感和顿悟的产生,则需要多给那些执着在某一方向钻研的科研人员更多的时间、宽容和理解。

 

参考文献:

1.https://en.wikipedia.org/wiki/Procrustes_analysis

2. LiangWang,HuazhongNing,WeimingHu,TieniuTan. GaitrecognitionbasedonProcrustesshapeanalysis.InProceedingsofInternationalConferenceonImageProcessing,2002. 

3. 张军平.爱犯错的智能体.  清华大学出版社.2019.

4.Kahneman,Daniel,andPatrickEgan. Thinking,fastandslow.NewYork:Farrar,StrausandGiroux,2011.

5.WangChen,JunpingZhang,LiangWang,JianPu,XiaoruYuan.Humanidentificationusingtemporalinformationpreservinggaittemplate. IEEETransactionsonPatternAnalysisandMachineIntelligence, 34(11):2164-2176,2012.

6.HaruyukiIwama,MayuOkumura,YasushiMakihara,andYasushiYagi.TheOU-ISIRGaitDatabaseComprisingtheLargePopulationDatasetandPerformanceEvaluationofGaitRecognition.IEEETransactionsonInformationForensicsandSecurity, 7(5):1511-1521,2012.

7.HanqingChao,YiweiHe,JunpingZhang,JianfengFeng.GaitSet:RegardingGaitasaSetforCross-ViewGaitRecognition.AAAI2019.arXivpreprintarXiv:1811.06186. 

源代码地址:https://github.com/AbnerHqC/GaitSet

8.ShiqiYu, DaoliangTan,TieniuTan.2006.Aframeworkforevaluatingtheeffectofviewangle,clothingandcarryingconditionongaitrecognition.InProceedingsofInternationalConferenceonPatternRecognition(ICPR),volume4,441–444.

张军平

2019年3月1日

延伸阅读:

24. 爱犯错的智能体(二十,完结篇)--平衡:机器vs智能?

23. 爱犯错的智能体(十九)–群体智能与错觉

22. 爱犯错的智能体(十九)–群体智能与错觉

21. 爱犯错的智能体(十八):情感与回忆错觉

20. 爱犯错的智能体(十七):灵光一闪与认知错觉

19. 爱犯错的智能体(十六):庄周梦蝶与梦境学习

18. 爱犯错的智能体---语言篇:可塑与多义

17. 爱犯错的智能体–体感篇:我思故我在?

16. 爱犯错的智能体---听觉篇(二):视听错觉与无限音阶的拓扑

15. 爱犯错的智能体--听觉篇(一):听觉错觉与语音、歌唱的智能分析

14. 爱犯错的智能体–视觉篇(十一):主观时间与运动错觉

13.爱犯错的智能体--视觉篇(十):自举的视觉与心智

12. 爱犯错的智能体--视觉篇(九):抽象的颜色

11. 爱犯错的智能体--视觉篇(八):由粗到细、大范围优先的视觉

10. 爱犯错的智能体--视觉篇(七):眼中的黎曼流形

9. 爱犯错的智能体--视觉篇(六):外国的月亮比较圆?

8、爱犯错的智能体-视觉篇(五):火星人脸的阴影

7、爱犯错的智能体-视觉篇(四):看得见的斑点狗

6、爱犯错的智能体-视觉篇(三):看不见的萨摩耶

5、爱犯错的智能体-视觉篇(二):颠倒的视界

4、爱犯错的智能体-视觉篇(一):视觉倒像

3、AI版“双手互搏”有多牛?浅谈对抗性神经网络

2、童话(同化)世界的人工智能

1、深度学习,你就是那位116岁的长寿老奶奶!

张军平,复旦大学计算机科学技术学院,教授、博士生导师,中国自动化学会混合智能专委会副主任。主要研究方向包括人工智能、机器学习、图像处理、生物认证及智能交通。至今发表论文近100篇,其中IEEETransactions系列18篇,包括IEEETPAMI,TNNLS,ToC,TITS,TAC等。学术谷歌引用3000余次,ESI高被引一篇,H指数28.

https://blog.sciencenet.cn/blog-3389532-1165107.html上一篇:人工智能(AI)写歌,抓不住回忆下一篇:论文写作:研究生必不可少的一环收藏IP:222.70.149.*|热度|

郭绍青:人工智能助力教师教学创新

人工智能作为关键共性与颠覆性技术,正在对产业结构、生活环境等产生影响。人工智能进入教育领域,推动了智能学习系统、虚实融合学习环境、智能教育助理等智能系统和工具的开发与供给,智能教育环境建设已现端倪。实现机器智能与人类(教师)智慧相融合指向学习者的高级思维发展、创新能力培养,启迪学习者智慧的新教育,培养复合型、创新型、战略型、智慧型的人才,能够对人工智能与人类智慧相融合从事社会工作的劳动者的智慧教育进行广泛讨论。教师作为人工智能融入教育的直接利益相关者,具备利用人工智能学习系统和工具开展教学的知识与技能,提升人工智能技术素养显得十分重要。当前人工智能教育产品正在快速进入学校与课堂,为教师利用人工智能技术实现教学创新提供了支撑。

智能诊断助力教师优化课堂教学。适应性学习系统、手写板、智能阅卷等系统进入学校,为教师提供了对学生个体、小组、班级等随堂数据和课外数据采集与分析的手段,教师利用数据分析结果,精准定位学生个性学习问题与班级的普遍问题,找准学生个性与共性薄弱点、聚集学生学习障碍点,改进教学策略与方法,进行分层、分类教学,提升教师在课堂教学中解决学生学习问题的针对性与教学效率。

学习分析技术助力教师开展规模个性化教学。《中国教育现代化2035》提出“走班制、选课制等教学组织模式……利用现代技术加快推动人才培养模式改革,实现规模化教育与个性化培养的有机结合”的要求,具备大数据学习分析功能的网络学习空间的应用,对学生学习的精准画像,使教师在精准掌握学情的基础上,能够有效组织翻转课堂、小组合作学习、探究学习等学习活动。同时,学习分析技术正在推动网络学习空间中以个性化发展为核心的动态学习组织的发展,并引发实体学校动态走班制度的建立,实体学校与网络学习空间相融合的动态学习组织发展,将使教师实施规模个性化教学成为现实。

课堂智能分析助力教师精准教研。集自然语言处理、计算机视觉、生物特征识别等技术的课堂教学智能分析系统的应用,实现了对课堂教学过程数据的伴随性采集,汇聚课堂教学多维数据的智能分析能够形成更加精准的教师课堂教学行为的可视化分析结果。跨校际、跨区域的教研活动,利用课堂教学智能分析系统的分析报告,结合教研员与优秀教师评价分析,为研修教师提供精准服务,指导、组织、协助研修教师进行深度学习,对提升研修效果与效率具有显著作用。

智能学习系统助力教师提升教学质量。目前相对成熟的智能学习系统主要集中在智能语言学习方面。英语流利说、英语趣配音等一批利用自然语言处理技术开发的智能语言学习系统进入了教育领域,教师利用英语智能学习系统能够支持学生的听说训练,特别是在面向农村教学点的专递课堂中的应用,能够弥补教师自身的能力缺陷。同时利用自然语言处理技术与AR/VR相融合开发的藏、维双语智能学习系统将为学生提供多通道的人机交互,提升国家通用语言的学习质量。

人工智能助力教师家校协同。人工智能技术在家校协同教育中的应用,正在改变家校教育分离、难以形成合力与协同监管的现状。一些县区在推动人工智能教育应用过程中,利用人工智能技术助力家校协同教育,利用智能校徽与体温和人脸采集摄像机,无感采集学生体温、运动量、行动轨迹等数据,协助教师与家长掌握学生健康状况、安全信息、运动强度。要求学生阅读课外书籍,并在每天规定时间内利用纸笔系统写出读后感,教师能够及时进行点评,对培养学生的学习习惯、扩宽知识面等发挥了积极作用。(西北师范大学郭绍青)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇