基于人工智能信息数据采集方法与流程
本发明设计人工智能相关技术领域,特别是一种基于人工智能信息数据采集方法。
背景技术:
人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。
信息数据采集是在我们办一件需要大众参与时经常会做的事情。但是正常的人工进行大量的信息数据采集是一件不容易的事情,如果想要得到想要的结果就需要投入大量的人力,物力以及时间。为了能够提高信息数据采集的效率以及普遍性,我们需要借助具有一定智能的人工系统帮助我们进行收集数据;目前我们正在使用的人工智能进行信息采集存在着重复采集的问题,为了增大采集的信息的准确性,我们需要设计一种判断方法,避免重复采集的现象,使结果尽可能的达到准确。
技术实现要素:
为增加信息数据采集效率以及采集结果尽可能准确,本发明提供了一种基于人工智能信息数据采集方法。
一种基于人工智能信息数据采集方法,其特征在于,包括以下步骤:步骤1:获取所需会话元素作为会话集合,所述会话元素包括会话问题,场景开始标识,场景结束标识,和预期答案:步骤2:统计所有会话元素的行为特征并输出;步骤3:根据步骤2输出结果判断收集信息的种类进行归类;步骤4:根据步骤3做得出的判断进行所采集的信息过滤取舍。
所述会话集合是通过手机或电脑登录网页为场景开始标识,关闭或退出所登录的网页为场景结束标识,退出所登录的网页的标准为会话问题均已回答完毕并确认无误,参与者同意提交退出所登录的网页为准,登录和退出需要参与者提供回答信息收集会话问题时面部图片作为证明,这样确保每个人的面部不可复制性,提高避免重复的概率。
会话问题也包括手机iccid或者电脑ip和参与者的身份证信息,手机iccid或者电脑ip,不需参与者本人手动输入,只需授权读取即可,参与者的身份证信息则需要手写输入,或者本人手写以照片的形式上传,确保是本人参与,这样系统就可以根据参与者本人在系统内存留的笔迹从另一方面确保信息收集的准确性。
步骤3归类策略和步骤4过滤取舍策略包括手机iccid电脑ip是否重复,参与者的身份证信息是否重复,会话问题结果:
1)手机iccid电脑ip,重复、参与者的身份证信息,重复、会话问题结果重复,舍去;
2)手机iccid电脑ip,重复、参与者的身份证信息,重复、会话问题结果,不重复,舍去;
3)手机iccid电脑ip,重复、参与者的身份证信息,不重复、会话问题结果,不重复,舍去;
4)手机iccid电脑ip,重复、参与者的身份证信息,不重复、会话问题结果,重复,舍去;
5)手机iccid电脑ip,不重复、参与者的身份证信息,重复、会话问题结果,不重复,舍去;
6)手机iccid电脑ip,不重复、参与者的身份证信息,重复、会话问题结果,重复,舍去;
7)手机iccid电脑ip,不重复、参与者的身份证信息,不重复、会话问题结果,重复,保存数据;
8)手机iccid电脑ip,不重复、参与者的身份证信息,不重复、会话问题结果,不重复,保存数据。
步骤4过滤取舍所收集的信息,舍弃的信息进入信息保护单元的粉碎删除防止再生的渠道;有效信息,进入加强保护渠道,防止信息泄露,保护参与者的信息安全。
和传统的信息数据采集方式以及目前的人工智能采集信息数据的方式相比,本发明利用人工智能特定的会话集合进行数据的过滤、收集,提高了工作效率,保证了据的准确性。
附图说明
图1本发明中信息采集流程示意图
图2本发明中信息采集过滤流程结构示意图。
具体实施方式
以下结合附图及具体实施案例进行进一步详细说明。
如图1所示,一种基于人工智能信息数据采集方法,其特征在于,包括以下步骤:
步骤1:获取所需会话元素作为会话集合,所述会话元素包括会话问题,场景开始标识,场景结束标识,和预期答案;步骤2:统计所有会话元素的行为特征并输出;步骤3:根据步骤2输出结果判断收集信息的种类进行归类;步骤4:根据步骤3做得出的判断进行所采集的信息过滤取舍。
其中会话集合是通过手机或电脑登录网页为场景开始标识,关闭或退出所登录的网页为场景结束标识,退出所登录的网页的标准为会话问题均已回答完毕并确认无误,参与者同意提交退出所登录的网页为准。
其中会话问题也包括手机iccid或者电脑ip和参与者的身份证信息,iccid自动从参与者手机卡中读取,电脑ip由参与者所登录的电脑读取,身份证信息,参与者自己填写。
步骤3归类策略和步骤4过滤取舍策略包括手机iccid电脑ip是否重复,参与者的身份证信息是否重复,会话问题结果:
1)手机iccid或者电脑ip,重复、参与者的身份证信息,重复、会话问题结果重复,舍去,不对信息数据进行保存和采纳;
2)手机iccid或者电脑ip,重复、参与者的身份证信息,重复、会话问题结果,不重复,舍去不对信息数据进行保存和采纳;
3)手机iccid或者电脑ip,重复、参与者的身份证信息,不重复、会话问题结果,不重复,舍去,不对信息数据进行保存和采纳;
4)手机iccid或者电脑ip,重复、参与者的身份证信息,不重复、会话问题结果,重复,舍去,不对信息数据进行保存和采纳;
5)手机iccid或者电脑ip,不重复、参与者的身份证信息,重复、会话问题结果,不重复,舍去,不对信息数据进行保存和采纳;
6)手机iccid或者电脑ip,不重复、参与者的身份证信息,重复、会话问题结果,重复,舍去,不对信息数据进行保存和采纳;
7)手机iccid或者电脑ip,不重复、参与者的身份证信息,不重复、会话问题结果,重复,保存数据;
8)手机iccid或者电脑ip,不重复、参与者的身份证信息,不重复、会话问题结果,不重复,保存数据。
如图2所示,一种基于人工智能信息数据采集方法的基本单元包括信息采集单元101,数据判断单元102,信息归类单元103,结果执行单元104,信息采集单元101与数据判断单元102相连,所述数据判断单元102与信息归类单元103相连,所述信息归类单元103与结果执行单元104连接;所述信息采集单元101收集信息传递给数据判断单元102,数据判断单元102判断所收集信息所提供的特征,进而传到信息归类单元103进行归类,所述结果执行单元104根据信息归类单元103归类的结果进行判断,对信息进行过滤取舍,取舍之后进去信息保护单元105进行信息保护或者粉碎删除。
步骤4过滤取舍所收集的信息,舍弃的信息进入信息保护单元的粉碎删除防止再生的渠道;有效信息,进入加强保护渠道,防止信息泄露,保护参与者的信息安全。
由所采集的保存下来的信息,进行计算达到最初的目的。
上述说明示出本发明的优选实施案例,如前所述,应当理解本发明并非局限于本文所展示的形式,不应看作是对其他案例的限制,而可以用于其他环境,并能够在本文所述发明构想范围内,通过上述相关技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围的都应该在本发明所附的权利要求保护范围之内。