博舍

科大讯飞被授予国家人工智能标准化总体组大模型专题组联合组长单位 科大讯飞人工智能研究院

科大讯飞被授予国家人工智能标准化总体组大模型专题组联合组长单位

中安在线 中安新闻客户端讯 7月7日,2023世界人工智能大会“共话标准,驱动产业—生成式人工智能标准化分论坛”在上海举行。会上,国家标准委指导的国家人工智能标准化总体组宣布我国首个大模型标准化专题组组长,由上海人工智能实验室与科大讯飞、华为、阿里等企业联合担任,现场进行了证书颁发并正式启动大模型测试国家标准制订。 

科大讯飞研究院院长刘聪被聘为国家人工智能标准化总体组大模型专题组联合组长,代表科大讯飞进一步参与大模型国家标准制定工作。

随着去年底ChatGPT发布并引爆全球,大模型产业迎来快速发展。大模型作为政府和企业推动人工智能产业发展的重要抓手,在识别、理解、决策、生成等AI任务的泛化性、通用性和迁移性方面都表现出巨大潜力和显著优势。  

今年5月,国家人工智能标准化总体组正式启动大模型专题组相关工作,以推动大模型国家标准化工作的开展。大模型专题组将承担大模型标准化制订工作,目的是推动大模型技术和标准化的实践结合,促进人工智能产业健康发展。  

此外,作为人工智能“国家队”之一,今年5月,科大讯飞被授予人工智能关键技术和应用评测工业和信息化部重点实验室大模型工作组的副组长单位,参编中国信通院大模型标准体系2.0的建设,积极推动大模型的应用落地,助力中国大模型产业发展。  

据了解,下一步科大讯飞将积极参与大模型国家标准的制定工作,推动人工智能技术的创新与应用,为我国人工智能产业高质量发展提供技术支撑。(记者 张毅璞) 

科大讯飞华南人工智能研究院(广州)有限公司

一、单位情况

科大讯飞华南人工智能研究院(广州)有限公司(下称“华南研究院”)于2017年落户广州南沙区,是南沙区重点引进的人工智能代表性项目,在广东省、广州市和南沙区各级领导和各部门的关心指导与大力支持下,研究院各项工作快速发展,取得了很好成果。研究院组织架构完善,建立了研究中心、工程中心、综合管理办、创新孵化中心,形成了基础研究、大数据、客服NLP、司法NLP、肺部CT、骨科影像六大研发方向,已认定为广东省高水平新型研发机构、广东省智能语音人机交互工程技术研究中心、机器人智能交互广东省新一代人工智能开放创新平台,在广东省人工智能技术领域处于领先水平。

华南研究院聚集了高端研发团队,目前共拥有员工40名,全部拥有本科及以上学历,其中研究生以上学历占80%(博士研究生学历与博士后19人、硕士研究生13人),搭建了研究中心、工程中心、综合管理办、创新孵化中心的完整框架,研发团队形成了基础研究、客服NLP、工业质检、医疗影像、声音振动、大数据六大研发方向。研究院团队积极参与制定“广州市人工智能发展五年规划”,为人工智能产业在广州的集聚和壮大提供指引。按照研究院董事长杜兰博士提出“要在听得见炮火的一线来做应用研发”的思路,华南研究院整合优势资源,促进人工智能生态领域新技术、新产品、新工艺的研发,加速技术成果产业化,进一步提升在学界、业界的影响力和知名度。2018年以来,研究院已授权知识产权98项,其中发明专利5项、实用新型专利51项、外观专利5项、软件著作权37项。

华南研究院在语音合成、语音识别、口语评测、自然语言理解、图像识别等多项国际测评中占据领先地位,自成立以来,紧紧围绕《广东省新一代人工智能发展规划》,以基础性、前瞻性、应用性研发为原则,定位于立足广东、辐射华南、服务全国,打造华南人工智能研发新高地。研究院通过人工智能在教育、医疗、政法、城市等应用场景,已经实现了源头技术创新和产业应用的良性互动,并通过产学研合作建设了广州南沙-科大讯飞人工智能医学影像诊断中心、华南理工大学-科大讯飞脑机协同混合智能技术及应用联合实验室、华南师范大学-科大讯飞行业大数据应用融合创新联合实验室。研究院以三大联合研究机构为依托,让人工智能研究更贴近行业需求,技术转化全面提速。

二、科研创新情况

1、语义理解技术研究

在客服NLP领域,研究团队在原有语义理解模型基础上,研发了BERT加有序LSTM方案,提升运营商客服场景下意图识别率至82.75%,金融客服场景下识别率至87.12%。针对语义理解中多厂商多条线的需求,提出了共享统一编码层方案,并对多分支多任务联合优化和额外输入标签两种方式进行验证,其中联合优化对比此前单一任务模型效果最大提升可达6%,并且实现模型部署可在厂商条线之间无缝切换。针对垂直场景中语料不足的情况,研究团队使用CVT和MIXUP两项技术生成多样性的掩码和混合数据,进一步提升客服场景中的意图识别和TOKEN抽取的正确率。在阅读理解任务中,研究团队利用多重注意力机制预测答案在文本中的位置,基于百度百科数据的模型,可以实现了72%的问答正确率。目前该项技术已运用于宝洁、越秀地产等大客户智能客服系统。

在司法文本中,研究团队围绕案由中实体和属性的抽取与关联进行要素抽取。根据时间描述,地点描述,人名指代等进行事件描述结构化,辅助评判两个事件是否为同一事件,提升同一文本内事件共指基线模型2%~3%的绝对F1值,同时进一步使用相似词匹配等技术改善同卷宗跨文本一致性分析。基于事件的证据链分析技术,对司法意见书和犯罪前科的生成准确度可达90%。基于语义匹配预训练模型,研究团队还实现跨笔录信息匹配关联搜索,辅助庭审过程中由卷宗笔录供述相关片段做参考。

2、医疗影像处理技术研究

在肺部CT多种疾病体征检测的问题上,研究团队优化了新的损失函数,改进了非极大值抑制的后处理流程,同时利用多尺度融合方案实现了密度增高影和无肺纹理两种征象在4虚警条件下80%以上的召回率,绝对效果提升10%。针对电子听诊器的应用场景,研究团队研发了新的肺音肺炎识别模型,基于声纹提取、说话人识别等相关技术,实现了85%以上的识别准确率。针对腹部CT肝脏分割的问题,研究团队提出了3D全卷积的Encoder-Decoder结构的AbdomentNet网络,使用密集相连的卷积层和边缘敏感的损失函数加强对空间语义信息建模和边缘精细结构的分割。在国际医学影像领域顶级会议ISBI(InternationalSymposiumonBiomedicalImaging)设置的CHAOS(CombinedHealthyAbdominalOrganSegmentation)比赛线上榜中刷新CT肝脏三项指标世界纪录。在国际顶级人工智能医学影像学术会议MICCAI2019(国际医学图像计算和计算机辅助干预会议)中,我院医学影像团队又获得AASCE2019X光片脊柱弯曲角度测量比赛第二名和VERSE19CT脊椎分割定位比赛总分第三名的好成绩。

3、工业质检技术研究。

在工业数字化智能的技术方向,采用更强的皮尔森系数匹配抽取多维特征的方式,实现了刀具磨损剩余寿命(RUL)多折预测偏差小于6次,整体寿命准确度达到95%以上。针对工业大型设备故障偶发、历史数据少问题,提出基于多元状态估计技术方案(MSET),通过可解释性地构造正常状态的记忆矩阵,进一步提高多种正常状态能力,多源传感器预测误差小于0.5%,达到业界领先水平。基于视觉的智能制造以及智慧工厂场景中,研究团队优化了新的损失函数,改进目标跟踪的后处理流程,同时利用时空信息进一步增强了断针、飞根瑕疵的视觉特征,F1达到90%,绝对效果提升30%以上。此外,针对端侧的嵌入式部署,研究团队设计了神经网络自动搜索(NAS)的方法,在保证识别精度的前提下,多款AI芯片网络计算复杂度下降50%以上。

4、教育答题批改技术研究。

研究团队整合公式批改、中文批改、区间表达等多种学科批改规则,结合光学字符识别以及深度语义理解,完成理化主观题引擎服务研发。高中物理化学填空题型,批改准确率达到94%,可批改率平均90%。在文本分析方向,研究团队利用问答(QA)抽取、扩展问挖掘技术,实现了说明文档到QA对的提取,其中在政务领域达到标题到问句BLEU-4指标86%效果。该技术已获得广州市重点研发计划项目资助。

科大讯飞,构筑人工智能生态的中国力量

A.I.能力赋能百万开发者。科大讯飞/供图

中国声谷&讯飞大厦。科大讯飞/供图

中国经济导报中国发展网记者 | 王晓涛

“预见未来的最好方式就是创造未来!”2月8日,科大讯飞董事长刘庆峰于春节前夕发表了充满激情的演讲,向逾万名员工明确了科大讯飞人工智能2.0时代的奋斗目标:十亿用户,千亿收入,万亿生态。

有人清楚地记得,在2015年的全国两会上,他在接受媒体采访时表示:“未来5~10年,人工智能会像今天的水、食物、互联网一样,成为人们每天生活中的标配。”作为全国人大代表,他在当年的两会代表提案中提出,要把人工智能作为国家“十三五”规划的重要内容。

弹指一挥间,6年过去了。从当年提出把人工智能写入国家“十三五”规划,到在“十四五”的开局之年,满怀信心地向人们展示科大讯飞的宏伟蓝图,6年间,这家我国人工智能的龙头企业又走过了怎样的征程?

源头技术创新,夯实讯飞生态根基

“我们去年拿了10项世界冠军!”就在文章开头提到的那次演讲中,刘庆峰自豪地用数据证明了科大讯飞在源头技术创新上的雄厚实力。的确,22年来,在人工智能的发展道路上,科大讯飞长期坚守在智能语音和人工智能产业中,并以持之以恒的创新,探索人工智能科技前沿的“无人区”,取得了一项又一项优异的技术创新,如首次让语音合成超过真人,首次让语音识别超过速记员,等等。

仅在“十三五”期间,科大讯飞技术进展就交出了耀眼的“成绩单”,在语音合成、语音识别、机器阅读理解等多项国际核心技术赛事上获得40余项冠军,并树立了人工智能发展史上的多个里程碑——

2016年,让机器的中英文口语作文评测全球首次达到人类专家水平;

2017年,让机器的全科医生能力全球首次通过国家执业医师资格考试;

2018年,让机器的口译翻译能力全球首次通过CATTI翻译资格考试;

2019年,让机器的阅读理解能力全球首次超过人类平均水平;

2020年,科大讯飞在国际最权威的英文语音识别大赛CHiME-6上再次摘得桂冠。

而在技术顶天的背后,则是企业坚实的资金支持后盾。数据显示,“十三五”期间,科大讯飞每年研发投入占营收比均超过20%。

据了解,作为技术创新型企业,科大讯飞自成立以来一直坚持源头核心技术创新,已形成了以基础算法为主干节点,以技术体系为生长方向,以场景理解为发展动力的A.I.科技树。

刘庆峰曾多次表示,“人工智能的发展要做好源头技术创新,走科技自主可控之路,不能在别人的院子里建大楼。”

现如今,公司核心研发平台下设A.I.研究院、大数据研究院、云计算研究院,有力支撑源头技术创新,多次在机器翻译、自然语言理解、图像识别、图像理解、知识图谱、知识发现、机器推理等各项国际评测中取得佳绩。近3年来,科大讯飞主持和参与制定国家标准已发布21项、行业标准已发布8项、团体标准已发布4项,主导和参与了5项国际标准和国际标准技术报告项目,在国际核心技术赛事上获得30余项世界冠军。

秉承开放赋能,拥抱百万生态伙伴

“我们一直坚定不移地认为,只有生态才能生生不息。”刘庆峰认为,一个企业的成功,绝不是单独成为一个帝国,做帝国注定会衰落。“只有愿意以自己为核心,开放出自己的资源和能力,形成的产业链,形成的生态体系,才能够生生不息地去发展。”

在科大讯飞的生态体系中,讯飞开放平台处于举足轻重的地位。这一基于科大讯飞的人工智能技术能力与大数据运营能力建设的人工智能技术与生态服务平台,以云服务连通厂商、用户与终端消费者,以技术赋能产业上下游资源合作伙伴。目前已上线包含农业、金融、司法、医疗等领域在内的共计14大行业专题,开放396项技术能力,全面赋能行业;面向企业数字化升级需求,量身定制云服务;推出行业A.I.人才成长体系、A.I.开发者竞赛平台,目前讯飞A.I.大学学员总量达到46.5万+,支撑A.I.人才培养。

在技术赋能的同时,科大讯飞持续通过资本、产业扶持赋能,为开发者团队提供从初生到壮大的全链路服务,持续营造和谐共赢的开发者生态。

在产业扶持方面,科大讯飞基于各地产业情况打造专属服务、定制方案,赋能城市。目前已建立青岛、苏州、天津、长春等十余个城市双创基地和产业加速中心,有效支持各地区的人工智能场景落地。

在资本方面,科大讯飞围绕人工智能硬科技及其在企业服务、教育、医疗、智能出行、消费升级等领域的落地,展开A.I.+赋能型的产业生态投资。自2015年以来,讯飞先后投资了商汤科技、寒武纪、优必选、主线科技、国仪量子等优秀独角兽公司。截至目前,讯飞人工智能生态已有超过270万生态伙伴,已扶持生态企业达3000家,平台孵化120家,战略投资近70家。

正是由于在企业生态建设中秉承开放的态度,科大讯飞的生态伙伴队伍不断壮大。据统计,截至今年2月底,科大讯飞人工智能生态平台上已聚集超过186万开发者团队,总应用数超过105万,累计覆盖终端用户数31亿+,以科大讯飞为中心的人工智能产业生态持续构建。

长三角是我国极富有生命力与创新力的地区,为助力长三角人工智能一体化发展,科大讯飞于今年1月7日发起成立长三角人工智能产业链联盟。截至去年底,讯飞人工智能生态长三角地区开发者数量近38万。由工业和信息化部与安徽省人民政府共建,以科大讯飞为龙头企业的“中国声谷”,截至去年底,成功实现入园企业1000家、产值规模1000亿元的“双千目标”。

刚需应用立地,人工智能红利兑现

随着核心技术持续突破,人工智能进入规模化应用阶段,人工智能红利开始不断兑现。科大讯飞坚持为“健康中国”“教育强国”“扶贫攻坚”等重要国家战略和“一带一路”倡议服务,满足社会刚需。

——在医疗领域,科大讯飞“智医助理”全科辅助诊疗系统可以大幅提升一线医生电子病历规范率和合理诊断能力,减少不合理用药和过度治疗,提高基层医生诊疗能力。目前该系统已在全国12个省份200余个区县的基层医疗机构实现常态化应用,服务于近5万名基层医生,累计提供AI辅助诊断超1.2亿次。

——在教育领域,科大讯飞智慧教学系统在全国31个省份广泛应用,服务全国超过3.8万所学校,惠及超过1亿师生减负增效,助力教育均衡发展。新冠肺炎疫情期间,科大讯飞全力保障湖北省和其他地区中小学生“停课不停学”,先后向安徽、河北、江西、广东、广西、吉林、山东等21个省份的6500余所中小学提供人工智能教育产品和服务,为全国免费提供在线教学及作业23亿次。

——在扶贫攻坚领域,科大讯飞与教育部、原国务院扶贫办等合作实施“推普扶贫攻坚战略”,已累计服务人数超过100万人;服务聋人、盲人等特殊人群的智能语音语言平台,每日提供服务次数已超过5000万次;联合中国聋协发起公益行动“听见A.I.的声音”,通过语音技术让听障人士通过文字感受世界,并捐赠相关设备助力听障人士日常工作等。

——在“一带一路”领域,科大讯飞与教育部联合推出全球中文学习平台,累计用户达57.6万人,覆盖全球123个国家;汉维翻译在全疆推广,月服务3.3亿人次,为25万“访惠聚”下派干部提供双语翻译服务;为联合国国际电信联盟以及博鳌论坛、中国国际进口博览会等重大场合提供翻译服务,并成为北京2022年冬奥会和冬残奥会官方自动语音转换与翻译独家供应商。

此外,在智慧城市领域,科大讯飞的智慧城市产品及服务的应用已经遍及全国30个省份;在消费电子领域,讯飞翻译机、讯飞听见会议系统、讯飞智能录音笔、讯飞智能办公本等产品备受市场欢迎。

“你一定要进入一个根据地市场,做一个赛道一个场景,一定要把它做实做透,真正地尊重客户,真正地为客户创造价值,一步一个脚印地积累我们的品牌公信力。”刘庆峰在演讲中言辞恳切地告诫公司员工。

系统性创新与根据地业务建设,是科大讯飞未来5年发展的两个核心引擎。“一定要形成以我为主的产业生态,而核心就是要掌握价值链的控制点和主导权。”刘庆峰同时强调,系统性创新能力恰逢其时,“在未来5年,我们一定要把系统性创新能力构建成科大讯飞牢不可破的核心竞争力和竞争壁垒。”

责任编辑:刘丹阳

10

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇