生成式人工智能浪潮将重塑和颠覆行业发展
青年报·青春上海记者刘秦春/文、图
ChatGPT成为现象级应用,生成式人工智能技术引起了广泛关注。7月7日,“‘生’机盎然,‘成’就未来”2023世界人工智能大会投融资主题论坛从投融资角度出发,畅谈生成式人工智能如何推进产业持续升级与科技跨越发展,探索人工智能产业趋势。
◆ AIGC浪潮将重塑和颠覆各行各业 ◆
中金公司首席运营官楚钢在致辞中指出,在数字化、智能化的浪潮下,以人工智能技术为代表的新一代科技革命和产业变革正在重构创新版图和经济结构,数字经济也迎来了许多新的赛道。AIGC技术将重塑和颠覆数字内容生产门槛和生产效率。
上海市经济和信息化委员会副主任刘平表示,中国经济发展进入到了新时代,投融资环境也在不断发生变化。我们将一同把握新时代下的机遇和挑战,积极探索人工智能领域内新型投融资模式和路径,挖掘潜在创新企业,赋能人工智能高质量发展。
金砖国家新开发银行副行长LeslieMaasdrop认为,我们正处于新的工业革命中心,人工智能革命在颠覆各个行业,需要广泛国际合作,聚焦共同目标,携手快速部署,助力实现可持续发展技术,需要全球重要经济体达成一致意见。
“中国在人工智能方面是个超级大国,有着能源丰富、规划统一、法律法规监管、政府发挥强大作用等独特优势,人工智能得以在这里蓬勃发展。”LeslieMaasdrop说道。
◆ AIGC的局限性、挑战和破局思路 ◆
AIGC的能力的确很强,但也有局限性。清华大学教授、智能产业研究院院长、中国工程院院士张亚勤指出,ChatGPT4还存在诸多问题。例如时效性,它所使用的语料库还是2021年前的。准确性也差强人意,经常产生一些“幻觉”。受到算力限制,效率也远远不够。
为什么会有这些问题?张亚勤认为,是因为算法本身无法解决不实信息的问题。如何降低计算耗能,提升效率是个很大的挑战。
“用到物理世界,具身AI、金融应用都有这些问题。因为需要的是垂直精准的信息,而不是泛泛的信息。”算力是AI发展当下最大的挑战,张亚勤建议可以找新模型、新算法、新框架去突破这个限制。
另外,有不少人认为现在的算法都是美国人发明的,但张亚勤在论坛上指出:“其实并非如此,有很多原始算法都是由中国人完成的。”例如7月6日本报报道的香港中文大学教授汤晓鸥与他的三名学生所取得的原创成果。
“现在才刚开始,就像42公里的马拉松我们才跑了5公里,还有好多事情可以做。”张亚勤说道。现在的AI就像1998年时候的互联网,有很多机遇和挑战,但也会经过一个大浪淘沙最终沉淀果实的阶段。
不少人都表示担忧未来AI替代人类,中金公司原总裁兼首席执行官、清华大学管理实践访问教授朱云来说:“不如把问题反过来想,假如现在AI就代替人类了,那对我们有什么影响?让它干它能干的,我们做它不能做的、更有创造性的工作。”
◆ AIGC的价值创造和落地应用 ◆
在过去的一年间,生成式人工智能的应用日益增多,斩获了艺术奖项、顺利通过了美国司法与商学院考试,将程序员人效提升了55%。
据麦肯锡全球资深董事合伙人艾力(AlexSawaya)介绍,生成式人工智能(GenAI)具有多种形式,包括声音、图像、视频、文本,将在各个行业中引发商业模式和工作类型的颠覆。
然而,生成式AI却并不是普遍适用的。因为在许多应用中提供实质性的价值需要对具体的工作流程、功能和风险有深入的理解。
部署生成式人工智能将需要现代化技术堆栈的许多组成部分,如云平台、模型中心、应用程序。
艾力进一步指出,随着潜力的巨大增长和可能性,也伴随着重大风险,如偏见、不适当的内容。部署生成式人工智能将需要在数据和技术堆找上跨越风险管理的巨大飞跃。
为了开发、部暑和实现业务价值,将需要新的能力和人才,因为生成式人工智能有可能大规模改变几个重要职业领域的范畴,如运营、研究、沟通。
企业和投资人如何看待人工智能未来的发展和应用?完美世界副总裁、战略投资部负责人任鹏在圆桌论坛环节表示,目前部分游戏已经在人脸识别、动作捕捉方面应用了人工智能,未来希望通过AI提高内容生成效率,做出丰富、有趣、互动性强的游戏产品。
青年报·青春上海记者刘秦春/文、图
编辑:张红叶
来源:青春上海News—24小时青年报
16个人工智能项目实战合集!【人脸识别、图文识别、自动驾驶……】
1. EasyPR车牌识别系统
EasyPR是一个开源的中文车牌识别系统,其目标是成为一个简单、高效、准确的非限制场景(unconstrainedsituation)下的车牌识别库。相比于其他的车牌识别系统,EasyPR有如下特点:
它基于openCV这个开源库。这意味着你可以获取全部源代码,并且移植到opencv支持的所有平台。
它能够识别中文。例如车牌为苏EUK722的图片,它可以准确地输出std:string类型的"苏EUK722"的结果
它的识别率比较高。图片清晰的情况下,车牌检测与字符识别可以达到80%以上的精度开源协议:Apache-2.0项目地址:https://gitee.com/liuruoze/EasyPR
2. OpenMLDB开原机器学习数据库
OpenMLDB致力于闭环解决AI工程化落地的数据治理难题,并且已经在上百个企业级人工智能场景中得到落地。OpenMLDB优先开源了特征数据治理能力,依托SQL的开发能力,为企业提供全栈功能的,低门槛特征数据计算和管理平台。开源协议:Apache-2.0项目地址:https://github.com/4paradigm/OpenMLDB
3. GAAS无人机自主飞行开源平台
OpenMLDB致力于闭环解决AI工程化落地的数据治理难题,并且已经在上百个企业级人工智能场景中得到落地。OpenMLDB优先开源了特征数据治理能力,依托SQL的开发能力,为企业提供全栈功能的,低门槛特征数据计算和管理平台。开源协议:BSD-3-Clause项目地址:https://github.com/generalized-intelligence/GAAS
4. Paddle百度深度学习平台
飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,是中国首个自主研发、功能完备、开源开放的产业级深度学习平台,集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体。目前,飞桨累计开发者265万,服务企业10万家,基于飞桨开源深度学习平台产生了34万个模型。飞桨助力开发者快速实现AI想法,快速上线AI业务。帮助越来越多的行业完成AI赋能,实现产业智能化升级。开源协议:Apache-2.0项目地址:https://github.com/PaddlePaddle/Paddle
5. Seetaface6JNIJAVA人脸识别算法库
基于中科院seetaface6进行封装的JAVA人脸识别算法库,支持人脸检测、人脸提取、1:1比对、1:N比对、静默图片活体检测。开源协议:BSD-3-Clause项目地址:https://gitee.com/cnsugar/seetaface6JNI
6. easyAiJava版AI框架
java傻瓜ai框架,无需任何算法知识,通过简单的api调用就可以实现常用的图像内物体的识别,定位等图像ai服务,及自然语言分类处理服务。面向java开发程序员,不依赖任何第三方库,第三方接口,独立包。开源协议:Apache-2.0项目地址:https://gitee.com/ldp_dpsmax/easyAi
7. wukong-robot对话机器人/智能音箱项目
wukong-robot是一个简单、灵活、优雅的中文语音对话机器人/智能音箱项目,目的是让中国的Maker和Haker们也能快速打造个性化的智能音箱。wukong-robot还可能是第一个开源的脑机唤醒智能音箱。开源协议:MIT项目地址:https://github.com/wzpan/wukong-robot
8. Dubhe一站式AI模式开发平台
天枢人工智能开源开放平台(简称:天枢平台)是由之江实验室牵头,联合北京一流科技等共同打造的具有自主知识产权的人工智能开源平台。整个平台由一站式AI模型开发平台、高性能深度学习框架和模型炼知框架三大子系统组成。其中,一站式AI模型开发平台(简称:一站式开发平台)面向AI模型生产的生命周期,提供了包括数据处理、模型开发、模型训练和模型管理等功能,方便用户一站式构建AI算法。开源协议:Apache-2.0项目地址:https://gitee.com/zhijiangtianshu/Dubhe
9. 中药图像识别系统
中药识别系统主要采用APP端拍照上传的方式,构建卷积神经网络(CNN)对图像进行识别,具有识别效率高,准确度高的特点。APP端的功能包括但不限于拍照识别、中药问答(付费咨询)、检索查询、中药性状以及功效查看、方剂智能推荐【开发中】等;本系统包含APP端以及服务器端。开源协议:MulanPSL-1.0项目地址:https://gitee.com/xiaohaoo/medicine-identification
10. QiarAI智能秘书
国内首个AI反电销骚扰,智能秘书开源项目,采用Golang语言+前端Vue开发,自带新手向导,开箱即用。这是一个软硬件结合的开源项目,如果是普通使用者,需要有初级的硬件动手能力(比如接电源网线,插个板子总得会)。初版主要针对手机自带的呼叫转移功能,您可以将手机设置白名单策略,将所有陌生电话呼叫转移到AI接听。开源协议:Apache-2.0项目地址:https://gitee.com/iqiar/QiarAI
11. self_drive树莓派自动驾驶小车
基于树莓派的自动驾驶小车,利用树莓派和tensorflow实现小车在赛道的自动驾驶。项目地址:https://github.com/Timthony/self_drive
12. mindspore深度学习训练/推理框架
MindSpore是一种适用于端边云场景的新型开源深度学习训练/推理框架。MindSpore提供了友好的设计和高效的执行,旨在提升数据科学家和算法工程师的开发体验,并为AscendAI处理器提供原生支持,以及软硬件协同优化。同时,MindSpore作为全球AI开源社区,致力于进一步开发和丰富AI软硬件应用生态。开源协议:Apache-2.0项目地址:https://github.com/mindspore-ai/mindspore
13. cvat视频和图像注释工具
一个用于计算机视觉的交互式视频和图像注释工具。开源协议:LGPL项目地址:https://github.com/openvinotoolkit/cvat
14. ncnn手机端高性能神经网络前向计算框架
ncnn是一个为手机端极致优化的高性能神经网络前向计算框架。ncnn从设计之初深刻考虑手机端的部署和使用。无第三方依赖,跨平台,手机端cpu的速度快于目前所有已知的开源框架。基于ncnn,开发者能够将深度学习算法轻松移植到手机端高效执行,开发出人工智能APP,将AI带到你的指尖。ncnn目前已在腾讯多款应用中使用,如QQ,Qzone,微信,天天P图等。项目地址:https://gitee.com/Tencent/ncnn
15. TrWebOCR中文离线OCR
一个开源易用的中文离线OCR,识别率媲美大厂,并且提供了易用的web页面及web的接口,方便人类日常工作使用或者其他程序来调用。开源协议:Apache-2.0项目地址:https://gitee.com/alisen39/TrWebOCR
16. FaceMergeJava版本的人脸替换项目
java人脸融合项目,基于javacv技术,将两张人脸进行深度融合,使用javacv识别人脸和获取人脸68个关键点。开源协议:BSD-3-Clause项目地址:https://gitee.com/endlesshh/FaceMerge