人工智能交叉论坛：文心 · CV大模型VIMER：算法和应用人工智能包括计算机

发表时间：2023-07-05 02:16:09

人工智能交叉论坛：文心 · CV大模型VIMER：算法和应用

报告人

王井东

百度计算机视觉首席科学家

报告信息

报告时间：

2023年6月5日15:00-16:00

报告地址：

燕园校区：理科二号楼2736

昌平校区：102教室

主持人

林宙辰教授

北京大学智能学院、人工智能研究院

Abstract

本报告主要内容包括百度文心·CV大模型VIMER以数据为中心的算法和应用。首先，介绍自监督表征学习算法ContextAutoencoder（CAE）算法及其推广。然后，讲述基于CAE的工业视觉大模型、OCR文字识别大模型、人体大模型等。最后分享图文对比预训练大模型在自动驾驶数据挖掘中的应用和基于多任务学习的交通感知大模型。

Biography

王井东，百度计算机视觉首席科学家，负责计算机视觉领域的研究、技术创新和产品研发。加入百度之前，曾任微软亚洲研究院视觉计算组首席研究员。2001年和2004年在清华大学获得学士和硕士学位，2007年在香港科技大学获得博士学位。研究领域为计算机视觉、深度学习及多媒体搜索。他的代表工作包括高分辨率神经网络、基于transformerattention的图像语义分割网络OCRNet、以及基于近邻图的大规模最近邻搜索等。在微软工作期间，科研成果10多次转化到微软的关键产品和业务中去，包括搜索、广告、OCR、小冰聊天机器人等。在百度带领团队研发的技术已经广泛应用于百度的搜索、智能云以及自动驾驶等重要产品和业务中。

他曾担任过许多人工智能会议的领域主席，如NerIPS、CVPR、ICCV、ECCV、AAAI、IJCAI、ACMMM等。他现在是IEEETPAMI和IJCV的编委会成员，曾是IEEETMM和IEEETCSVT编委会成员。因在视觉内容理解和检索领域的杰出贡献，他被遴选为国际电气电子工程师学会和国际模式识别学会会士、国际计算机协会杰出会员。

人工智能交叉论坛：文心 · CV大模型VIMER：算法和应用 人工智能包括计算机

人工智能交叉论坛：文心 · CV大模型VIMER：算法和应用

人工智能交叉论坛：文心 · CV大模型VIMER：算法和应用人工智能包括计算机