数据标注员:做人工智能的眼睛
“我们就像人工智能(AI)的眼睛,带它看世界,理解世界,快速成长。”重庆瑞铭安普科技有限公司人工智能训练师吴宏羽这样描述自己的工作。
随着人工智能技术快速发展,越来越多的人工智能应用落地,人工智能训练师这个职业应运而生并不断发展壮大。2020年2月,人工智能训练师作为新职业被纳入国家职业分类目录。2021年,人力资源和社会保障部发布该职业的国家职业技能标准。“职业规范愈加清晰,折射出人工智能行业蓬勃发展的强劲势头,也更加坚定了我从事这份工作的信心。”吴宏羽说。
找到工作价值
2016年,从重庆工商大学人力资源管理专业毕业的吴宏羽进入一家银行工作,不久后辞职去支教。一次偶然的机会,她得知重庆奉节县政府正与百度共同建设人工智能数据标注基地,就选择加入其中,成为一名数据标注员。“此前,我从来都没有听说过数据标注员这个职业。经过了解,我知道这个职业还有一个名字叫人工智能训练师,有很大的发展空间,因此产生了浓厚兴趣。”吴宏羽说。
人工智能训练师是指使用智能训练软件,在人工智能产品使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员,包括数据标注员和人工智能算法测序员两个工种。
刚接触这个职业时,从操作系统到工作流程,吴宏羽需要一点一滴从头学起。打开电脑,根据人工智能项目提供的各种场景图片,按要求对图片拉框、调整细节、标注不同类型要素,完成初步的数据标注。听上去简单,但因为对数据精细度的要求较高,有时候一张图片需重复操作数次。
在不断学习中,吴宏羽逐渐加深了对这份工作的理解,“人工智能就像刚出生的婴儿,什么都不懂,数据标注员要像老师一样一步步教它们认识、识别物品,把图片、语音、文本、视频等原始数据标注成人工智能可以理解的结构化语言”。通过反复练习,她的标注准确率不断提升,数据质量也就越来越高。
人们生活中常见的智能音箱、语音助手、网络客服、人脸识别等产品的背后,都有人工智能训练师的身影。“看到人工智能产品越来越聪明,人们的生活变得更加便捷和舒适,我找到了工作的价值所在。”吴宏羽说。
提高专业水平
行业的快速发展让吴宏羽感到惊喜。随着人工智能产业加速与各行各业融合,数据标注基础服务需求量持续增长。仅一年的时间,吴宏羽所在的数据标注基地就培育孵化专业数据标注企业10多家,容纳了500多名数据标注师。“我们公司业务量也越来越大,从去年的20多人发展到目前近70人,高学历员工占比越来越高。”吴宏羽说。
让吴宏羽更高兴的是,在通过自己的努力推动智能产品更新迭代的同时,也见证了人工智能技术的快速进步。“我标注的自动驾驶项目最初大多是2D平面图片,适用于一些简单的户外路面识别系统,此后拓展到3D立体图像,更加贴合实际驾驶场景,再演变为2D与3D融合标注,有的还包括手势采集,以便智能系统更好识别理解驾驶员或者数字人的动作。”吴宏羽说,“从人工智能项目数据标注的变化,能感受到我国无人驾驶技术的不断飞跃,我觉得挺酷的。”
由于工作表现突出,吴宏羽如今已成为一名审核质检员,负责审核其他数据标注员的工作。但在她看来,这份工作依然充满挑战,要持之以恒地学习。“数据标注员需要了解不同应用行业的背景知识,根据不同项目特点做出不同标注。同时,由于每次操作的工具平台都由项目方决定,基本不同,因此,数据标注员要熟悉各个标注平台的操作方法,不断学习新的标注规则。”吴宏羽说。
尽管目前行业需求旺盛,但吴宏羽还是产生了强烈的职业危机感。“人工智能培训师职业门槛不高、可替代性强,从业者需要不断提高专业技能水平,增强竞争力。”吴宏羽说。为此,她规划了未来职业发展路线。一方面,了解更多人工智能行业的前沿趋势,掌握语义分割、文本标注等更多技能;另一方面,努力从标注师成长为培训师,为有志从事这个行业的人提供培训、指导服务。
“身边一些朋友了解我的工作后,也选择投身其中,这让我很开心。”吴宏羽说,希望未来会有更多人认可并加入人工智能培训师职业中。
华为人工智能岗位面试经历分享
点击上方“程序人生”,选择“置顶公众号”
第一时间关注程序猿(媛)身边的故事
作者
JackYang
如需转载,请联系原作者授权。
Part.1
面试是在马桶上进行的,因为那里安静。
开始我自我介绍,然后他说总体介绍的很清晰。
然后问我的项目细节,问我使用的哪个卷积神经网络模型,为什么选择这个模型,通常都有哪些模型。
在项目中最难的地方是在哪里?
我介绍了我还会爬虫,数据分析,他就问我觉得哪些工作让我最有成就感。
我说当我搞定一个爬虫网站,很有成就感时候,就发现说错了,明明面试的是AI岗位,哭死。
项目中都使用了TensorFlow的哪些函数?
问我非科班出身,是否学过数据结构和算法分析等计算机课程。我说我在大学选修过。然后开始问了都有哪些排序算法,快速排序,选择排序,冒泡排序……
来,分析下他们的时间消耗,我靠,我搞不懂,总是搞混淆啊。
知道二分查找吗?知道,是对已经排好序的数组进行查找,数据和中间的数值比较,然后迭代就行。
那分析下时间消耗,我不知道怎么分析,只知道是程序运行的次数啊。也看过书上怎么一步步分析,说不出来。
面试官不耐烦了,那你下去再看看。继续下面的问题。
你都知道哪些机器学习方法,我一口气把统计学分析上的大部分都说出来了。
问我k近邻算法和k均值算法都是怎么回事?讲讲呗。
问我是否知道监督学习和无监督学习的区别,这个入门级问题也来问我。
关键是后面这个问题,你刚才说的那些算法中哪些是无监督,哪些是有监督学习。我菊花一紧,不知道我刚才都说了啥。
想起来统计学分析都是在讨论有监督学习,也知道聚类算法和k均值算法是无监督学习。就如实说了。
后来问我查准率和查全率怎么回事?又问我精确率和召回率怎么回事。
我说有四种情况,正正,正负,负正,负负。具体公式怎么算,我想不起来了。
回家查了下是这样。
精确率:P=TP/TP+FP机器学习西瓜书里: 也叫查准率
召回率:R=TP/TP+FN机器学习西瓜书里:也叫查全率
F1值:精确率和召回率的调和均值。
最后问我评价一个模型好坏的标准是什么?
我说看模型是否能够准确拟合测试集,尽量避免欠拟合和过拟合的情况。
Part.2
最后让我提问。我问,如果我能够进华为,我要做什么项目?
他说了很多,估计十分钟,佩服他的口才,我只记住了他说有许多项目,比如会议场合的语音识别。
又问了他们这次要招多少人?他说几百人。
又问了工作地点,因为华为深圳总部一直在搬迁去东莞。他说在深圳,他们同时在全球广招人才。
后来我问我有多少竞争者?他说很多,感觉他们最近把深圳的人工智能工程师都挖完了。嗯,我在美丽又富饶的深圳,美国硅谷碰到深圳硅谷都要哭了。
面试这个岗位的有多少人,他们都是什么背景,我哪里还不足?
后来我感觉凉凉,赶紧说我现在刚转行,技术可能还不够精湛,但是我个人非常努力,是一个高度自律的小伙子(其实,我是大叔了)
学习让我开心的人,我还写了公众号《湾区人工智能》,我愿意投入100%,200%的时间和热情在AI领域。
举例说,你看我会四国语言,有多年海外留学,工作经历,很符合华为的国际化战略。他又问我语言水平,我说日语初级,应付旅游场合可以,德语,英语都可以应付工作和学习,有时候也会找外国人吵架。
后来我四点还有其他面试,看着时间感觉来不及了,赶紧从商场的卫生间出来往地铁走,他说差不多也说完了,听到我这边也很吵,就结束了谈话,看了下手机,哇,面了我一个多小时。
其实,我第一次面试AI岗位,心脏都快跳出来了,后来面试了十几家,都麻木了,一点都不紧张。
Part.3 建议
边准备面试,边投简历,不用等到准备充分,万事俱备,过去直接面试,让面试官检查自己哪里还做的不够好,把最想去的公司放在最后面试,先拿不想去的公司练习着,找感觉。
不要觉得这样过分,其实很多公司并不想招人,但是总招人过来面试,过来和你讨论技术问题,很有可能是他们碰到的,无法解决的问题。当然也有很多公司是急缺人,都靠缘分。
面试最重要的就是简历上面的项目,一定要描述清楚,如果项目都说不清,很难拿到offer,我第一个游戏公司面试就是因为项目问题挂了。
平时每做一个项目,都好好总结一下,用将来要面试的心态,用一段自我陈述的,别人能够轻松理解的句子写到博客里。大概100字左右把项目说清楚。然后把项目里用到的库,常用的函数及其用法,含义也整理出来,放在博客开头。面试的时候直接复制到手机里阅读,方便面试。把功夫花在平时,而不是准备面试时候才抓头骚耳想当时项目是怎么回事。每年让老板给自己开具一份工作证明,顺便也让老板回顾下你付出了多少,收获了什么。
面试时候也碰到薪资问题,让人感到很气愤。有些公司会问你现在的工资,只愿意给你增加3成或者5成,如果你是转行,那就很不合理。不过,总有公司愿意给你合理的价格,不看以前的薪水。
假如你在实体行业工作,每年工资涨5%,干了十年,发现工资没有应届生工资高。这个时候,你醒悟了,出去面试,其他公司还是要你提供工资流水,只愿意涨5成工资。这个就很不公平。
公司只看目前薪水,不考虑行业,职位的平均水平和员工在这个岗位的工作年限,这种思维只会导致员工频繁换公司,因为换工作涨工资比努力工作涨工资快很多倍。当然换工作也会逼迫自己努力学习,准备面试。
目前中国通货膨胀,M2超发了十几年,也就是每年政府会多印很多钱出来,导致工资涨幅赶不上通货膨胀。尤其是大型的实体行业每年涨幅5%,但是招新人,必须给出市场价才能招到人。所以才会导致10年老员工没有应届生工资高,还要指导应届生工作,心里不爽。老员工工资更没有跳槽过来的工资高。有些理智的跨国公司,会定期考察市场价,然后给远远低于市场价的老员工集体调薪。
Part.4 不同公司的福利
大公司:
工资可能不会特别高,但是福利保障很好。全市的班车,晚上九点后打车免费,周末加班打车免费,吃饭免费。午饭,晚饭都有20元的吃饭补助,9点后还有各种水果,点心随便吃,咖啡机,饮水机,茶叶随便享用。平时各种TED分享,出差五星级酒店,头等舱。15天带薪年假,30天带薪病假。各种心理咨询服务,租房补贴,每年给2万吧。各种体育活动场所。
拿到天量风投资金的小公司:
一日三餐都免费,加班出租车报销,工资很高,比如普通公司前端工程师最高给3万,他们直接给6万招前端,招APP工程师。有些岗位直接给10万招人。打开公司招聘栏目,几乎所有岗位都比行业平均工资高太多。这种公司也会招到各种大牛,海归,清北名校学生。
没钱开不起工资的小作坊公司:
各种抠门,老板一般没有人品,人员素质最差,动不动就骂人,没有任何福利,在里面只有受气的份,所有人的唯一想法都是赶紧离开,但是大部分人又没有离开的能力。
其实,一个公司就是一种气质,这种气质是由领导层决定的,老板什么性格,手下员工大多都是什么性格。公司越好,里面同事背景都会越好,什么海归,清北一抓一大把。小作坊公司大多是底层学校,底层家庭出身的居多。身边同事的质量决定了你的工作环境,决定了你的眼界,认知,他们说话,办事,工作方法,勤奋程度都值得让人学习。所以,从这个层面讲,底层出身(学校,家庭等),尽量去大公司,跟着牛人学习,自我成长后再去小公司。
我曾经在国外的一个国内物流公司工作过几天,那里的人员大都是华人,但是那里大部分的华人都有一个特点,混得不好,有些是难民身份,有些是因为各种原因大学没法毕业,找不到正式工作,但是不愿回国,都熬到50多岁了,有些是刚毕业找不到工作,又面临经济危机,比如我,还有一个女生是嫁给了一个外国人,生了孩子,家庭经济压力太大,老公对她不满意,不得不出来工作,没啥技能,只能去物流公司打包东西(人很非常漂亮,可惜没有技能,嫁到国外的华人女子的一种命运)。这个公司聚集了被主流社会忽视的人群。记得日本东野奎吾的小说《信》里面也提到了这点,日本有个公司,工资很低,工作环境恶劣,里面的人都是各种原因,没有什么技能为了生存不得不在那里工作,比如,大学没有毕业,高中因为家庭原因没有毕业,复原的犯人,等等被折叠的底层人物。
当时在国外就在想,既然在外国找不到好工作,为啥不回国呢,回国后起码是海归身份,有很多好公司愿意给一个工作机会,不用再做社会底层的工作。比如我在国外小公司做电站维护工作,每天都在开车出差,面临着车祸的风险。
到了电站,面临被高压电瞬间击毙的风险,工资也不高。但是福利很好,保证我的生活不会差到哪里去,但是个人完全没有任何成就感。那就果断回国,回国后,很轻松靠着学历进入大公司,做了我想做的程序员工作,充分利用了降维打击的法则。在一线城市拿着985大学的学历过不好,回到小城市,瞬间就被关注,有更多的机会。过一段时间,我分析下国内每个城市的优势产业,指导大家就业。目前来看,北上广深已经服务业化了,适合搞轻资产的互联网服务,金融服务,保险服务。从事制造业的赶紧往内陆转移,要不然以后很麻烦。
愿大家都抓紧时间学到一技之长,靠自己的技能能够不依赖任何人生存于这个世界,不论现在年纪多大,改变总是来得及,活到老,学到老;stayhungry, stayfoolish!你的技能创造的价值越大,或者技能越稀有,你的收入就会越高。把握这个原则,从现在开始学习一门有价值的技能,换工作技能贬值低的技能。不要被自己的年龄,性别,家庭出身,专业背景,学校背景限制,不要让任何东西限制你无限的可能,找工作,最关键的是,能不能给公司创造价值,解决问题。
没有做不到的事,只有不想做的心。Youwillmakeyourdreamcometrueifyounevernevernevergiveup!!!
Part.5
最后给大家分享一下我觉得有价值,工作环境又好的工作,也是我全力以赴在做的工作。那就是编程,做程序员,进入互联网服务业,中国的制造业时代已经进入尾声了。过去10年让农业进入尾声,下一个10年就是让制造业面临农民的境地,辛苦工作一年,还不如给人打工一个月挣得多。看看下面跳动的薪水,比发达国家的工资都高。
不建议年轻人去腾讯,看看工资多低,去今日头条吧,干两年,上市,坐拥千万身家。类似当年拼多多老板选择微软和谷歌一样。
今天的分享就到这里,谢谢您的时间。
-TheEnd-
这里有个免费线上分享会,了解一下
扫描下方海报二维码,添加小助手,回复「分享」,小助手会邀你进群。免费听《区块链核心技术与应用》该书作者庄鹏的分享。
分享结束后,会在群内抽出5名互动积极用户,免费送出作者著作一本!
*本期嘉宾拥有近15年的金融行业业务和应用架构、IT系统集成、应用系统开发和管理,战略咨询规划经验和经历。欢迎感兴趣的同学前来免费听讲。
「若你有原创文章想与大家分享,欢迎投稿。」
加编辑微信ID,备注#投稿#:
程序丨druidlost
小七丨duoshangshuang
上期精彩内容