(NLP)自然语言处理岗位最新面试经验总结
乎所有自然语言类(NLP)岗位都是3轮及以上的面试。第一轮:基本沟通(自我介绍、经验介绍…)、基础知识(线程、设计模式…)、基础算法题(Transformer、Bert…)。第二轮:有一定难度的算法题、项目经验的详细讨论。第三轮:技术Leader和HR的最终面试。并且必定会考算法题。对于每一家公司,算法绝对是一个基本线,如果算法不过关那么几乎没有机会到达第三轮面试。所以算法准备是必需的!但也不是万能的,如果你以为只刷leetcode就能顺利通过面试,那就有点盲目乐观了。下面开始分享干货很干的呦,比干香菇还干!大家拿好小板凳。
第一、二轮面试通过的关键:算法题!
每一轮面试中,如果有算法题,最好能准确做出来,那样大概率可以进入下一轮面试;如果完全没思路,那基本属于凉凉!如果思路正确,写得不是特别对,那还有百分之六十左右的概率进入下一轮。面试过程中,遇到比较困难的题目,如果没有思路,可以先写一版复杂度较高的方法,然后再问下面试官是否可以给些提示。最差的情况,实在不会,询问面试官是否可以换一个题目(主要看面试官肯不肯给换),如果换题目了,那就必须得做出来,不然凉凉,这个我操作过。题目大部分以leetcode中等难度为主,而且原题的比例也比较高,或者就是原题的变形;极少数hard题目,大厂会考。
那么问题来了!那么多算法题怎么刷呢?刷多少合适呢?50道?100道?200道?当然了,题海战术永远有效!但我们的时间和精力也是有限的。这不仅仅是概率问题!就算你刷了300道题,但你没有完全理解或者融会贯通,那么题目稍微变形你就有可能翻车了。所以策略应该是:重点准备各厂喜欢考的高频算法结合刷题。通过调研发现高频的算法考点有:简单一些的快排、编辑距离、二叉树、递归、随机数问题、矩阵旋转等。还有和算法紧密相关的理论题:Bptt、Lstm、Transformer、GPT等等。
算法是通过面试的核心和基础,如果算法不过关那么就没有机会了。所以大家一定要重视算法准备,多刷题,要有量!同时重点算法要理解甚至用代码去实现。《智想新知-算法面试》课程里有过全面的整理和讲解。每一个算法都做了详细的介绍、讲解,大家有兴趣可以联系老师索取。
第三轮面试的关键:充分准备、良好心态和沟通技巧!经过“枪林弹雨”来到了第三轮。这是决定你去留的“终局之战”!你要过两关,一是技术小组长或者技术负责人,另一个是HR。前者一般是你未来汇报的对象,大多问你的是技术问题和项目经验的探讨,以及未来共事他关注的一些个人素质的点。后者则是公司文化、个人性格、个人成长性的考量以及谈薪待遇等。下面来通过两个面试中的重要角色来帮你剖析准备的关键点。
几个技术Leader喜欢问的经典问题:
如何去评估一个算法项目?除了开发工作之外,一个完整项目还需要承担什么工作?
您在简历中的项目,用的主要算法技术点是什么?解决了哪些问题?提升的效能如何?未来做哪些变革可以做的更好!应用场景是否可以多元化?
你怎样开展项目?如何落地?资源不够的情况下怎么应对?
你认为你的优势是什么,劣势是什么?为什么?
你有什么要问我的吗?
回答建议:
认真准备自我介绍,突出自己的优势,要有差异化,最好能够熟练背诵。言简意赅介绍项目经验和成绩。学术成就和比赛成绩会加分。谦虚、诚实、注意听清并理解面试官的问题,回答每一个问题之前思考一下再回答,不要过于圆滑。对面试公司和面试岗位的职责要求做充分了解,尤其是公司的业务。
几个HR喜欢问的经典问题:
你的优缺点?
你对薪资的要求?
你对加班的看法?
工作中与同事、上司发生冲突你会怎么处理?
用三个词总结自己?
回答建议:
在讲优缺点的时候不要凡尔赛!也不要说一些很严重的缺点,比如:懒惰、脾气大等。薪资要求要合理,不要过于“贪婪”,否则很容易失去好机会!一般应该从个人发展的角度去做薪资待遇上的权衡。通常问加班,实际都是在测试你“是否愿意为公司做奉献”!针对于同事、上司的冲突,最好的解决办法是有效沟通、换位思考,实在不行也可以找第三方权威来评判。用三个词总结自己,主要突出自己的优势,且有一定的差异化特色。HR问的当然不止这些,就是希望大家能够摆正心态去进行面试,自信、平稳、谦虚、诚恳。
面试策略?
建议先从小厂开始面,然后再去最想去的厂子面。当然小厂不用面太多,大体面试模式和内容都差不多,主要目的是积累经验。所以如果对算法题比较自信的同学,可以在小厂上积累一些经验之后,直接面大厂。
面试难度?根据众多就业学员的反馈,NLP相关岗位难度大体如下,难度由高到低排序:
腾讯【微信】、字节 > 华为、美团 、虾皮> B站、知乎、小红书、网易 >微博、携程
北信源再获自然语言处理专利 技术将应用于信源密信
证券时报网讯,随着AIGC技术在2023年迎来大爆发,越来越多科技公司在AI领域发力,网络与信息安全作为护航AI安全发展的行业,持续在技术领域探索,不断加强企业核心竞争力,成为推动AIGC发展的重要力量。7月4日,北信源(300352)披露公告称,公司于近日取得中华人民共和国国家知识产权局颁发的“智能设备自然语言交互信息处理方法”发明专利证书。北信源表示,该发明专利的取得充分发挥了公司自主知识产权优势,对公司三大业务方向“信息安全及信创、移动办公及安全通讯应用、智慧社区及健康医疗”具有积极影响,是公司坚持持续创新的成果,有利于为用户打造全场景人工智能解决方案及服务,对提升公司核心竞争力及未来公司业务发展具有巨大的潜在推动力。聚焦人工智能核心研究课题 专利技术将应用于信源密信此次北信源发明专利的技术领域为“自然语言处理”,自然语言交互信息处理是人工智能领域中非常重要的组成部分,主要用来解决人机对话的问题,让智能设备理解人类所表达的内容。作为人工智能研究的核心课题之一,对自然语言处理的技术探索对于推动人工智能技术服务数字经济发展具有重要意义。2021年,国务院办公厅曾印发《关于全面加强新时代语言文字工作的意见》指出,大力推动语言文字与人工智能、大数据、云计算等信息技术的深度融合,加强人工智能环境下自然语言处理等关键问题研究和原创技术研发,加强语言技术成果转化及推广应用,支持数字经济发展。据悉,该发明专利能够有效解决“物-物”对话问题,解决信息无特定协议互传互通的表达方式。北信源表示,该发明专利是解决基于AI的万物互联问题中的核心技术,采用自然语言实现万物互联过程中“人-物”和“物-物”交互,目的是联合其他公司自主人工智能技术,应用于北信源信源密信等产品。北信源自主研发的“信源密信”安全通信平台·底座,重新定义了基于自然语言的无协议沟通框架,具有标准的公共服务开放平台。目前,信源密信已经接入国内优秀的大模型AI产品,比如百度文心一言、阿里通译千问、科大讯飞星火大模型等。业内人士指出,这些ChatGPT类产品可以被描述为一个自然语言处理领域的人工智能模型,在未来的自然语言交互方式中,自然语言识别效率和准确率则是绕不开的问题。北信源表示,信源密信在未来或将结合大模型产品,在自然语言交互维度上扩大产品的应用场景,提升协同办公的效率。北信源多年潜心研发自然语言处理前景可期网络与信息安全行业对人工智能的发展具有重要作用。根据华安证券相关研报,AI能力一方面会增加网络进攻,形成网络安全新需求;另一方面AI能力可以融入网络安全技术,提高处理效率。回顾北信源的研发之路可以发现,北信源之所以能解决“物-物”对话方面找到新的突破口,离不开其在自然语言处理领域的长期深耕。北信源早在2015年就已在该技术领域开展相关研究工作并取得一系列科研成果,持续布局了多件相关专利,本专利是该系列研究成果的一部分。2016年初,北信源申请了名为“一种支持自然语言信息交互的智能设备控制体系和方法”和“一种用于人与智能设备交互操作的辅助智能装置”的发明专利,逐渐将自然语言处理技术的布局从最初的智能家居方面延伸到更广泛的智能设备与人机交互中。2017年,北信源申请发明专利“一种支持自然语言交互的装置和方法”。2022年申请的发明专利中,北信源则开始侧重语音识别/语言解释的效率和准确率。可见,北信源此次在自然语言处理领域中的突破,以及在语音噪音处理、提高识别率方面的贡献,是其长期布局,潜心钻研的成果。有专家指出,大模型时代的自然语言处理依然大有可为。未来,以大模型作为基座,拓展其感知,计算,推理,交互和控制能力,自然语言处理技术将进一步助力通用人工智能的发展,促进各行各业的生产力进步,更好地为人类社会服务。(燕云)海量资讯、精准解读,尽在新浪财经APP自然语言处理 Paddle NLP
基础自然语言处理(NLP)自然语言处理PaddleNLP-词向量应用展示自然语言处理(NLP)-前预训练时代的自监督学习自然语言处理PaddleNLP-预训练语言模型及应用自然语言处理PaddleNLP-文本语义相似度计算(ERNIE-Gram)自然语言处理PaddleNLP-词法分析技术及其应用自然语言处理PaddleNLP-快递单信息抽取理解自然语言处理PaddleNLP-信息抽取技术及应用自然语言处理PaddleNLP-基于预训练模型完成实体关系抽取--实践自然语言处理PaddleNLP-情感分析技术及应用-理论自然语言处理PaddleNLP-情感分析技术及应用SKEP-实践问答自然语言处理PaddleNLP-检索式文本问答-理论自然语言处理PaddleNLP-结构化数据问答-理论翻译自然语言处理PaddleNLP-文本翻译技术及应用-理论自然语言处理PaddleNLP-机器同传技术及应用-理论对话自然语言处理PaddleNLP-任务式对话系统-理论自然语言处理PaddleNLP-开放域对话系统-理论产业实践自然语言处理PaddleNLP-预训练模型产业实践课-理论什么是任务型对话:
任务型:用于帮助用户完成某领域的特定任务,例如订餐、查天气、订票等闲聊型:也称作开放域对话系统,目标是让用户持续的参与到交互过程,提供情感陪伴问答型:提供知识满足,具体类型比较多,如图谱问答、表格问答、文档问答等Pipeline型任务型对话系统什么是NLU?NLU(自然语言理解):是指将用户表述映射为结构化的语义表示,典型的结构化语义表示是意图+词槽的形式。意图:是指对话中用户想要表达的目的,比如订票,查天气等词槽:是指用户表述中,与任务相关的核心语义元素意图分类+词槽识别==>文本分类+序列标注什么是DST?DS(对话状态):是指将t时刻的对话表示为可供系统选择下一时刻动作信息的抽象信息(数据结构),典型而言就是每个槽值的取值分布情况(BelifState)。DST:对DS进行追踪,当前大多数工作采用BelifStatePipeline型任务式对话系统中的Policy对话策略是指根据DST估计的对话状态,通过预设的候选动作集,选择系统动作的过程。Policy中的典型方法典型方式:在离线阶段,通过监督学习或模拟学习在语料上进行学习在线阶段,通过强化学习的方式,与真实用户交互过程中学习用户模拟器在DPL中的应用定义:用户模拟器是另一套对话系统,其动作行为与真实用户类似,用来提供进行训练或评估的环境缺点:用户模拟器并不能完全模拟真实用户的对话习惯,它本身行为的有偏可能会导致学习到的是不是最优模型,从而在与真实用户交互时表现较差。Pipeline型任务式对话系统中的NLG什么是NLG?定义:自然语言生成的主要任务是将对话管理模块输出的抽象表达转换为句法合法、语义准确的自然语言句子,一般被视为一个条件语言生成任务。评估标准:人为标准:是否自然、是否多样,是否完整传达了语义、是否流畅,可读性是否好等机器指标:BLEU、perplexity、ROUGE、METEOR等虽然有多种机器评估指标,但实际上依然缺乏一种能够贴近人为感知的评估标准
端到端任务型对话系统什么是端到端任务型对话系统?
端到端任务型对话系统是受开放域对话领域的进步启发,使用模型以端到端的方式而不是分模块优化的方式构建任务型对话系统。虽然大多数端到端任务型对话系统采用了Seq2Seq框架,但端到端任务型对话系统≠Seq2Seq模型端到端任务型对话系统--示例工业界的任务型对话系统UNIT任务式对话技术发展UNIT--面向小样本的意图识别UNIT--TaskFlow:可编程对话流管理框架UNIT网站:https://ai.baidu.com/unit/home