AI人工智能、机器学习 面试题(2023最新版)
人工智能、机器学习面试题总结,侧重于理解,回答供参考,欢迎讨论。
General深度学习(DeepLearning,DL)和机器学习(MachineLearning,ML)的关系是什么?
深度学习是机器学习的子类,是利用深度神经网络提取特征进行学习。机器学习还有其他非深度学习的技术,例如SVM、DecisionTree、NaiveBayes等。
深度学习流行的框架有哪些?各有什么特点?
TensorFlow:最主流,生态支持完备,硬件友好,同时有GoogleBrain研究支撑。
PyTorch:后起之秀,融合了Torch和Caffe2,和python混合编程体验好,学术界宠儿。
以及国内的PaddlePaddle,MindSpore等。
精确率(Precision)和召回率(Recall)以及F1值/分数(F1value/score)是什么?查准率和查全率呢?
先解释缩写:
TP:TruePositive,预测为真,结果也为真的数量;
FP:FalsePositive,预测为真,结果为假的数量;
FN:FalseNegative,预测为假,结果为真的数量。
精确率:P=TP/(TP+FP),西瓜书里也叫查准率;
召回率:R=TP/(TP+FN),西瓜书里也叫查全率。
F1值:F1=2*(P*R)/(P+R),精确率和召回率的调和均值。
可以看出,精确率和召回率的区别在于分母,精确率关心的是预测为真的数量中有多少真正对的(而不是其他类错误预测为这一类),而召回率关注的是这一类有多少判断正确了(而不是判断为其他类了)。直观理解:召回的意思是,如果这一类错误预测为其他类了,要找回来,即为召回。
AUC指标与precesion/recall/F1评估模型的手段有何区别,什么情况下应该用哪一种?
AUC是AreaunderCurve,曲线下面积。这个曲线横纵坐标分别为TPR和FPR.
TPR:TruePositiveRate,即recall;TPR=TP/(TP+FN),表示正确分类的正样本所占所有正样本的比例;
FPR:FalsePositiveRate,FPR=FP/(FP+TN),表示错误分类的负样本占所有负样本的比例。
对于同一个模型,TPR和FPR是一对跷跷板,可以通过修改阈值的方式来调节,例如调低分类为正样本的门槛,则更多的样本被分类为正样本,TP会增加,导致FPR增加;但此时,FP也会增加,导致FPR增加。
F1score相当于是综合了precision和recall,使用默认阈值;AUC是一个模型更为全面的指标,考虑了不同的阈值。但由于AUC比较复杂,一般情况下使用F1score就可以了。
SGD中S代表什么,如何理解?
S即为stochastic,随机梯度是指用来计算梯度的输入数据是随机选取的一部分(batch),而不是所有的数据。使用所有数据一方面计算量巨大,不太现实,另一方面容易陷入局部极小值难以跳出,随机batch的梯度反而增加了跳出局部极限值的可能性,从而获得更好的结果。
激活函数(ActivationFunction)有什么用处,有哪几种?
提供了非线性单元,使得整个网络变为非线性,从而能够解决各种非线性问题。
有ReLU/PReLU/Relu6/Sigmond/Tanh/SELU/SWISH等,目前最常用的还是ReLU,复杂度低,效果还可以。
监督学习和无监督学习的区别?请分别举例。
监督学习必须要标注,使用标记数据牵引训练,例如LR、SVM;
无监督机器学习不需要标注,模型通过自己发现数据的内部关系,例如Kmeans。
机器学习/深度学习项目中所需的步骤?
采集数据、预处理与特征选择、选择模型、训练模型、评估模型、诊断模型、调整参数,最后是预测、上线运行。
神经网络参数初始化方法有哪些,适用范围是什么?
weight最常用的是由KaimingHe提出的MSRA,在Xavier的基础上改进。Xavier假设激活函数关于原点中心对称,而常用的ReLU并不满足该条件。MSRA初始化是一个均值为0,方差为sqrt(2/Fin)的高斯分布。Xavier初始化是一个均匀分布U[-sqrt(6/(Fin+Fout))],Fin、Fout代表扇入、扇出,即为输入和输出的维度。
bias一般初始化为0,另外提醒一下如果conv后面接bn,可以省略bias,是等价的,有兴趣的可以自己推导一下。
因此,如果激活函数使用ReLU,则推荐使用MSRA;如果激活函数使用tanh等中心对称的函数,则使用Xavier初始化。
CV列举深度学习中常用的分类网络、检测网络、分割网络(语义分割、多实例分割)、超分网络。
分类网络:ResNet,SENet,EfficientNet等;
检测网络:FasterRCNN,YOLO,SSD等;
分割网络:MaskRCNN、UNet等;
超分网络:SRCNN、FSRCNN等。
具体网络介绍可以关注我的公众号和博客。
ResNet解决了什么问题?结构有何特点?
ResNet提出是为了解决或缓解深度神经网络训练中的梯度消失问题。通过增加shortcut,使得梯度多了一个传递的途径,让更深的网络成为可能。
在图像处理中为什么要使用卷积神经网络(CNN)而不是全连接网络(FC)?
首先,CNN相对于FC的参数量减少非常多,对于图像这种输入维度相对较大的任务,全部使用FC不现实,另外参数量过多而数据规模跟不上非常容易过拟合,网络本身也难以训练。图像本身附近像素的关联信息很多,CNN正好能够提取一个区域数据的特征,并且能够通过不断加深扩展感受野,使得其适用于图像任务。
分类网络和检测网络的区别?
任务不同,Loss函数不同,一般分类网络使用crossentropyloss,而检测网络的loss是分类的loss和检测框回归loss的加权和。
损失函数(loss函数)有什么作用?
牵引网络的更新,梯度是loss函数相对于权重的偏导。
网络训练时为何要加正则化,有哪些手段?
目的是防止网络过拟合。
手段有:
L1/L2正则化
Dropout
Earlystop
数据增强也可以视为是一种正则化,例如图像的平移、旋转、缩放等。
如何判断网络是过拟合还是欠拟合?有哪些手段改善?
通过train和test的准确率来判断,如果train和test准确率差距非常大,即train的准确率接近100%,而test较差,说明过拟合;如果train的准确率就较差,说明欠拟合。
过拟合可以通过增加数据,或者加正则化缓解;欠拟合可以增加网络容量,例如加深或者加宽网络来改善。
BatchNormalization有什么作用?使用时需要注意什么?
BN的主要作用有:
加速网络的训练(缓解梯度消失,支持更大的学习率)
防止过拟合
降低了参数初始化的要求
使用时需要注意train时更新bn的相关参数,而test时要固定,一般有is_training的flag.
梯度爆炸有哪些解决办法?
梯度截断(gradientclipping)
良好的参数初始化策略
调小lr
相关文章
人工智能技术分析
人工智能机器学习深度学习
第六届世界互联网大会乌镇峰会简评
华为人工智能战略分析:2019华为全连接大会
阿里含光VS华为昇腾:AI芯片路在何方
AI人工智能三要素:数据、算力和算法
计算机视觉(CV)任务介绍:分类、检测、分割、超分、关键点识别、图像生成、度量学习
理解深度学习中的分类网络:LeNet
PyTorch1.3
tf.GradientTape详解:梯度求解利器
TensorFlow高阶API和低阶API
TensorFlow静态图和eager机制
TensorFlow2.0
TensorFlow高阶API和低阶API
TensorFlow调试技巧
TensorFlow与PyTorch对比
PyCharm调试技巧
解读谷歌的AI杀手级专利:Dropout
AutoML算法分析(一):基于强化学习的算法
SENet详解
关于我
缘起:新的开始
公众号持续更新,欢迎订阅。
AI人工智能与大数据
人工智能面试题分享(含答案)
现在人工智能就业前景怎么样?学完人工智能相关课程好找工作吗?目前国内人工智能领域正在高速发展,各大企业都在积极布局人工智能技术应用。想要从事人工智能相关工作,不但要了解国内整体的发展方向。而进入企业唯有基础才是最好的敲门砖。今天在黑马程序员论坛找了一些关于人工智能的面试题。希望对近期求知的小伙伴有一定的帮助。
人工智能面试题分享(含答案)1、深度学习框架TensorFlow中有哪四种常用交叉熵?答:tf.nn.weighted_cross_entropy_with_logitstf.nn.sigmoid_cross_entropy_with_logitstf.nn.softmax_cross_entropy_with_logitstf.nn.sparse_softmax_cross_entropy_with_logits
2、什么叫过拟合,避免过拟合都有哪些措施?答:过拟合:就是在机器学习中,我么测试模型的时候,提高了在训练数据集的表现力时候,但是在训练集上的表现力反而下降了。解决方案:1.正则化;2.在训练模型过程中,调节参数。学习率不要太大;3.对数据进行交叉验证;4.选择适合训练集合测试集数据的百分比,选取合适的停止训练标准,使对机器的训练在合适;5.在神经网络模型中,我们可以减小权重;
3、什么是核函数?核函数是将线性不可分的特征隐射到高位特征空间,从而让支持向量机在这个高维空间线性可分,也就是使用核函数可以向高维空间映射并解决非线性的分类问题。包括线性核函数,多项式核函数,高斯核函数等,其中高斯核函数最为常用。
4、深度学习框架TensorFlow中常见的核函数都有哪些?SVM高斯核函数,应为如果想要分割非线性数据集,改变线性分类器隐射到数据集,就要改变SVM损失函数中的核函数线性核函数多项式核函数
5、朴素贝叶斯方法的优势是什么?朴素贝叶斯有稳定的分类效率对于小规模的数据表现很好,能处理多分类问题,可以再数据超出内存时,去增量训练对缺失数据不太敏感,算法比较简单,常用于文本分类。
6、什么是监督学习的标准方法?所有的回归算法和分类算法都属于监督学习并且明确的给给出初始值在训练集中有特征和标签,并且通过训练获得一个模型,在面对只有特征而没有标签的数据时,能进行预测。
7、在机器学习中,模型的选择是指什么?根据一组不同复杂度的模型表现,从某个模型中挑选最好的模型。选择一个最好模型后,在新的数据上来评价其预测误差等评价和指标。
8、图形数据库Neo4J的优劣势?优势:1.更快的数据库操作,前提是数据量足够大。2.数据更加直观,相应的SQL语句更加好写。3.更灵活,不管有什么新的数据需要储存,都是一律的节点,只需要考虑节点属性和边属性。4.数据库的操作不会随着数据库的增大有明显的降低。劣势:1.极慢的插入速度。2.超大的节点。当一个节点的边非常多,有关这个节点的操作速度就会大大下降
9、LR和SVM的联系与区别是什么?都是分类算法如果不考虑核函数,LR和SVM都是线性分类算法,也就是说他们的分类决策面都是线性的。LR和SVM都是监督学习算法LR和SVM的损失函数不同SVM只考虑局部的边界线附近的点,LR考虑全局,远离的点对边界线的确定也起作用。
10、什么是聚类,聚类的应用场景?聚类是指根据一定的准则,把一份事物按照这个准则归纳成互不重合的几份,机器学习中,聚类指按照一个标准,这个标准通常是相似性,把样本分成几份,是得相似程度高的聚在一起,相似程度低的互相分开。聚类的应用场景,求职信息完善(有大约10万份优质简历,其中部分简历包含完整的字段,部分简历在学历,公司规模,薪水,等字段有些置空顶。希望对数据进行学习,编码与测试,挖掘出职位路径的走向与规律,形成算法模型,在对数据中置空的信息进行预测。)
以上就是关于人工智能的10到面试题。后续会和大家分享更多关于人工智能学习、面试等方面的内容。
后面会继续给大家分享一些面试的小技巧记得给我点赞哈!