AI人工智能专业词汇集
机器之心原创,机器之心编辑部,转自机器之心公众号。作为最早关注人工智能技术的媒体,机器之心在编译国外技术博客、论文、专家观点等内容上已经积累了超过两年多的经验。期间,从无到有,机器之心的编译团队一直在积累专业词汇。虽然有很多的文章因为专业性我们没能尽善尽美的编译为中文呈现给大家,但我们一直在进步、一直在积累、一直在提高自己的专业性。
两年来,机器之心编译团队整理过翻译词汇对照表「红宝书」,编辑个人也整理过类似的词典。而我们也从机器之心读者留言中发现,有些人工智能专业词汇没有统一的翻译标准,这可能是因地区、跨专业等等原因造成的。举个例子,DeepMind 的一篇论文中有个词汇为 differentiable boundary tree,当时机器之心的翻译为可微分界树,但后来有读者表示这样的译法如果不保留英文很难明白表达的意思且建议翻译为可微分边界树。
因此,我们想把机器之心内部积累的人工智能专业词汇中英对照表开放给大家,希望为大家写论文、中文博客、阅读文章提供帮助。同时,这也是一份开放的表单,希望越来越多的人能够提供增添、修改建议,为人工智能的传播助力。
项目地址:https://github.com/jiqizhixin/Artificial-Intelligence-Terminology
组织形式读者在此项目中,可通过以上表盘查看自己想要了解的专业词汇。在单个首字母中,表格的组织形式为:英文/缩写、汉语、来源&扩展。
来源&扩展是对该词汇的注解,内容为机器之心往期的相关文章。例如下图所示的「算法」,我们关联到的三篇文章是《回归、分类与聚类:三大方向剖解机器学习算法的优缺点》和《机器学习算法附速查表》和《深度学习算法全景图:从理论证明其正确性》。因此,我们希望不仅能提供相对应的术语,同时还希望能为读者提供每一个术语的来源和概念上的扩展。但由于这一部分工作量较大,我们还将与读者共同推进这一部分扩展的进程。
准确性本项目中所有英文专业词汇对照的中文都来自机器之心编译的文章和系列机器学习教科书(如周志华的《机器学习》和李航的《统计学习方法》等),我们力求在提供准确翻译的同时保留最常用的形式。同时,为了保证词汇翻译的准确性,我们将此项目向读者开源,并希望能与读者共同迭代术语的准确度。除此之外,我们还将为每一个词汇提供来源与扩展进一步提升词汇的置信度。
机器之心术语编译标准因为该项目很多术语都是机器之心平常编译文章所积累的,所以我们首先需要向读者说明机器之心术语编译的标准。
1. 常见术语的编译标准
机器之心常见术语的编译首先会确保术语的正确性,其次再考虑术语的传播广度。例如常见术语。logistic regression,首先机器之心会保证该术语的准确度。我们常见 logistic regression 会翻译为逻辑回归,但中文「逻辑」与 logistic 的含义还是有些差别,因此我们并不太倾向于采用这种译法。在准确度的基础上,我们会考虑术语的传播广度。例如有学者建议可以将 logistic regression 译为对数几率回归,但鉴于该译法的传播度不广,看到中文并不会马上检索到对应英文和概念,所以我们最终在常见术语编译标准下将 logistic regression 译为 logistical 回归。机器之心在对常见术语编译时并不会保留英文,也不会做进一步说明。
2. 非常见术语的编译标准
机器之心在编译技术文章或论文时,常常会遇到非常见的术语。因为像论文那样的文章是在特定领域下为解决特定问题而规范化书写的,所以就会存在较多的非常见的术语。而机器之心在编译非常见术语时,唯一的标准就是准确性,通常我们也会保留英文。因为非常见术语通常是数学、神经科学和物理学等领域上的专业术语,机器之心会尽可能地借鉴其他领域内的译法和意义而确定如何编译。例如 fixed-point theorem,在参考数学的情况下,我们会更倾向于译为不动点定理,fixed-point 译为不动点而不是定点。
3. 歧义术语的编译标准
还有很多术语其实是有歧义的,而对于这一类词,机器之心的编译标准会根据语义进行确定,因此也会有一些误差。例如 bias 在描述神经网络层级单元时可以译为偏置项。而在描述训练误差和与叉验证误差间的关系或学习曲线时,bias 可以译为偏差。这样的例子还有很多,比如 Stationary 在马尔可夫模型中可译为稳态分布(Stationary distribution),在最优化问题中可译为驻点(Stationary point),而在涉及博弈论或对抗性训练时,其又可能表达为静态。
以上是机器之心大概编译术语的标准,虽然我们在常用术语的编译上错误率相对较少,但在非常见术语和歧义术语上仍然会出现一些错误。尤其是在非常见术语的编译上,没有特定的背景知识很容易在编译上出现误差。因此我们希望能与读者共同加强术语的编译质量。
词汇更新本词汇库目前拥有的专业词汇共计 500 个,主要为机器学习基础概念和术语,同时也是该项目的基本词汇。机器之心将继续完善术语的收录和扩展阅读的构建。词汇更新主要分为两个阶段,第一阶段机器之心将继续完善基础词汇的构建,即通过权威教科书或其它有公信力的资料抽取常见术语。第二阶段机器之心将持续性地把编译论文或其他资料所出现的非常见术语更新到词汇表中。
读者的反馈意见和更新建议将贯穿整个阶段,并且我们将在项目致谢页中展示对该项目起积极作用的读者。因为我们希望术语的更新更具准确度和置信度,所以我们希望读者能附上该术语的来源地址与扩展地址。因此,我们能更客观地更新词汇,并附上可信的来源与扩展。
LetterA
Accumulatederrorbackpropagation累积误差逆传播ActivationFunction激活函数AdaptiveResonanceTheory/ART自适应谐振理论Addictivemodel加性学习AdversarialNetworks对抗网络AffineLayer仿射层Affinitymatrix亲和矩阵Agent代理/智能体Algorithm算法Alpha-betapruningα-β剪枝Anomalydetection异常检测Approximation近似AreaUnderROCCurve/AUCRoc曲线下面积ArtificialGeneralIntelligence/AGI通用人工智能ArtificialIntelligence/AI人工智能Associationanalysis关联分析Attentionmechanism注意力机制Attributeconditionalindependenceassumption属性条件独立性假设Attributespace属性空间Attributevalue属性值Autoencoder自编码器Automaticspeechrecognition自动语音识别Automaticsummarization自动摘要Averagegradient平均梯度Average-Pooling平均池化LetterB
BackpropagationThroughTime通过时间的反向传播Backpropagation/BP反向传播Baselearner基学习器Baselearningalgorithm基学习算法BatchNormalization/BN批量归一化Bayesdecisionrule贝叶斯判定准则BayesModelAveraging/BMA贝叶斯模型平均Bayesoptimalclassifier贝叶斯最优分类器Bayesiandecisiontheory贝叶斯决策论Bayesiannetwork贝叶斯网络Between-classscattermatrix类间散度矩阵Bias偏置/偏差Bias-variancedecomposition偏差-方差分解Bias-VarianceDilemma偏差–方差困境Bi-directionalLong-ShortTermMemory/Bi-LSTM双向长短期记忆Binaryclassification二分类Binomialtest二项检验Bi-partition二分法Boltzmannmachine玻尔兹曼机Bootstrapsampling自助采样法/可重复采样/有放回采样Bootstrapping自助法Break-EventPoint/BEP平衡点LetterC
Calibration校准Cascade-Correlation级联相关Categoricalattribute离散属性Class-conditionalprobability类条件概率Classificationandregressiontree/CART分类与回归树Classifier分类器Class-imbalance类别不平衡Closed-form闭式Cluster簇/类/集群Clusteranalysis聚类分析Clustering聚类Clusteringensemble聚类集成Co-adapting共适应Codingmatrix编码矩阵COLT国际学习理论会议Committee-basedlearning基于委员会的学习Competitivelearning竞争型学习Componentlearner组件学习器Comprehensibility可解释性ComputationCost计算成本ComputationalLinguistics计算语言学Computervision计算机视觉Conceptdrift概念漂移ConceptLearningSystem/CLS概念学习系统Conditionalentropy条件熵Conditionalmutualinformation条件互信息ConditionalProbabilityTable/CPT条件概率表Conditionalrandomfield/CRF条件随机场Conditionalrisk条件风险Confidence置信度Confusionmatrix混淆矩阵Connectionweight连接权Connectionism连结主义Consistency一致性/相合性Contingencytable列联表Continuousattribute连续属性Convergence收敛Conversationalagent会话智能体Convexquadraticprogramming凸二次规划Convexity凸性Convolutionalneuralnetwork/CNN卷积神经网络Co-occurrence同现Correlationcoefficient相关系数Cosinesimilarity余弦相似度Costcurve成本曲线CostFunction成本函数Costmatrix成本矩阵Cost-sensitive成本敏感Crossentropy交叉熵Crossvalidation交叉验证Crowdsourcing众包Curseofdimensionality维数灾难Cutpoint截断点Cuttingplanealgorithm割平面法LetterD
Datamining数据挖掘Dataset数据集DecisionBoundary决策边界Decisionstump决策树桩Decisiontree决策树/判定树Deduction演绎DeepBeliefNetwork深度信念网络DeepConvolutionalGenerativeAdversarialNetwork/DCGAN深度卷积生成对抗网络Deeplearning深度学习Deepneuralnetwork/DNN深度神经网络DeepQ-Learning深度Q学习DeepQ-Network深度Q网络Densityestimation密度估计Density-basedclustering密度聚类Differentiableneuralcomputer可微分神经计算机Dimensionalityreductionalgorithm降维算法Directededge有向边Disagreementmeasure不合度量Discriminativemodel判别模型Discriminator判别器Distancemeasure距离度量Distancemetriclearning距离度量学习Distribution分布Divergence散度Diversitymeasure多样性度量/差异性度量Domainadaption领域自适应Downsampling下采样D-separation(Directedseparation)有向分离Dualproblem对偶问题Dummynode哑结点DynamicFusion动态融合Dynamicprogramming动态规划LetterE
Eigenvaluedecomposition特征值分解Embedding嵌入Emotionalanalysis情绪分析Empiricalconditionalentropy经验条件熵Empiricalentropy经验熵Empiricalerror经验误差Empiricalrisk经验风险End-to-End端到端Energy-basedmodel基于能量的模型Ensemblelearning集成学习Ensemblepruning集成修剪ErrorCorrectingOutputCodes/ECOC纠错输出码Errorrate错误率Error-ambiguitydecomposition误差-分歧分解Euclideandistance欧氏距离Evolutionarycomputation演化计算Expectation-Maximization期望最大化Expectedloss期望损失ExplodingGradientProblem梯度爆炸问题Exponentiallossfunction指数损失函数ExtremeLearningMachine/ELM超限学习机LetterF
Factorization因子分解Falsenegative假负类Falsepositive假正类FalsePositiveRate/FPR假正例率Featureengineering特征工程Featureselection特征选择Featurevector特征向量FeaturedLearning特征学习FeedforwardNeuralNetworks/FNN前馈神经网络Fine-tuning微调Flippingoutput翻转法Fluctuation震荡Forwardstagewisealgorithm前向分步算法Frequentist频率主义学派Full-rankmatrix满秩矩阵Functionalneuron功能神经元LetterG
Gainratio增益率Gametheory博弈论Gaussiankernelfunction高斯核函数GaussianMixtureModel高斯混合模型GeneralProblemSolving通用问题求解Generalization泛化Generalizationerror泛化误差Generalizationerrorbound泛化误差上界GeneralizedLagrangefunction广义拉格朗日函数Generalizedlinearmodel广义线性模型GeneralizedRayleighquotient广义瑞利商GenerativeAdversarialNetworks/GAN生成对抗网络GenerativeModel生成模型Generator生成器GeneticAlgorithm/GA遗传算法Gibbssampling吉布斯采样Giniindex基尼指数Globalminimum全局最小GlobalOptimization全局优化Gradientboosting梯度提升GradientDescent梯度下降Graphtheory图论Ground-truth真相/真实LetterH
Hardmargin硬间隔Hardvoting硬投票Harmonicmean调和平均Hessematrix海塞矩阵Hiddendynamicmodel隐动态模型Hiddenlayer隐藏层HiddenMarkovModel/HMM隐马尔可夫模型Hierarchicalclustering层次聚类Hilbertspace希尔伯特空间Hingelossfunction合页损失函数Hold-out留出法Homogeneous同质Hybridcomputing混合计算Hyperparameter超参数Hypothesis假设Hypothesistest假设验证LetterI
ICML国际机器学习会议Improvediterativescaling/IIS改进的迭代尺度法Incrementallearning增量学习Independentandidenticallydistributed/i.i.d.独立同分布IndependentComponentAnalysis/ICA独立成分分析Indicatorfunction指示函数Individuallearner个体学习器Induction归纳Inductivebias归纳偏好Inductivelearning归纳学习InductiveLogicProgramming/ILP归纳逻辑程序设计Informationentropy信息熵Informationgain信息增益Inputlayer输入层Insensitiveloss不敏感损失Inter-clustersimilarity簇间相似度InternationalConferenceforMachineLearning/ICML国际机器学习大会Intra-clustersimilarity簇内相似度Intrinsicvalue固有值IsometricMapping/Isomap等度量映射Isotonicregression等分回归IterativeDichotomiser迭代二分器LetterK
Kernelmethod核方法Kerneltrick核技巧KernelizedLinearDiscriminantAnalysis/KLDA核线性判别分析K-foldcrossvalidationk折交叉验证/k倍交叉验证K-MeansClusteringK–均值聚类K-NearestNeighboursAlgorithm/KNNK近邻算法Knowledgebase知识库KnowledgeRepresentation知识表征LetterL
Labelspace标记空间Lagrangeduality拉格朗日对偶性Lagrangemultiplier拉格朗日乘子Laplacesmoothing拉普拉斯平滑Laplaciancorrection拉普拉斯修正LatentDirichletAllocation隐狄利克雷分布Latentsemanticanalysis潜在语义分析Latentvariable隐变量Lazylearning懒惰学习Learner学习器Learningbyanalogy类比学习Learningrate学习率LearningVectorQuantization/LVQ学习向量量化Leastsquaresregressiontree最小二乘回归树Leave-One-Out/LOO留一法linearchainconditionalrandomfield线性链条件随机场LinearDiscriminantAnalysis/LDA线性判别分析Linearmodel线性模型LinearRegression线性回归Linkfunction联系函数LocalMarkovproperty局部马尔可夫性Localminimum局部最小Loglikelihood对数似然Logodds/logit对数几率LogisticRegressionLogistic回归Log-likelihood对数似然Log-linearregression对数线性回归Long-ShortTermMemory/LSTM长短期记忆Lossfunction损失函数LetterM
Machinetranslation/MT机器翻译Macron-P宏查准率Macron-R宏查全率Majorityvoting绝对多数投票法Manifoldassumption流形假设Manifoldlearning流形学习Margintheory间隔理论Marginaldistribution边际分布Marginalindependence边际独立性Marginalization边际化MarkovChainMonteCarlo/MCMC马尔可夫链蒙特卡罗方法MarkovRandomField马尔可夫随机场Maximalclique最大团MaximumLikelihoodEstimation/MLE极大似然估计/极大似然法Maximummargin最大间隔Maximumweightedspanningtree最大带权生成树Max-Pooling最大池化Meansquarederror均方误差Meta-learner元学习器Metriclearning度量学习Micro-P微查准率Micro-R微查全率MinimalDescriptionLength/MDL最小描述长度Minimaxgame极小极大博弈Misclassificationcost误分类成本Mixtureofexperts混合专家Momentum动量Moralgraph道德图/端正图Multi-classclassification多分类Multi-documentsummarization多文档摘要Multi-layerfeedforwardneuralnetworks多层前馈神经网络MultilayerPerceptron/MLP多层感知器Multimodallearning多模态学习MultipleDimensionalScaling多维缩放Multiplelinearregression多元线性回归Multi-responseLinearRegression/MLR多响应线性回归Mutualinformation互信息LetterN
Naivebayes朴素贝叶斯NaiveBayesClassifier朴素贝叶斯分类器Namedentityrecognition命名实体识别Nashequilibrium纳什均衡Naturallanguagegeneration/NLG自然语言生成Naturallanguageprocessing自然语言处理Negativeclass负类Negativecorrelation负相关法NegativeLogLikelihood负对数似然NeighbourhoodComponentAnalysis/NCA近邻成分分析NeuralMachineTranslation神经机器翻译NeuralTuringMachine神经图灵机Newtonmethod牛顿法NIPS国际神经信息处理系统会议NoFreeLunchTheorem/NFL没有免费的午餐定理Noise-contrastiveestimation噪音对比估计Nominalattribute列名属性Non-convexoptimization非凸优化Nonlinearmodel非线性模型Non-metricdistance非度量距离Non-negativematrixfactorization非负矩阵分解Non-ordinalattribute无序属性Non-SaturatingGame非饱和博弈Norm范数Normalization归一化Nuclearnorm核范数Numericalattribute数值属性LetterO
Objectivefunction目标函数Obliquedecisiontree斜决策树Occam’srazor奥卡姆剃刀Odds几率Off-Policy离策略Oneshotlearning一次性学习One-DependentEstimator/ODE独依赖估计On-Policy在策略Ordinalattribute有序属性Out-of-bagestimate包外估计Outputlayer输出层Outputsmearing输出调制法Overfitting过拟合/过配Oversampling过采样LetterP
Pairedt-test成对t检验Pairwise成对型PairwiseMarkovproperty成对马尔可夫性Parameter参数Parameterestimation参数估计Parametertuning调参Parsetree解析树ParticleSwarmOptimization/PSO粒子群优化算法Part-of-speechtagging词性标注Perceptron感知机Performancemeasure性能度量PlugandPlayGenerativeNetwork即插即用生成网络Pluralityvoting相对多数投票法Polaritydetection极性检测Polynomialkernelfunction多项式核函数Pooling池化Positiveclass正类Positivedefinitematrix正定矩阵Post-hoctest后续检验Post-pruning后剪枝potentialfunction势函数Precision查准率/准确率Prepruning预剪枝Principalcomponentanalysis/PCA主成分分析Principleofmultipleexplanations多释原则Prior先验ProbabilityGraphicalModel概率图模型ProximalGradientDescent/PGD近端梯度下降Pruning剪枝Pseudo-label伪标记LetterQ
QuantizedNeuralNetwork量子化神经网络Quantumcomputer量子计算机QuantumComputing量子计算QuasiNewtonmethod拟牛顿法LetterR
RadialBasisFunction/RBF径向基函数RandomForestAlgorithm随机森林算法Randomwalk随机漫步Recall查全率/召回率ReceiverOperatingCharacteristic/ROC受试者工作特征RectifiedLinearUnit/ReLU线性修正单元RecurrentNeuralNetwork循环神经网络Recursiveneuralnetwork递归神经网络Referencemodel参考模型Regression回归Regularization正则化Reinforcementlearning/RL强化学习Representationlearning表征学习Representertheorem表示定理reproducingkernelHilbertspace/RKHS再生核希尔伯特空间Re-sampling重采样法Rescaling再缩放ResidualMapping残差映射ResidualNetwork残差网络RestrictedBoltzmannMachine/RBM受限玻尔兹曼机RestrictedIsometryProperty/RIP限定等距性Re-weighting重赋权法Robustness稳健性/鲁棒性Rootnode根结点RuleEngine规则引擎Rulelearning规则学习LetterS
Saddlepoint鞍点Samplespace样本空间Sampling采样Scorefunction评分函数Self-Driving自动驾驶Self-OrganizingMap/SOM自组织映射Semi-naiveBayesclassifiers半朴素贝叶斯分类器Semi-SupervisedLearning半监督学习semi-SupervisedSupportVectorMachine半监督支持向量机Sentimentanalysis情感分析Separatinghyperplane分离超平面SigmoidfunctionSigmoid函数Similaritymeasure相似度度量Simulatedannealing模拟退火Simultaneouslocalizationandmapping同步定位与地图构建SingularValueDecomposition奇异值分解Slackvariables松弛变量Smoothing平滑Softmargin软间隔Softmarginmaximization软间隔最大化Softvoting软投票Sparserepresentation稀疏表征Sparsity稀疏性Specialization特化SpectralClustering谱聚类SpeechRecognition语音识别Splittingvariable切分变量Squashingfunction挤压函数Stability-plasticitydilemma可塑性-稳定性困境Statisticallearning统计学习Statusfeaturefunction状态特征函Stochasticgradientdescent随机梯度下降Stratifiedsampling分层采样Structuralrisk结构风险Structuralriskminimization/SRM结构风险最小化Subspace子空间Supervisedlearning监督学习/有导师学习supportvectorexpansion支持向量展式SupportVectorMachine/SVM支持向量机Surrogatloss替代损失Surrogatefunction替代函数Symboliclearning符号学习Symbolism符号主义Synset同义词集LetterT
T-DistributionStochasticNeighbourEmbedding/t-SNET–分布随机近邻嵌入Tensor张量TensorProcessingUnits/TPU张量处理单元Theleastsquaremethod最小二乘法Threshold阈值Thresholdlogicunit阈值逻辑单元Threshold-moving阈值移动TimeStep时间步骤Tokenization标记化Trainingerror训练误差Traininginstance训练示例/训练例Transductivelearning直推学习Transferlearning迁移学习Treebank树库Tria-by-error试错法Truenegative真负类Truepositive真正类TruePositiveRate/TPR真正例率TuringMachine图灵机Twice-learning二次学习LetterU
Underfitting欠拟合/欠配Undersampling欠采样Understandability可理解性Unequalcost非均等代价Unit-stepfunction单位阶跃函数Univariatedecisiontree单变量决策树Unsupervisedlearning无监督学习/无导师学习Unsupervisedlayer-wisetraining无监督逐层训练Upsampling上采样LetterV
VanishingGradientProblem梯度消失问题Variationalinference变分推断VCTheoryVC维理论Versionspace版本空间Viterbialgorithm维特比算法VonNeumannarchitecture冯·诺伊曼架构LetterW
WassersteinGAN/WGANWasserstein生成对抗网络Weaklearner弱学习器Weight权重Weightsharing权共享Weightedvoting加权投票法Within-classscattermatrix类内散度矩阵Wordembedding词嵌入Wordsensedisambiguation词义消歧LetterZ
Zero-datalearning零数据学习Zero-shotlearning零次学习