语音识别入门推荐文献【转】语音识别论文参考文献近几年怎么写的

发表时间：2023-07-26 03:15:55

语音识别入门推荐文献【转】

ReadinglistfromNCMMSCSpeechgroup

１、PaperRefereeAreaandnotesLink

GeorgeE.Dahl,DongYu,LiDeng,andAlexAcero,Context-DependentPre-TrainedDeepNeuralNetworksforLarge-VocabularySpeechRecognition,2011,IEEETransonASLP.Vol.20,No.1.贾磊（百度）推动DNN应用于工业级ASR http://research.microsoft.com/pubs/144412/dbn4lvcsr-transaslp.pdf

LawrenceR.Rabiner,AtutorialonhiddenMarkovmodelsandselectedapplicationsinspeechrecognition谢磊（西工大）HMM http://www.cs.ubc.ca/~murphyk/Bayes/rabiner.pdf

End-to-EndText-DependentSpeakerVerificationGeorgHeigold,IgnacioMoreno,SamyBengio,NoamShazeer肖雄（南洋理工大学）这篇文章用神经网络来对不同长度的句子提取固定长度的向量（类似ivector）的作用。

RapidSpeakerAdaptationinEigenvoiceSpace苏腾荣（华米）对后面的基于超矢量的方法都有影响

G.Hinton,L.Deng,D.Yuetal.,“Deepneuralnetworksforacousticmodelinginspeechrecognition:Thesharedviewsoffourresearchgroups,”SignalProcessingMagazine,IEEE,vol.29,no.6,pp.82-97,2012.邹月娴（北大深圳）DNN声学模型

Speechrecognitionwithweightedfinite-statetransducers苏腾荣（华米）ASR的标配 http://www.cslu.ogi.edu/~zak/cs506-lvr/mohri-wfst_asr.pdf

SpeechRecognitionAlgorithmsUsingWeightedFinite-StateTransducersTakaakiHoriandAtsushiNakamuraSynthesisLecturesonSpeechandAudioProcessing,January2013,Vol.9,No.1,Pages1-162陶斐（UTD）ASR和WFST

Biing-HwangJuang,WuChou,Member,andChin-HuiLee，Minimumclassificationerrorratemethodsforspeechrecognition洪青阳（厦门大学）区分性训练MCE

DanielPovey.DiscriminativeTrainingforLargeVocabularySpeechRecognition.杨嵩（驰声科技）声学模型区分性训练

Has�0�0imSak,AndrewSenior,KanishkaRao,Franc�0�0oiseBeaufays,FastandAccurateRecurrentNeuralNetworkAcousticModelsforSpeechRecognition徐海华（南阳理工大学），苏牧（云知声）CTC

AlexGraves,SupervisedSequenceLabelingwithRecurrentNeuralNetworks.Phdthesis.汤本来（南开），李博（谷歌）LSTM，CTC

FastandAccurateRecurrentNeuralNetworkAcousticModelsforSpeechRecognition.Has�0�0imSak,AndrewSenior,KanishkaRao,Franc�0�0oiseBeaufays徐海华（南洋理工学）CTC http://arxiv.org/pdf/1507.06947.pdf

Lattice-basedoptimizationofsequenceclassificationcriteriaforneural-networkacousticmodelingbyBrianKingsbury,IBMWatson王广森（新加坡I2R）

MJFGales:MaximumlikelihoodlineartransformationsforHMM-basedspeechrecognition.《ComputerSpeech&Language》,1998,12(2):75–98钱彦旻（上海交大）MLLR

Woodland,P.C.:MaximumlikelihoodlinearregressionforspeakeradaptationofcontinuousdensityhiddenMarkovmodels.ComputerSpeechandLanguage9(2),

171-185||钱彦旻（上海交大）||MLLR||

TandemconnectionistfeatureextractionforconventionalHMMsystems，hermansky钱彦旻（上海交大）自适应

SubspaceGaussianmixturemodelsforspeechrecognition.Povey,D.钱彦旻（上海交大）dan的SGMM

Anovelschemeforspeakerrecognitionusingaphonetically-awaredeepneuralnetworkYLei,NScheffer,LFerrer,MMcLaren夏瑞（IntelLab）

CampbellWM,SturimDE,ReynoldsDA.SupportvectormachinesusingGMMsupervectorsforspeakerverification[J].SignalProcessingLetters,IEEE,2006,13(5):308-311.龙艳花（上海师范大学）基于SVM声纹识别方面的文章

CampbellWM,SturimDE,ReynoldsDA,etal.SVMbasedspeakerverificationusingaGMMsupervectorkernelandNAPvariabilitycompensation[C]//Acoustics,SpeechandSignalProcessing,2006.ICASSP2006Proceedings.2006IEEEInternationalConferenceon.IEEE,2006,1:I-I.龙艳花（上海师范大学）基于SVM声纹识别方面的文章

DouglasA.Reynolds,ThomasF.Quatieri,andRobertB.Dunn,SpeakerVerficationUsingAdaptedGaussianMixtureModels洪青阳（厦门大学）说话人识别，GMM-UBM

NajimDehak,PatrickKenny,R′edaDehak,PierreDumouchel,andPierreOuellet,Front-EndFactorAnalysisForSpeakerVerification洪青阳（厦门大学）说话人识别，i-vector

AnalysisofI-vectorLengthNormalizationinSpeakerRecognitionSystemsDanielGarcia-RomeroandCarolY.Espy-Wilson许敏强（阿里巴巴）lengthnormalization+PLDA

Within-ClassCovarianceNormalizationforSVM-basedSpeakerRecognitionAndrewO.Hatch,SachinKajarekar,andAndreasStolcke许敏强（阿里巴巴）speaker方向,这个论文的方法，不仅可以用于speaker，还可以推广到图像识别、分类等领域，效果明显

SilkeMWitt,SteveJYoung,Phone-levelpronunciationscoringandassessmentforinteractivelanguagelearning,2000,SpeechCommunication黄浩（新疆大学）GOP以及错误检测

S.M.Witt.UseofSpeechRecognitioninComputer-assistedLanguagelearning杨嵩（驰声科技）语音评测

AndrewJ.Hunt,AlanW.Black,Unitselectioninaconcatenativespeechsynthesissystemusingalargespeechdatabase,ICASSP1996.康永国（百度）拼接语音合成的典型工作

ZenH,TokudaK,BlackAW.Statisticalparametricspeechsynthesis[J].SpeechCommunication,2009,51(11):1039-1064.凌振华（中科大）HMM统计参数语音合成

TokudaK,NankakuY,TodaT,etal.SpeechsynthesisbasedonhiddenMarkovmodels[J].ProceedingsoftheIEEE,2013,101(5):1234-1252.凌振华（中科大）HMM统计参数语音合成

Zee,H.,Senior,A.,Schuster.M.2013,Statisticalparametricspeechsythesisuusingdeepneuralnetworks吴君如（华东师大），康永国（百度）

parametergenerationalgorithmsforHMM-basedspeechsynthesis,Proc.ofICASSP,pp.1315-1318,June2000康永国（百度）HMM统计参数语音合成

S.King,"Areadinglistofrecentadvancesinspeechsynthesis",Proc.ICPhS2015.武执正（爱丁堡大学），杨鹏（百度） https://www.internationalphoneticassociation.org/icphs-proceedings/ICPhS2015/Papers/ICPHS1043.pdf

statisticalparametricspeechsynthesis，HeigaZen杨辰雨（新加坡I2R）语音合成声学建模方面

ZHLing:DeepLearningforAcousticModelinginParametricSpeechGeneration.《SignalProcessingMagazineIEEE》,2015,32(3):35-52杨辰雨（新加坡I2R）语音合成声学建模方面

XuYi.SeparationoffunctionalcomponentsoftoneandintonationfromobservedF0patterns.林怡亭（Nuance）,李雅（中科院自动化所）

automaticsegmentationofspeechintosentencesandtopics.Speechcommunication,32(1),127-154.陈磊（ETS语音评测），谢磊（西工大）SRI使用Prosody信息做语音结构化切分的工作，GoogleScholar引用430

ToBI:AstandardforlabelingEnglishprosody杨辰雨（新加坡I2R）中英文韵律标注

chineseprosodyandprosodiclabelingofspontaneousspeech杨辰雨（新加坡I2R）C-ToBI3.0

ShrikanthS.NarayananandPanayiotisGeorgiou,BehavioralSignalProcessing:DerivingHumanBehavioralInformaticsfromSpeechandLanguage(2013),in:ProceedingsofIEEE,101:5(1203-1233)李明（中山大学）语音及多模态行为信号分析的综述性paper推荐给做情感计算和行为分析这一领域的人

Levelt.W,Roelofs.A,1999,Atheoryoflexicalaccessinspeechproduction.吴君如（华东师大）语言认知领域，本文为心理语言学界到90年代末为止，对人类语言产生心理过程实证研究结果及机制探讨最全面的总结，不少计算模型都以重现本文列举的效应为目标

AHighlyRobustAudioFingerprintingSystem，Pilips的JaapHaitsma朱磊（芋头科技）audiofingerprint

TomasMikolov,IlyaSutskever,KaiChen,GregCorrado,andJeffreyDean.DistributedRepresentationsofWordsandPhrasesandtheirCompositionality.InProceedingsofNIPS,2013.陈谐(剑桥）

DzmitryBahdanau,KyungHyunCho,YoshuaBengio,NeuralMachineTranslationByJointlyLearningToAlignAndTranslate肖雄（南洋理工大学）,徐海华（南洋理工大学）attentionmodelforMT http://arxiv.org/pdf/1409.0473.pdf

２、BookandThesis

《SpokenLanguageProcessing:AGuidetoTheory,Algorithm,andSystemDevelopment》黄学东何伟（中国传媒大学）钱彦旻（上海交大）

自然语言处理综论，danieljurafsky汪淼淼（阿里巴巴）

Speechenhancementtheoryandpractice,PhiliposC.Loizou,张学良（内蒙古大学）语音增强的书

Statisticalmethodsforspeechrecognition,Jenilek，金琴（中国人民大学）经典教材

HiddenMarkovModelsforSpeechRecognition(EdinburghUniversityPress1990)穆向禹（百度）

MachineLearningParadigmsforSpeechRecognition卢鲤（腾讯）用机器学习的观点看语音识别，框架非常清晰

《实用语音识别基础》，国防工业出版社王晶（北理工）

Text-to-speechsynthesis,PaulTaylor,UniversityofCambridge黄东延（新加坡）书对text-to-speech怎样work给了详细深入的解释

Acourseinphonetics,Ladefoged冯卉（天津大学）群内多人推荐

ACourseinPhonetics(7thEd.).P.Ladeforged&K.Johnson(2015).CengageLearning.顾文涛（南京师范大学）很好的入门级教科书

AcousticsandAuditoryPhonetics(3rdEd.).K.Johnson(2012).Wiley-Blackwell.顾文涛（南京师范大学）

ArticulatoryPhonetics.B.Gick,I.Wilson,&D.Derrick(2013).Wiley-Blackwell.顾文涛（南京师范大学）

实验语音学概要，实验语音学概要修订版熊子瑜（语言所），时秀娟（天津师大）

实验语音学基础教程，孔江平时秀娟（天津师大）

Phonetics，Reetz&Jongman孙锐欣（华东师大）国内李爱军老师等在翻译中文版

《实验语音学概要》吴宗济王磊（音乐雷达）等语音合成--音韵学

自然语言处理综论，DanielJurafsky

Duda的PatternClassification第二版，有中文版谢凌云（中国传媒大学）模式识别

《现代汉语音典》蔡莲红、孔江平王愈（捷通华声）

《汉语语调实验研究》2012年，作者林茂灿李爱军（社科院语言所）

在英语语调理论AM基础上对汉语语调的研究

Sun-AhJun写的prosodictopology，中科院声学所吕士楠老师将之翻译为中文版《韵律类型学》郝玉峰（海天瑞声）多语言韵律标注

KennethN.Stevens的AcousticPhonetics解炎陆（北京语言大学）从acoustic的角度阐述了各种发音的特征，原版太贵，希望国内能出版。

"Ladefoged《世界语音》时秀娟（天津师大）【荐书】PeterLadefoged《世界语音》

TheoryandApplicationsofDigitalSpeechProcessing,LawrenceRabiner，党建武（天津大学）

T.F.Quatieri,Discrete-timespeechsignalprocessing（英文版）王晶（北理工）经典的语音信号处理课程教材

《信号与系统》奥本海《SignalsandSystems》AlanV.Oppenheim陈谐(剑桥）

MicrophoneArrays:SignalProcessingTechniquesandApplications(DigitalSignalProcessing)byMichaelBrandstein,DarrenWard,Springer,2001.李军锋（中科院声学所）语音信号处理领域

Patternrecognitionandmeachinelearning王东（清华）机器学习领域经典大作

Machinelearningaprobabilisticperspective，machinelearningalgorithmicperspective卢鲤（腾讯）

Introductiontostatisticalpatternrecognition.KeinosukeFukunaga朱璇（三星北京研究院）模式识别这本书对于特征空间的表述非常清晰，深入浅出，很适合初学者。

Anintroductionforsupportvectormachine朱璇（三星北京研究院）svm

步尚全《基础泛函分析》邓侃(思昂教育）泛函

，北京大学出版社明怀平（新加坡I2R）

DanielPovey,"DiscriminativeTrainingforLargeVocabularySpeechRecognition,"PhDthesis,CambridgeUniversityEngineeringDept,2003俞凯（上海交大）鉴别性训练，博士论文

语境相关的声学模型和搜索策略的研究，高升，中国科学院博士论文，2001李宏言（阿里巴巴）国内早期lvcsr的力作

３、Tools：

HTKbook

Kaldi

Praat

Theano

CNTK

RNNLIB

EesenCTCtoolkit yajiemiao/eesen -Video&onlinecourse

４、其他：

DeepLearningSummerSchool,Montreal2015 DeepLearningSummerSchool,Montreal2015

INTRODUCTIONTODIGITALFILTERS王愈（捷通华声）一套在线的信号处理教程,深入浅出地讲解了信号分析处理的基础知识，并结合Matlab常用的信号系统库函数——如freqz——推导讲解简明透彻 INTRODUCTIONTODIGITALFILTERSWITHAUDIOAPPLICATIONS

九州语言网李爱军（社科院语言所）

计算机课程设计参考文献,近几年课程设计参考文献课程设计参考文献有哪些

汇总了【100个】与课程设计相关论文参考文献,为广大毕业生和职称者推荐近几年课程设计参考文献,解决在校大学生不知个课程设计参考文献有哪些等相关问题！

一、课程设计论文参考文献范文

[1]军校课程设计人员学习素质提升基于心理学角度.李华.王建和.田东岳，2013教育部学习科学教学指导分委会第二次会议暨全国大学学习科学研究会第十一次学术年会

[2]土木工程专业基础工程课程设计的改革与实践.彭雄志，2014第四届全国土力学教学研讨会

[3]基于项目的“自动控制原理课程设计”改革探索.强盛.史小平.何朕，20132013年全国自动化教育学术年会

[4]三维设计软件在机械设计《课程设计》教学中的应用.李喜秋，2013第五届华北、东北五省两市一区工程图学学术研讨会

[5]关于将认知规律融入大学化学课程设计的一些思考.张娜.杜金会，2013第十二届全国大学化学教学研讨会

[6]基于任务驱动的《自动控制系统课程设计》教学实践.于建均.乔俊飞.李振龙.杨金福.韩红桂.严爱军，20132013年全国自动化教育学术年会

[7]计算机控制课程设计二阶控制系统的分析实现.胡青.青黄勤.唐丹.王延川，20132013年全国自动化教育学术年会

[8]《供用电系统课程设计》的教学改革与探索.陈亚爱.周京华.李正熙.樊生文，2010第七届全国高等学校电气工程及其自动化专业教学改革研讨会

[9]可雇佣性导向的大学课程设计方式探讨.郑东辉，2011中国教育学会中青年教育理论工作者分会第二十届学术年会

[10]电控系统综合课程设计的研究与实践.盛海燕.赵静静.冉建平，2015北京高教学会实验室工作研究会2014年度学术年会

二、课程设计论文期刊参考资料

[1].微课程设计模式研究——基于国内外微课程的对比分析.《开放教育研究》.被北京大学《中文核心期刊要目

语音识别入门推荐文献【转】 语音识别论文参考文献近几年怎么写的