ai声音模仿
ThispostisaboutsomefairlyrecentimprovementsinthefieldofAI-basedvoicecloning.Ifwehavehoursandhoursoffootageofaparticularvoiceatourdisposalthenthatvoicecanbeclonedusingexistingmethods.Butthisrecentbreakthroughenablesustodothesameusingminusculedata—onlyfivesecondsofaudiofootage.Theoutputgeneratedusingthismethodhastimbrestrikinglysimilartotheoriginalvoiceanditisabletosynthesizesoundsandconsonantsthatarenon-existentintheoriginalaudiosample.Itisabletoconstructthesesoundsonit’sown.Youcanlistentosomegeneratedsampleshere.
这篇文章是关于基于AI的语音克隆领域中一些相当近期的改进。如果我们有一个小时或几个小时的特定声音素材可以使用,那么可以使用现有方法克隆该声音。但是,最近的突破使我们能够使用微小的数据(只有五秒钟的音频素材)进行相同的操作。使用这种方法产生的输