基于生成對抗網(wǎng)絡(luò)合成噪聲的語音增強方法研究
所屬分類:技術(shù)論文
上傳者:aetmagazine
文檔大小:491 K
標簽: 語音增強 生成對抗網(wǎng)絡(luò) 數(shù)據(jù)增強
所需積分:0分積分不夠怎么辦?
文檔介紹:在語音增強領(lǐng)域,深度神經(jīng)網(wǎng)絡(luò)通過對大量含有不同噪聲的語音以監(jiān)督學習方式進行訓練建模,從而提升網(wǎng)絡(luò)的語音增強能力。然而不同類型噪聲的獲取成本較大,噪聲類型難以全面采集,影響了模型的泛化能力。針對這個問題,提出一種基于生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)的噪聲數(shù)據(jù)樣本增強方法,該方法對真實噪聲數(shù)據(jù)進行學習,根據(jù)數(shù)據(jù)特征合成虛擬噪聲,以此擴充訓練集中噪聲數(shù)據(jù)的數(shù)量和類型。通過實驗驗證,所采用的噪聲合成方法能夠有效擴展訓練集中噪聲來源,增強模型的泛化能力,有效提高語音信號去噪處理后的信噪比和可理解性。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。