摘要:近年來深度學習尤其是神經網絡的發展,對語音識別這類復雜的模式分類問題提供了新的解決思路.為加強對我國方言語種的保護工作、提高方言語種識別的準確率以及豐富語音識別的前處理模塊,首先采用目前語音識別領域應用最廣泛的LSTM模型搭建單任務方言語種識別模型SLNet作為基線系統.其次,針對中國方言的多樣性、復雜性特點,基于多任務學習的參數共享機制,通過多任務神經網絡模型發現不同語種間的隱含相關特性,提出基于多語種任務的方言語種識別模型MTLNet.進一步根據中國方言的區域特點,采用基于參數硬共享的多任務學習模式,構建基于輔助任務的多任務學習神經網絡ATLNet.經實驗驗證表明:相比于單任務神經網絡方言語種識別,MTLNet和ATLNet將識別準確率可提升至80.2%,彌補了單任務模型的單一性和弱泛化性.
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社