基于SDBN和BLSTM注意力融合的端到端視聽雙模態語音識別

摘要:提出一種端到端的視聽語音識別算法。在該算法中,通過具有瓶頸結構的深度信念網絡(deep belief network,DBN)中引入混合的l1/2范數和l1范數構建一種稀疏DBN(sparse DBN,SDBN)來提取稀疏瓶頸特征,從而實現對數據的特征降維,然后用雙向長短期記憶網絡(bidirectional long short-term memory,BLSTM)在時序上對特征進行模態處理,之后利用一種注意力機制將經過模態處理的唇部視覺信息和音頻聽覺信息進行自動對齊、融合,最后將融合的視聽覺信息通過一個附加了Softmax層的BLSTM進行分類識別。實驗表明,該算法能有效地識別視聽覺信息,在同類算法中有很好的識別率和頑健性。

關鍵詞:
  • 端到端  
  • 視聽語音識別  
  • 稀疏瓶頸特征  
  • 注意力機制  
作者:
王一鳴; 陳懇; 薩阿卜杜薩拉木·艾海提拉木
單位:
寧波大學信息科學與工程學院; 浙江寧波315211
刊名:
電信科學

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

期刊名稱:電信科學

電信科學雜志緊跟學術前沿,緊貼讀者,國內刊號為:11-2103/TN。堅持指導性與實用性相結合的原則,創辦于1956年,雜志在全國同類期刊中發行數量名列前茅。

主站蜘蛛池模板: 久久久久久不卡| 亚洲AV无码乱码在线观看富二代| 精品无码国产一区二区三区51安 | 亚洲综合激情视频| 福利小视频在线观看| 又粗又长又色又爽视频| 色噜噜狠狠色综合欧洲selulu| 国产女人的高潮国语对白| 欧美日韩亚洲成色二本道三区| 国产精品亚洲综合一区在线观看 | 亚洲国产成人精品无码区在线观看 | 日本阿v视频在线观看高清| 成人免费无码大片a毛片软件| 亚洲av日韩av无码av| 妖神记1000多章哪里看| 免费视频中文字幕| 91精品国产网曝事件门| 日韩精品人妻系列无码专区| 四虎国产永久在线观看| 99re最新地址精品视频| 日韩精品专区在线影院重磅| 含羞草实验研所入口| 996热在线视频| 日韩人妻潮喷中文在线视频| 别揉我胸啊嗯~| 337p人体大胆扒开下部| 日本熟妇色熟妇在线视频播放| 内地女星风流艳史肉之| 2019中文字幕在线| 日本aⅴ日本高清视频影片www| 免费中日高清无专码有限公司 | 国产成人免费观看| 丝袜诱惑中文字幕| 欧美成人精品第一区| 国产一区二区三区在线免费 | 99精品国产一区二区| 曰批免费视频试看天天视频下 | 无码囯产精品一区二区免费| 亚洲色精品vr一区二区三区| 欧美黑人bbbbbbbbb| 希岛婚前侵犯中文字幕在线|