摘要:文本特征項的選擇是文本挖掘和信息檢索的基礎和重要內(nèi)容。傳統(tǒng)的特征提取方法需要手工制作的特征,而手工設計有效的特征是一個漫長的過程,但針對新的應用深度學習能夠快速地從訓練數(shù)據(jù)中獲取新的有效特征表示。作為一種新的特征提取方法,深度學習在文本挖掘方面取得了一定的成果。深度學習與傳統(tǒng)方法的主要區(qū)別在于,深度學習能自動地從大數(shù)據(jù)中學習特征而不是采用手工制作的特征,手工制作的特征主要依賴于設計者的先驗知識,很難充分利用大數(shù)據(jù);深度學習可以自動地從大數(shù)據(jù)中學習特征表示,并包括數(shù)以萬計的參數(shù)。文中概述了用于文本特征提取的常用方法,并闡述了在文本特征提取及應用中常用的深度學習方法,以及深度學習在特征提取中的應用展望。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社