摘要:為了提高文本情感傾向性分類的精度,提出了一種文本情感傾向性分析方法 bfsmPMI-SVM.該方法在文本預處理階段,濾除了對表述主題情感傾向性不強烈的語句以及無關停用詞等;用改進的PMI-IR算法對情感傾向性詞語抽取,并自動擴充了正負基準詞集;改進了互信息(MI)算法,在MI的計算中增加了詞頻因子(f)、類別差異因子(b)和符號因子(s).利用改進的MI算法選擇文本特征,融合其他一些文本特征,用SVM實現文本情感傾向性分類.實驗以食品安全領域爬取文本為例,與PMI-IR-SVM和MI-SVM算法的傾向分析相比,本文方法的正向文本準確率、負向文本準確率、召回率和F1值等都有提高.
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社