摘要:詞性標注是自然語言處理的基礎研究,應用的領域十分廣泛?;谵D換的錯誤驅動學習詞性標注是一種基于規則的算法,但由于此算法占用大量的計算機資源進行規則的提取,從而造成算法本身偏慢的問題。文章在原有算法的基礎上,跳過那些對語料庫的標注不夠明顯的規則,尋找應用最好的轉換規則,使語料庫錯誤標注降到最低,從而達到標注的目的。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社
熱門期刊
期刊名稱:計算機時代
計算機時代雜志緊跟學術前沿,緊貼讀者,國內刊號為:33-1094/TP。堅持指導性與實用性相結合的原則,創辦于1983年,雜志在全國同類期刊中發行數量名列前茅。