基于加權關聯模式挖掘與規則后件擴展的跨語言信息檢索

摘要:【目的】針對自然語言處理中查詢主題漂移和詞不匹配問題,提出一種基于加權關聯模式挖掘和規則后件擴展的跨語言信息檢索模型及其算法。【方法】該模型采用新的加權關聯模式支持度和基于最大項目權值的項集剪枝策略挖掘頻繁項集,利用置信度和相關度評價加權關聯規則,根據擴展模型從規則中提取優質擴展詞實現規則后件擴展,擴展詞與原查詢詞項組合為新查詢再次檢索文檔得到最終檢索結果。【結果】實驗結果表明,與單語言檢索基準比較,本文檢索模型的R-prec和P@10平均增幅分別為42.49%和25.53%;與跨語言檢索基準比較,其平均增幅分別為91.87%和64.61%;與現有基于加權關聯規則挖掘的跨語言檢索方法比較,R-prec和P@10最高平均增幅分別可達93.20%和34.60%。【局限】只進行實驗性研究,需要探討在實際跨語言搜索引擎中的具體應用。【結論】本文檢索模型能有效地減少查詢主題漂移和詞不匹配問題,改善和提高檢索性能。

關鍵詞:
  • 信息檢索  
  • 跨語言檢索  
  • 文本挖掘  
  • 關聯規則  
  • 自然語言處理  
作者:
黃名選; 盧守東; 徐輝
單位:
廣西財經學院廣西(東盟)財經研究中心; 南寧530003; 廣西跨境電商智能信息處理重點實驗室(廣西財經學院); 南寧530003; 廣西財經學院信息與統計學院; 南寧530003
刊名:
數據分析與知識發現

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

數據分析與知識發現雜志緊跟學術前沿,緊貼讀者,國內刊號為:10-1478/G2。堅持指導性與實用性相結合的原則,創辦于1980年,雜志在全國同類期刊中發行數量名列前茅。

主站蜘蛛池模板: 一二三四视频社区在线| 欧美卡4卡1卡2卡3超清免费| 欧美伊人久久大香线蕉在观| 岛国片在线观看| 最新欧美精品一区二区三区| 天天色天天干天天射| 国产一区二区精品久久| 亚洲av乱码一区二区三区 | chinese激烈高潮HD| 老子影院我不卡在线理论| 日韩精品无码久久一区二区三 | 国产欧美一区二区三区在线看| 人与禽交免费网站视频| 东北老妇露脸xxxxx| 野花社区视频在线观看| 欧美一级免费在线观看| 国产高清自产拍av在线| 免费一级大片儿| 中文丰满岳乱妇在线观看| 色狠狠一区二区| 日本xxxxxxx69xx| 国产伦子系列视频6| 久久精品国产99国产| 国产激情视频在线观看首页| 欧美大交乱xxxx| 国产精品扒开做爽爽爽的视频| 亚洲毛片免费看| 91人成在线观看网站| 欧美视频第一页| 国内精品视频在线播放一区| 人与禽交另类网站视频| free哆拍拍免费永久视频| 看看镜子里我怎么玩你| 成人精品视频一区二区三区| 国产午夜精品一区二区三区漫画| 久热国产在线视频| 亚洲www在线观看| 欧美亚洲国产精品久久久久| 国产精品综合在线| 亚洲欧美视频二区| 99在线在线视频免费视频观看|