融合圖結構與節點關聯的關鍵詞提取方法

摘要:單篇文本的關鍵詞提取可應用于網頁檢索、知識理解與文本分類等眾多領域。該文提出一種融合圖結構與節點關聯的關鍵詞提取方法,能夠在脫離外部語料庫的情況下發現單篇文本的關鍵詞。首先,挖掘文本的頻繁封閉項集并生成強關聯規則集合;其次,取出強關聯規則集合中的規則頭與規則體作為節點,節點之間有邊當且僅當彼此之間存在強關聯規則時,邊權重定義為關聯規則的關聯度,將強關聯規則集合建模成關聯圖;再次,綜合考慮節點的圖結構屬性、語義信息和彼此的關聯性,設計一種新的隨機游走算法計算節點的重要性分數;最后,為了避免抽取的詞項之間有語義包含關系,對節點進行語義聚類并選取每個類的類中心作為關鍵詞提取結果。通過設計關聯圖模型參數的選取、關鍵詞的提取規模、不同算法對比3個實驗,在具有代表性的中英文數據上證明了該方法能夠有效提升關鍵詞提取的效果。

關鍵詞:
  • 關鍵詞提取  
  • 隨機游走  
  • 節點屬性  
  • 語義信息  
  • 節點關聯  
作者:
馬慧芳; 王雙; 李苗; 李寧
單位:
西北師范大學計算機科學與工程學院; 甘肅蘭州730070; 桂林電子科技大學廣西可信軟件重點實驗室; 廣西桂林541004; 中國科學院信息工程研究所; 北京100093
刊名:
中文信息學報

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

期刊名稱:中文信息學報

中文信息學報緊跟學術前沿,緊貼讀者,國內刊號為:11-2325/N。堅持指導性與實用性相結合的原則,創辦于1986年,雜志在全國同類期刊中發行數量名列前茅。

主站蜘蛛池模板: 成人免费午间影院在线观看| 五月天精品在线| 在线观看免费视频a| 500第一福利正品蓝导航| 国产好爽…又高潮了毛片| 绿巨人草莓香蕉丝瓜菠萝| 成成人看片在线| 亚洲精品成人片在线播放| 欧美丰满大乳大屁股流白浆 | 国产精品igao视频网网址| 青青草国产三级精品三级| 伊人大杳焦在线| 日韩欧美亚洲另类| 99久久精品费精品国产一区二区| 国产日韩综合一区二区性色av| 精品欧美一区二区三区在线观看| 亚洲另类无码专区丝袜| 成人免费黄色网址| 高潮毛片无遮挡高清免费视频| 免费av一区二区三区| 日本熟妇色一本在线观看| 69视频免费在线观看| 午夜精品久久久久久| 日韩在线一区二区三区免费视频| 99视频精品全国在线观看| 国产亚洲精品自在久久| 欧美日韩一区二区三区在线视频 | 伺候情侣主vk| 欧美和拘做受全程看| 800av凹凸视频在线观看| 亚洲精品tv久久久久久久久久| 成人a在线观看| 美女毛片在线看| 中日韩精品电影推荐网站| 国产区香蕉精品系列在线观看不卡| 毛片免费在线视频| china同性基友gay勾外卖| 免费在线观看中文字幕| 好吊视频一区二区三区| 琪琪女色窝窝777777| 中文字幕日韩三级|