面向機器學習的流式文檔邏輯結構標注方法研究

摘要:針對采用機器學習方法識別流式文檔結構時語料庫稀少、語料標注復雜的問題,該文在研究文檔的邏輯結構和編輯語義特征的基礎上,確立流式文檔邏輯結構標注體系,并提出一種三段式的半自動文檔邏輯結構標注方法:第一階段通過機助人工實現文檔元數據的分離式標注,第二階段自動重建邏輯結構,第三階段自動填充特征向量。實驗結果表明,該文提出的文檔邏輯結構標注方法能夠節省人工成本、提高機器學習算法對文檔結構識別的準確率與召回率,F值達到97.5%。

關鍵詞:
  • 結構標注  
  • 文檔結構識別  
  • 機器學習  
作者:
劉倩; 李寧; 田英愛
單位:
北京信息科技大學計算機學院; 北京100101
刊名:
中文信息學報

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

期刊名稱:中文信息學報

中文信息學報緊跟學術前沿,緊貼讀者,國內刊號為:11-2325/N。堅持指導性與實用性相結合的原則,創辦于1986年,雜志在全國同類期刊中發行數量名列前茅。

主站蜘蛛池模板: 高清伦理电影在线看| 国产思思99re99在线观看 | 亚欧免费视频一区二区三区| 97色伦图片97综合影院| 污视频免费网站| 国产精品视频全国免费观看| 亚洲日韩欧洲无码av夜夜摸| 2018天天爽天天玩天天拍| 欧美国产日本高清不卡| 国产精品一区二区久久不卡| 亚洲av高清一区二区三区| 欧美黑人bbbbbbbbb| 日韩欧美黄色大片| 国产免费内射又粗又爽密桃视频| 久久久精品2019中文字幕之3| 色综合色天天久久婷婷基地| 成在人线av无码免费高潮水 | 国产无遮挡又黄又爽又色 | 精品国产亚洲AV麻豆| 好爽好多水小荡货护士视频| 伊人热热久久原色播放www| 99久久99久久久99精品齐| 欧美性猛交xxxx乱大交极品| 国产日产久久高清欧美一区| 久久国产高清字幕中文| 老子影院午夜伦手机在线看| 小箩莉奶水四溅小说| 亚洲综合激情另类小说区| 在线免费视频你懂的| 日韩人妻精品一区二区三区视频 | 中日韩欧一本在线观看| 窝窝人体色www| 国产高清免费的视频| 亚洲1区1区3区4区产品乱码芒果 | 美女胸被狂揉扒开吃奶二次元| 宅男噜噜噜66网站| 亚洲欧美日韩精品| 黑人巨鞭大战中国妇女| 扁豆传媒在线入口| 亚洲自偷自偷在线制服| 欧美一级特黄乱妇高清视频|