基于Ad-Sim算法的代碼克隆檢測方法

摘要:代碼克隆檢測在代碼抄襲檢測、代碼審查、軟件更迭和錯誤檢測等方面有重要作用。為提高代碼克隆檢測的準確率,結合TF-IDF及馬爾科夫模型提出了一種改進的Simhash算法Ad-Sim。該算法首先對代碼進行歸一化預處理;其次在Simhash計算指紋簽名的過程中使用TF-IDF計算各關鍵詞權重,并利用馬爾科夫模型優化關鍵詞權重;最后比較待檢測代碼指紋簽名的漢明距離相似度,從而判斷待檢測代碼是否為克隆代碼。實驗結果表明:Ad-Sim算法在代碼克隆檢測上的準確率及召回率相比Simhash有所提升,尤其在少量代碼的檢測準確率上提升更明顯。

關鍵詞:
  • simhash  
  • 漢明距離  
  • 馬爾科夫模型  
作者:
王衛紅; 谷永亮; 毛怡偉; 張政豪
單位:
浙江工業大學計算機科學與技術學院; 浙江杭州310023
刊名:
浙江工業大學學報

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

期刊名稱:浙江工業大學學報

浙江工業大學學報緊跟學術前沿,緊貼讀者,國內刊號為:33-1193/T。堅持指導性與實用性相結合的原則,創辦于1973年,雜志在全國同類期刊中發行數量名列前茅。

主站蜘蛛池模板: 黑人巨大白妞出浆| 伊人色综合久久天天网| 久久aa毛片免费播放嗯啊| 色噜噜成人综合网站| 少妇被又大又粗又爽毛片久久黑人 | 99re5久久在热线播放| 欧美手机在线视频| 国产成人综合久久精品下载| 久久国产视频精品| 美女羞羞视频免费网站| 大伊香蕉精品一区视频在线| 亚洲国产精品无码久久久秋霞2| 黄色软件下载链接| 成**人特级毛片www免费| 亚洲精品www久久久久久| 欧美成人18性| 成人黄色激情视频| 亚洲精品乱码久久久久久按摩| 亚洲国产成人精品激情| 日本一道本在线| 免费一区二区视频| 你懂的国产精品| 日产欧产va高清| 人妻蜜と1~4中文字幕月野定规| **aa级毛片午夜在线播放| 日本三级黄视频| 亚洲美女人黄网成人女| 精品国产福利片在线观看| 成人综合激情另类小说| 亚洲精品国产肉丝袜久久| 国产鲁鲁视频在线播放| 成人欧美日韩一区二区三区| 亚洲第一区视频在线观看| 高清国产美女一级毛片| 婷婷影院在线观看| 亚洲剧情在线观看| 老师xxxx69动漫| 国产精品观看在线亚洲人成网| 久久午夜夜伦鲁鲁片免费无码 | 国产主播福利在线观看| ankhazone度盘|