摘要:聚類分析在無監督學習領域中一直備受國內外學者關注.針對K-means聚類算法對初始聚類中心點敏感、簇內數據相關性差以及收斂到局部最優的缺點,提出了一種基于離群因子的優化聚類算法.該算法采用信息熵加權歐式距離作為相似性度量依據,以更明顯地區分數據對象間的差異,然后利用k距離參數自調整的局部異常因子檢測算法計算出各數據點的離群因子并篩選出初始聚類中心的候選集,最后根據其離群因子加權距離法優化聚類中心.通過在UCI數據集上的實驗測試結果表明,優化算法的準確率比K-means++算法、OFMMK-means算法、FCM算法更高,運行速度比FCM算法更快.該算法能夠更好地應用于入侵行為檢測、信用風險評估以及多故障診斷等領域.
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社