摘要:目的隨著3D掃描技術和虛擬現實技術的發展,真實物體的3D識別方法已經成為研究的熱點之一。針對現有基于深度學習的方法訓練時間長,識別效果不理想等問題,提出了一種結合感知器殘差網絡和超限學習機(ELM)的3D物體識別方法。方法以超限學習機的框架為基礎,使用多層感知器殘差網絡學習3D物體的多視角投影特征,并利用提取的特征數據和已知的標簽數據同時訓練了ELM分類層、K最近鄰(KNN)分類層和支持向量機(SVM)分類層識別3D物體。網絡使用增加了多層感知器的卷積層替代傳統的卷積層。卷積網絡由改進的殘差單元組成,包含多個卷積核個數恒定的并行殘差通道,用于擬合不同數學形式的殘差項函數。網絡中半數卷積核參數和感知器參數以高斯分布隨機產生,其余通過訓練尋優得到。結果提出的方法在普林斯頓3D模型數據集上達到了94.18%的準確率,在2D的NORB數據集上達到了97.46%的準確率。該算法在兩個國際標準數據集中均取得了當前最好的效果。同時,使用超限學習機框架使得本文算法的訓練時間比基于深度學習的方法減少了3個數量級。結論本文提出了一種使用多視角圖識別3D物體的方法,實驗表明該方法比現有的ELM方法和深度學習等最新方法的識別率更高,抗干擾性更強,并且其調節參數少,收斂速度快。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社