摘要:目的基于圖像的人體姿態估計是計算機視覺領域中一個非常重要的研究課題,并廣泛應用于人機交互、監控以及圖像檢索等方面。但是,由于人體視覺外觀的多樣性、遮擋和混雜背景等因素的影響,導致人體姿態估計問題一直是計算機視覺領域的難點和熱點。本文主要關注于初始特征對關節點定位的作用,提出一種跨階段卷積姿態機(CSCPM)。方法首先,采用VGG(visual geometry group)網絡獲得初步的圖像初始特征,該初始特征既是圖像關節點定位的基礎,同時,也由于受到自遮擋和混雜背景的干擾難以學習。其次,在初始特征的基礎上,構建多層模型學習不同尺度下的結構特征,同時為了解決深度學習中的梯度消失問題,在后續的各層特征中都串聯該初始特征。最后,設計了多尺度關節點定位的聯合損失,用于學習深度網絡參數。結果本文實驗在兩大人體姿態數據集MPII(MPII human pose dataset)和LSP(leeds sport pose)上分別與近3年的人體姿態估計方法進行了定性與定量比較,在MPII數據集中,模型的總檢測率為89.1%,相比于性能第2的模型高出了0.7%;在口戸數據集中,模型的總檢測率為91.0%,相比于性能第2的模型高出了0.5%。結論實驗結果表明,初始特征學習能夠有效判斷關節點的自遮擋和混雜背景干擾情況,引入跨階段結構的CSCPM姿態估計模型能夠勝出現有人體姿態估計模型。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社