![]() 論文短視頻 | 結(jié)合強化學習自適應候選框挑選的SAR目標檢測方法 背景介紹 ![]() ![]() 團隊工作 近年來,西安電子科技大學雷達信號處理國家重點實驗室的杜蘭教授團隊對SAR圖像目標檢測與識別相關(guān)方法開展了深入研究。 ![]() 在SAR目標檢測方面,針對大場景SAR圖像中目標數(shù)量較多,分布情況較為復雜且易受雜波影響的特點,提出一種結(jié)合強化學習的SAR目標檢測方法,提出方法通過使用強化學習自適應確定搜索區(qū)域?qū)崿F(xiàn)了對初始候選框的自適應挑選,提升了對背景雜波的鑒別能力并減少傳統(tǒng)強化學習應用于檢測問題的計算量。所提方法自適應確定搜索區(qū)域的能力包括兩方面的自適應,一是通過綜合利用圖像的特征信息和上下文信息自適應確定搜索區(qū)域的位置坐標;二是通過搜索區(qū)域尺寸約束自適應調(diào)整下一次搜索區(qū)域的范圍尺寸。所提方法能夠有效減少SAR目標檢測的虛警數(shù)量,提升傳統(tǒng)深度學習目標檢測方法的檢測性能。 該工作擬發(fā)表在《雷達學報》2022年第5期“《雷達學報》創(chuàng)刊10周年紀念???”論文“結(jié)合強化學習自適應候選框挑選的SAR目標檢測方法”(杜蘭,王梓霖,郭昱辰,杜宇昂,嚴俊坤)。 論文介紹 文章提出的SAR目標檢測方法整體流程如下所示: ![]() 從總體結(jié)構(gòu)上來說,提出方法基于傳統(tǒng)Faster R-CNN方法,在RPN與RoI池化層之間加入深度強化學習網(wǎng)絡(luò)搜索可能含有目標的區(qū)域。特征提取網(wǎng)絡(luò)提取SAR圖像特征,并通過RPN在特征圖上生成初始候選框。對于大量的初始候選框,本文使用深度強化學習網(wǎng)絡(luò)進行區(qū)域搜索實現(xiàn)對初始候選框進行挑選,將可能含有目標的候選框送入RoI池化層進行整合。整合后的候選框?qū)⒈凰腿霗z測器,獲取最終的檢測目標框。 其中上文所述深度強化學習網(wǎng)絡(luò)采用循環(huán)神經(jīng)網(wǎng)絡(luò)實現(xiàn),此網(wǎng)絡(luò)可以在特征圖上找到一個可能含有目標的區(qū)域,并將該區(qū)域內(nèi)的候選框送入后續(xù)檢測器獲得該區(qū)域內(nèi)的檢測結(jié)果,然后綜合檢測結(jié)果再找到另一個可能含有目標的區(qū)域,繼續(xù)將該區(qū)域內(nèi)的候選框送入后續(xù)檢測,如此迭代,最終完成候選框的自適應挑選和檢測。深度強化學習網(wǎng)絡(luò)在迭代過程中捕捉到圖像的上下文信息并確定可能含有目標的搜索區(qū)域的位置坐標。并且,本方法在強化學習中對產(chǎn)生的搜索區(qū)域尺寸添加約束,使得搜索區(qū)域尺寸可以根據(jù)之前迭代過程中的搜索區(qū)域以及目標檢測結(jié)果進行自適應調(diào)整。從表1可以看出本文方法與傳統(tǒng)檢測方法相比的性能優(yōu)勢。圖5展示了本文方法在大場景SAR圖像上的檢測結(jié)果。 ![]() ![]() ![]() 結(jié)合表1的檢測結(jié)果及RoI分布可以分析,F(xiàn)aster R-CNN方法由于采用NMS法對RPN在整張?zhí)卣鲌D上產(chǎn)生的大量初始候選框進行處理,會導致SAR圖像的邊緣和難鑒別的背景雜波位置生成大量RoI,從而造成檢測結(jié)果中出現(xiàn)較多虛警。而所提方法則依靠強化學習策略及深度強化學習網(wǎng)絡(luò)積累的上下文信息來確定含有目標的搜索區(qū)域,并且只在搜索區(qū)域內(nèi)生成RoI,能夠讓RoI盡可能集中在目標周圍,有效減少圖片邊緣及復雜背景雜波導致的虛警,從而獲得較好的檢測效果。 作者簡介 杜 蘭,西安電子科技大學電子工程學院教授,主要研究方向為雷達目標識別、雷達信號處理、機器學習。 王梓霖,西安電子科技大學在讀碩士研究生,研究方向為SAR圖像目標檢測、機器學習。 郭昱辰,西安電子科技大學前沿交叉研究院講師,主要研究方向為智能雷達目標檢測和識別。 杜宇昂,西安電子科技大學在讀博士研究生,主要研究方向為SAR圖像解譯、機器學習與人工智能。 |
|