中文引用格式: 肖飛,孫震笙,金俊杰. 感興趣區(qū)域引導的碼率可變衛(wèi)星遙感圖像壓縮方法[J]. 電子技術應用,2026,52(1):21-27.
英文引用格式: Xiao Fei,Sun Zhensheng,Jin Junjie. Region of interest guided variable-rate compression method for satellite remote sensing images[J]. Application of Electronic Technique,2026,52(1):21-27.
引言
隨著經(jīng)濟社會的發(fā)展和國際形勢的變化,我國對空間信息的需求悄然發(fā)生變化:在觀測范圍上,隨著我國綜合國力的不斷提升,國家利益的范疇已從領土拓展到全球乃至太空;在響應時間上,對空間信息的獲取-傳輸-處理的響應速度從離線向?qū)崟r在線轉(zhuǎn)變,用戶對信息獲取的實效性提出了更高要求,希望在第一時間就能夠獲取到所關注區(qū)域或突發(fā)事件區(qū)域的現(xiàn)場圖像和評估結(jié)果,這在災害應急中尤為突出。在此背景下,將傳統(tǒng)星下處理分析任務轉(zhuǎn)換到星上并結(jié)合遙感任務的數(shù)據(jù)特點設計相應的星載壓縮算法,實現(xiàn)衛(wèi)星服務的智能化轉(zhuǎn)型,能夠有效提升衛(wèi)星服務的實效性。
目前,圖像壓縮按照框架劃分主要包含兩大類方法,即傳統(tǒng)混合框架圖像編碼[1-4]和端到端深度神經(jīng)網(wǎng)絡圖像壓縮[5-10]。傳統(tǒng)混合編碼框架是使用人工設計的算法將預測、變換、量化、熵編碼等模塊組合起來,從而得到一套完整的圖像編碼器。而端到端深度神經(jīng)網(wǎng)絡圖像壓縮方法的性能從最初的低于JPEG[1]已發(fā)展到與最先進的H.266[4]幀內(nèi)編碼相當。為了適應壓縮的需求,端到端圖像編碼在自編碼器的基礎上引入了量化和熵編碼,用于高效編碼提取到的特征?;谒褂玫木W(wǎng)絡結(jié)構(gòu),端到端圖像編碼可以分為三類:基于循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)[5]的壓縮模型、基于卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)[6]的壓縮模型和基于生成對抗網(wǎng)絡(Generative Adversarial Networks,GAN)[7]的壓縮模型。
然而,隨著遙感圖像數(shù)據(jù)量的急劇增長以及應用場景不斷變化,遙感圖像壓縮方法已不再局限于更低的碼率和更高的重建質(zhì)量,更要同時滿足多種處理任務的要求。Xiang等人[11]結(jié)合壓縮與信息提取,提出了一種引入潛在特征選擇模塊(Latent Feature Selection,LFS)的聯(lián)合模型,但該方法依賴于LFS模塊的魯棒性,需要針對不同任務進行廣泛調(diào)優(yōu)。Li等人[12]通過深度神經(jīng)網(wǎng)絡識別目標與背景區(qū)域,對背景區(qū)域應用雙線性降采樣以節(jié)省比特率,但其對目標-背景分割精度依賴較強,并且背景區(qū)域的降采樣處理引入了嚴重偽影,影響全局分析和視覺質(zhì)量。Zhang等人[13]開發(fā)的遙感圖像機器編碼框架(Remote Sensing Image Coding for Machines,RSICM)專門針對語義分割任務,通過對比學習增強壓縮圖像的特征判別能力,補償壓縮過程中的特征判別損失。然而,其過度依賴于對比學習優(yōu)化過程和特定分割網(wǎng)絡,限制了在其他視覺任務中的適用性。Ye等人[14]提出的地圖輔助生成式壓縮(Map-Assisted Generative Compression,MAGC)框架針對極低比特率場景,結(jié)合預訓練擴散模型與矢量地圖提供的語義結(jié)構(gòu)信息實現(xiàn)高質(zhì)量圖像重建,但它依賴于預訓練擴散模型和外部矢量地圖的可用性,這限制了其在某些應用場景中的適用性。
此外,在現(xiàn)有的遙感圖像壓縮應用領域,由于衛(wèi)星和地面的傳輸帶寬有限,往往需要對圖像壓縮的碼率進行限制。Jia和Shi等人[15-16]通過至少兩次預編碼得到真實碼率與編碼參數(shù)λ的數(shù)據(jù)對。該方法需要通過七次預編碼,耗時長,僅在特定場景中能夠應用。Xue等人[17]在編碼器提取的特征基礎上,利用碼率估計器來取代多次預編碼。該方法在一定程度上節(jié)省了碼率控制的時間,但也要基于編碼器的特征來訓練碼率估計器,仍有較長的處理延遲。因此,如何在實際應用中控制遙感圖像壓縮的碼率,仍是需要進一步研究的問題。
結(jié)合上述分析,為了進一步提高遙感圖像壓縮任務性能,本文提出了一種感興趣區(qū)域引導的碼率可變壓縮方法,主要貢獻如下:
(1)針對現(xiàn)有遙感圖像壓縮方法的弊端,提出一種感興趣區(qū)域驅(qū)動的碼率可變壓縮方法,在實現(xiàn)碼率可變壓縮的同時有效提高感興趣區(qū)域重建質(zhì)量。
(2)提出了基于感興趣區(qū)域引導的重要性圖模塊,在壓縮網(wǎng)絡前端使用一個通用檢測網(wǎng)絡得到感興趣目標分布掩膜,將感興趣區(qū)域分布與原始圖像相結(jié)合,以指導感興趣區(qū)域和背景區(qū)域的碼率分配,提高感興趣區(qū)域的壓縮性能。
(3)提出了針對遙感圖像的碼率可變策略,實現(xiàn)在壓縮過程中靈活的碼率控制,以適應遙感圖像傳輸帶寬的要求。
本文詳細內(nèi)容請下載:
http://www.ihrv.cn/resource/share/2000006907
作者信息:
肖飛,孫震笙,金俊杰
(中國星網(wǎng)數(shù)字科技有限公司,河北 雄安新區(qū) 071700)

