引言
隨著網(wǎng)絡信息技術快速發(fā)展,各行業(yè)數(shù)字化建設不斷推進,數(shù)據(jù)將逐步從信息化資產(chǎn)向生產(chǎn)要素轉(zhuǎn)變,數(shù)據(jù)流轉(zhuǎn)更加頻繁。在數(shù)據(jù)開發(fā)、測試、生產(chǎn)、管理等過程中,數(shù)據(jù)傳輸鏈路長、參與人數(shù)多等客觀情況給數(shù)據(jù)安全帶來挑戰(zhàn)。因此,如何降低信息安全風險,消除敏感信息泄露的威脅成為學者廣泛關注的問題。
數(shù)據(jù)脫敏技術通過預設方法對敏感信息進行數(shù)據(jù)變形,是解決上述問題的有效方法。文獻[1]將RSA非對稱加密標準與傳統(tǒng)MD5方法相結合,應用于云計算的完整性校驗和加密過程,有效解決信息泄露問題,但破壞了原有數(shù)據(jù)結構,導致脫敏后數(shù)據(jù)難以直接利用。文獻[2]采用同態(tài)加密策略,實現(xiàn)了對過程工業(yè)中重要參數(shù)的脫敏,一定程度上保留了數(shù)據(jù)的原始信息,但加解密過程存在對密文數(shù)量的限制。實際上,民航領域廣泛存在需要保留原有數(shù)據(jù)格式的業(yè)務處理場景。
保形加密(FormatPreserving Encryption, FPE)的提出為解決上述問題提供了思路。保形加密后的密文具有與原文相同的格式特征,能在脫敏的同時盡可能滿足數(shù)據(jù)分析的需求。文獻[3]針對大數(shù)據(jù)場景,以Hadoop平臺為基礎,設計了基于傳統(tǒng)FPE算法的數(shù)據(jù)脫敏系統(tǒng)。文獻[4]針對數(shù)值型數(shù)據(jù),在此基礎上改進,替換FPE中常采用的CycleWalking策略,顯著提升了算法性能,使其在大規(guī)模脫敏的場景中更具優(yōu)勢。文獻[4]將FPE算法引入特征識別領域,用于生物特征身份驗證系統(tǒng)中的數(shù)據(jù)保護,在保留原始數(shù)據(jù)結構的同時,有效降低信息泄露風險。但民航旅客數(shù)據(jù)量大,高頻、涉敏字段多,且各字段之間存在關聯(lián),如果獲取到大量數(shù)據(jù),仍存在被逆推破解的風險。
針對傳統(tǒng)FPE的安全性問題,文獻[5]將改進的FPE應用于民航領域,考慮到字段之間的關聯(lián)關系,計算出各字段之間的關聯(lián)度,據(jù)此篩選相關字段脫敏,增加了由密文逆推明文的難度,一定程度上提高了安全性。從本質(zhì)上講,F(xiàn)PE要求數(shù)據(jù)脫敏前后有唯一的對應關系,導致攻擊者在沒有準確FPE密鑰的情況下,可以根據(jù)大量明密文對應數(shù)據(jù)將脫敏數(shù)據(jù)重標識化,這一特點限制了其安全性上限[6]。針對此問題,文獻[7]提出一種基于泛化FPE的動態(tài)脫敏方法,打破了傳統(tǒng)FPE中明密文唯一映射關系,有效提高民航旅客信息的安全性,然而對于需要解密的場景,由于同一密文可能對應多個原文,此方法無法準確還原數(shù)據(jù)。
綜上,本文基于FPE技術,結合民航旅客信息的應用場景,從改變單一解密密鑰角度出發(fā),根據(jù)數(shù)據(jù)特點,篩選出非敏感的必要字段,并據(jù)此賦值調(diào)整因子T,在保留原數(shù)據(jù)格式的前提下,建立數(shù)據(jù)明密文多對一的映射關系。在提升數(shù)據(jù)安全性的同時,根據(jù)需求能夠有效還原數(shù)據(jù)原值,在民航領域具備更強場景適配能力。
本文詳細內(nèi)容請下載:
http://www.ihrv.cn/resource/share/2000006861
作者信息:
杜宇浩,王保國,譚玲,胡楠
(中國航空結算有限責任公司, 北京101300)

