《電子技術應用》
您所在的位置:首頁 > 通信与网络 > 业界动态 > 数据安全:数据开放共享面临的问题

数据安全:数据开放共享面临的问题

2021-08-08
來源:计算机与网络安全
關鍵詞: 数据 开放共享

  目前無論是國家頂層設計層面,還是具體實操層面,數據開放共享都取得了比較顯著的成效,但是我們也必須看到,由于一系列因素的掣肘,無論是政府之間的數據開放共享,還是政府與企業(yè)之間的數據開放共享,其進展都沒有設想的那么盡如人意。與主要發(fā)達國家相比,我國政府數據開放共享的水平仍然較低。根據Data.gov網站的《全球開放數據深度報告》,我國得分為11.8分,而美國得分為93.4分,差距極大。為何會出現(xiàn)這樣的情況?主要還是無意愿、無膽量、無本領造成的。

  1. 無意愿開放共享

  不同于以往任何時候,我們正生活在一個萬事萬物高速發(fā)展的時代,而大數據正是催生這種時代特征的根本動力。大數據研究專家維克托·邁爾-舍恩伯格曾經說過:“世界的本質是數據。”在他看來,認識大數據之前,世界原本就是一個數據時代;認識大數據之后,世界不可避免地分為大數據時代、小數據時代。

  從政府的角度來看,當前各級各類政府部門及公共機構掌握的政務數據是數量最龐大、價值密度最高的數據資源,也正是所謂的大數據,對于推動經濟發(fā)展、完善社會治理、提升政府服務和監(jiān)管能力具有重要價值。目前,在政府的公共管理過程中,從定性決策到量化決策已是必然趨勢。其中,數據是決策的基礎。如今的數據分析已與傳統(tǒng)基于抽樣方法統(tǒng)計的數據不同,基本可以不經過任何抽樣而直接對全樣本的復雜數據進行實時分析處理,使政府決策所依據的數據資料更加全面,提高決策的針對性、科學性和時效性。

  與政府相比,企業(yè)產生的主要是小數據,但是小數據也有大作用。如今,因實施數字化轉型取得成功的案例比比皆是。以前,領導層確定企業(yè)決策和戰(zhàn)略實施,主要依靠自身的決策經驗和信息整合能力。而現(xiàn)在高性能并行的計算機處理技術通過處理海量數據集推導出科學的戰(zhàn)略決策,能大大提升領導決策的精準度和效率,同時也暢通了內部信息的溝通渠道,提高了企業(yè)的運轉效率。更重要的是通過幫助營銷部門從繁雜龐大的數據中挖掘、分析用戶的行為習慣和喜好,研發(fā)出更符合用戶偏好的產品和服務,最終也極大提高了商業(yè)利益。

  除此之外,公共領域利用大數據造福人類的事件也是不勝枚舉。例如,大數據曾被洛杉磯警察局和加利福尼亞大學合作用于預測犯罪的發(fā)生;麻省理工學院利用手機定位數據和交通數據建立城市規(guī)劃;谷歌流感趨勢利用搜索關鍵詞預測禽流感的散布;氣象局通過整理近期的氣象情況和衛(wèi)星云圖,更加精確地判斷未來的天氣狀況。

  因此,大數據時代,無論是大數據還是小數據,里面都蘊含了無窮的寶藏。但是有一點我們必須清楚,數據本身并不產生價值,如何分析和利用大數據對業(yè)務、對人類產生幫助,才是它的價值所在。

  然而,并非所有人都能認識到數據的價值在于利用、流動,在于整合分析挖掘。這種思維方式無論在政府、企業(yè),還是其他機構,都大有人在。他們往往將數據束之高閣,不加任何開發(fā)和利用。由于數據的一個重要特性就是其價值具有很強的時效性,過了一定的時間,價值就可能貶低甚至消失,因此將數據束之高閣是數據開放共享過程中的大礙。

  對于數據的價值,有部分人沒有認識到,而有部分人了解得非常清楚。正因為太了解,所以又出現(xiàn)了一種在數據開放共享的過程中將數據作為利益、權力或私有財產獨享的心理。

  2018年7月,國務院印發(fā)了《關于加快推進全國一體化在線政務服務平臺建設的指導意見》(簡稱《指導意見》),在“統(tǒng)一數據開放共享”中提到:國家政務服務平臺充分利用國家人口、法人、信用、地理信息等基礎資源庫,對接國務院部門垂直業(yè)務辦理系統(tǒng),滿足政務服務數據開放共享需求;發(fā)揮國家數據開放共享交換平臺作為國家政務服務平臺基礎設施和數據交換通道的作用,對于各?。ㄗ灾螀^(qū)、直轄市)和國務院有關部門提出的政務服務數據開放共享需求,由國家政務服務平臺統(tǒng)一受理和提供服務,并通過國家數據開放共享交換平臺交換數據;整合市場監(jiān)管相關數據資源,推動事中事后監(jiān)管信息與政務服務深度融合、“一網通享” ;建設國家政務服務平臺數據資源中心,匯聚各地區(qū)和國務院有關部門政務服務數據,積極運用大數據、人工智能等新技術,開展全國政務服務態(tài)勢分析,為提升政務服務質量提供大數據支撐?!吨笇б庖姟穼φ招畔⒐蚕硖岢隽丝茖W的目標和要求,數據應用開放的關鍵是打破數據孤島,讓數據互聯(lián)互通,達成數據和信息共享。

  但是,當前我國政府信息化建設依然存在各自為政、重復建設的問題,部門條塊分割比較嚴重,各部門之間溝通困難。出于權限和利益問題的考慮,很多單位將政府數據資源部門化、專屬化、利益化,存在所謂“數據話語權”思想,對數據開放共享存在抵觸情緒及推諉應付現(xiàn)象,導致“數據割據”問題嚴重。例如,我們每個公民的個體信息分別掌握在工商部門、銀行、保險、公安、醫(yī)院、社保、運營商等不同的機構手里,但真要打通和融合各個部門掌握的數據卻是很困難的事情。

  數據割據的現(xiàn)象不僅存在于政府部門之間,當前我國一些企業(yè)之間的此類現(xiàn)象也非常嚴重。我國互聯(lián)網巨頭都掌握了海量的數據,像百度、騰訊、阿里巴巴三大互聯(lián)網公司分別掌握了搜索、社交和消費數據。如果三方數據能匯聚在一起,就可拼湊出一個完整的互聯(lián)網數據圖譜,但事實往往是互聯(lián)網企業(yè)之間的競爭多于合作。勢均力敵的巨頭之間尚且如此,互聯(lián)網市場的中小型企業(yè)對巨頭所掌握的數據更是望塵莫及,因此很難在現(xiàn)有市場格局中取得突破,這種現(xiàn)狀進一步加劇了巨頭割據的現(xiàn)象。

  2. 無膽量開放共享

  2018年3月25日,1.5億條來自美國著名運動裝備品牌安德瑪(Under Armour)的用戶數據遭泄露,這些數據包括用戶名、郵箱地址、密碼等隱私信息。同年,法國工程咨詢公司Ingérop也遭遇了網絡攻擊,超過1萬份與法國核電站、監(jiān)獄及電車網絡相關的機密文件從該公司的服務器上被竊取。

  這些都是明網上公開的數據泄露事件,暗網上被竊取的數據交易更是不勝枚舉。2019年1月,360安全監(jiān)測與響應中心發(fā)布了一篇關于“2018年暗網非法數據交易總結”的報告,是基于從某暗網交易平臺抽樣收錄不法分子發(fā)布的1000條數據交易信息歸納出的情況,其中記錄的暗網重大數據交易事件涉及軍事、政府、互聯(lián)網等多個領域。例如,在政治方面,Anomali Labs和 Intel 471的安全研究人員第一次追蹤到有人在暗網兜售2018年美國選民登記記錄。這些選民數據來自美國19個州,被售賣的信息包含選民的全名、電話號碼、真實地址、歷史投票和其他暫未明確的投票數據。每個選民的信息以150美元~12500美元的價格出售。售賣者還聲稱,一旦購買這些數據,他們將每周都為購買者提供定期的更新。

  在互聯(lián)網領域,某動漫網站發(fā)布公告稱近千萬條用戶數據被盜,被盜的數據包括用戶的ID、昵稱和密碼等。而這些數據早在2019年3月8日就已經在暗網被出售。出售數據被分為三組,其中一組為800萬條該動漫網站數據以12000元,即1元800條的價格出售;而另外兩組數據也分別達到了70萬條和600萬條,以7000元和12000元的價格出售。這些被出售的數據均包含用戶名、手機號碼和密碼,且均為一手數據,整份價格約為0.49個比特幣。

  在酒店及快遞行業(yè),某集團旗下多家連鎖酒店的數據在中文暗網市場交易網站出售。賣家聲稱,這些數據涉及多家知名酒店,共1.3億人的個人信息。出售的數據包含三個部分:(1)官網的注冊資料,如姓名、手機號、郵箱、身份證號和登錄密碼等;(2)酒店入住時登記的登錄信息,包含姓名、身份證、家庭住址、生日和內部ID; (3)酒店開房記錄,包含同房間關聯(lián)號、姓名、卡號、手機號、郵箱、入住時間及離開時間等。

  無論是一些大型工業(yè)互聯(lián)網的安全事件,還是暗網上令人觸目驚心的數據交易,都只是數據安全領域的冰山一角。近年來,數據安全問題頻頻發(fā)生,大到給國家安全和經濟社會發(fā)展造成嚴重的潛在危害,小到給公民個人造成巨大的經濟損失和精神傷害。正是由于數據在收集、存儲、使用、交換及銷毀等各個環(huán)節(jié)都存在極大的安全隱患,很多政府部門和大型互聯(lián)網企業(yè)在數據開放共享中都心存憂慮,擔心因數據泄露或遭黑客攻擊而帶來嚴重后果,不敢推動數據開放共享進程。

  除了對數據泄露等安全事件的恐懼,還有些出于對數據倫理的考慮。2018年10月24日,科技部官網公布了對復旦大學附屬華山醫(yī)院、華大基因、藥明康德、昆皓睿誠、廈門艾德生物、阿斯利康6家單位的行政處罰。雖然行政處罰的時間各不相同,但處罰的原因一致,都是因為違反《人類遺傳資源管理暫行辦法》(國辦發(fā)〔1998〕36號)、《中華人民共和國行政處罰法》等有關規(guī)定,違規(guī)采集、收集、買賣、出口、出境人類遺傳資源。從網上公開的材料來看,涉事單位阿斯利康未經許可將已獲批項目的剩余樣本轉運至廈門艾德生物醫(yī)藥科技股份有限公司和昆皓睿誠醫(yī)藥研發(fā)(北京)有限公司,開展超出審批范圍的科研活動;廈門艾德未經許可接收阿斯利康投資30管樣本,擬用于試劑盒研發(fā)相關活動;而昆皓睿誠則未經許可接收阿斯利康567管樣本并保存。

  值得一提的是,這是科技部首次公開涉及人類遺傳資源的行政處罰。實際上,針對此次“基因信息違法出境”事件,在《人類遺傳資源管理暫行辦法》《專利法》《網絡安全法》和《個人信息和重要數據出境安全評估辦法》,以及《刑法修正案》和《民法總則》等法律法規(guī)中均能找到處罰依據。這個案件折射出的不僅僅是如何把握數據跨境流動的安全性問題,還有數據倫理問題。

  大數據殺熟、動態(tài)定價等現(xiàn)象,數據本身是中立的,但與數據相關的技術和算法不一定是中立的,甚至帶有人類認識的局限性。因此,數據在利用過程中就會出現(xiàn)不中立甚至違背倫理的現(xiàn)象。尤其是針對上述基因信息等帶有人類生物特征的數據,更是一個國家、一國公民所不可觸碰的底線資源。再以無人駕駛為例,人類開車在正常行駛過程中遇到有人突然橫穿馬路時是決定直接撞過去還是緊急剎車,都包含對自身倫理道德的拷問,其決定可能是自私的,也可能是無私的,但在無人駕駛時,汽車只是接收一行行冷冰冰的代碼指令,然后做出選擇。所以,這也涉及數據的道德和倫理問題。那么,這些數據的開放共享牽扯到很多既有挑戰(zhàn)性又很復雜的問題,均會加重數據主體在開放共享數據時的顧慮。

  更有甚者,有時開放數據還會惹來麻煩,尤其由于數據質量問題招來的質疑。

  對于一個國家來說,統(tǒng)計數據是政府數據的主要來源。改革開放以來,我國政府統(tǒng)計進行了一系列改革,政府統(tǒng)計數據正在朝著越來越全面客觀反映國家經濟社會發(fā)展情況的方向發(fā)展。但我們也要看到,統(tǒng)計工作是一個比較復雜的系統(tǒng)工程,需要多個部門加強配合協(xié)調,按計劃進行統(tǒng)計信息的收集匯總和分析,才能形成統(tǒng)計數據分析結論。只要其中一個環(huán)節(jié)出現(xiàn)問題或失誤,就會直接導致統(tǒng)計數據的準確性下降。此外,缺乏明確的解釋和統(tǒng)一的統(tǒng)計口徑也會導致統(tǒng)計數據混亂。很多數據即使收集起來也無法進行對比分析和統(tǒng)一轉化,因而直接影響了政府統(tǒng)計數據的全面性、真實性和準確性,損害了政府公信力和權威形象。因此,有些部門和單位為了不承擔數據開放共享后因數據質量存在問題所帶來的麻煩,而寧可不開放共享。

  除了數據質量方面容易讓人產生顧慮,還有些數據造假行為更是成了數據開放共享過程中的“攔虎路”。2018年的某市空氣監(jiān)測數據造假案引起了廣泛關注。2017年1月,某市政府因大氣環(huán)境質量持續(xù)惡化、二氧化硫濃度長時間“爆表”問題被原環(huán)境保護部約談,并同步暫停新增大氣污染物排放項目的環(huán)評審批。2018年3月底,生態(tài)環(huán)境部檢查發(fā)現(xiàn),該市的6個國控空氣自動監(jiān)測站部分監(jiān)測數據異常,采樣系統(tǒng)受到人為干擾。經調查,犯罪嫌疑人通過堵塞采樣頭、向監(jiān)測設備灑水等方式,對全市6個國控空氣自動監(jiān)測站實施干擾近百次,導致監(jiān)測數據嚴重失真達53次。最終,涉案人員均被判處有期徒刑。

  試想,如果這樣的假數據被開放共享移作他用,將會帶來何種負面影響?!但是,當前此類問題并不鮮見。

  在互聯(lián)網行業(yè),數據造假更是隨處可見。2018年11月,一篇自媒體文章不僅引起了公眾對旅游社區(qū)平臺馬蜂窩點評內容抄襲的質疑,也捅開了互聯(lián)網行業(yè)數據造假的“馬蜂窩”。隨后,有業(yè)內人士指出,從最早的電商刷單、刷好評,到之后的微信公眾號買粉、刷閱讀量,再到網絡直播平臺買流量、App機器人用戶充數據,數據造假充斥各個角落。盡管數據造假的手段多種多樣,但背后的目的都是一樣的,即造假能夠降低成本、提高商業(yè)利益。然而,這樣的數據如果被開放共享,對于數據使用方來說真的是百害而無一利。

  3. 無本領開放共享

  大數據的價值在于如何通過分析繁復的數據得出預測性結論,并最終利用它來實現(xiàn)某種目的。其中,對數據的分析和處理是數據使用者的核心競爭力。然而,對數據進行挖掘和分析既包含統(tǒng)計、在線分析處理、機器學習等學科知識,也利用了人工智能、模式識別和算法等思想。同時,數據挖掘還接納入了包括最優(yōu)化、進化計算、信息論和可視化等其他領域的思維方式。可以說,數據的利用是一項專業(yè)性強、難度大的技術活。

  與數據的利用相比,數據的開放共享更是不易。從技術角度看,當前數據難以開放共享的根本原因在于當前信息系統(tǒng)設計的理論體系有問題。當前設計各種信息系統(tǒng)的特點是數據及數據結構完全由設計人員自己決定,因此各信息系統(tǒng)中的數據完全是異構的,要實現(xiàn)信息系統(tǒng)之間的互聯(lián)互通,必須通過轉換數據結構的方式實現(xiàn)。從這個意義來說,很多數據主體不具備實現(xiàn)開放共享的技能,無法開放共享。

  此外,目前關于數據開放共享的法律法規(guī)也十分匱乏。關于數據開放共享,目前國家和地方層面出臺了一些管理制度,但是主要針對政府間行為。

  國家層面

  2016年9月發(fā)布的《政務信息資源共享管理暫行辦法》規(guī)定,政務信息資源按共享類型分為無條件共享、有條件共享、不予共享等三種??商峁┙o所有政務部門共享使用的政務信息資源,屬于無條件共享類;可提供給相關政務部門共享使用,或僅能夠部分提供給所有政務部門共享使用的政務信息資源,屬于有條件共享類;不宜提供給其他政務部門共享使用的政務信息資源,屬于不予共享類。

  2018年3月發(fā)布的《科學數據管理辦法》在有關科學數據的共享與利用中提到以下幾點。

 ?。?)政府預算資金資助形成的科學數據應當按照開放為常態(tài)、不開放為例外的原則,由主管部門組織編制科學數據資源目錄,有關目錄和數據應及時接入國家數據共享交換平臺,面向社會和相關部門開放共享,暢通科學數據軍民共享渠道。國家法律法規(guī)有特殊規(guī)定的除外。

 ?。?)法人單位要對科學數據進行分級分類,明確科學數據的密級和保密期限、開放條件、開放對象和審核程序等,按要求公布科學數據開放目錄,通過在線下載、離線共享或定制服務等方式向社會開放共享。

 ?。?)對于政府決策、公共安全、國防建設、環(huán)境保護、防災減災、公益性科學研究等需要使用科學數據的,法人單位應當無償提供;確需收費的,應按照規(guī)定程序和非營利原則制定合理的收費標準,向社會公布并接受監(jiān)督。

  (4)對于因經營性活動需要使用科學數據的,當事人雙方應當簽訂有償服務合同,明確雙方的權利和義務。

  地方層面

  2017年5月開始施行的《貴陽市政府數據共享開放條例》將政府數據開放共享工作、經費、目標考核納入法制化管理,對各級部門的相應職責進行了具體規(guī)定和明確;規(guī)定行政機關通過共享平臺獲取的文書類、證照類、合同類政府數據與紙質文書原件具有同等效力,可以作為行政管理、服務和執(zhí)法的依據。在政府數據開放共享中,政府數據提供機關不同意開放政府數據的要說明理由并限時答復。尤其是在政府數據開放中,除了規(guī)定不同意開放要說明理由以外,還規(guī)定了對政府數據提供機關的答復有異議的可以向市大數據行政主管部門提出復核申請,大數據行政主管部門應當限時反饋復核結果。

  不過,這些政策文件主要還是從宏觀和頂層設計的角度對政府數據開放共享進行規(guī)定,目前我國還沒有哪部法律法規(guī)對數據開放共享的原則、數據分類和開放邊界、數據格式、質量標準、互操作性等做出規(guī)范。而且,數據在采集、傳輸、存儲、處理、交換甚至銷毀等各個階段,其所有者和使用者往往都不同,存在數據所有權和使用權分離的情況,很容易導致數據濫用、數據權屬不明確以及無法進行數據定價等問題。針對這些情況,現(xiàn)階段都沒有明確的法規(guī)予以指導和規(guī)范,所以導致數據開放共享難以操作,出現(xiàn)問題也找不到相應的法律依據加以解決。




電子技術圖片.png

本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。

相關內容