在以互聯網為標志的信息化時代,傳統數據在形式和內容的表達以及交流和傳遞的方式都發生了質與量的變化。網絡數據對社會形態產生重大影響,對社會發展形成巨大動力。
對網絡數據,不論是從法律和司法,或是技術和應用的角度,都必須要有明確、清晰的定義,以及對合規性有廣泛的共識。否則,對網絡數據的研究難以避免缺少“共同語言”、缺失“治理 邊界”、缺欠“對話基礎”。
什么是網絡數據?
簡單地說,網絡數據是以規范化數值或字符集合的方式,提供事實、概念或指令的表示形式,并通過網絡傳輸、交換、存儲和共享,適合于人工或自動方法處理的通信和解釋。
網絡數據的承載包括:元數據、內容、信息和情報。
圖1 網絡數據承載的一般分類
因此,感知和認知網絡數據,既可以從不同角度、不同場景、不同方法、不同目的,而且所獲取的知識也不是唯一的。但是,網絡數據的合規性具有緊迫和重要的現實意義,參考國外的法律法規和術語定義,探討如下。
一、前言
2012年2月,美國智庫布魯金斯學會(Brookings)在題為《網絡安全與美中關系》的報告中,就術語和議題框架的重要性指出:“任何一個登上國際議程的新議題,即使費時費力,都必須發展出一套公認的詞匯和概念。無論是貿易談判還是核武器,這些問題的基本術語往往看起來簡單,但要達成共識卻非常困難。”該報告認為,“術語相異”對美中雙方就行為規范或合作性實施機制達成共識產生巨大挑戰。
2014年6月9日,美國國防部發布《專業術語和定義》,開篇引用了希臘哲學家、教育家蘇格拉底的一句話:“智慧始于對術語的定義”。美國參謀長聯席會議、美國國防部、美國國土 安全部、北約組織等近年來不斷地修正和持續地更新網絡以及信息戰的字典和專用術語,發人深省。
二、網絡數據驅動了“網絡法律”
5月25日生效的歐盟《通用數據保護條例》GDPR,取代了1995年的數據保護指令,是迄今最為嚴格的個人數據保護法規。
GDPR重新定義和規定了網絡數據中的“個人數據”為:“識別或可識別自然人有關的任何信息”。在GDPR法釋(Recital)中的第26條進一步澄清“可識別”為:可以通過“一切合理和可能使用的手段”識別個人。這就是說,雖然可能不是由持有數據的企業主動地識別個人,但是如果數據可用于通過與其他數據源進行匯總來識別某個人,則該數據(或元數據)仍被視為個人數據。
GDPR還規定了個人身份識別不僅僅是個人姓名,還包括身份標識(ID),瀏覽器緩存(Cookie)、電子郵件(Email)地址、互聯網協議(IP)地址、元數據(Metadata)等內容,以及對于數據泄露的報告和通報。
因此,可以認為,是網絡數據驅動了GDPR“網絡法律”,以保護網絡數據中的個人數據及個人隱私和個人權利。
3月23日,美國《澄清境外數據合法使用法》(CLOUD)生效,授權美國執法部門可以調取互聯網所涉在世界各地存儲和管理的網絡數據。CLOUD不僅修正了美國法典(U.S. Code)的第18章,而且與之前的相關法律法規互為依托、延伸。例如:
聯邦貿易委員會法(FTCA),消費者保護法,禁止不公平或欺騙行為,并應用于離線和在線隱私和數據安全政策。
金融服務現代化法(FSMA),規定金融信息的收集, 使用和披露。
健康保險流通與責任法(HIPAA),規定醫療信息的收集, 使用和披露。
公平信用報告法(FCRA),適用于使用消費者報告的機構(如貸款機構)和提供消費者報告信息的機構(如信用卡公司)。
電話用戶保護法(TCPA),規范收集和使用電子郵件地址和電話號碼。
電子通信隱私法(ECPA)和預防電腦欺詐和濫用法(CFAA),分別規范攔截電子通信和篡改計算機內容。
可見,由網絡數據驅動的“網絡法律”,所規范和適用的場景和范圍不盡相同,但又存在法條的相互關聯和參照的交叉法則(Two-Pronged Test)。因而,“網絡法律”是跨領域的立法和司法程序,且需要不斷地補充、修正和完善,包括術語的定義和解釋。
三、網絡數據之“術語”及其合規性
英文與中文都有多義詞匯,其含義往往不僅需要結合上下文解釋,而且還需要有專業的知識和實踐的經驗。尤其是,隨著互聯網的快速發展,某些關鍵的英文單詞和詞匯被重新標準化定義,修正或賦予專業的表達。
美國參謀長聯席會議副主席詹姆斯·卡特賴特(James Cartwright)在發布網絡空間戰專用術語詞典的備忘錄中強調:網絡領域的某些單詞已不能夠詳細表述任務集的細微差別,專業詞典是作為在所有與網絡相關的文檔、指令、作戰理念和出版物中規范術語的起點。相關術語定義和解釋的摘錄如下:
1)數據(Data),以規范化數值或字符集合的方式,提供 事實、概念或指令的表示形式(適合人工或自動手段進行通信、解釋或處理)。來源:美國國土安全部專業術語詞典。
2)元數據(Metadata),對具體數據段的描述及其所有關聯屬性的信息。(備注: 元數據表示資源的來源、特征、時間、地點、原因和方式。最為一般的解釋是描述數據的數據。) 來源:美國國土安全部專業術語詞典。
3)信息(Information),是可利用形式的數據,通常以有意圖的方式進行處理,組織,結構化或呈現(人類賦予數據以使用的已知慣例的含義表示)。來源:美國國土安全部專業術語詞典。
4)情報(Intelligence),分析和綜合具有戰術,行動或戰略 價值的信息。來源:美國國土安全部專業術語詞典。
5)數據元素(Data Element),(1)建立在標準結構上的基本信息單元,具有特定含義和不同單位或數值的。(2)在電子記錄中,涉及具體的信息項目的字符或字節的組合,例如姓名,地址或年齡。來源:美國國防部專業術語詞典。
6)信息環境(Information Environment),對信息收集、處理、傳播或行動的個人、組織和系統的集合。來源:美國國防部專業術語詞典。
7)‘網信’空間(Cyberspace),全球范圍的信息環境(數字化信息通過計算機網絡傳遞的概念環境), 由相互依存的信息技術基礎設施網絡和存儲數據組成, 包括互聯網、電信網絡、計算機系統以及嵌入式處理器和控制器,通過網絡系統和相關的物理基礎設施來存儲,修改和交換數據。來源:美國國防部專業術語詞典。
8)網絡(Network),執行某一功能的信息交換或相互交互。來源:美國國土安全部專業術語詞典。
9)互聯網(Internet),可公開訪問網站(Web)內容的網絡。來源:美國國土安全部專業術語詞典。
10)‘網際’或‘網信’(Cyber),與計算機文化特點相關的信息技術和虛擬現實。(來源:北約網絡協同防務合作中心(CCDCOE)-牛津字典。)
參考專業術語定義以及網絡和互聯網的關系和現狀,必須 定位和區分網絡(Network)、互聯網(Internet)、‘網際’(Cyber):
圖2 國際標準:‘網際’安全與其他安全領域的關聯關系(來源:Guidelines for Cybersecurity,ISO/IEC27032,2012)
其中,網絡(Network)一般指的是電信網絡(或計算機網絡、物理網絡),而‘網際’(Cyber)既與網絡(Network)有交集,且覆蓋的范圍更為寬泛。因此,Network和Cyber同譯為“網絡” 不僅造成概念混淆、混亂,而且缺失合規性(或成為“術語陷阱”)。
建議考慮:Cyber結合上下文譯為“網際”或“網信”,以應對 “網絡邊界”的挑戰,包括合規邊界、管轄邊界、治理邊界:
1)彌補傳統網絡(Network)、互聯網(Internet)、應用(App)之間存在的空白(缺失),定位和顯現法律的合規邊界;
2)Cyerspace,或譯為“網信空間”,是由全球化的物理網絡、 網絡數據、網絡行為的三個維度所組成(來源:美國參謀長聯席會議的軍事教義“信息戰”,JP3-13,2012-11),而這個信息環境不可避免地存在主權的管轄邊界。
3)網絡數據的核心問題是數據保護,而基于網絡數據的立法司法的多邊對等執行直接涉及政策的治理邊界。
四、網絡數據之“數據”及其合規性
在網絡環境中,數據與信息必須有效地差分(分類)和區分(聚類),“跨界內容刪除”(Cross-Border Content Takedown)是目前國際社會正在熱議的主題之一。
在網絡應用中,數據不再僅僅局限于“記錄”的過程和動作,而數據的多源和多元的涌現使得數據有了“生命力”(例如,臉書Facebook的數據泄露丑聞),“跨界訪問用戶數據”(Cross-Border Access to User Data)是目前國際社會正在研討的另一主題。
圖3 全球互聯網及管轄政策網絡的研討主題(2016-2019)
事實上,網絡數據對于傳統意義的“客觀性”和“工具性”,已經或正在發生顛覆性的變化。
1)從法律的角度,GDPR規定:
在存儲或處理個人數據之前, 需要得到個人的有效認可。個人認可包括所收集的數據和將用于的目的,也包括營銷和其他形式的通信交流。
任何處理歐盟內個人數據的公司應對數據負責, 數據的管理者與數據的處理者同責,而無論公司位于何處。
因而,GDPR強制(迫使)在數據屬主(用戶)、數據管理者和數據處理者之間形成了一種“非零和”的合作博弈。
2)網絡數據的“客觀性”之轉基因
GDPR對規定“所有IP 地址應作為個人數據處理”的解釋是:在動態IP 地址的情況下,個人每次連接到網絡時IP地址都會發生了變化,但是網絡服務提供商(ISP) 有一個暫時的動態IP 地址記錄(日志), 并知道IP 地址已被分配給誰。
雖然原始產生的網絡數據是客觀的,但是不可避免人為影響的介入,導致衍生或派生出新的網絡數據(如習慣、喜好);由于濫用、失竊、泄露就可能形成變異的網絡數據(如模仿、克隆),使原有網絡數據的真實性出現了“轉基因”。例如,在機器學習領域中的一類模型:生成對抗網絡,其目的和效果不僅超越了網絡數據的客觀性,而且還可能超越人們對現實的已知能力。
任何網絡數據集合都是稀疏的,或“客觀”網絡數據存在局限性。
3)對網絡數據的“工具性”之商榷
網絡數據,不管是產生、應用和被利用,或是可以相互獨立存在的集合體,都是由信息技術賦予其動態的“生命力”,并挖掘出其價值。曾幾何時,網絡數據被詬病為“信息孤島”、“數字垃圾”,而并不具備任何“工具性”特征。一旦網絡數據的“客觀性”不復存在,其功能和作用就需要被重新審視。因此,為了認知網絡數據、了解網絡數據,需要理念、方法和技術能力的不斷提升,包括:普適性的理論基礎和階段性的經驗推斷。例如:
香農(Shannon)定理給出,信道信息傳送速率的上限(比特每秒)和信道信噪比及帶寬的關系。香農定理可以解釋現代各種無線制式由于帶寬不同,所支持的單載波最大吞吐量的不同。
摩爾(Moore)定律提出,當價格不變時,集成電路上可容納的元器件的數目,約每隔18-24個月便會增加一倍,性能也將提升一倍。
但是,摩爾定律不同于香農定理的嚴格證明,摩爾定律應該被認為是觀測或推測,而不是一個自然或物理定理。
網絡數據的“工具性”基于理論基礎、先驗和認知,以及合規。
五、歸納總結
網絡數據驅動了“網絡法律”,網絡法律指的是跨邊界、跨領域、跨學科、跨(業務)應用所形成多邊的法律網絡(Networking),以及適用于更為廣泛的交叉法則(Two-Pronged Test),而司法 不再僅僅是依照于一個法規、或若干法條的解釋。
網絡數據所需的合規性(包括政策和策略以及多邊和對等),首先需要有對專業術語的理解和共識,避免或緩解由于“術語 相異”而造成的“術語陷阱”。
網絡數據存在的稀疏性,成為機器學習、數據挖掘等新技術的目標和聚焦點,需要理念、方法和技術能力的不斷提升,尤其是加強對基礎理論的研究和積累。
主權和管轄是有界的;治理和管理是有界的,但法律和司法是跨界的;技術和理論是跨界的;業務和應用是跨界的,因此對網絡數據合規性的相關研究和認知必須明確地定義和定位邊界。
(來源:昆侖策網【原創】)
【昆侖策研究院】作為綜合性戰略研究和咨詢服務機構,遵循國家憲法和法律,秉持對國家、對社會、對客戶負責,講真話、講實話的信條,追崇研究價值的客觀性、公正性,旨在聚賢才、集民智、析實情、獻明策,為實現中華民族偉大復興的“中國夢”而奮斗。歡迎您積極參與和投稿。
電子郵箱:gy121302@163.com
更多文章請看《昆侖策網》,網址:
http://www.kunlunce.cn
http://www.jqdstudio.net
1、本文只代表作者個人觀點,不代表本站觀點,僅供大家學習參考;
2、本站屬于非營利性網站,如涉及版權和名譽問題,請及時與本站聯系,我們將及時做相應處理;
3、歡迎各位網友光臨閱覽,文明上網,依法守規,IP可查。
作者 相關信息
內容 相關信息
? 昆侖專題 ?
? 十九大報告深度談 ?
? 新征程 新任務 新前景 ?
? 習近平治國理政 理論與實踐 ?
? 我為中國夢獻一策 ?
? 國資國企改革 ?
? 雄安新區建設 ?
? 黨要管黨 從嚴治黨 ?
? 社會調查 ?
圖片新聞