神州數(shù)碼TDMP數(shù)據(jù)脫敏解決方案
企業(yè)敏感數(shù)據(jù)的“易容大師”!
神州數(shù)碼集團
冷秋華
Part 1
背景引言
在大數(shù)據(jù)時代的“江湖”中,數(shù)據(jù)作為信息的重要載體,潛藏著不可限量的商業(yè)價值,與此同時,數(shù)據(jù)在流動的過程中也面臨著敏感信息一不小心就會被泄露的危險。
在企業(yè)數(shù)字化轉(zhuǎn)型的過程中,公司的新業(yè)務系統(tǒng)正在研發(fā),系統(tǒng)要完成上線,必須提供如商業(yè)數(shù)據(jù)、財務數(shù)據(jù)、人力資源數(shù)據(jù)等一些包含敏感隱私數(shù)據(jù)給研發(fā)用于開發(fā)環(huán)境/測試環(huán)境的使用。此時,在企業(yè)戰(zhàn)略升級必須提供數(shù)據(jù)卻又不能展示敏感信息的矛盾中,作為公司數(shù)據(jù)資產(chǎn)負責人的您,會作何抉擇?
在武俠的江湖里,“大俠”為了在行走江湖行俠仗義的時不被認出來,一般通過易容將自己的“敏感”信息——真實的面容隱藏起來。在當今時代,數(shù)據(jù)想要在流動的過程中發(fā)揮價值,又必須隱藏自己不便為眾人所知的“真實樣子”又該如何做到呢?
數(shù)據(jù)脫敏技術(shù)應運而生。
Part 2
什么是數(shù)據(jù)脫敏?
數(shù)據(jù)脫敏(Data Masking),即屏蔽敏感數(shù)據(jù)。在數(shù)據(jù)脫敏是指對某些敏感信息通過脫敏規(guī)則進行數(shù)據(jù)的變形,實現(xiàn)敏感隱私數(shù)據(jù)的可靠保護,防止敏感數(shù)據(jù)直接在不可靠的環(huán)境下使用。
通俗來說:就是通過技術(shù)手段給企業(yè)敏感數(shù)據(jù)進行“易容”,“易容”后的敏感數(shù)據(jù)就夠在各種“危險”環(huán)境中“來去自由”,實現(xiàn)他自身的“行俠仗義拯救江湖”的高階價值。
數(shù)據(jù)脫敏一般分為靜態(tài)數(shù)據(jù)脫敏和動態(tài)數(shù)據(jù)脫敏。靜態(tài)數(shù)據(jù)脫敏,是數(shù)據(jù)的“搬移并仿真替換”,是將數(shù)據(jù)抽取進行脫敏處理后,下發(fā)給下游環(huán)節(jié),隨意取用和讀寫的,脫敏后數(shù)據(jù)與生產(chǎn)環(huán)境相隔離,滿足業(yè)務需求的同時保障生產(chǎn)數(shù)據(jù)庫的安全。適用于將數(shù)據(jù)抽取出生產(chǎn)環(huán)境脫敏后分發(fā)至測試、開發(fā)、培訓、數(shù)據(jù)分析等場景。
動態(tài)數(shù)據(jù)脫敏,在訪問敏感數(shù)據(jù)的同時實時進行脫敏處理,可以為不同角色、不同權(quán)限、不同數(shù)據(jù)類型執(zhí)行不同的脫敏方案,從而確保返回的數(shù)據(jù)可用而安全。動態(tài)數(shù)據(jù)脫敏一般用在生產(chǎn)環(huán)境,將敏感數(shù)據(jù)實時進行脫敏后用于應用訪問等生產(chǎn)環(huán)境。
Part 3
數(shù)據(jù)“易容”的過程是怎么樣的呢?
數(shù)據(jù)脫敏的業(yè)務流程包括:數(shù)據(jù)源管理、敏感數(shù)據(jù)發(fā)現(xiàn)、脫敏方案制定、脫敏任務定制與調(diào)度。其中核心的2步是敏感數(shù)據(jù)發(fā)現(xiàn)和脫敏方案制定。
1.數(shù)據(jù)“易容”之敏感數(shù)據(jù)發(fā)現(xiàn)
在進行數(shù)據(jù)脫敏之前,我們首先要確認哪些數(shù)據(jù)作為脫敏的目標。一般的敏感信息包括:身份標識、生物識別信息、虛擬身份信息、個人隱私信息、財產(chǎn)信息等。在更復雜的業(yè)務場景中,還需要按照比如安全等級、業(yè)務維度梳理敏感信息。
2.數(shù)據(jù)“易容”之脫敏方案制定
確認了敏感數(shù)據(jù)字段后,就是根據(jù)特定的場景對敏感數(shù)據(jù)制定脫敏方案。常見的數(shù)據(jù)脫敏方式包括:替換、重排、加密、截斷、掩碼、日期偏移取整。
在選擇通過什么樣的方式給敏感數(shù)據(jù)“易容”,需要基于不同的應用場景,但都要遵循兩個原則:
1)盡可能地為脫敏后的應用,保留脫敏前的有意義信息
2)最大程度上防止黑客進行破解
通俗來說,在抹去數(shù)據(jù)中的敏感內(nèi)容同時,也需要保持原有的數(shù)據(jù)特征、業(yè)務規(guī)則和數(shù)據(jù)關聯(lián)性,保證我們在開發(fā)、測試以及數(shù)據(jù)分析類業(yè)務不會受到脫敏的影響,使脫敏前后的數(shù)據(jù)一致性和有效性。
Part 4
神州數(shù)碼TDMP有哪些“易容”絕技?
脫敏的概念并不算標新立異,近年來,隨著國家法律法規(guī)及行業(yè)信息化管理制度的完善、數(shù)據(jù)使用場景愈加復雜、脫敏后數(shù)據(jù)仿真度要求提高,專業(yè)的數(shù)據(jù)脫敏產(chǎn)品成為了大眾普遍的選擇。
神州數(shù)碼TDMP數(shù)據(jù)脫敏平臺是神州數(shù)碼獨立設計、研發(fā)的一款開箱即用的敏感數(shù)據(jù)安全防護應用,曾斬獲工信部“鼎信杯”信創(chuàng)大賽優(yōu)秀產(chǎn)品獎,并通過了公安部的多項高標準、高級別安全測試。作為企業(yè)敏感數(shù)據(jù)的“易容大師”,TDMP具備以下五大絕技。
絕技一:博——廣泛的數(shù)據(jù)源支持
系統(tǒng)支持各種主流關系數(shù)據(jù)庫、國產(chǎn)數(shù)據(jù)庫、內(nèi)存數(shù)據(jù)庫、分布式數(shù)據(jù)庫、列式數(shù)據(jù)庫、分區(qū)數(shù)據(jù)庫、各種結(jié)構(gòu)化文件、非結(jié)構(gòu)化文件、本地文件、遠程文件、各種大數(shù)據(jù)平臺等。
絕技二:準——精準的敏感信息識別
系統(tǒng)采用正則、編碼校驗、詞法語法分析、數(shù)據(jù)字典、智能記憶、統(tǒng)計分析等多種組合掃描算法實現(xiàn)敏感信息的快速識別和精準識別。同時還提供在線修正與核實功能,以及csv文本批量導入與下載敏感信息功能。
絕技三:妙——靈活的脫敏策略
系統(tǒng)內(nèi)置各種基線策略,包括個人基本信息、醫(yī)療衛(wèi)生、教育、金融、制造、政務等各種行業(yè)或類別的內(nèi)置策略。還可以設置策略種子、策略是否可逆、策略適配度等。
絕技四:好——高效豐富的脫敏算法
系統(tǒng)內(nèi)置80多種脫敏算法,囊括了包括人基本信息、醫(yī)療衛(wèi)生、教育、金融、制造、政務等各種行業(yè)或類別的敏感信息的脫敏算法。算法有唯一仿真類算法、隨機類算法、加密類算法、切片類算法、掩碼類算法、置換類算法、組合類算法、自定義類算法等。
絕技五:廣——多樣化業(yè)務場景支持
系統(tǒng)支持源庫更新脫敏、庫到庫異構(gòu)脫敏、庫到庫同構(gòu)脫敏、庫到文件脫敏、文件到庫脫敏、文件到文件脫敏、大數(shù)據(jù)平臺脫敏、大數(shù)據(jù)平臺與文件&數(shù)據(jù)庫互遷移脫敏。
神州數(shù)碼TDMP數(shù)據(jù)脫敏解決方案,讓您企業(yè)的數(shù)據(jù)以更安全的形式發(fā)揮最大的商業(yè)價值。