神州數(shù)碼TDMP數(shù)據(jù)脫敏解決方案
企業(yè)敏感數(shù)據(jù)的“易容大師”!
神州數(shù)碼集團(tuán)
冷秋華
Part 1
背景引言
在大數(shù)據(jù)時(shí)代的“江湖”中,數(shù)據(jù)作為信息的重要載體,潛藏著不可限量的商業(yè)價(jià)值,與此同時(shí),數(shù)據(jù)在流動的過程中也面臨著敏感信息一不小心就會被泄露的危險(xiǎn)。
在企業(yè)數(shù)字化轉(zhuǎn)型的過程中,公司的新業(yè)務(wù)系統(tǒng)正在研發(fā),系統(tǒng)要完成上線,必須提供如商業(yè)數(shù)據(jù)、財(cái)務(wù)數(shù)據(jù)、人力資源數(shù)據(jù)等一些包含敏感隱私數(shù)據(jù)給研發(fā)用于開發(fā)環(huán)境/測試環(huán)境的使用。此時(shí),在企業(yè)戰(zhàn)略升級必須提供數(shù)據(jù)卻又不能展示敏感信息的矛盾中,作為公司數(shù)據(jù)資產(chǎn)負(fù)責(zé)人的您,會作何抉擇?
在武俠的江湖里,“大俠”為了在行走江湖行俠仗義的時(shí)不被認(rèn)出來,一般通過易容將自己的“敏感”信息——真實(shí)的面容隱藏起來。在當(dāng)今時(shí)代,數(shù)據(jù)想要在流動的過程中發(fā)揮價(jià)值,又必須隱藏自己不便為眾人所知的“真實(shí)樣子”又該如何做到呢?
數(shù)據(jù)脫敏技術(shù)應(yīng)運(yùn)而生。
Part 2
什么是數(shù)據(jù)脫敏?
數(shù)據(jù)脫敏(Data Masking),即屏蔽敏感數(shù)據(jù)。在數(shù)據(jù)脫敏是指對某些敏感信息通過脫敏規(guī)則進(jìn)行數(shù)據(jù)的變形,實(shí)現(xiàn)敏感隱私數(shù)據(jù)的可靠保護(hù),防止敏感數(shù)據(jù)直接在不可靠的環(huán)境下使用。
通俗來說:就是通過技術(shù)手段給企業(yè)敏感數(shù)據(jù)進(jìn)行“易容”,“易容”后的敏感數(shù)據(jù)就夠在各種“危險(xiǎn)”環(huán)境中“來去自由”,實(shí)現(xiàn)他自身的“行俠仗義拯救江湖”的高階價(jià)值。
數(shù)據(jù)脫敏一般分為靜態(tài)數(shù)據(jù)脫敏和動態(tài)數(shù)據(jù)脫敏。靜態(tài)數(shù)據(jù)脫敏,是數(shù)據(jù)的“搬移并仿真替換”,是將數(shù)據(jù)抽取進(jìn)行脫敏處理后,下發(fā)給下游環(huán)節(jié),隨意取用和讀寫的,脫敏后數(shù)據(jù)與生產(chǎn)環(huán)境相隔離,滿足業(yè)務(wù)需求的同時(shí)保障生產(chǎn)數(shù)據(jù)庫的安全。適用于將數(shù)據(jù)抽取出生產(chǎn)環(huán)境脫敏后分發(fā)至測試、開發(fā)、培訓(xùn)、數(shù)據(jù)分析等場景。
動態(tài)數(shù)據(jù)脫敏,在訪問敏感數(shù)據(jù)的同時(shí)實(shí)時(shí)進(jìn)行脫敏處理,可以為不同角色、不同權(quán)限、不同數(shù)據(jù)類型執(zhí)行不同的脫敏方案,從而確保返回的數(shù)據(jù)可用而安全。動態(tài)數(shù)據(jù)脫敏一般用在生產(chǎn)環(huán)境,將敏感數(shù)據(jù)實(shí)時(shí)進(jìn)行脫敏后用于應(yīng)用訪問等生產(chǎn)環(huán)境。
Part 3
數(shù)據(jù)“易容”的過程是怎么樣的呢?
數(shù)據(jù)脫敏的業(yè)務(wù)流程包括:數(shù)據(jù)源管理、敏感數(shù)據(jù)發(fā)現(xiàn)、脫敏方案制定、脫敏任務(wù)定制與調(diào)度。其中核心的2步是敏感數(shù)據(jù)發(fā)現(xiàn)和脫敏方案制定。
1.數(shù)據(jù)“易容”之敏感數(shù)據(jù)發(fā)現(xiàn)
在進(jìn)行數(shù)據(jù)脫敏之前,我們首先要確認(rèn)哪些數(shù)據(jù)作為脫敏的目標(biāo)。一般的敏感信息包括:身份標(biāo)識、生物識別信息、虛擬身份信息、個人隱私信息、財(cái)產(chǎn)信息等。在更復(fù)雜的業(yè)務(wù)場景中,還需要按照比如安全等級、業(yè)務(wù)維度梳理敏感信息。
2.數(shù)據(jù)“易容”之脫敏方案制定
確認(rèn)了敏感數(shù)據(jù)字段后,就是根據(jù)特定的場景對敏感數(shù)據(jù)制定脫敏方案。常見的數(shù)據(jù)脫敏方式包括:替換、重排、加密、截?cái)?、掩碼、日期偏移取整。
在選擇通過什么樣的方式給敏感數(shù)據(jù)“易容”,需要基于不同的應(yīng)用場景,但都要遵循兩個原則:
1)盡可能地為脫敏后的應(yīng)用,保留脫敏前的有意義信息
2)最大程度上防止黑客進(jìn)行破解
通俗來說,在抹去數(shù)據(jù)中的敏感內(nèi)容同時(shí),也需要保持原有的數(shù)據(jù)特征、業(yè)務(wù)規(guī)則和數(shù)據(jù)關(guān)聯(lián)性,保證我們在開發(fā)、測試以及數(shù)據(jù)分析類業(yè)務(wù)不會受到脫敏的影響,使脫敏前后的數(shù)據(jù)一致性和有效性。
Part 4
神州數(shù)碼TDMP有哪些“易容”絕技?
脫敏的概念并不算標(biāo)新立異,近年來,隨著國家法律法規(guī)及行業(yè)信息化管理制度的完善、數(shù)據(jù)使用場景愈加復(fù)雜、脫敏后數(shù)據(jù)仿真度要求提高,專業(yè)的數(shù)據(jù)脫敏產(chǎn)品成為了大眾普遍的選擇。
神州數(shù)碼TDMP數(shù)據(jù)脫敏平臺是神州數(shù)碼獨(dú)立設(shè)計(jì)、研發(fā)的一款開箱即用的敏感數(shù)據(jù)安全防護(hù)應(yīng)用,曾斬獲工信部“鼎信杯”信創(chuàng)大賽優(yōu)秀產(chǎn)品獎,并通過了公安部的多項(xiàng)高標(biāo)準(zhǔn)、高級別安全測試。作為企業(yè)敏感數(shù)據(jù)的“易容大師”,TDMP具備以下五大絕技。
絕技一:博——廣泛的數(shù)據(jù)源支持
系統(tǒng)支持各種主流關(guān)系數(shù)據(jù)庫、國產(chǎn)數(shù)據(jù)庫、內(nèi)存數(shù)據(jù)庫、分布式數(shù)據(jù)庫、列式數(shù)據(jù)庫、分區(qū)數(shù)據(jù)庫、各種結(jié)構(gòu)化文件、非結(jié)構(gòu)化文件、本地文件、遠(yuǎn)程文件、各種大數(shù)據(jù)平臺等。
絕技二:準(zhǔn)——精準(zhǔn)的敏感信息識別
系統(tǒng)采用正則、編碼校驗(yàn)、詞法語法分析、數(shù)據(jù)字典、智能記憶、統(tǒng)計(jì)分析等多種組合掃描算法實(shí)現(xiàn)敏感信息的快速識別和精準(zhǔn)識別。同時(shí)還提供在線修正與核實(shí)功能,以及csv文本批量導(dǎo)入與下載敏感信息功能。
絕技三:妙——靈活的脫敏策略
系統(tǒng)內(nèi)置各種基線策略,包括個人基本信息、醫(yī)療衛(wèi)生、教育、金融、制造、政務(wù)等各種行業(yè)或類別的內(nèi)置策略。還可以設(shè)置策略種子、策略是否可逆、策略適配度等。
絕技四:好——高效豐富的脫敏算法
系統(tǒng)內(nèi)置80多種脫敏算法,囊括了包括人基本信息、醫(yī)療衛(wèi)生、教育、金融、制造、政務(wù)等各種行業(yè)或類別的敏感信息的脫敏算法。算法有唯一仿真類算法、隨機(jī)類算法、加密類算法、切片類算法、掩碼類算法、置換類算法、組合類算法、自定義類算法等。
絕技五:廣——多樣化業(yè)務(wù)場景支持
系統(tǒng)支持源庫更新脫敏、庫到庫異構(gòu)脫敏、庫到庫同構(gòu)脫敏、庫到文件脫敏、文件到庫脫敏、文件到文件脫敏、大數(shù)據(jù)平臺脫敏、大數(shù)據(jù)平臺與文件&數(shù)據(jù)庫互遷移脫敏。
神州數(shù)碼TDMP數(shù)據(jù)脫敏解決方案,讓您企業(yè)的數(shù)據(jù)以更安全的形式發(fā)揮最大的商業(yè)價(jià)值。