名门电玩

logo logo logo logo
股票代码:000034.SZ
神州云 | 数据安全法表决通过,名门电玩TDMP全面推进数据安全建设
发布日期:2021-06-11
分享到:

近几年(nian),以(yi)数(shu)(shu)据(ju)为(wei)新(xin)生产要素(su)的(de)数(shu)(shu)字经(jing)济蓬勃(bo)发展,数(shu)(shu)据(ju)安(an)全(quan)(quan)(quan)(quan)作(zuo)为(wei)保障数(shu)(shu)字经(jing)济稳步发展的(de)基(ji)石,相关的(de)法律法规和监管(guan)制(zhi)度(du)也日益严格。2021年(nian)6月10日,《中华人民(min)共和国(guo)(guo)数(shu)(shu)据(ju)安(an)全(quan)(quan)(quan)(quan)法》由第(di)十三(san)届全(quan)(quan)(quan)(quan)国(guo)(guo)人民(min)代表大会常务委员会第(di)二十九(jiu)次会议通过,作(zuo)为(wei)数(shu)(shu)据(ju)领域的(de)基(ji)础(chu)性法律,也是国(guo)(guo)家安(an)全(quan)(quan)(quan)(quan)领域的(de)一部重要法律,数(shu)(shu)据(ju)安(an)全(quan)(quan)(quan)(quan)法进(jin)一步明确了企业在保障数(shu)(shu)据(ju)安(an)全(quan)(quan)(quan)(quan)中的(de)责任与义务,强调要建(jian)立(li)健全(quan)(quan)(quan)(quan)全(quan)(quan)(quan)(quan)流(liu)程数(shu)(shu)据(ju)安(an)全(quan)(quan)(quan)(quan)管(guan)理制(zhi)度(du),采取(qu)相应的(de)技(ji)术措施保障数(shu)(shu)据(ju)安(an)全(quan)(quan)(quan)(quan)。

面对数(shu)(shu)据(ju)(ju)(ju)(ju)安全(quan)法提出的(de)(de)更高要求(qiu),名门电玩独立设计研发的(de)(de)TDMP数(shu)(shu)据(ju)(ju)(ju)(ju)脱敏系(xi)统,基于灵活的(de)(de)脱敏策略、精准(zhun)的(de)(de)隐私(si)数(shu)(shu)据(ju)(ju)(ju)(ju)发现、多样化的(de)(de)脱敏方(fang)(fang)式和高效(xiao)的(de)(de)脱敏算法等优势,为企业(ye)的(de)(de)数(shu)(shu)据(ju)(ju)(ju)(ju)隐私(si)保护提供高安全(quan)性、高可(ke)用性、高可(ke)靠性、高稳定(ding)性、高效(xiao)率(lv)的(de)(de)专业(ye)数(shu)(shu)据(ju)(ju)(ju)(ju)安全(quan)方(fang)(fang)案。

数据安全防护面临多重难点 数据识别能力亟需提升

当前,越(yue)(yue)来越(yue)(yue)多的(de)(de)企业(ye)正在(zai)通过(guo)引入专业(ye)的(de)(de)数(shu)(shu)据(ju)(ju)脱敏工具完(wan)善数(shu)(shu)据(ju)(ju)安全防(fang)(fang)御体系,提高(gao)数(shu)(shu)据(ju)(ju)安全管理(li)和治理(li)水平。但(dan)随(sui)着业(ye)务扩展、以及大数(shu)(shu)据(ju)(ju)、云(yun)计算等新(xin)技术(shu)的(de)(de)应用,企业(ye)数(shu)(shu)据(ju)(ju)安全防(fang)(fang)护(hu)(hu)的(de)(de)要求越(yue)(yue)来越(yue)(yue)高(gao),防(fang)(fang)护(hu)(hu)的(de)(de)难度也越(yue)(yue)来越(yue)(yue)大,原有的(de)(de)安全防(fang)(fang)护(hu)(hu)模(mo)型逐渐(jian)难以满(man)足现实的(de)(de)安全需(xu)求。

一方(fang)面(mian),由于企业(ye)业(ye)务(wu)变(bian)更(geng)迭代和人员流动等问(wen)题,导致(zhi)新的(de)敏感(gan)数(shu)据(ju)未(wei)被数(shu)据(ju)脱敏系统(tong)及(ji)时(shi)识别和脱敏处理,造(zao)成敏感(gan)信息泄露(lu)的(de)风(feng)险;另(ling)一方(fang)面(mian),业(ye)务(wu)系统(tong)中经常(chang)存在(zai)非(fei)规范化敏感(gan)数(shu)据(ju),这些数(shu)据(ju)的(de)特(te)征(zheng)不够明显,无法使用正则(ze)和编码校验(yan)等方(fang)式去匹配,系统(tong)通过基于数(shu)据(ju)特(te)征(zheng)的(de)方(fang)法很难(nan)识别到这类(lei)非(fei)规范化敏感(gan)数(shu)据(ju),或者(zhe)识别有误。

面对(dui)这类防护难点,数据(ju)脱(tuo)敏系统需(xu)要加强自动(dong)化识(shi)(shi)别和动(dong)态(tai)变更(geng)的能力(li),同时也要提升非规(gui)范(fan)化敏感(gan)数据(ju)的识(shi)(shi)别能力(li)。名门电玩TDMP数据(ju)脱(tuo)敏系统,通(tong)过(guo)采集(ji)元数据(ju)、采集(ji)样(yang)(yang)(yang)本数据(ju)、样(yang)(yang)(yang)本数据(ju)清洗和标准(zhun)化、对(dui)样(yang)(yang)(yang)本数据(ju)识(shi)(shi)别并归类,可有效提升非规(gui)范(fan)化敏感(gan)数据(ju)识(shi)(shi)别率(lv)。

提升非规范化敏感数据识别率 为数据安全保驾护航

首先,数(shu)(shu)据(ju)(ju)(ju)(ju)脱敏系(xi)(xi)(xi)统需要(yao)(yao)采(cai)集业务系(xi)(xi)(xi)统数(shu)(shu)据(ju)(ju)(ju)(ju)库中的(de)(de)元(yuan)数(shu)(shu)据(ju)(ju)(ju)(ju),包(bao)括(kuo)模式名、表名、字(zi)段名、字(zi)段类型、注释信息,系(xi)(xi)(xi)统会根据(ju)(ju)(ju)(ju)字(zi)段类型对数(shu)(shu)据(ju)(ju)(ju)(ju)的(de)(de)类型进(jin)行初步(bu)的(de)(de)判断。随(sui)后,数(shu)(shu)据(ju)(ju)(ju)(ju)脱敏系(xi)(xi)(xi)统会采(cai)集业务系(xi)(xi)(xi)统的(de)(de)样(yang)本数(shu)(shu)据(ju)(ju)(ju)(ju),对每张数(shu)(shu)据(ju)(ju)(ju)(ju)表进(jin)行随(sui)机抽样(yang),抽样(yang)时需要(yao)(yao)剔除噪声数(shu)(shu)据(ju)(ju)(ju)(ju),包(bao)括(kuo)空字(zi)符(fu)、null对象(xiang)等,从而提高数(shu)(shu)据(ju)(ju)(ju)(ju)样(yang)本质量。

样(yang)本(ben)(ben)采集后(hou),系统会(hui)对(dui)(dui)(dui)样(yang)本(ben)(ben)数(shu)据(ju)进行(xing)清洗(xi)和标准化处理。如(ru)果样(yang)本(ben)(ben)数(shu)据(ju)是规范且具有某种数(shu)据(ju)特(te)征,数(shu)据(ju)脱敏系统会(hui)对(dui)(dui)(dui)样(yang)本(ben)(ben)数(shu)据(ju)进行(xing)精准识(shi)别(bie)(bie)。但通常(chang)会(hui)有一些样(yang)本(ben)(ben)数(shu)据(ju)并不(bu)规范,会(hui)导致系统识(shi)别(bie)(bie)出现误差。比(bi)(bi)如(ru)客(ke)户在(zai)录入电(dian)话号(hao)码的时候,可能(neng)将(jiang)“88188286”写成“02888188286”、“028-88188286”、“(028)-88188286”、“88188286”。对(dui)(dui)(dui)此,系统需(xu)要对(dui)(dui)(dui)样(yang)本(ben)(ben)数(shu)据(ju)进行(xing)清洗(xi)和标准化处理,比(bi)(bi)如(ru):将(jiang)影响识(shi)别(bie)(bie)的字(zi)(zi)(zi)符(fu)(fu)诸(zhu)如(ru)空格、非常(chang)用特(te)殊字(zi)(zi)(zi)符(fu)(fu)、括号(hao)、中(zhong)横杠等(deng)去掉;将(jiang)全角类字(zi)(zi)(zi)符(fu)(fu)自动转(zhuan)换为半角字(zi)(zi)(zi)符(fu)(fu);将(jiang)乱码字(zi)(zi)(zi)符(fu)(fu)替换成汉字(zi)(zi)(zi)或剔除等(deng)。

最后(hou),数(shu)据脱(tuo)敏系统会(hui)对获取的样本数(shu)据进行分类(lei)(lei)(lei)与识(shi)别。在初步的分类(lei)(lei)(lei)中,系统会(hui)根据样本数(shu)据的数(shu)据类(lei)(lei)(lei)型进行归类(lei)(lei)(lei),比如(ru)字(zi)符类(lei)(lei)(lei)型的数(shu)据通常(chang)不(bu)会(hui)存储(chu)(chu)金额类(lei)(lei)(lei)数(shu)据;数(shu)值(zhi)类(lei)(lei)(lei)型的数(shu)据不(bu)会(hui)存储(chu)(chu)名称、地址类(lei)(lei)(lei)数(shu)据;日(ri)期(qi)类(lei)(lei)(lei)型的数(shu)据只(zhi)能是日(ri)期(qi)时间类(lei)(lei)(lei)数(shu)据;大对象字(zi)段通常(chang)存储(chu)(chu)有(you)文本、图(tu)片、报文等(deng)特殊的数(shu)据。

在对样本数(shu)(shu)据(ju)(ju)(ju)(ju)的识(shi)别(bie)(bie)(bie)(bie)上,数(shu)(shu)据(ju)(ju)(ju)(ju)脱敏(min)(min)系(xi)统会进(jin)行三轮(lun)识(shi)别(bie)(bie)(bie)(bie)。首轮(lun)识(shi)别(bie)(bie)(bie)(bie)中(zhong),系(xi)统根据(ju)(ju)(ju)(ju)数(shu)(shu)据(ju)(ju)(ju)(ju)的词汇特点进(jin)行初步匹(pi)配,对数(shu)(shu)据(ju)(ju)(ju)(ju)进(jin)行敏(min)(min)感(gan)(gan)(gan)(gan)信(xin)息大类划分,例如,全是汉字或汉字占(zhan)比较(jiao)高的可能(neng)是名称、地(di)址等(deng)敏(min)(min)感(gan)(gan)(gan)(gan)信(xin)息类,全是数(shu)(shu)字或数(shu)(shu)字占(zhan)比较(jiao)高的可能(neng)是电话、账号等(deng)敏(min)(min)感(gan)(gan)(gan)(gan)信(xin)息类。首轮(lun)的识(shi)别(bie)(bie)(bie)(bie)和(he)分类,可以减少数(shu)(shu)据(ju)(ju)(ju)(ju)脱敏(min)(min)系(xi)统对敏(min)(min)感(gan)(gan)(gan)(gan)数(shu)(shu)据(ju)(ju)(ju)(ju)识(shi)别(bie)(bie)(bie)(bie)的总体时间,提升识(shi)别(bie)(bie)(bie)(bie)效率;第二轮(lun)精(jing)确识(shi)别(bie)(bie)(bie)(bie)中(zhong),系(xi)统通(tong)过(guo)(guo)内置的高级识(shi)别(bie)(bie)(bie)(bie)算法(fa)对样本数(shu)(shu)据(ju)(ju)(ju)(ju)特征进(jin)行词法(fa)分析,并完(wan)成(cheng)(cheng)敏(min)(min)感(gan)(gan)(gan)(gan)数(shu)(shu)据(ju)(ju)(ju)(ju)的精(jing)确识(shi)别(bie)(bie)(bie)(bie),识(shi)别(bie)(bie)(bie)(bie)成(cheng)(cheng)功的数(shu)(shu)据(ju)(ju)(ju)(ju)根据(ju)(ju)(ju)(ju)分类自动归纳到某(mou)种敏(min)(min)感(gan)(gan)(gan)(gan)信(xin)息类,识(shi)别(bie)(bie)(bie)(bie)失败的数(shu)(shu)据(ju)(ju)(ju)(ju)则交给AI敏(min)(min)感(gan)(gan)(gan)(gan)数(shu)(shu)据(ju)(ju)(ju)(ju)扫描引擎处理(li);AI敏(min)(min)感(gan)(gan)(gan)(gan)数(shu)(shu)据(ju)(ju)(ju)(ju)扫描引擎会加载某(mou)敏(min)(min)感(gan)(gan)(gan)(gan)类型和(he)训(xun)练(lian)模型,经过(guo)(guo)模型运算输出敏(min)(min)感(gan)(gan)(gan)(gan)信(xin)息识(shi)别(bie)(bie)(bie)(bie)率,通(tong)过(guo)(guo)敏(min)(min)感(gan)(gan)(gan)(gan)信(xin)息识(shi)别(bie)(bie)(bie)(bie)率与敏(min)(min)感(gan)(gan)(gan)(gan)类型阀(fa)值大小比较(jiao)判断(duan)是否识(shi)别(bie)(bie)(bie)(bie)成(cheng)(cheng)功,完(wan)成(cheng)(cheng)第三轮(lun)深度扫描识(shi)别(bie)(bie)(bie)(bie)。

通(tong)过(guo)AI敏感数(shu)(shu)据(ju)(ju)(ju)扫描(miao)引擎(qing)识(shi)(shi)(shi)别非规范(fan)化敏感数(shu)(shu)据(ju)(ju)(ju)的(de)精确度会(hui)远远高于非AI识(shi)(shi)(shi)别算(suan)法(fa)。以下面的(de)扫描(miao)对比情况为(wei)例:ADDRESS的(de)数(shu)(shu)据(ju)(ju)(ju)是规范(fan)化数(shu)(shu)据(ju)(ju)(ju),CLIENT_ADDRESS的(de)数(shu)(shu)据(ju)(ju)(ju)是非规范(fan)化数(shu)(shu)据(ju)(ju)(ju),通(tong)过(guo)非AI识(shi)(shi)(shi)别算(suan)法(fa),扫描(miao)CLIENT_ADDRESS的(de)识(shi)(shi)(shi)别率仅(jin)仅(jin)13.33,而使用AI敏感数(shu)(shu)据(ju)(ju)(ju)扫描(miao)引擎(qing)后,识(shi)(shi)(shi)别率能达(da)到73.33%。

基于强(qiang)大的(de)数(shu)据安(an)全(quan)(quan)管理能力,目前,名门电玩TDMP数(shu)据脱敏系统已在(zai)银行、保险、证券等领域多个(ge)头部客户(hu)的(de)实(shi)际应用场(chang)景中落地。未来(lai),以(yi)数(shu)据安(an)全(quan)(quan)法提出的(de)更高要求为目标(biao),名门电玩将(jiang)继续(xu)积极探索,为企业的(de)数(shu)据安(an)全(quan)(quan)保驾(jia)护航(hang),为数(shu)字(zi)经济(ji)发展提供安(an)全(quan)(quan)稳定(ding)的(de)保障。

var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?78ebdacae9da971faf025645ab77d367"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })();