91精产国品,日本免费一级,国产手机在线视频,午夜伦情电午夜伦情电影,亚洲99影视一区二区三区,亚洲毛片视频,久久伊人热

基于機(jī)器學(xué)習(xí)的數(shù)據(jù)脫敏系統(tǒng)研究與設(shè)計(jì)

2018-03-20 15:54:05 電力信息與通信技術(shù)  點(diǎn)擊量: 評論 (0)
近年來,國家電網(wǎng)公司各專業(yè)信息系統(tǒng)建設(shè)不斷完善,為了保障數(shù)據(jù)在各類應(yīng)用場景中安全使用,提出了一種基于機(jī)器學(xué)習(xí)的數(shù)據(jù)脫敏系統(tǒng)設(shè)計(jì)方案,重點(diǎn)針對敏感數(shù)據(jù)識別、定級,敏感算法制定,以及脫敏任務(wù)配置的實(shí)現(xiàn)方式進(jìn)行研究。結(jié)合用戶欠費(fèi)信息的脫敏分析,驗(yàn)證了該方案具有自定義定級

 3 脫敏任務(wù)配置

在完成脫敏策略制定后,為使脫敏任務(wù)能夠長時(shí)間工作,首先需在脫敏系統(tǒng)中對源數(shù)據(jù)所在業(yè)務(wù)系統(tǒng)的地址及端口號進(jìn)行注冊[14]。然后,獲取已制定的脫敏策略,脫敏系統(tǒng)按照選擇的脫敏算法及相關(guān)參數(shù)生成脫敏代碼。用戶根據(jù)應(yīng)用場景選擇脫敏實(shí)現(xiàn)方式,對于靜態(tài)脫敏,系統(tǒng)先執(zhí)行脫敏操作,并將脫敏結(jié)果緩存在本地存儲,待目標(biāo)系統(tǒng)需要獲取脫敏數(shù)據(jù)時(shí),用戶在脫敏系統(tǒng)中注冊目標(biāo)系統(tǒng)的地址及端口,最后將本地脫敏數(shù)據(jù)傳輸至目標(biāo)系統(tǒng)。而對于動(dòng)態(tài)脫敏,用戶必須先在脫敏系統(tǒng)中注冊目標(biāo)系統(tǒng)地址、端口以及目標(biāo)系統(tǒng)使用賬號,然后將脫敏代碼下發(fā)至代理服務(wù)器,由代理服務(wù)器進(jìn)行在線數(shù)據(jù)脫敏,并將脫敏結(jié)果返回至脫敏系統(tǒng),最后傳輸至目標(biāo)系統(tǒng),由目標(biāo)系統(tǒng)中的數(shù)據(jù)需求方的賬號使用。脫敏任務(wù)配置流程如圖4所示。

圖4 脫敏任務(wù)配置流程Fig.4 Configuration flow chart of data masking task

 4 應(yīng)用驗(yàn)證

本文以營銷業(yè)務(wù)應(yīng)用系統(tǒng)數(shù)據(jù)庫中的實(shí)收電費(fèi)信息表為例[15],分析人員希望通過分析某一用電用戶的欠費(fèi)歷史,對該用戶的用電行為進(jìn)行評估。實(shí)收電費(fèi)信息表中涉及的用戶用電欠費(fèi)信息和繳費(fèi)信息均為敏感信息,因此在使用數(shù)據(jù)表進(jìn)行分析之前,應(yīng)對其進(jìn)行脫敏處理。

在明確敏感信息后,脫敏實(shí)現(xiàn)的關(guān)鍵點(diǎn)為脫敏算法的選擇。脫敏算法選擇決策樹如圖5所示,為數(shù)據(jù)脫敏系統(tǒng)中用于脫敏算法制定的決策樹,由192組數(shù)據(jù)的訓(xùn)練集訓(xùn)練得到,其中Level表示敏感級值,ZSX、KYX、KPZ、GLX、SXX、KCX分別為真實(shí)性、可用性、可配置、關(guān)聯(lián)性、時(shí)效性、可重現(xiàn)等6個(gè)脫敏算法選擇因素的中文首字母縮寫,RP、EC、SF、DL、MK、CG為上文介紹的6種脫敏方法。在利用決策樹選擇脫敏算法之前,脫敏系統(tǒng)用戶應(yīng)與分析人員共同確定敏感信息在本次分析過程中的6個(gè)因素是否滿足。

圖5 脫敏算法選擇決策樹Fig.5 Decision tree for masking algorithm selection

欠費(fèi)信息是統(tǒng)計(jì)分析的對象,數(shù)據(jù)應(yīng)具有可用性和真實(shí)性。同時(shí),由于是分析某一用戶,因此用戶編號字段和欠費(fèi)信息間的對應(yīng)關(guān)系不能被破壞,數(shù)據(jù)需要具有關(guān)聯(lián)性,而時(shí)效性、可重現(xiàn)和可配置3個(gè)因素在這里則無關(guān)緊要。因此,綜合考慮因素分析,系統(tǒng)用戶可按照圖5決策樹選擇數(shù)據(jù)變換(CG)算法對欠費(fèi)信息進(jìn)行脫敏處理。而繳費(fèi)信息不是統(tǒng)計(jì)分析的對象,不具可用性,同時(shí)另外5個(gè)因素也不用具備,根據(jù)決策樹推薦可以直接刪除并置空繳費(fèi)信息。

在系統(tǒng)用戶完成靜態(tài)脫敏任務(wù)配置后,脫敏系統(tǒng)可按照選擇的脫敏策略對實(shí)收電費(fèi)信息表進(jìn)行脫敏,待分析人員的目標(biāo)地址及端口在脫敏系統(tǒng)中注冊后,即可將脫敏表從本地緩存?zhèn)鹘o用于分析的目標(biāo)系統(tǒng)。

 5 結(jié)語

數(shù)據(jù)脫敏將成為大數(shù)據(jù)時(shí)代企業(yè)數(shù)據(jù)化運(yùn)行維護(hù)的必要安全機(jī)制。本文從國家電網(wǎng)公司信息化建設(shè)實(shí)際情況出發(fā),分析并提出了一種數(shù)據(jù)脫敏系統(tǒng)設(shè)計(jì)方法,探討利用機(jī)器學(xué)習(xí)方法使脫敏過程更加系統(tǒng)化、智能化、專業(yè)化,并結(jié)合實(shí)際應(yīng)用場景驗(yàn)證了脫敏策略制定功能。隨著未來對數(shù)據(jù)脫敏的進(jìn)一步研究,脫敏系統(tǒng)將可實(shí)現(xiàn)更細(xì)粒度的訪問控制、更精確的需求理解能力、更強(qiáng)的擴(kuò)展能力以及更友好的交互方式,從而滿足更多跨系統(tǒng)、跨專業(yè)、跨行業(yè)的數(shù)據(jù)交互、共享和融合需求。

大云網(wǎng)官方微信售電那點(diǎn)事兒

責(zé)任編輯:售電衡衡

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與本站無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。
我要收藏
個(gè)贊
?