www涩-www黄网站-www黄色-www黄色com-国产免费拍拍视频在线观看网站-国产免费怕怕免费视频观看

基于實時關(guān)聯(lián)分析算法及CEP的大數(shù)據(jù)安全分析模塊研究與實現(xiàn)

2018-03-21 14:20:36 電力信息與通信技術(shù)  點擊量: 評論 (0)
從海量安全日志中發(fā)現(xiàn)威脅,提取有效安全事件,生成安全告警供相關(guān)人員處置是企業(yè)內(nèi)大數(shù)據(jù)安全管理平臺的研究熱點。在傳統(tǒng)的大數(shù)據(jù)安全管理平臺中,安全事件由安全分析人員人工研判,在數(shù)據(jù)關(guān)聯(lián)分析的實時性、準(zhǔn)確性及個性化分析方面有所欠缺,同時還存在交互性弱的問題。為了完善及

0 引言

在信息爆炸的互聯(lián)網(wǎng)社會,大數(shù)據(jù)滲透在生活的方方面面。大數(shù)據(jù)時代的企業(yè)網(wǎng)絡(luò)環(huán)境安全數(shù)據(jù)分析也呈現(xiàn)海量化、多樣化、異構(gòu)化等特點。自“棱鏡門”事件的爆發(fā)[1],層出不窮的安全問題凸顯,從傳統(tǒng)病毒進化到蠕蟲、拒絕服務(wù)攻擊(Denial of Service,DoS)等惡意攻擊,乃至復(fù)雜程度更高的網(wǎng)絡(luò)攻擊手段——木馬、間諜軟件、僵尸網(wǎng)絡(luò)、網(wǎng)絡(luò)詐騙、網(wǎng)絡(luò)釣魚等,攻擊者已不僅僅滿足于使用單一的手段進行攻擊,而是使用關(guān)聯(lián)的、復(fù)雜的攻擊手段、模型及算法針對企業(yè)網(wǎng)絡(luò)環(huán)境中的薄弱部分進行攻擊[2]。面對企業(yè)內(nèi)安全告警信息的特點及愈發(fā)復(fù)雜的攻擊手段,安全告警監(jiān)控平臺的相關(guān)監(jiān)控、分析及使用人員無所適從。因此,對企業(yè)網(wǎng)絡(luò)環(huán)境中接入的海量數(shù)據(jù)關(guān)聯(lián)分析生成告警的實時性、準(zhǔn)確性及個性化等方面提出更嚴格的要求。

在傳統(tǒng)的大數(shù)據(jù)安全告警監(jiān)控平臺中,安全告警是以數(shù)據(jù)為驅(qū)動[3-4],從經(jīng)驗豐富的安全分析人員獲得。對海量安全數(shù)據(jù)的分析實際上是對安全事件的分析[5],但僅從數(shù)據(jù)入手,靠人工途徑獲得安全數(shù)據(jù)的關(guān)聯(lián)知識過程繁瑣[6-8],在不同的應(yīng)用環(huán)境可能存在差異,更無法滿足實時性,從而無法滿足大數(shù)據(jù)安全分析告警監(jiān)控的整體需要。因此,采用新技術(shù)相結(jié)合的自動化數(shù)據(jù)關(guān)聯(lián)分析生成告警顯得尤為
迫切。

在大數(shù)據(jù)環(huán)境下,本文基于上述海量安全事件分析的新要求,設(shè)計并實現(xiàn)了基于復(fù)雜事件處理(Complex Event Processing,CEP)的大數(shù)據(jù)安全關(guān)聯(lián)分析模型,使用Storm和Esper結(jié)合的事件處理框架,結(jié)合前置的數(shù)據(jù)采集模塊、后置的告警生成模塊,進行海量數(shù)據(jù)關(guān)聯(lián)分析與告警生成。此思路經(jīng)過設(shè)計、研發(fā)并投入生產(chǎn)環(huán)境應(yīng)用、驗證,自動化地進行海量數(shù)據(jù)分析,提取關(guān)鍵信息,生成告警,為安全分析相關(guān)人員提供了實時、準(zhǔn)確、個性化的安全信息分析服務(wù)。

 1 模型設(shè)計

大數(shù)據(jù)安全關(guān)聯(lián)分析及告警生成的實現(xiàn)通過完整平臺實現(xiàn),設(shè)計重點是基于CEP的大數(shù)據(jù)安全關(guān)聯(lián)分析模型,故安全數(shù)據(jù)關(guān)聯(lián)分析的前置及后置模塊僅簡單介紹。復(fù)雜事件處理的數(shù)據(jù)關(guān)聯(lián)分析模型架構(gòu)如圖1所示。

圖1 復(fù)雜事件處理的數(shù)據(jù)關(guān)聯(lián)分析模型架構(gòu)Fig.1 Architecture of data association analysis module based on complex event processing

1.1 數(shù)據(jù)采集模塊

數(shù)據(jù)采集是海量數(shù)據(jù)關(guān)聯(lián)分析的前置,在實現(xiàn)安全關(guān)聯(lián)分析之前,需確保系統(tǒng)中有數(shù)據(jù)采集前置。數(shù)據(jù)采集模塊主要包括多源異構(gòu)數(shù)據(jù)的采集、存儲及轉(zhuǎn)發(fā)。企業(yè)網(wǎng)絡(luò)環(huán)境中部署各類設(shè)備,數(shù)據(jù)采集模塊分布式統(tǒng)一采集從不同設(shè)備發(fā)送的日志數(shù)據(jù),對數(shù)據(jù)進行初步抽取與處理,處理后的數(shù)據(jù)本地存儲一份,并推送至消息隊列中,推送的數(shù)據(jù)稱為安全事件流,是安全設(shè)備、網(wǎng)絡(luò)設(shè)備、應(yīng)用服務(wù)器等采集到的一組數(shù)據(jù)、一個數(shù)據(jù)包、一類描述文件,這些事件按照設(shè)備報出來的形式,被視為一個安全原子事件[9],記為e,一個安全原子事件中包含事件的開始時間、事件的結(jié)束時間及日志的重要屬性,如行為描述。因此,單個事件可以表示為:

e=<start_time,end_time,data>

其中:start_time和end_time分別表示事件的開始時間與結(jié)束時間,data表示日志其他的重要
屬性。

在企業(yè)網(wǎng)絡(luò)環(huán)境下,數(shù)據(jù)采集層隨時從不同設(shè)備、系統(tǒng)中接收并生成安全事件流,安全事件流可以看作是無間斷地主被動采集,類型相互關(guān)聯(lián)的數(shù)個原子事件e的集合則可以看作是事件流E,事件流由事件之間的關(guān)系連接而成[10],這個關(guān)系可以是時間上的先后次序,邏輯上的因果、蘊含、聚合等關(guān)系。

1.2 安全數(shù)據(jù)關(guān)聯(lián)分析模塊

數(shù)據(jù)采集完畢后,通過安全數(shù)據(jù)分析模塊對推送至消息隊列的安全復(fù)雜事件即安全數(shù)據(jù)進行數(shù)據(jù)關(guān)聯(lián)分析,安全數(shù)據(jù)關(guān)聯(lián)分析模塊按照安全數(shù)據(jù)處理事件選擇、事件聚合、事件處理[11]3個步驟的執(zhí)行順序分為標(biāo)準(zhǔn)化引擎、事件語義分析引擎及復(fù)雜事件處理引擎(見圖2)。

圖2 安全數(shù)據(jù)關(guān)聯(lián)分析模塊組成Fig.2 Security data association analysis module

1.2.1 標(biāo)準(zhǔn)化引擎

標(biāo)準(zhǔn)化引擎是對安全數(shù)據(jù)的過濾、分類、加強及范式化等數(shù)據(jù)分析工作,實現(xiàn)事件流的主題去重去噪分析、加強分析及范式化分析。該引擎是事件流的標(biāo)準(zhǔn)化分析環(huán)節(jié)的引擎,業(yè)務(wù)邏輯是依據(jù)不同數(shù)據(jù)的特性預(yù)置的,不需要人工自定義規(guī)則,不必結(jié)合Esper技術(shù)使用EPL語句進行處理,利用Storm框架的高吞吐率,采用Storm的技術(shù)架構(gòu)[12],加快事件流的處理速度。Storm采用實時計算的圖狀結(jié)構(gòu),圖在Storm中成為拓撲。每個拓撲提交給集群,由集群中的主控節(jié)點分發(fā)代碼,將任務(wù)分配給工作節(jié)點執(zhí)行。一個拓撲中包括spout和bolt 2種角色,其中spout發(fā)送消息,負責(zé)將數(shù)據(jù)流以tuple元組的形式發(fā)送出去;bolt則負責(zé)轉(zhuǎn)換這些數(shù)據(jù)流,在bolt中可以完成計算、過濾等操作,bolt自身也可以隨機將數(shù)據(jù)發(fā)送給其他bolt。由spout發(fā)射出的tuple是不可變數(shù)組,對應(yīng)著固定的鍵值對。Storm框架如圖3
所示。

圖3 Storm框架Fig.3 Storm framework

1)分類去重去噪分析

分類去重去噪是對事件流的第一重選擇。

①數(shù)據(jù)主題分類:根據(jù)與數(shù)據(jù)采集層約定的自定義數(shù)據(jù)類型主題關(guān)鍵詞,將數(shù)據(jù)分為網(wǎng)絡(luò)設(shè)備數(shù)據(jù)、安全設(shè)備數(shù)據(jù)、主機設(shè)備數(shù)據(jù)、終端設(shè)備數(shù)據(jù)、應(yīng)用設(shè)備數(shù)據(jù)、網(wǎng)絡(luò)流數(shù)據(jù)及情報類數(shù)據(jù)七大類,并解析數(shù)據(jù)的分隔符號,將事件流中的data進一步拆分具體屬性特征。

②去重:去重是對分完類且具有具體屬性特征的安全事件流的去重,依據(jù)每條日志的MD5值進行計算后,MD5值一致的即為重復(fù)數(shù)據(jù),僅保留一條有效的,否則會造成數(shù)據(jù)的冗余。

③去噪:去噪是對已經(jīng)過去重后的事件流中的“噪點”數(shù)據(jù)進行修飾,由于事件流中數(shù)據(jù)類型各異,且來自不同廠商、設(shè)備和系統(tǒng),故數(shù)據(jù)中包含不符合規(guī)范的數(shù)據(jù)項在所難免,去噪就是對這類數(shù)據(jù)包括標(biāo)點符號、特殊符號等噪聲的“消噪”處理,并最大程度還原有意義屬性,不能還原的“臟數(shù)據(jù)”剔除。

2)加強分析

加強分析是依據(jù)業(yè)務(wù)的要求,將已經(jīng)過去重去噪的事件流關(guān)聯(lián)離線的知識庫數(shù)據(jù),加強每條事件流的關(guān)聯(lián)信息,包括IP所在地域、經(jīng)緯度、資產(chǎn)名稱、責(zé)任人等屬性信息。

3)范式化分析

范式化將經(jīng)過以上2步分析處理的事件流再標(biāo)準(zhǔn)化,只保留符合預(yù)定義的格式規(guī)范的數(shù)據(jù),用于后續(xù)事件的語義分析及復(fù)雜事件處理。

1.2.2 事件語義分析引擎

事件語義分析引擎即將前一步的標(biāo)準(zhǔn)化后的分析字段進行字段映射。這里的語義是指需要分析的行為模式關(guān)聯(lián)語義,即按照規(guī)范化事件流之間的關(guān)聯(lián)模式進行分析的語義。事件流語義分析引擎僅進行事件字段映射。

事件字段映射用于提取需要分析的事件流中的關(guān)鍵語義,關(guān)鍵語義以<Key,Value>鍵值對形式存在,為事件流生成告警的重要屬性字段的集合。

1.2.3 復(fù)雜事件處理引擎

復(fù)雜事件處理引擎參考CEP的通用處理框架[13](見圖4)。

圖4 CEP處理框架Fig.4 CEP processing framework

CEP處理框架反映的是原子事件進入事件處理引擎后通過一系列的操作,生成復(fù)雜事件直至最終事件的流程。復(fù)雜事件處理主要負責(zé)實時事件流的處理及不同事件流實時關(guān)聯(lián)分析。

事件輸入來源包括前一步事件流語義分析后的結(jié)果,數(shù)據(jù)覆蓋全面、實時;在事件處理部分,事件建模器中的模型分為預(yù)定義場景分析及可視化交互用戶模型自定義分析。在自定義業(yè)務(wù)規(guī)則上使用熱切換實現(xiàn)新建規(guī)則。在用戶GUI配置完規(guī)則后,實現(xiàn)快速重啟Esper引擎,該引擎依據(jù)自定義與否分為預(yù)定義場景分析和可視化交互分析。

1.2.4 實時關(guān)聯(lián)分析算法

在傳統(tǒng)技術(shù)架構(gòu)下,關(guān)聯(lián)分析算法往往需要從離線的非結(jié)構(gòu)化數(shù)據(jù)集上執(zhí)行分析,難以對大量、嘈雜的數(shù)據(jù)進行融合關(guān)聯(lián)分析,形成實時全局可視化安全態(tài)勢,因此本平臺在Storm等流式計算框架基礎(chǔ)上,結(jié)合CEP以及Apriori算法[14],通過數(shù)據(jù)內(nèi)存實時分析、海量安全信息實時監(jiān)控與關(guān)聯(lián)分析,及時發(fā)現(xiàn)安全異常行為。

Apriori算法主要分為2個步驟:第一步對基礎(chǔ)數(shù)據(jù)進行迭代,檢索出數(shù)據(jù)中頻繁的項集,其中頻繁的閾值預(yù)先設(shè)定。第二步首先找出頻繁項集-1,記為L1;然后利用L1來生成候選項集C2,對C2中的項進行判斷挖掘出L2,即頻繁項集-2,其中候選頻繁項集不斷如此循環(huán)直到無法發(fā)現(xiàn)更多的頻繁項集-k為止。

在基礎(chǔ)的Apriori算法中,每一步產(chǎn)生候選項集時循環(huán)產(chǎn)生的組合較多,沒有排除冗余元素,其次在數(shù)據(jù)增多的情況下,對計算機的I/O開銷成幾何倍數(shù)增加,因此做出一些改進,將每個項集生成hash值,通過和最小支持計數(shù)相比,先淘汰一部分項集。

1.3 告警生成模塊

在事件流經(jīng)過基于復(fù)雜事件處理的數(shù)據(jù)關(guān)聯(lián)分析后,將生成的告警存儲在告警生成模塊的關(guān)系型MySQL數(shù)據(jù)庫中[15],并通過數(shù)據(jù)總線為應(yīng)用層的使用人員提供統(tǒng)一服務(wù),供不同角色人員進行監(jiān)控、處置等操作。

1.4 應(yīng)用場景算例分析與設(shè)計

依照基于復(fù)雜事件處理的大數(shù)據(jù)安全關(guān)聯(lián)分析模型的設(shè)計,選取“郵件賬號異常登錄場景”進行算例分析。該場景為:依據(jù)采集的海量日志,對企業(yè)內(nèi)部郵件賬號異常登錄的行為進行識別,滿

大云網(wǎng)官方微信售電那點事兒

責(zé)任編輯:售電衡衡

免責(zé)聲明:本文僅代表作者個人觀點,與本站無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。
我要收藏
個贊
?
主站蜘蛛池模板: 国产精品成人在线 | 国产禁女女网站免费看 | 亚洲自拍偷拍图 | 免费亚洲成人 | 精品国产一区二区三区不卡 | 久久这里只有精品免费播放 | 亚洲免费在线视频播放 | 中文字幕一区2区 | 免费一区二区三区视频狠狠 | 久草在线资源 | 99精品在线观看视频 | 亚洲高清在线播放 | 日本一视频一区视频二区 | 精品国产一区二区在线观看 | 久草在线视频免费播放 | 国产成人免费影片在线观看 | 国产精品线在线精品国语 | 大桥未久在线精品视频在线 | 欧美一级纶理片免费 | 欧美性色黄大片一级毛片视频 | 一道本久久 | 一个人看的日本www的免费视频 | 国产亚洲精品资源一区 | 日日干夜夜爽 | 国产高清在线看免费视频观 | 成人毛片全部免费观看 | 一级毛片大全 | 日韩欧美在线一区二区三区 | 久久国产中文字幕 | 小明台湾成人永久免费看看 | 欧美在线成人午夜网站 | 久久婷婷影院 | 免费人成观看在线网 | 成年人黄视频在线观看 | 欧美成人短视频 | 91久久精品国产91性色tv | 欧美亚洲另类视频 | 国产在线精品一区二区 | 最新国产精品亚洲 | 日韩精品久久久久久 | 72种姿势欧美久久久久大黄蕉 |