熱門文章
人工智能技術的發展及其在通信安全領域的應用
發布時間:2019-06-10 分類:趨勢研究
摘要:隨著大數據、機器學習等創新技術的發展,人工智能技術越來越成熟化,在社會生活的多個領域得到了廣泛的應用,極大地推動了社會進步,同時也帶來了安全領域的挑戰。對人工智能技術的發展和政策背景進行概述,對標準化現狀進行了介紹,在對應用于通信領域的人工智能技術分析的基礎上,探討了人工智能在通信安全領域的應用。0
引言
近年來,云計算、大數據、深度學習技術的發展推動人工智能產業的進步,尤其是2016、2017年AlphaGo橫掃中日韓頂級圍棋高手在人工智能產業界引起了極大反響??梢钥吹?,人工智能正在推動工業進入第四次發展浪潮,并逐步開始在農業生產、工業制造、交通駕駛、醫療健康、文化傳播、投資金融等各個領域進入商用化階段,推動人類生產、生活的革命性變化。不論是政府、企業還是用戶,都期待人工智能技術的標準化應用。1人工智能技術發展及其標準化情況
1.1人工智能概念
人工智能在不同的發展階段中被賦予了不同的概念。在1956年的達特茅斯
會議上,麥卡錫首次提出人工智能概念。百度百科中對人工智能的定義是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器。
1.2人工智能政策
人工智能已經開始在智能制造、智慧醫療、智能家居等各行各業的產品中得到了應用。我國發布的《新一代人工智能發展規劃》中提出,要加強人工智能標準框架體系研究,到2020年初步建成人工智能技術標準體系,包括人工智能基礎共性、互聯互通、行業應用、網絡安全、隱私保護等技術標準,以及無人駕駛、服務機器人等細分應用領域標準,鼓勵參與或主導制定國際標準,以技術標準“走出去”帶動產品和服務“走出去”。工信部在編寫的通信行業《“十三五”技術標準體系建設方案》中,已經提出建立人工智能標準體系,研制網絡、平臺、終端、安全、智能化水平等關鍵標準。
1.3人工智能標準化
在通信網和人工智能融合這一大趨勢下,各個標準化組織已紛紛開展行動。2017年10月,ISO/IEC JTC1正式成立新的人工智能分技術委員會,進行人工智能相關的標準研究工作。目前包括中國、加拿大、德國、法國、俄羅斯、英國、美國等18個全權成員國,以及澳大利亞、荷蘭等5個觀察成員國。2018年4月18—20日,人工智能分技術委員會第一次全會在北京成功召開,會議討論確定了組織架構,下設基礎工作組、計算方法與AI系統特征研究組、可信研究組、用例與應用研究組,重點在術語、參考框架、算法模型和計算方法、安全及可信、用例和應用分析等方面開展標準化研究。而在此之前ISO/IEC JTC1已經發布了100余項人工智能相關的標準,基本形成了較為完備的標準體系。
歐洲電信標準協會于2017年2月成立了ISG-ENI,期望通過人工智能提高運營商在網絡部署和操作方面的體驗,同時,根據用戶需求和環境條件變化等,自適應地調整網絡服務。2018年1月,ETSI又建立了ISG-ZSM,囊括了40多個單位或組織,最初將專注于網絡切片管理等研究。隨后,ETSI發布了《自動化下一代網絡中的網絡和服務操作的必要性和益處》白皮書,強調5G網絡中服務管理、運營自動化的目標。
國際電信聯盟-電信標準化部門在2017年11月成立了未來網絡機器學習焦點組(FG-ML5G)),具體包括3個工作組,分別關注服務和需求、數據格式和機器學習技術、機器學習感知網絡架構。重點研究機器學習、人工智能在包含5G系統的未來網絡中的應用。FG-ML5G第一次會議于2018年1月29日至2月3日在瑞士日內瓦舉行,就組織架構、工作組設置、相關工作內容等達成了一致。會議決議成立用例與需求工作組、數據格式與安全工作組、網絡架構組3個工作組來推動網絡智能化的工作。會議就通信網絡基礎設施無法有效滿足機器學習技術使用條件現狀、焦點組聚焦研究內容范疇、數據在機器學習應用中的重要性以及標準化缺失阻礙機器學習技術應用等方面的判斷和需求達成共識,同時決定焦點組將致力于解決工業界使用人工智能技術遇到的技術及數據障礙進行相關標準制定,并針對不同案例應用輸出技術報告以起到規范行業、引領發展的作用。
IEEE在2017年11月下旬,發布了3項人工智能領域標準。包括“機器化系統、智能系統和自動系統的倫理推動標準”、“自動和半自動系統的故障安全設計標準”和“道德化的人工智能和自動系統的福祉衡量標準”。
2017年5月3GPP SA2#121會議上,基于Big Data/AI的FS-eNA立項通過,2018年6月中國移動牽頭立項3GPP RAN大數據應用研究。前者主要關注用于網絡數據分析的必要數據以及必要的輸出數據,后者則面向無線大數據的采集與應用。
2人工智能技術
目前主流的人工智能中,最主要使用的是機器學習和深度學習,它們是專門研究計算機怎樣模擬人類的學習行為獲取新的知識或技能,從而不斷改善自身的性能。
2.1監督學習
在監督學習中,每個訓練數據組都是由一個輸入對象和一個期望的輸出值組成的,目標是得出輸入和輸出數據的函數關系,并推斷其他輸入數據可能的輸出值。函數的輸出可以是一個連續的值或是預測一個分類標簽。監督學習中常見的算法有K-鄰近、決策樹、樸素貝葉斯、邏輯回歸、支持向量機。
2.2半監督學習
半監督學習是監督學習與無監督學習相結合的一種學習方法,輸入數據包括有標簽樣本數據和無標簽樣本數據,根據這些數據集訓練習,輸出一個學習機,對數據集或者外界的無標簽樣本進行預測,以便大幅度降低標記成本。其中包括一些對常用監督式學習算法的延伸,如圖論推理算法、拉普拉斯支持向量機等。使用半監督學習,減輕了獲取大量樣本標簽的代價,又能夠帶來比較高的準確性,因此越來越受到人們的重視。
2.3無監督學習
無監督式學習輸入無標簽數據,學習模型推斷出數據的內在結構。常見的應用場景包括關聯規則的學習,聚類和降維等。常見算法包括Apriori算法、K均值聚類、主成分分析降維,以及神經網絡中的自組織映射聚類等。
2.4強化學習
強化學習基于智能實體與環境之間的動態交互。當智能實體感知到環境信息后,依據自己采取動作所可能帶來的獎賞或懲罰確定策略,并進一步觀察環境的反應,循環往復,直至收斂至某一穩態狀態。強化學習的常見應用場景包括調度管理、信息檢索、過程控制、動態系統以及機器人控制等。常見算法包括Q學習以及時序差分。
2.5神經網絡
神經網絡也叫人工神經網絡,是受生物神經網絡啟發而構建的算法模型,常用于解決非線性回歸和分類問題。一個簡單的神經網絡的邏輯架構包括輸入層、隱藏層和輸出層。輸入層負責接收信號,隱藏層負責對數據的分解和處理,輸出層輸出整合結果。
2.6深度學習
早先的神經網絡算法比較容易過訓練,準確率依賴于龐大的訓練集,訓練速度受限于計算機,分類效果并不優于其它方法。深度學習算法可通過多隱層的神經網絡逐層預訓練進行特征學習,具有自學習功能、聯想存儲功能和高速尋找優化解的能力,適用于模式識別、信號處理、優化組合、異常探測、文本到語音轉錄等數據量龐大、參數之間存在內在聯系的場景。神經網絡也從單純的監督學習轉向半監督學習和無監督學習領域,并且可以實現分類器、生成數據、降維等多種功能。
3人工智能技術在通信安全領域的應用
3.1基于人工智能的網絡異常流量檢測技術
隨著因特網規模的不斷擴大和迅速發展,網絡用戶在得到了極大的便利的同時也出現了一系列的攻擊事件。近幾年來大規模的流量攻擊事件層出不窮,給各國經濟都帶來了巨大的損失,網絡安全已經引起了人們的高度重視。當用戶在請求網絡服務時,會產生相應的網絡流量,而流量的監測是網絡管理的重要組成部分,網絡流量數據為網絡的運行和維護提供了極其重要的信息,這些數據反映出了網絡的資源分布情況,容量劃分情況,能夠對網絡服務質量進行分析,對網絡發生的錯誤和攻擊進行監測和隔離,從而為網絡用戶提供安全可靠的服務。
針對異常流量的檢測主要分為基于特征的檢測和基于異常的檢測。目前,各網絡采取最多的入侵檢測技術是特征檢測技術。它通過匹配已經建立的規則和模型來檢測已知的攻擊,然而在處理對未知攻擊的檢測時,很難將未知的攻擊與正常行為區分開來,往往需要不斷更新規則庫。新攻擊的海量流量數據的不斷增加給網絡安全帶來了極大的挑戰,因此,基于特征檢測的技術已經不適用于當前網絡對攻擊行為進行實時檢測?;诋惓5娜肭謾z測,不需要建立規則庫,但是由于傳統的入侵檢測系統無法有效地對零日攻擊進行檢測,網絡安全面臨的挑戰依然嚴峻。
針對網絡安全以上問題,在工業界和學術界都引起了廣泛的重視,各國政府機構相應出臺了一系列政策,大力改善網絡安全問題。入侵檢測概念最早于1980年提出,并提出利用審計信息跟蹤用戶可疑行為的入侵檢測方法。接下來的20年間,又陸續提出了了各種入侵檢測模型。近2年我國政府將“維護網絡安全”寫進政府工作報告,將這一計劃上升到國家戰略,根據360公司在2016年底的中國互聯網政企安全報告顯示:全球化的網絡安全領域各項技術正在全面加速推進,在安全防御方面以開放數據挖掘為代表的威脅新動向是未來安全研究的新趨勢。進入21世紀以來,隨著人工智能的快速發展和大數據分析的優勢,國內外應用機器學習和深度學習方法對入侵檢測的研究開辟了新的研究道路。
目前網絡異常流量檢測所面臨的主要問題包括:
a)高速網絡環境的性能改善問題。高速網絡環境下,網絡的吞吐量非常大,需要從大量的流量數據中檢測出網絡入侵的具體類別,同時提高檢測速度和準確率,降低網絡的誤報率和漏報率,把入侵造成的損失控制在最小限度內。
b)入侵檢測系統主動防御能力不足。大部分入侵檢測系統是以檢測漏洞為主,依靠漏洞庫實現,對于漏洞庫中不存在的攻擊,很難實現檢測,一般只有在攻擊發生后,才添加到庫,這樣無法做到提前防御未知攻擊,只能依賴漏洞庫的更新。
c)入侵檢測系統體系結構問題。集中式的入侵檢測無法適應分布式攻擊的檢測,需要采用中央代理一級大量分布在各處的本地代理組成分布式入侵檢測系統進行檢測。
根據以上異常流量檢測所面臨的問題以及人工智能和大數據分析的優勢,有必要研究基于人工智能和大數據的互聯網異常流量檢測技術。在大量流量數據條件下利用網絡產生的流量數據進行分析,及時發現檢測可疑的用戶和攻擊行為,維護網絡安全,為用戶提供安全可靠的服務。
3.2智能運維
機器學習和數據挖掘處理,用于運維中的隱患預測和動態巡檢。通過同步運維數據,集中優化平臺數據,實現動態監控,從多個維度對現場操作和維護指標進行特征畫像,使用人工智能技術實時預測重要警報,找到關鍵監測點并制定動態檢查計劃。通過關聯工單系統,自動輸出診斷計劃,提高工單派單準確性,實現智能化的運維。利用數據挖掘技術,早期發現問題,從被動處理問題到主動預防問題,提升運維效率。
3.3故障溯源
隨著創新型技術的迅速發展,電信網絡設備日趨虛擬化、自動化和智能化。電信網絡系統的規模和復雜度的不斷增加,維護變得越來越繁雜,運維人員還必須面對各種高度集成的設備產生的大量實時信息。當異常情況發生時,現有系統無法為運維人員提供足夠支持,導致許多問題無法及時發現,且不斷傳播和升級,進而影響所有業務。如果在發生異常警報時查找問題的根源和分析得出解決方案需要花費大量時間,小問題也會被升級?;谌斯ぶ悄芗夹g,可實現通信網絡中的告警全局監控和處理,實時采集告警數據,實現靈活的過濾和可追溯性,主要原因是適當的分析和處理當前警報中的關鍵信息。通過對告警信息進行過濾、匹配,確定并分類告警信息,同時關聯告警信息,實現溯源,從而屏蔽低級別告警,實現網絡故障的快速診斷,并協調相應的通信業務模型和網絡拓撲,實現準確的故障定位。為了實現可追溯性,需要建立故障分析模型,實現智能識別。關聯規則算法定義為從從一個數據集中發現項之間的隱藏關系。在大量的告警數據中,需要識別出告警間關聯關系根故障分析模型,通過從多個不同的維度來進行識別,如發生模式或規律,這些固有發生模式或規律就是根故障分析模型。
因此,基于人工智能的故障診斷和可追溯性,在分析大數據關聯規則和人工智能技術的基礎上,在綜合網絡和業務數據基礎上,對所有報警和性能監控數據以及日志進行綜合分析,從而發現故障特征和故障原因的規則。在實際的網絡運行和維護中,根據發現的故障特征自動匹配診斷規則,從而智能化的發現故障點,并且得到處理建議。
[1]黃兵明,郭慧峰,趙良,薛金明,人工智能在通信網絡故障溯源的應用研究[J]郵電設計技術,2018,12
[2]機器學習的分類與主要算法對比[N](http://blog.csdn.net)
[3]尤肖虎,張川,談曉思,金石,鄔賀銓,基于AI的5G技術——研究方向與范例[J]中國科學:信息科學,2018,12
[4]林龍成,陳波,郭向民,傳統網絡安全防御面臨的新威脅:APT攻擊[J]信息安全與技術,2013,03
[5]王西點,王磊,龍泉,薛陽,人工智能及其在網絡優化運維中的應用[J]電信工程技術與標準化,2018,07
[6]劉積芬,網絡入侵檢測關鍵技術研究[D]東華大學博士論文,2013,12
顏博,男,博士,主要從事人工智能技術及相關領域應用的研究