用戶名: 密碼: 驗證碼:

光網(wǎng)絡應用人工智能探討

摘要:隨著光網(wǎng)絡規(guī)模不斷擴大,網(wǎng)絡結(jié)構(gòu)趨于復雜,導致運維成本成倍增長。人工智能技術(shù)(AI)為解決光網(wǎng)絡問題帶來新的機遇,利用AI強大的數(shù)據(jù)分析和信息提取能力,通過對海量網(wǎng)絡數(shù)據(jù)采集、分析、預測、決策,為診斷網(wǎng)絡質(zhì)量、優(yōu)化業(yè)務性能、減輕運營負擔、改善用戶體驗等帶來無限可能。

  隨著“互聯(lián)網(wǎng)+”、5G、4K、VR等新業(yè)務和新技術(shù)的蓬勃發(fā)展,新興網(wǎng)絡服務對基礎光網(wǎng)絡提出了更高的要求,光網(wǎng)絡規(guī)模不斷擴大,網(wǎng)絡結(jié)構(gòu)更加復雜,網(wǎng)絡復雜度呈指數(shù)級增長,導致運維成本成倍增長。人工智能技術(shù)(AI)的蓬勃發(fā)展為解決上述問題帶來了新的機遇,利用AI強大的數(shù)據(jù)分析和信息提取能力,通過對海量網(wǎng)絡數(shù)據(jù)采集、分析、預測、決策,為診斷網(wǎng)絡質(zhì)量、優(yōu)化業(yè)務性能、減輕運營負擔、改善用戶體驗等帶來無限可能。

  光網(wǎng)絡AI應用場景分析

  光網(wǎng)絡引入AI的驅(qū)動力

  引入AI可以有效解決網(wǎng)絡運維中預測預防類、復雜類、重復性等工作帶來的成本和效率上的問題,主要體現(xiàn)在以下3個方面。

  一是預評估。實現(xiàn)對光網(wǎng)絡故障/風險進行提前預測和提示,提升故障/風險閉環(huán)處理效率;對全網(wǎng)容量增長進行預測,指導網(wǎng)絡擴容建設預算評估;精準預測網(wǎng)絡流量變化并及時對網(wǎng)絡資源進行擴容和縮容,提升網(wǎng)絡穩(wěn)定性和用戶體驗,節(jié)省運營商成本。

  二是智管控。構(gòu)建智能處理建議能力,嵌入維護流程或系統(tǒng)中,提升故障處理效率;具備啞資源空閑纖芯質(zhì)量監(jiān)控能力,實現(xiàn)全量纖芯質(zhì)量可視,突破啞資源數(shù)字化管理。

  三是優(yōu)網(wǎng)絡。對海量告警信息進行統(tǒng)計分析與建模學習,快速、準確過濾關(guān)聯(lián)告警,定位根因告警,提升告警事件處理的效率;智能調(diào)測優(yōu)化網(wǎng)絡,波長發(fā)放自動調(diào)測,光性能實時監(jiān)控、實時調(diào)優(yōu),免人工調(diào)測;頻譜/路由等網(wǎng)絡資源自動優(yōu)化,提升網(wǎng)絡資源利用率。

  AI分析類場景分析

  將主備業(yè)務或關(guān)聯(lián)業(yè)務部署到同一條光纜上并不鮮見,如果單條光纜中斷后主備業(yè)務或關(guān)聯(lián)業(yè)務同時失效,不僅會導致業(yè)務中斷,還會使部分網(wǎng)絡成為“孤島”。隨著網(wǎng)絡不斷變更和演進,人工巡線、人工錄入維護方式不能夠精準識別同纜,效率和識別準確度較低,引入AI技術(shù)可以智能識別主備業(yè)務、關(guān)聯(lián)業(yè)務是否存在同纜風險,保障網(wǎng)絡高可靠運行。

  網(wǎng)絡規(guī)劃與業(yè)務發(fā)展不同步,可能造成網(wǎng)絡負載不均、資源利用效率低下、資源需求高低不均,根因是網(wǎng)絡拓撲已經(jīng)無法匹配業(yè)務流量流向變化。對此,可以基于業(yè)務精準預測反向優(yōu)化網(wǎng)絡拓撲,通過適量加纖、加纜、加點,實現(xiàn)網(wǎng)絡承載能力倍增,適應業(yè)務變化和發(fā)展需要。

  秒級、毫秒級甚至微秒級業(yè)務閃斷發(fā)生頻次高,但持續(xù)時間短、無告警上報,且人工定位和回溯困難,故障很難復現(xiàn),基本依據(jù)用戶投訴解決問題,嚴重影響客戶感知和運營商口碑。同時,網(wǎng)絡“卡、慢、斷”導致用戶體驗差與應用、帶寬、連接多個維度緊密相關(guān),根因定位定界涉及大量網(wǎng)絡數(shù)據(jù),人工分析效率很低,大多數(shù)用戶業(yè)務體驗問題難以根治。迫切需要引入AI技術(shù),提升光網(wǎng)絡瞬態(tài)變化感知精度,實現(xiàn)性能瞬變監(jiān)測和閃斷智能定位定界,實現(xiàn)用戶體驗差根因的高效定位定界。

  AI預測類場景分析

  隨著專線業(yè)務的快速發(fā)展,業(yè)務發(fā)放效率成為運營商的核心競爭力,而傳統(tǒng)資源規(guī)劃很難適應專線的隨機性和突發(fā)性,當前運營商對網(wǎng)絡投資的收緊加大了資源精準預留、業(yè)務快速發(fā)放的難度。引入AI智能資源預測,結(jié)合歷史業(yè)務增長趨勢,實現(xiàn)資源高效利用、業(yè)務發(fā)放“零”等待。

  光網(wǎng)絡的性能劣化、隱患變故障是漸進式發(fā)展的,基于閾值的人工判斷方式難以識別,故障一旦發(fā)生,經(jīng)常面臨大量業(yè)務中斷、修復周期過長等挑戰(zhàn)。隨著光網(wǎng)絡承載的業(yè)務流量增長,維護壓力與日俱增,迫切需要引入AI智能識別網(wǎng)絡健康、提前預測風險。

  隨著數(shù)字經(jīng)濟的發(fā)展,光網(wǎng)絡上波長增加明顯提速,同時為了增加網(wǎng)絡可靠性引入智能路由調(diào)整,使得網(wǎng)絡中頻繁加掉波,從而對現(xiàn)有波長性能產(chǎn)生影響,而當前人工方式存在工作量大、效率低、精度差等問題。引入AI智能余量預測,可以自動對波長余量進行動態(tài)仿真,精準模擬加掉波對現(xiàn)有波長的性能余量變化和劣化根因分析,為精準調(diào)測提供保障。

  AI優(yōu)化類場景分析

  省際骨干傳送網(wǎng)與省內(nèi)骨干傳送網(wǎng)融合、省內(nèi)骨干傳送網(wǎng)與城域網(wǎng)一體化將導致網(wǎng)絡規(guī)模不斷擴展,使路由選擇過多,從而加大業(yè)務選路變數(shù)。因此,光模擬網(wǎng)絡面臨手工調(diào)測效率低、出錯概率高、效果不可控等問題。而引入AI智能優(yōu)化調(diào)測步驟,再結(jié)合自動性能檢測,可以實時監(jiān)控關(guān)聯(lián)路徑的性能,保障網(wǎng)絡處于穩(wěn)定、較優(yōu)狀態(tài)。

  為適應動態(tài)的業(yè)務變化、保障網(wǎng)絡性能指標時刻處于最優(yōu)并發(fā)掘網(wǎng)絡利用潛能,需要對波長、鏈路和路由實施動態(tài)優(yōu)化。以往各類傳輸優(yōu)化工具或軟件主要借助固化的方法和簡單的規(guī)則,甚至依賴工程師的經(jīng)驗完成優(yōu)化,并未識別到本質(zhì)特征、考慮維度簡單、相關(guān)性分析不足、局部而非全局,因此優(yōu)化的結(jié)果往往不是普遍有效。如今隨著網(wǎng)絡規(guī)模和業(yè)務規(guī)模的不斷擴大,傳統(tǒng)優(yōu)化方式難堪重任,需要引入人工智能以完成整個傳輸網(wǎng)生命周期內(nèi)的精細化、動態(tài)化、智能化的優(yōu)化。

  光網(wǎng)絡AI關(guān)鍵實現(xiàn)技術(shù)

  光網(wǎng)絡AI應用解決方案架構(gòu)

  AI應用解決方案架構(gòu)可以為光網(wǎng)絡提供啞資源管理、智能規(guī)劃、智能運營、智能維護和智能優(yōu)化等AI應用,實現(xiàn)光網(wǎng)絡全生命周期自動化、智能化運維,支撐政企專線、數(shù)據(jù)中心、家寬、算力網(wǎng)絡等各類業(yè)務高品質(zhì)發(fā)展。具體實現(xiàn)載體包括底層網(wǎng)元設備和上層管控系統(tǒng),整體架構(gòu)如圖1所示。

圖1 光網(wǎng)絡AI應用解決方案架構(gòu)

  管控系統(tǒng)可以對光網(wǎng)絡進行數(shù)字孿生,基于網(wǎng)絡級意圖管理集成網(wǎng)絡級AI引擎,進行智能分析預測、仿真和決策控制,實現(xiàn)自動化閉環(huán)處理。

  網(wǎng)元設備能夠基于光Sensor體系對光參數(shù)據(jù)進行全面、精準、實時感知和采集,使用網(wǎng)元級內(nèi)生AI對高性能數(shù)據(jù)分析、處理和壓縮,實現(xiàn)網(wǎng)元級分析預測、智能決策,上報全量光參,精準計算噪聲、代價和余量等,與管控系統(tǒng)網(wǎng)絡級AI進行功能互補。

  融合感知技術(shù)

  面對高復雜度的多參量光網(wǎng)絡系統(tǒng),為了能夠全面、精準、實時感知光網(wǎng)絡狀態(tài),網(wǎng)元系統(tǒng)和管控系統(tǒng)需要從維度、精度、頻度等多個角度進行光Sensor數(shù)據(jù)的分層采集和匯聚,并通過AI算法對原始光Sensor數(shù)據(jù)進行數(shù)據(jù)挖掘,支撐光網(wǎng)絡的各類業(yè)務場景。

  對于管控系統(tǒng)需要具備數(shù)據(jù)匯聚和數(shù)據(jù)挖掘處理能力。數(shù)據(jù)匯聚是指管控系統(tǒng)需要將采集的數(shù)據(jù)進行分類匯聚,可分為資源數(shù)據(jù)底座和性能數(shù)據(jù)底座。資源數(shù)據(jù)底座匯聚的數(shù)據(jù)主要是靜態(tài)的存量數(shù)據(jù),比如業(yè)務存量、網(wǎng)絡拓撲存量數(shù)據(jù)等。匯聚的資源和性能原始數(shù)據(jù)表達的信息量始終是有限的,因此管控系統(tǒng)需要基于AI算法技術(shù)對光Sensor數(shù)據(jù)進行數(shù)據(jù)挖掘以獲得額外的信息量,用于支撐感知、診斷、預測、控制等多類業(yè)務場景。

  光Sensor技術(shù)是以光技術(shù)手段感知、檢測多種物理量,并將模擬物理量數(shù)字化的一種技術(shù)。面對高復雜度的多參量光網(wǎng)絡系統(tǒng),為了能夠全面、精準、實時感知光網(wǎng)絡狀態(tài),網(wǎng)元系統(tǒng)和管控系統(tǒng)需要從維度、精度、頻度等多個角度進行光Sensor數(shù)據(jù)的分層采集和匯聚,并通過AI算法對原始光Sensor數(shù)據(jù)進行數(shù)據(jù)挖掘,支撐光網(wǎng)絡的各類業(yè)務場景。網(wǎng)元系統(tǒng)利用光Sensor技術(shù)對各個層面的數(shù)據(jù)進行逐層采集:光業(yè)務層、光器件層、光信道層、光鏈路層。光業(yè)務層數(shù)據(jù)主要是客戶關(guān)注的業(yè)務屬性指標,比如帶寬、時延、誤碼、保護倒換時長等指標;光器件層數(shù)據(jù)主要是采集光器件的物理指標,包括功率、溫度、電壓、頻偏等;光信道層數(shù)據(jù)關(guān)注點在于信道的屬性特征,類似信道編號、光信噪比、單波功率等;光鏈路層數(shù)據(jù)集中在鏈路側(cè)的特征,包含光纖損耗、光纖類型、光纖事件等。

  網(wǎng)絡時延是一項重要的網(wǎng)絡性能指標,對業(yè)務流量吞吐、業(yè)務感知有直接影響,精準捕捉影響網(wǎng)絡性能和業(yè)務體驗的時延變化,感知時延并定界定位時延變化根因,對自動優(yōu)化時延、保障業(yè)務體驗至關(guān)重要。感知時延能力不僅要支持已開通業(yè)務電路的時延可檢可測,還要能在任意潛在源宿開通電路之前準確預估時延,并在業(yè)務電路時延出現(xiàn)變化時,能及時捕捉到時延變化根因,比如業(yè)務電路保護倒換導致的線路時延變化,并能準確檢測到業(yè)務時延變化值。通過AI算法提前獲取業(yè)務影響時長是評估業(yè)務體驗、提升網(wǎng)絡質(zhì)量、改進運維手段的重要指標。

  面臨光Sensor產(chǎn)生的海量數(shù)據(jù),數(shù)據(jù)流轉(zhuǎn)技術(shù)建立了網(wǎng)元設備內(nèi)和網(wǎng)元設備與管控系統(tǒng)間的高速傳輸通道,實施網(wǎng)元設備分布式本地決策和管控系統(tǒng)集中式智能控制兩層處理,協(xié)同完成決策,如圖2所示。

圖2 高性能數(shù)據(jù)流轉(zhuǎn)架構(gòu)示意

  網(wǎng)元設備按照數(shù)據(jù)采集量的大小和時間精度分為高速采集和低速采集。硬件上,在網(wǎng)元設備為關(guān)鍵Sensor開辟快速外送數(shù)據(jù)到硬件通道,使用高速緩存區(qū)存儲多端口高精度數(shù)據(jù)(如毫秒級);軟件上,構(gòu)建統(tǒng)一大采集數(shù)據(jù)框架,抽象建模光Sensor數(shù)據(jù)采集項,靈活控制多單板、多端口的數(shù)據(jù)并發(fā)采集,并使用內(nèi)存共享技術(shù)高效讀寫。

  云地協(xié)同全棧AI技術(shù)

  光網(wǎng)絡AI技術(shù)研究面對模型泛化能力差、模型部署要求算力高、本地樣本少/標注難、大數(shù)據(jù)管理困難等問題,需要探索一種新的AI技術(shù)架構(gòu)應對這些問題,加速AI應用的規(guī)模部署。AI模型應具有在線學習能力,能夠不斷學習網(wǎng)絡新特征、新變化,AI模型訓練應集中部署在算力中心或者支持分布式訓練部署。針對光網(wǎng)絡多邊緣設備+中心控制的組網(wǎng)特點,云地協(xié)同AI技術(shù)架構(gòu)是解決上述挑戰(zhàn)的最佳解決方案。

  云地協(xié)同是指云端和地端協(xié)作完成數(shù)據(jù)樣本上云、模型狀態(tài)管理、模型重訓練、模型/知識下發(fā)、 擇優(yōu)更新等一系列閉環(huán)任務,同時把云端匯集的全局網(wǎng)絡知識經(jīng)驗、全量數(shù)據(jù)訓練得到的高精度模型,持續(xù)注入地端,讓光網(wǎng)絡AI能夠進行智能迭代升級,變得越來越聰明,如圖3所示。

圖3 云地協(xié)同全棧AI示意

  AI服務包含數(shù)據(jù)治理服務、模型訓練服務、專家經(jīng)驗輔助服務,涉及運營商大量運營數(shù)據(jù)、用戶數(shù)據(jù)、網(wǎng)絡數(shù)據(jù),對數(shù)據(jù)安全要求很高,云端適合部署在IT云。實時海量數(shù)據(jù)并發(fā)上報、處理加劇整網(wǎng)壓力,在地端(包含管控系統(tǒng)、網(wǎng)元設備)部署分布式AI,就近處理本地實時海量數(shù)據(jù)。

  智能分析預測技術(shù)

  網(wǎng)絡出現(xiàn)問題后生成告警,進而觸發(fā)故障定位和修復是當前網(wǎng)絡運維的普遍方式。海量告警上報導致故障根因定位困難、靜默故障無告警上報導致無法定位故障根因,是根因告警分析的兩大難題。

  由于網(wǎng)絡數(shù)據(jù)量大、維度多和故障模式多樣化,且關(guān)聯(lián)影響發(fā)散,需要精準的篩查和多維度關(guān)聯(lián)分析能力,通過智能分析技術(shù),構(gòu)建關(guān)聯(lián)模型并進行相關(guān)訓練,實現(xiàn)根因告警識別和靜默故障定位。智能資源預測和故障風險預測可提前發(fā)現(xiàn)資源瓶頸和故障風險,提升業(yè)務TTM(最近十二個月市盈率)和業(yè)務可靠性。

  光網(wǎng)絡智能分析預測能力需在網(wǎng)元和管控層面分別構(gòu)筑對應的智能分析能力。通過分層實現(xiàn)智能AI分析預測能力,基于高精度數(shù)據(jù)的短周期預測,需在網(wǎng)元進行高速數(shù)據(jù)采集處理和分析預測閉環(huán),提升分析效率;基于數(shù)據(jù)粒度較大的長周期預測,可通過管控系統(tǒng)長周期數(shù)據(jù)采集和分析預測閉環(huán)。智能預測一般采用時間序列模型+訓練學習方式實現(xiàn)。光網(wǎng)絡常見時間序列模型包括差分回歸移動平均模型(ARIMA)和PROPHET模型,前者根據(jù)網(wǎng)絡實際資源進行預測,例如根據(jù)網(wǎng)絡當前新增鏈路來預測未來某一段時間內(nèi)的鏈路增量;后者可以在一定數(shù)據(jù)缺失的情況下,仍能保持較好的預測效果,如光傳輸性能余量預測適用于該方法。

  智能仿真決策技術(shù)

  光網(wǎng)絡仿真能夠為網(wǎng)絡規(guī)劃、設計、配置以及網(wǎng)絡自優(yōu)化(如網(wǎng)絡路徑優(yōu)化、網(wǎng)絡資源性能優(yōu)化等)提供可靠依據(jù),通過對配置和優(yōu)化結(jié)果下發(fā)前進行事前仿真決策,確保配置和優(yōu)化結(jié)果的自動、準確、可信任執(zhí)行,保障業(yè)務安全。網(wǎng)絡仿真能夠有效地驗證實際方案或比較多個不同的仿真設計以及組織方案,以便于對不同的設計方案建立模型,實施模擬,對網(wǎng)絡性能預測數(shù)據(jù)采取定量獲取,為設計、配置方案的比較和驗證提供可靠的依據(jù)。

  網(wǎng)絡仿真決策技術(shù)是一種利用數(shù)學建模和統(tǒng)計分析的方法模擬網(wǎng)絡決策行為,通過建立網(wǎng)絡信息的統(tǒng)計模型,模擬網(wǎng)絡操作執(zhí)行,獲取網(wǎng)絡設計及優(yōu)化所需要的網(wǎng)絡性能數(shù)據(jù)的技術(shù)。網(wǎng)絡仿真分為3個階段:準備階段、模型設計、仿真與結(jié)果分析。

  在仿真的基礎準備階段,構(gòu)建全光參量數(shù)字孿生底座,通過Sensor體系實現(xiàn)上報全量光參、在線學習,精準計算噪聲、代價、余量等,支撐對網(wǎng)元實時狀態(tài)的全量認知;在仿真的模型設計階段,除了對網(wǎng)元、單板、端口、濾波器等基礎建模外,通過離線和在線大數(shù)據(jù)學習,對光傳輸質(zhì)量進行在線建模;在仿真與結(jié)果分析階段,通過AI遷移學習算法、回歸算法等實現(xiàn)余量動態(tài)監(jiān)控以及自優(yōu)化執(zhí)行結(jié)果分析,做到自動調(diào)整優(yōu)化方案以及實時自調(diào)優(yōu)。

  光網(wǎng)絡AI應用案例

  目前,AI技術(shù)在光傳送網(wǎng)絡中已經(jīng)開始各種應用探索。

  應用一:同纜風險智能識別

  為排除主備業(yè)務物理同纜風險,基于光纖的瑞利散射、受激拉曼散射、偏振狀態(tài)等光學效應產(chǎn)生機制,通過對光纖信息、站點地理信息、光性能信息、環(huán)境信息等數(shù)據(jù)進行分析,提取光纖指紋特征,采用多模態(tài)機器學習智能算法識別同纜概率,實現(xiàn)了同纜風險自動識別。

  應用二:光網(wǎng)絡健康預測和可視

  為實現(xiàn)對光網(wǎng)絡健康預測與可視,基于秒級數(shù)據(jù)采集,對數(shù)據(jù)進行清洗、標定和特征提取,采用AI算法對光纖進行多維度健康預測和劣化預警,分析光纖和波道健康度,并根據(jù)光性能變化趨勢,提前預測劣化類故障風險,以及自動定位和定界光纖故障、自動分析割接質(zhì)量。

  應用三:網(wǎng)絡故障根因分析

  首先對歷史告警以及告警相關(guān)聯(lián)數(shù)據(jù)進行特征提取、清洗與聚合等處理,根據(jù)處理后的數(shù)據(jù),通過機器學習等智能化算法的訓練推理,獲得告警間的關(guān)聯(lián)及衍生關(guān)系、關(guān)聯(lián)告警與根因故障的映射關(guān)系,進而生成RCA(Root Cause Analysis根因分析)規(guī)則、積累形成規(guī)則庫。在告警監(jiān)控中,通過展開告警關(guān)系樹,可以明確地獲悉告警間的關(guān)聯(lián)、衍生關(guān)系,并通過RCA規(guī)則庫獲得關(guān)聯(lián)告警所映射的故障根因。

  光網(wǎng)絡架構(gòu)體系處于數(shù)智化轉(zhuǎn)型升級的關(guān)鍵階段,AI在光網(wǎng)絡中的應用有廣闊空間可以挖掘。近期需要深化融合感知和智能分析、預測類技術(shù)研究,提升啞資源感知能力,推進光網(wǎng)絡全參量感知、光纜和資源規(guī)劃預測、故障智能定界定位及風險預測技術(shù)的成熟。遠期需要突破光網(wǎng)絡智能仿真決策技術(shù),增強AI模型泛化能力,將AI優(yōu)化類場景應用擴展至光網(wǎng)絡業(yè)務配置優(yōu)化、資源優(yōu)化、性能優(yōu)化等場景。

  作者:中國移動研究院 李允博 葛大偉 孫將 趙陽、中國移動通信集團有限公司網(wǎng)絡事業(yè)部 郝斌、中國移動通信集團北京有限公司 車輪奔、中國移動通信集團浙江有限公司 王曉義

內(nèi)容來自:通信世界
本文地址:http://odinmetals.com//Site/CN/News/2021/11/30/20211130005637842657.htm 轉(zhuǎn)載請保留文章出處
關(guān)鍵字: 光網(wǎng)絡
文章標題:光網(wǎng)絡應用人工智能探討
【加入收藏夾】  【推薦給好友】 
1、凡本網(wǎng)注明“來源:訊石光通訊網(wǎng)”及標有原創(chuàng)的所有作品,版權(quán)均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標注作者信息和本站來源。
2、免責聲明,凡本網(wǎng)注明“來源:XXX(非訊石光通訊網(wǎng))”的作品,均為轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。因可能存在第三方轉(zhuǎn)載無法確定原網(wǎng)地址,若作品內(nèi)容、版權(quán)爭議和其它問題,請聯(lián)系本網(wǎng),將第一時間刪除。
聯(lián)系方式:訊石光通訊網(wǎng)新聞中心 電話:0755-82960080-168   Right