數(shù)據(jù)中心光網(wǎng)絡智能管控
近年來,全球移動用戶數(shù)量迅速擴增,數(shù)據(jù)中心業(yè)務快速增長,這些趨勢對目前的數(shù)據(jù)中心互聯(lián)光網(wǎng)絡提出了更大需求。在降低部署與運營成本的同時如何保證系統(tǒng)穩(wěn)定運行是一個重要挑戰(zhàn)。一方面,隨著相干器件的發(fā)展,器件具備多種調(diào)制模式選擇,鏈路與信號的配置逐漸多樣化,配合OPC-4的Flex-grid應用,這讓彈性光網(wǎng)絡(elastic optical networks, EON)成為了可能,鏈路性能優(yōu)則采用更高的單波速率,鏈路性能差則降低單波速率換取更高的傳送性能。這就像新能源汽車的續(xù)航里程一樣,高速行駛續(xù)航里程相對越短,勻速行駛里程相對較長,如何平衡這兩者的關(guān)系是一個平衡經(jīng)濟效益的點。網(wǎng)絡控制層能夠?qū)︻l譜資源進行更靈活和精確的配置,但需要一套評估機制來平衡利用率與性能的關(guān)系。另一方面,隨著光網(wǎng)絡的開源解耦,基于開放平臺的控制器實現(xiàn)對多廠商設備統(tǒng)一管控,同時集中化控制場景下,海量的PM數(shù)據(jù)被更高頻次的采集上來,網(wǎng)絡管理者可以站在更精細化的維度上去審視系統(tǒng)的性能情況,基于在線的實時性能優(yōu)化成了可能,如何處理并運用這些數(shù)據(jù)是今后的一個重要課題。
以上提到的光網(wǎng)絡發(fā)展趨勢,使得維持高質(zhì)量的光傳輸業(yè)務從壽命起始(Beginning of life, BoL)到壽命終止(End of life, EoL)更具挑戰(zhàn)性。在大部分情況下,由于光網(wǎng)絡規(guī)劃平臺無法準確預估未部署的光信號傳輸質(zhì)量(Quality of transmission, QoT),為確保網(wǎng)絡正常運行,需要預留較高的設計余量以容忍規(guī)劃的性能指標與實際結(jié)果之間的差異。然而,高余量的設計會導致頻譜資源利用不足,從而浪費了一部分傳輸容量。因此,為了構(gòu)建一個低余量的光網(wǎng)絡來增加網(wǎng)絡容量,控制層需要更準確的光網(wǎng)絡規(guī)劃工具(planning tool)在光路部署前來評估傳輸性能。其中,QoT估計模型是planning tool的核心模塊。
本篇推文將首先介紹QoT估計模型中對于光纖信道的建模原理,并對兩種經(jīng)典模型進行簡要介紹。在此基礎上,我們將簡要介紹開發(fā)QoT模型的流程及未來針對數(shù)據(jù)中心光網(wǎng)絡智能管控的研究方向。
光纖信道建模原理
通常來說,光信號在傳輸過程中,會受到多種物理效應的影響從而引入噪聲,其中包括偏振效應、光放大器自發(fā)輻射(ASE)噪聲、收發(fā)機噪聲、非線性噪聲、濾波效應等。前文提到的planning tool可以通過建模這些物理效應,計算相應的噪聲,從而評估給定參數(shù)的鏈路的QoT。但設計這樣的planning tool存在一定挑戰(zhàn),讓我們來看這樣一個現(xiàn)象,試著理解下這些難懂的過程:
小明在大街上接打電話,由于周圍環(huán)境嘈雜,小明開啟了免提并調(diào)高音量貼在耳朵上聽著對方說話,但由于音量太大揚聲器爆音,小明更難聽明白電話另一頭濃重的鄉(xiāng)音。于是小明從書包里翻出了降噪耳機戴上后立馬可以清晰地聽清楚對方,并且連耳機的靜默電流聲也聽得一清二楚,小明努力地識別著對方的口音,費了半天勁也沒搞明白對方說的一些詞的意思,但在此時小明被身邊的人猛得一拉,緩過神來的小明才反應過來原來路人看見小明完全沒聽到身后汽車的鳴笛聲,是路人幫忙提醒了他。
上面這樣一個例子在生活中也是大家所常見的,其實這樣一個通信過程也夾雜著很多類似的原理:
收發(fā)機噪聲:手機的揚聲器效果差,降噪耳機效果好,其實這就如同不同的收發(fā)器自身也會攜帶不同的噪聲,干擾我們聽清對方的話。
ASE噪聲:就像我們打電話過程中,戴著降噪耳機時,在對方說話的間隔中或多或少會聽到一些背景的靜默電流聲,耳機聲音越大這個聲音也越大,耳機放大器的自身噪聲也會隨著音量調(diào)大而變大。
濾波器噪聲:小明使用降噪耳機,我們可以變相地理解為通過一個降噪濾掉了小明所處環(huán)境的背景音,但是降噪耳機也有個不好的地方,大家應該都有體會:所有身邊的聲音都隔離掉之后反而對于行走中的人帶來了危險。當然這個例子只是解釋濾波器本身也會帶來代價,就像降噪耳機引入安全問題一樣,也會引入新的代價。
非線性噪聲:就和小明一樣,面對一個口音濃重的人在談話中說到了一個俚語,你很難弄清他說的這個詞是什么含義,也很難通過前后語境去推測這個詞到底是什么,這樣的難以判斷與預測就和非線性噪聲一樣,沒有公式或算法去計算非線性效應的不確定性,這給通信系統(tǒng)帶來了很大的挑戰(zhàn)。
那么QoT充當一個什么角色
QoT充當一個量化溝通難度的工具,即在小明接通電話前我們可以告訴他,小明你的漢語水平結(jié)合當前的場景,你可能無法理解對方的話。當然這個例子可能并不十分恰當,實際上我們的QoT遇到的問題就像是小明所遇到的問題,不同的是planning tool不光要能準確地識別和理解對方的鄉(xiāng)音與俚語,還要評估環(huán)境噪聲有多大,例如這款耳機的降噪系數(shù)如何,音質(zhì)是否優(yōu)異,對方的口音大概是哪里人等等,即把每一個所經(jīng)環(huán)節(jié)的信息拿到并給出一個評估:在環(huán)境噪音不高于多少分貝的情況下,使用這個耳機可以讓漢語水平8級的人聽懂來自浙江溫州的他所打來的電話。QoT就是這樣一個評估通信系統(tǒng)代價的工具。
通過小明的例子理解這一過程后,我們來看看相對專業(yè)一些的分析,說明了我們做這樣一個工具的幾方面難點:
1.各項物理效應自身的建模存在復雜性
前文提到的各項物理效應產(chǎn)生的機制不完全相同,所對應的建模都具有一定的挑戰(zhàn)性。其中,光纖非線性噪聲在高速光纖通信系統(tǒng)中是最為復雜也最難定量計算的噪聲。這是由于非線性噪聲由多種復雜的光學物理效應相互作用產(chǎn)生,如色散、自相位調(diào)制、交叉相位調(diào)制、四波混頻、受激散射等。非線性噪聲可以通過非線性薛定諤方程來進行計算。由于這個方程在一般情況下沒有解析解,因此非線性噪聲的計算成為了鏈路QoT估計模型中的技術(shù)關(guān)鍵點。
圖中所示的這些噪聲作用于信號的時、頻域,其大小與信號配置、波道分布、光纖類型都密切相關(guān)。對于這些噪聲的單獨建模存在一定的復雜性,但都有可行的方案。目前常用的兩種QoT評估框架:高精度的基于分步傅里葉的估計模型(split-step Fourier method,SSFM)和快速的基于高斯噪聲假設的估計模型(Gaussian noise model, GN model),都可以在假設各項噪聲為加性噪聲的情況下,給出鏈路中噪聲的評估總和。目前關(guān)于各項噪聲建模的研究很多,但仍然存在改進的空間,尤其是針對靈活彈性光網(wǎng)絡的應用場景。
2.噪聲之間互相影響,增加了建模的復雜性
各項噪聲除了自身建模的復雜性之外,由于彼此間的相互所用,還會進一步增加信道精確建模的難度。例如,在GN模型計算非線性噪聲的基礎上,在噪聲來源中加入濾波效應,會造成非線性噪聲的估計準確性下降。這是因為濾波效應使得信號頻譜不再完全符合GN模型計算非線性噪聲時做出的信號頻譜為方形分布的假設。也就是說,簡單的逐一實現(xiàn)各類噪聲并疊加不能精準地建模各類噪聲共同作用的效果。
3.理論模型的部署存在著復雜性
將理論模型以能夠工程化的編程語言實現(xiàn)也存在一定的復雜性。我們的工作內(nèi)容就是基于目前常用的兩種QoT評估框架(SSFM模型和GN模型),首先實現(xiàn)了傳輸性能估計模型的python版本。在新信號部署前,可以使用精度較高的SSFM模型準確預估其性能。對已部署的信號進行調(diào)整時,可以使用速度較快的GN模型進行快速靈活的配置。在此基礎上,我們將理論模型進行了進一步的拓展擴充,使之更適配實際的鏈路情況,包括鏈路中WSS濾波效應的多樣性和EDFA增益譜噪聲譜的非一致性。
我們怎么做?
講述完困難,我們是如何做這樣一個模型的,早在2019年,我們啟動TOOP的時候,我們意識到planning tool這樣一個產(chǎn)品是任何一家波分供應商的核心組件,用它你可以了解一個供應商的全部類型板卡的性能情況,因此很難有任何廠商會愿意分享他們的工具,也不會售賣,且對于他們自己內(nèi)部也是license嚴格把控。即拿到一個供應商的EPT工具即掌握了這家的核心器件性能機密,因此我們需要有自己的評估系統(tǒng)來實現(xiàn)對通信系統(tǒng)的先驗計算配置與后驗優(yōu)化性能的需求。我們選擇與上交大的團隊合作,從建模開始做一個可用的QoT功能模塊來幫助我們的開放光網(wǎng)絡部署與運營。
模型簡要介紹
SSFM模型完整模擬了整個鏈路中信號從發(fā)端產(chǎn)生到收端被接收處理的過程。它將光纖分成小段,假設每一小段中信號的色散(線性)和非線性噪聲可以分開計算;線性效應在時域進行計算,而非線性效應則在頻域進行計算,這使得模型中存在大量的FFT和IFFT,導致了運算速度較慢。在實際應用中,可以通過設計變步長的分步傅里葉算法減少時頻域變換的次數(shù)。同時,通過GPU的輔助,SSFM的計算速度也可以進一步提升。
GN模型則根據(jù)假設信號和噪聲都遵循高斯分布,通過數(shù)值運算得到非線性噪聲的噪聲功率譜密度。由于模型計算中不產(chǎn)生符號序列,GN模型的計算速度在ms級,能夠快速給出鏈路QoT估計結(jié)果。運算速度優(yōu)勢使得GN模型可以廣泛用于對鏈路QoT估計有快速需求的場景。在GN模型的基礎上,可以將GN模型拓展為enhanced GN(EGN)模型,得到更精確的鏈路QoT估計結(jié)果。另外,還可以將GN模型的結(jié)果和其他鏈路特征送入神經(jīng)網(wǎng)絡進行訓練,進一步提升模型的精度。
模型開發(fā)流程
首先,我們使用python語言對兩種模型進行開發(fā),并完成封裝與集成。為了能夠給用戶提供更方便的模型選擇和參數(shù)輸入,我們將模型輸入輸出開放成RESTful接口,以json數(shù)據(jù)形式進行讀取和寫入。
目前可以輸入的模型參數(shù)包括光纖相關(guān)參數(shù)(如長度、損耗等),器件相關(guān)參數(shù)(如EDFA,WSS等)和信號相關(guān)參數(shù)(如調(diào)制格式等),并可以根據(jù)需求選擇高精度模型或快速模型來輸出收端信號的SNR。我們將在后續(xù)工作中將輸出擴展到BER、OSNR、Q值等指標。
另外,我們在兩個模型中都加入了對濾波噪聲的估計。對于SSFM模型,它在發(fā)端已經(jīng)生成了符號序列,只需要在光纖傳輸過程中添加濾波功能。對于GN模型,考慮到原始模型僅計算非線性噪聲,無法直接計算濾波噪聲,因此需要對整個模型進行重構(gòu)。我們利用半仿真半數(shù)值解的方案來實現(xiàn):模擬一個AWGN信道,在發(fā)端產(chǎn)生符號序列,將原有GN模型上得到的非線性噪聲和ASE噪聲視為信道中的白噪聲,加在符號序列上后經(jīng)過WSS,在收端獲得最終的SNR。由于加入了符號傳輸仿真,這會使得GN模型的運算速度稍有下降,但仍遠快于SSFM模型。
后續(xù)將對模型進行更新迭代,使模型能夠適應帶寬靈活可調(diào)、調(diào)制格式靈活可變、路由自由定義的網(wǎng)絡場景,并進一步對EDFA等器件進行精準建模,使之能夠更符合實際中的鏈路情況。
未來的研究計劃
本階段完成了對物理層光網(wǎng)絡性能估計算法的初步部署。隨著彈性光網(wǎng)絡的發(fā)展,我們將進一步設計新網(wǎng)絡場景中的性能估計模型,并考慮開源硬件的趨勢,對不同型號收發(fā)機及光器件進行精準地適配。同時,目前的性能估計主要基于靜態(tài)模型,隨著網(wǎng)絡配置及信道的變化,下一代模型將以智能監(jiān)測為核心,從實時鏈路的監(jiān)測結(jié)果出發(fā),使靜態(tài)模型轉(zhuǎn)化為動態(tài)模型,進一步提升網(wǎng)絡性能,構(gòu)建智能化、數(shù)字化的光網(wǎng)絡管控系統(tǒng)。基于上述的鏈路QoT估計模型,我們未來將展開對光網(wǎng)絡智能管控算法的研究。其中的重點包括光功率優(yōu)化:實現(xiàn)更有效的入纖光功率配置來進一步提升網(wǎng)絡容量。還可以根據(jù)精確的鏈路QoT相關(guān)數(shù)據(jù)分析,進行光網(wǎng)絡中軟故障的管理,如檢測和定位等。這些研究都可以在目前工作的基礎上進行,最終目標是實現(xiàn)更智能和動態(tài)的光網(wǎng)絡管控。
QoT給我們帶來的意義和價值
QoT的價值一方面是為我們在開通系統(tǒng)前提供了先驗機制,輸出對應配置,但更大的價值在于它賦予了TOOP控制器在線診斷能力。當線路發(fā)生劣化時,根據(jù)telemetry所得到的PM數(shù)據(jù)情況,判斷劣化區(qū)間與劣化事件,通過QoT組件計算線路性能,得到最優(yōu)配置下發(fā)并調(diào)節(jié)確保系統(tǒng)可以正常運行。從采集、分析、執(zhí)行,光層設備與電層設備如同傳感器一樣時刻反饋數(shù)據(jù),光功率、Pre-fec、Q值、SOP等參數(shù)作為評估參數(shù)進行系統(tǒng)性能評估,并根據(jù)計算結(jié)果修正配置,這樣一個反饋循讓系統(tǒng)維持在一個健康狀態(tài)。如同開篇所講到的,長久以來光網(wǎng)絡在設計時都預留很大的余量,包括工程余量,系統(tǒng)老化余量,線路劣化余量等等。過多的預留帶來的是成本問題,通過QoT組件精準的性能分析可以在滿足系統(tǒng)性能的前提下預留合理的余量,最大程度的利用頻譜資源,平衡成本與穩(wěn)定性的關(guān)系。曾經(jīng)的光網(wǎng)絡設備專業(yè)且復雜,龐大的子框及聯(lián)關(guān)系,復雜的分布式功率調(diào)節(jié)算法與自動化的缺失讓網(wǎng)絡的運營十分繁冗。TOOP結(jié)合QoT組件實現(xiàn)自動化并最終像智慧管控進行演進,這就是QoT帶給我們的價值。
上海交通大學課題組介紹
本課題組主要研究方向為數(shù)據(jù)中心光網(wǎng)絡、核心骨干網(wǎng)光通信和B5G/6G光應用技術(shù),研究內(nèi)容涉及光通信系統(tǒng)架構(gòu)、光網(wǎng)絡智能管控、光數(shù)字信號處理和光無線融合等。主持科技部重點專項(課題負責人)和自然科學基金。在國際一流期刊和會議上發(fā)表論文140余篇,共申請美國專利10項,在OFC和ECOC等國際會議上作特邀報告20余次。擔任Optics Express等國際期刊副編輯。擔任OFC等國際會議的技術(shù)委員會主席(OFC S4和OSA SPPCom等)和委員。獲2020年OFC康寧杰出學生論文獎第一名,2019年華為優(yōu)秀合作獎等。
感謝上海交通大學諸葛群碧副教授課題組。參與本課題的學生包括:劉曉敏、高若萱、劉蕾、倫華志、蔡萌、邱淇智。