ICC訊 隨著人工智能應(yīng)用的快速發(fā)展,AI智算網(wǎng)絡(luò)正在經(jīng)歷著加速向超大規(guī)模集群演進的過程。由于大規(guī)模并行計算的廣泛采用,為了確保AI智算網(wǎng)絡(luò)的運行效率與經(jīng)濟性,AI智算網(wǎng)絡(luò)對光互聯(lián)的可靠性和可用性均提出了新的挑戰(zhàn)。
大量的實驗及現(xiàn)網(wǎng)數(shù)據(jù)表明,光纖鏈路臟污是導(dǎo)致AI智算網(wǎng)絡(luò)的故障的一個重要因素,其引起的丟包會大幅降低AI智算中心集群的可用度;同時,隨著網(wǎng)絡(luò)聯(lián)接規(guī)模的指數(shù)級加大,涉及的光聯(lián)接節(jié)點數(shù)也呈指數(shù)級倍增,光聯(lián)接的虛接問題已經(jīng)成為影響AI智算網(wǎng)絡(luò)開局及日常運維效率的另一個重要因素。
“星云“400G/800G光模塊依托海思在光/電芯片、軟/硬協(xié)同等方面的技術(shù)整合優(yōu)勢,實現(xiàn)了領(lǐng)先的臟污定位檢測與診斷算法,支持主動在線光路診斷監(jiān)測預(yù)警和故障定界。該產(chǎn)品具備三大技術(shù)優(yōu)勢:
● 極簡維護:無需外在儀表,無需現(xiàn)場上站檢測,可遠程監(jiān)測,大幅減少網(wǎng)絡(luò)的開局和日常維護投入,顯著提升運維效率
● 極高可靠:通過持續(xù)在線連續(xù)跟蹤,提前預(yù)警鏈路風(fēng)險 (臟污、斷纖等),制定技術(shù)排障計劃,提升網(wǎng)絡(luò)可靠性的同時支撐大模型等AI應(yīng)用的高效運行
● 極致成本:“星云”光模塊原生支持相關(guān)特性,無需外在硬件、傳統(tǒng)儀表等額外支出,打造極致成本的建網(wǎng)和運維方案
在CIOE 2024展上,海思展示了基于“星云“智能400G/800G光模塊的演示方案,在演示中系統(tǒng)中通過人為引入的光纖虛連接、接口臟污乃至光器件性能劣化均得到了明確的預(yù)警與界定,從而顯著提升了網(wǎng)絡(luò)的維護效率,得到產(chǎn)業(yè)上下游的高度關(guān)注與認可。
AI及AI智算網(wǎng)絡(luò)正處于前所未有的加速發(fā)展階段,海思光電打造的“星云”系列光模塊將繼續(xù)適配AI智算網(wǎng)絡(luò)對光互聯(lián)的關(guān)鍵需求,賦能高可用、高可靠、智能化等業(yè)務(wù)場景,助力AI智算網(wǎng)絡(luò)的蓬勃發(fā)展。