ICC訊 6月19~20日,2024中國光網(wǎng)絡(luò)研討會在北京成功舉辦。在會議期間,海思光電先進(jìn)光電實驗室主任滿江偉博士發(fā)表題為“星云光模塊助力智算中心光互聯(lián)技術(shù)發(fā)展”的主題演講,分享智算中心網(wǎng)絡(luò)對光互聯(lián)的技術(shù)需求以及海思光電面向智算中心光互聯(lián)的星云系列光模塊產(chǎn)品。
近年來,大模型的爆發(fā)性發(fā)展帶動了AI智算中心向超大規(guī)模集群演進(jìn)。大規(guī)模計算集群中的NPU/GPU高性能互聯(lián)成為影響網(wǎng)絡(luò)性能的關(guān)鍵因素,并且正在經(jīng)歷著快速迭代演進(jìn)。不斷加快的產(chǎn)品換代催生光互聯(lián)接口的代際升級,面向AI光互聯(lián)的光模塊正迎來爆發(fā)性增長。
滿江偉博士在分享中指出:運(yùn)營商的數(shù)據(jù)中心分布廣泛,涵蓋從城市的核心數(shù)據(jù)中心到區(qū)域的邊緣接入數(shù)據(jù)中心,部署環(huán)境復(fù)雜且面臨鹽霧、硫化、水汽等復(fù)雜場景挑戰(zhàn),因此對于光模塊的長期性能和穩(wěn)定性有較高的要求。IPEC國際光電委員會正在協(xié)同全產(chǎn)業(yè)鏈伙伴探索電信級光模塊可靠性保證。同時,AI智算中心向大規(guī)模集群演進(jìn)的過程中,由于采用了大規(guī)模并行計算,AI計算相比通用計算具有更高的集約度和更大的能耗,因此在大帶寬、低時延、低功耗、高可靠、智能化等多個方面都對光互聯(lián)模塊提出了新的挑戰(zhàn)。
海思光電立足AI智算中心的光互聯(lián)需求,聯(lián)合計算、網(wǎng)絡(luò)等領(lǐng)域進(jìn)行協(xié)同創(chuàng)新,推出面向AI智算中心的星云系列光模塊,從五大維度適配AI智算需求,提升計算網(wǎng)絡(luò)效率:
-- 大帶寬維度:依托基于VCSEL的多模光芯片和基于TFLN、EML及硅光的單模光芯片,打造400G、800G短距光互聯(lián)產(chǎn)品,匹配AI智算中心的互聯(lián)需求。持續(xù)提升單Lane速率,推進(jìn)光模塊向更高速率演進(jìn)
-- 低時延維度:推進(jìn)系統(tǒng)側(cè)、模塊側(cè)的協(xié)同處理,采用低時延FEC等措施降低端到端時延。此外,針對業(yè)界討論熱點之一的LPO方案,持續(xù)關(guān)注其在標(biāo)準(zhǔn)化、互聯(lián)互通等方面的挑戰(zhàn)與進(jìn)展
-- 低功耗維度:在電/光/系統(tǒng)級等多個領(lǐng)域進(jìn)行協(xié)同優(yōu)化,充分挖掘技術(shù)潛力,構(gòu)建系統(tǒng)級的功耗優(yōu)化方案來降低per-bit的功耗
-- 高可靠維度:AI智算網(wǎng)絡(luò)的鏈路故障來源于光纖鏈路、連接器、光電轉(zhuǎn)換單元、系統(tǒng)設(shè)備等多個部分。針對AI計算對高可靠光互聯(lián)的需求,從系統(tǒng)層面進(jìn)行統(tǒng)籌考慮,采用光/電聯(lián)合設(shè)計,提升光模塊長期工作的穩(wěn)定性和系統(tǒng)的可靠性
-- 智能化維度:引入AI技術(shù)提升光模塊和智算網(wǎng)絡(luò)的可運(yùn)維性,通過對光模塊、光鏈路參數(shù)的數(shù)據(jù)檢測分析,對光模塊本體、光電鏈路健康度進(jìn)行診斷;同時,與設(shè)備層面進(jìn)行聯(lián)動,主動預(yù)防網(wǎng)絡(luò)故障
滿江偉博士最后指出,AI及AI智算網(wǎng)絡(luò)正處于前所未有的加速發(fā)展階段,這對光互聯(lián)既是機(jī)會也是挑戰(zhàn)。海思光電打造的星云系列光模塊將繼續(xù)適配AI智算網(wǎng)絡(luò)對光互聯(lián)的關(guān)鍵需求,賦能高可用、高可靠、智能化等業(yè)務(wù)場景,助力AI數(shù)據(jù)中心的蓬勃發(fā)展。