ICC訊 硅基光電計算是建立在硅基光電子學基礎(chǔ)上的一種新型計算體系,如圖1所示。硅基光電子學是探討微納米量級光子、電子及光電子器件在不同材料體系中的工作原理,并使用與硅基集成電路工藝兼容的技術(shù)和方法,將它們異質(zhì)集成在同一硅襯底上形成一個完整的具有綜合功能的新型大規(guī)模光電集成芯片的一門科學。
圖1 硅基光電計算體系
早期硅基光電子概念的提出是為了解決傳統(tǒng)微電子芯片中核心單元之間的互連通信瓶頸問題。近十年來,硅基光電子因其與CMOS技術(shù)兼容的集成工藝和光域通信互連方面的優(yōu)點,不僅在通信領(lǐng)域?qū)崿F(xiàn)了產(chǎn)業(yè)化,快速占領(lǐng)市場份額,還催生了其他前沿應(yīng)用領(lǐng)域,如人工智能處理器中的光電計算,成為了具有多樣化應(yīng)用潛力的硬件平臺。基于硅基光電子技術(shù)的光電計算,利用光的優(yōu)異特性,如低延遲、低損耗、超寬頻帶、多維復(fù)用、波動特性等,與微電子技術(shù)結(jié)合,在硅襯底上巧妙構(gòu)造軟硬件深度融合的光電計算體系,解決傳統(tǒng)微電子處理器在高速計算應(yīng)用上的算力、能耗和輸入輸出瓶頸問題,成為光電子學、微電子學、光子學、數(shù)學、算法、計算機系統(tǒng)等深度融合的新型交叉學科。
關(guān)鍵進展
以現(xiàn)階段熱門的人工智能為例,其開發(fā)過程依賴專用的硬件,如圖像處理單元(GPU)和專用集成電路(ASIC),為樣本訓練和模型參數(shù)調(diào)優(yōu)提供算力基礎(chǔ)。根據(jù)硅谷人工智能研究組織OpenAI統(tǒng)計,在2012-2020年的8年間,深度人工神經(jīng)網(wǎng)絡(luò)的浮點計算量以指數(shù)速率快速增長,平均每3.4個月翻一倍,遠超集成電路摩爾定律的增長速率,同時也伴隨驚人的能耗問題,限制了人工智能的發(fā)展。因此,在后摩爾定律時代,發(fā)展新的人工智能計算硬件是當務(wù)之急。人工神經(jīng)網(wǎng)絡(luò)計算中包含大量矩陣相關(guān)的基本運算,如矩陣乘法、點乘內(nèi)積和乘加計算等。如圖2所示,在深度卷積神經(jīng)網(wǎng)絡(luò)的隱藏層中的卷積核與特征圖之間存在大量的矩陣卷積操作,在全連接層則通過矩陣乘法實現(xiàn)層間傳遞。當矩陣規(guī)模較大時,通過微電子處理器進行大量的二進制矩陣運算,效率較低,延遲較高,難以實現(xiàn)高速實時的人工智能應(yīng)用。
圖2 人工神經(jīng)網(wǎng)絡(luò)運算過程的矩陣乘法和卷積運算
硅基光電計算,以片上光電融合為基礎(chǔ),利用電子的邏輯運算優(yōu)勢和光子的光學變換、等效映射、相干探測、高速互連等方式,有望構(gòu)建大算力、低能耗的光電矩陣計算硬件體系,如圖3所示。學術(shù)界和產(chǎn)業(yè)界對光電計算的算力、能耗和可行性等指標做了預(yù)測和評估:(1)任意矩陣可通過奇異值分解,分解成兩個酉矩陣和一個對角特征值矩陣相乘,其中酉矩陣和特征值矩陣可通過級聯(lián)的馬赫-曾德爾干涉(MZI)網(wǎng)絡(luò)實現(xiàn)。傳輸損耗<1dB/cm的大規(guī)模低損耗的MZI網(wǎng)絡(luò),是實現(xiàn)光電矩陣運算的硬件基礎(chǔ),可利用硅基光電子技術(shù)制備。(2)利用高速電光調(diào)制的大規(guī)模MZI網(wǎng)絡(luò)實現(xiàn)矩陣運算,在典型深度的多層MLP神經(jīng)網(wǎng)絡(luò)中,可以達到1018 MAC/s的等效矩陣乘法算力量級,比使用ASIC微電子芯片進行的同類運算快5個數(shù)量級。(3)在自差相干探測的光電乘加器中,可實現(xiàn)接近標準量子極限的模擬乘加計算。在典型的神經(jīng)網(wǎng)絡(luò)神經(jīng)元規(guī)模下,光電乘加運算的標準量子極限理論能耗在10-18 J/MAC量級,而目前實際可行的光電乘加器件能耗約為10-15 J/MAC量級,相比電子乘加器運算的10-12J/MAC量級,有3~4個數(shù)量級的能效提升。
圖3 硅基光電計算案例
除了人工神經(jīng)網(wǎng)絡(luò)矩陣運算以外,硅基光電子技術(shù)在模擬計算、離散傅里葉變換、集成光量子邏輯門和神經(jīng)擬態(tài)計算等研究和應(yīng)用中也取得了如下的重要進展:(1)在伊辛問題和圖最大割問題等非確定性多項式NP問題中,通過軟硬件深度融合可設(shè)計高能效和高性能的光電啟發(fā)式算法求解器。在硅基光電系統(tǒng)的快速循環(huán)迭代下,實現(xiàn)NP問題的模型能量快速演化收斂,得到復(fù)雜問題的可行解。(2)通過硅基光電子平臺的片上光學變換,構(gòu)建低延遲的光電離散傅里葉變換DFT器件和系統(tǒng),可克服無線局域網(wǎng)和蜂窩數(shù)據(jù)通信中多徑效應(yīng)和信道衰減等數(shù)據(jù)傳輸問題,實現(xiàn)OFDM系統(tǒng)的載波信道復(fù)用,是未來微波無線通信中降低數(shù)據(jù)通信延遲的可行技術(shù)方案。(3)在電控光量子處理器中,通過多維度調(diào)控的硅基光電子器件庫,使得片上多量子態(tài)的量子信息操控和處理成為可能;利用硅基光電子芯片的高集成度,突破量子信息處理的實驗規(guī)模,同時避免了光電元件的空間占用,有利于量子計算的大規(guī)模可拓展應(yīng)用。(4)在基于硅基光電子技術(shù)的神經(jīng)擬態(tài)芯片中,片上光互連的優(yōu)勢可促使低損耗、低延遲的光電神經(jīng)元和神經(jīng)擬態(tài)系統(tǒng)的構(gòu)建。隨著光脈沖神經(jīng)元數(shù)量的增加,神經(jīng)元節(jié)點間的信息通信和復(fù)雜連接可組成大規(guī)模的光電神經(jīng)系統(tǒng),通過神經(jīng)系統(tǒng)的訓練,進而實現(xiàn)復(fù)雜的類腦人工智能。
總結(jié)與展望
硅基光電計算是未來提高處理器算力、減少能耗、降低數(shù)據(jù)處理和通信延遲的關(guān)鍵技術(shù),具有重要的戰(zhàn)略意義。然而,現(xiàn)階段高性能計算在研究過程中存在目標不明確、發(fā)展路線規(guī)劃混亂等現(xiàn)象,為此,我們認為下面三點需要在業(yè)界成為共識:
1、光電計算的特點和意義。光子由于自身的特點,難以便捷高效地實現(xiàn)相互作用、單元緩存和邏輯運算,其器件集成度也難以達到電子集成電路的規(guī)模,因而,利用“光子計算”來取代“電子計算”是不切實際的?!肮杌怆娪嬎恪笔枪怆娮訉W、微電子學、光子學、數(shù)學、算法、計算機系統(tǒng)等深度結(jié)合的新型交叉學科,通過軟件和硬件的深度聯(lián)合設(shè)計,有望實現(xiàn)超高性能計算。
2、光電融合的發(fā)展趨勢。在硅基光電計算中,光子和電子相輔相成,缺一不可,光電融合是必然趨勢。通過與硅基集成電路工藝兼容的技術(shù)和方法,將光子、光電子和微電子器件集成在同一硅基芯片平臺上,形成優(yōu)勢互補的整體,才能突破現(xiàn)有“電子計算”的性能極限,擺脫“光子計算”的觀念誤區(qū),更好地推動光電計算的實際應(yīng)用。
3、硅基光電計算系統(tǒng)。其架構(gòu)需要包含如圖4所示的基本單元,其中光電計算單元(Optoelectronic Computing Unit, OECU)是計算處理性能提升的關(guān)鍵,用以實現(xiàn)高速的矩陣運算和模擬計算等。一些在光域上不便進行的計算操作,如信號延遲、數(shù)據(jù)緩存和邏輯運算等,仍需要引入算術(shù)邏輯單元(Arithmetic & Logic Unit, ALU),主控(Control Unit),寄存器(Register)、緩存(Memory)等,在電子處理單元中實現(xiàn)。而計算、控制和存儲單元之間的互連通信和硬件系統(tǒng)I/O等,則通過光互連來實現(xiàn)。
圖4 硅基光電計算初級系統(tǒng)
在這個全新的系統(tǒng)中,光子、電子及光電子技術(shù)在芯片上的優(yōu)勢互補和計算單元之間以及單元與外界的高速光電互連形成硅基光電計算的基礎(chǔ),這是最終獲得實用性超高性能計算的關(guān)鍵。