Iccsz訊 在近日召開(kāi)的“GNTC全球網(wǎng)絡(luò)技術(shù)大會(huì)”上,阿里技術(shù)保障部高級(jí)網(wǎng)絡(luò)專(zhuān)家曹捷表示,阿里網(wǎng)絡(luò)從最開(kāi)始千兆、萬(wàn)兆,到現(xiàn)在25G,以及到明年的100G,花了近五年的時(shí)間,這個(gè)過(guò)程當(dāng)中經(jīng)歷了很多次的技術(shù)迭代和很多次的試錯(cuò),最終阿里決定要把網(wǎng)絡(luò)做到最簡(jiǎn)單,簡(jiǎn)單到一個(gè)網(wǎng)絡(luò)里面只有一個(gè)路由協(xié)議,而且這個(gè)BCP路由協(xié)議沒(méi)有任何擴(kuò)展的協(xié)議組。網(wǎng)絡(luò)在接入交換機(jī)就在最后的端口上,提供給服務(wù)器接入。
據(jù)曹捷介紹,在2013年和2014年,阿里第一次做網(wǎng)絡(luò)架構(gòu)的標(biāo)準(zhǔn)化, 13年底實(shí)現(xiàn)了整個(gè)阿里數(shù)據(jù)中心的標(biāo)準(zhǔn)化建設(shè),不管北京、上海、深圳,還是在云南、成都,機(jī)房里數(shù)據(jù)中心的網(wǎng)絡(luò)hope圖完全一樣,設(shè)備型號(hào)完全一樣,設(shè)備配置也完全一樣。之后,阿里做超大規(guī)模的網(wǎng)絡(luò)部署,解決了服務(wù)器分散,運(yùn)維團(tuán)隊(duì)忙不過(guò)來(lái)的問(wèn)題。
2016年,為適應(yīng)阿里云的迅猛發(fā)展,阿里網(wǎng)絡(luò)再次進(jìn)行改造,第一次嘗試自己做網(wǎng)管,雖然成功的實(shí)現(xiàn)了網(wǎng)絡(luò)的正常運(yùn)轉(zhuǎn),但由于業(yè)務(wù)與網(wǎng)絡(luò)間過(guò)于耦合導(dǎo)致業(yè)務(wù)線(xiàn)對(duì)產(chǎn)品進(jìn)行調(diào)整就需要網(wǎng)絡(luò)部門(mén)配合對(duì)網(wǎng)絡(luò)進(jìn)行修改。為此,阿里開(kāi)始將網(wǎng)絡(luò)與業(yè)務(wù)進(jìn)行分離,從而實(shí)現(xiàn)網(wǎng)絡(luò)與業(yè)務(wù)的解耦。
曹捷認(rèn)為,通過(guò)一次次迭代,讓阿里網(wǎng)絡(luò)的架構(gòu)設(shè)計(jì)原則,變?yōu)樵胶?jiǎn)單越好。簡(jiǎn)單才能穩(wěn)定可靠,穩(wěn)定可靠才可以活下來(lái)。
此外,曹捷認(rèn)為,對(duì)于整個(gè)數(shù)據(jù)中心網(wǎng)絡(luò)流量監(jiān)控也至關(guān)重要,要做流量可視化。流量可視化解決三個(gè)問(wèn)題:第一個(gè)問(wèn)題解決看不見(jiàn)問(wèn)題,比如延時(shí)、轉(zhuǎn)發(fā)路徑等;第二個(gè)問(wèn)題解決找不到問(wèn)題,通過(guò)隨包的檢測(cè)和拓?fù)涞木S護(hù),快速定位問(wèn)題所在的位置;第三個(gè)是摸不準(zhǔn)問(wèn)題,通過(guò)可視化看網(wǎng)絡(luò)真實(shí)的轉(zhuǎn)發(fā)數(shù)據(jù),把數(shù)據(jù)整合起來(lái)做分析,會(huì)找到整個(gè)網(wǎng)絡(luò)設(shè)計(jì)架構(gòu)的盲點(diǎn),解決收斂比、規(guī)模等設(shè)計(jì)難點(diǎn)。
曹捷表示,可視化將會(huì)在未來(lái)3-5年之內(nèi)是阿里全力投入的數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù),其會(huì)幫助阿里在沒(méi)有辦法實(shí)現(xiàn)完全自研支持最大可能的掌握數(shù)據(jù)交配。