Iccsz訊 在昨天召開(kāi)的“2017開(kāi)放數(shù)據(jù)中心峰會(huì)”上,阿里巴巴基礎(chǔ)設(shè)施事業(yè)群總經(jīng)理周明表示,阿里巴巴基礎(chǔ)設(shè)施團(tuán)隊(duì),支持了來(lái)自整個(gè)淘寶、天貓為基礎(chǔ)的電商集團(tuán),以螞蟻金服、支付寶為核心的金融集團(tuán),以及以菜鳥(niǎo)網(wǎng)絡(luò)為核心的物流板塊,遇到了一些壓力和挑戰(zhàn)。
周明說(shuō),阿里巴巴擁有國(guó)際化的基礎(chǔ)設(shè)施和全球化的網(wǎng)絡(luò),有巨大的服務(wù)器的保有量以及每年有相當(dāng)數(shù)量新增的服務(wù)器量,如何去運(yùn)營(yíng),如何提供技術(shù),都是一個(gè)非常大的壓力。他認(rèn)為,降低成本是最原始的驅(qū)動(dòng)力,但其實(shí)不夠,更重要的是如何構(gòu)建技術(shù)競(jìng)爭(zhēng)力。
據(jù)周明介紹,阿里巴巴通過(guò)三個(gè)方面來(lái)應(yīng)對(duì)這些挑戰(zhàn)。首先是白盒化,除了降低成本,還實(shí)現(xiàn)了很多優(yōu)秀技術(shù)的疊加;其次是架構(gòu)一體化,實(shí)現(xiàn)了從芯片到硬件,到基礎(chǔ)軟件平臺(tái)乃至上層應(yīng)用的一體化設(shè)計(jì);第三是智慧化,不僅僅提供一個(gè)設(shè)備、技術(shù)或者軟件,還提供7×24小時(shí)、365天的不中斷的服務(wù),解決Online服務(wù)對(duì)基礎(chǔ)設(shè)施穩(wěn)定性的挑戰(zhàn)。
從數(shù)據(jù)中心的風(fēng)火水電層面來(lái)看,最重要的是降低PUE,提高用電效率,因?yàn)槟茉闯杀疽呀?jīng)成為數(shù)據(jù)中心OPEX的大頭。阿里巴巴從最初的租用數(shù)據(jù)中心,到后來(lái)的自建,一直在不斷的摸索,比如杭州的數(shù)據(jù)中心將引入千島湖湖底冷水作為冷源,而在張北建立的數(shù)據(jù)中心則引入自然風(fēng)冷,阿里巴巴做了非常多細(xì)致的工作。
從數(shù)據(jù)中心服務(wù)器層面來(lái)看,阿里巴巴從最開(kāi)始購(gòu)買整臺(tái)服務(wù)器,到后來(lái)的整機(jī)柜,甚至到服務(wù)器的部件、芯片,都逐步在做白盒化工作。從整機(jī)定制變成CPU定制,最初規(guī)格的定制,到微架構(gòu)的定制,包括采用越來(lái)越多的智能網(wǎng)卡,網(wǎng)絡(luò)已經(jīng)開(kāi)始從交換機(jī)逐步落到服務(wù)器,最后落到網(wǎng)卡。當(dāng)前,結(jié)合AI,比如FPGA、NPU等異構(gòu)技術(shù),也已經(jīng)進(jìn)入考慮的范疇。
從數(shù)據(jù)中心網(wǎng)絡(luò)層面來(lái)看,阿里巴巴也在加快自研速度,從最下面的傳輸?shù)侥K自研,到上層交換機(jī),甚至是OS層面的自研;在一些基礎(chǔ)軟件,比如涉及到VPC、虛擬網(wǎng)絡(luò)以及服務(wù)化QoS,包括整個(gè)流量的調(diào)度,把每一項(xiàng)技術(shù)深入到每一層來(lái)做白盒化的解決方案。
“事實(shí)證明白盒化是不夠的,白盒化只是解決了工作,我們的目的是架構(gòu)一體化,實(shí)現(xiàn)競(jìng)爭(zhēng)能力。比如把PUE降低了夠不夠?不夠!還需要跟服務(wù)器、網(wǎng)絡(luò),怎么有機(jī)的結(jié)合起來(lái)。從白盒化到架構(gòu)一體化,這是非常重要的核心,也是我們技術(shù)競(jìng)爭(zhēng)力的體現(xiàn)。”周明說(shuō)。
在談到智慧化時(shí),周明指出,白盒化的設(shè)備和一體化的技術(shù)架構(gòu),要保證7×24小時(shí)的服務(wù),依然會(huì)出現(xiàn)很多問(wèn)題和故障,有了故障之后會(huì)對(duì)業(yè)務(wù)造成什么影響,如何快速的發(fā)現(xiàn)故障,定位故障,修復(fù)故障,這是非?,F(xiàn)實(shí)的演進(jìn)過(guò)程。規(guī)模小的時(shí)候手工搞定就可以,規(guī)模大了一定是不行的,只有實(shí)現(xiàn)信息化和自動(dòng)化,才能提高效率,走向未來(lái)的智慧化。