來源:【科學(xué)網(wǎng)】
2022阿里云峰會(huì)只有半天時(shí)間的云上跨時(shí)空連線,時(shí)間雖短,但發(fā)布的信息令人震撼。
最重磅的消息,當(dāng)屬阿里云智能總裁張建鋒發(fā)布的全新“處理器”:CIPU(Cloud infrastructure Processing Units 云基礎(chǔ)設(shè)施處理器)。他介紹說,以CIPU為中心的體系架構(gòu)是一個(gè)全新的架構(gòu)體系,“將替代CPU成為云時(shí)代IDC的處理核心”。
眾所周知,無論是個(gè)人計(jì)算機(jī)還是數(shù)據(jù)中心、超算集群等基礎(chǔ)設(shè)施,CPU的核心地位都牢不可破。為何在阿里云的話語體系里,這個(gè)只比CPU多個(gè)“I”的新名詞,一舉成了在云計(jì)算架構(gòu)中取代CPU“C位”的存在?
阿里云的葫蘆里,賣的是什么藥?
創(chuàng)新架構(gòu),解決真實(shí)存在的問題
在搞清楚“為什么”之前,要先弄清楚“是什么”。
CIPU意即云基礎(chǔ)設(shè)施處理器。從字面上看,CIPU專門用于云計(jì)算,定位是云數(shù)據(jù)中心的管理中樞。在張建鋒的介紹中,CIPU的功能定位也很專一:“專門用于連接服務(wù)器內(nèi)硬件和云上虛擬化資源”。
阿里云給出的 CIPU 架構(gòu)圖顯示,通過“飛天”云計(jì)算操作系統(tǒng),CIPU能夠長(zhǎng)出“三頭六臂”,分別接入計(jì)算加速單元、存儲(chǔ)加速單元和網(wǎng)絡(luò)加速單元??梢钥闯?,CIPU扮演了統(tǒng)籌協(xié)調(diào)各類計(jì)算硬件的角色,并實(shí)現(xiàn)計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)的加速。過程中,它以中心管理者的姿態(tài),取代了傳統(tǒng)數(shù)據(jù)中心中CPU的位置。
CPU為什么當(dāng)不了核心了?
CPU和GPU等計(jì)算單元,是服務(wù)器中最昂貴的部分。而云計(jì)算要體現(xiàn)出彈性特征,需要做好資源池化、虛擬化以及網(wǎng)絡(luò)分發(fā)等各項(xiàng)工作。在傳統(tǒng)的數(shù)據(jù)中心,這些“雜活兒”,都要身價(jià)不菲的CPU來承載。也就是說,CPU不僅要充當(dāng)計(jì)算核心,還要負(fù)責(zé)網(wǎng)絡(luò)管控、安全、訪問協(xié)議等“瑣事”,不僅大材小用,還嚴(yán)重透支著服務(wù)器的計(jì)算資源。
而對(duì)于云計(jì)算服務(wù)商來說,云計(jì)算的核心賣點(diǎn)是隨時(shí)隨地的彈性計(jì)算,但廠商不能為了提供彈性計(jì)算服務(wù),就放任計(jì)算性能有一定的損失。相反,只有把服務(wù)器的計(jì)算資源“吃干榨凈”——盡量多地將CPU用于提供計(jì)算能力,用戶才能用上更便宜好用的云服務(wù)。
換言之,要說服更多用戶上云,云服務(wù)商就不僅要提供更好彈性的云,還要提供性能更好、成本更低、安全性佳的云。
那么云服務(wù)商必然要面對(duì)這樣的難題:對(duì)服務(wù)器物理機(jī)的虛擬化、計(jì)算存儲(chǔ)分離都會(huì)造成性能損耗、提高延遲,云服務(wù)本身還會(huì)承受許多攻擊,需要強(qiáng)調(diào)云上隱私保護(hù)的重要性。這些問題已經(jīng)不是簡(jiǎn)單地軟件迭代就能解決得了的,探索更加云化的體系結(jié)構(gòu)是完全合理的方向。
事實(shí)上,阿里云早就注意到了虛擬化等給 CPU 帶來的額外消耗,并致力于解決問題。2017 年,阿里云代表云數(shù)據(jù)中心虛擬化技術(shù)變革、致力于以軟硬協(xié)同設(shè)計(jì)提升虛擬化效率的“神龍架構(gòu)”問世。歷經(jīng)多輪迭代,神龍架構(gòu)逐漸加入了編排調(diào)度、硬件加速等更多能力,最終誕生了CIPU的雛形。
飛天+CIPU支撐的云計(jì)算技術(shù)體系
阿里云認(rèn)為,云計(jì)算歷經(jīng)十余年發(fā)展,有兩個(gè)比較標(biāo)志性的階段。
第一階段是分布式和虛擬化技術(shù)替代了大型機(jī)、小型機(jī),滿足了當(dāng)時(shí)企業(yè)業(yè)務(wù)擴(kuò)展帶來的算力彈性需求;第二階段出現(xiàn)了資源池化技術(shù),把計(jì)算和存儲(chǔ)資源分離,再規(guī)?;幣藕驼{(diào)度,提供了超大規(guī)模的計(jì)算和存儲(chǔ)資源池。
“這兩個(gè)階段的演進(jìn)推動(dòng)了云計(jì)算發(fā)展,但都是基于傳統(tǒng)的以CPU為中心的體系架構(gòu)去做優(yōu)化,已經(jīng)觸及瓶頸?!卑⒗镌普J(rèn)為,近年來云上的需求發(fā)生了很大變化,數(shù)據(jù)密集型的計(jì)算越來越多,提高了對(duì)云計(jì)算提供的低時(shí)延、高帶寬的需求,這些需求“很難通過傳統(tǒng)體系結(jié)構(gòu)去滿足”。
這已經(jīng)成為云計(jì)算的下一戰(zhàn)場(chǎng)。以英特爾、英偉達(dá)為代表的硬件廠商,和以亞馬遜為代表的頭部云廠商,都紛紛推出了IPU、DPU,來應(yīng)對(duì)愈加棘手的數(shù)據(jù)吞吐、網(wǎng)絡(luò)時(shí)延和帶寬的問題。但他們?nèi)匀辉谂f有的計(jì)算體系架構(gòu)上做文章,尚未真正實(shí)現(xiàn)突破和大規(guī)模落地。
這也是阿里云構(gòu)建以 CIPU 為基構(gòu)建一個(gè)全新架構(gòu)體系的初衷。張建鋒介紹,從最底層的數(shù)據(jù)中心核心部件到最上層云原生軟件,阿里云建立了完整的自研技術(shù)體系,做到了軟硬件無縫結(jié)合,形成了“飛天+CIPU”支撐的云計(jì)算技術(shù)體系。
張建鋒介紹說,CIPU替代CPU成為云計(jì)算的加速和管控中心,CIPU向下接入數(shù)據(jù)中心的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源,快速云化并進(jìn)行硬件加速;向上接入飛天云操作系統(tǒng),管控阿里云全球數(shù)百萬臺(tái)服務(wù)器,讓算力“零”損耗對(duì)用戶服務(wù),并通過規(guī)?;瘧?yīng)用RDMA網(wǎng)絡(luò)技術(shù),讓訪問云端比訪問本地硬盤更快,網(wǎng)絡(luò)時(shí)延最低可達(dá)二十萬分之一秒。
“有利于爭(zhēng)奪云計(jì)算定義權(quán)”
目前,阿里云在全球云計(jì)算的市場(chǎng)和技術(shù)水平均處于領(lǐng)先地位,在權(quán)威機(jī)構(gòu)Gartner發(fā)布的年度報(bào)告里,阿里云的IaaS基礎(chǔ)設(shè)施能力、產(chǎn)品能力獲得了全球最高分。其中,在網(wǎng)絡(luò)技術(shù)上,阿里云被權(quán)威機(jī)構(gòu)AMiner評(píng)為全球十大最具影響力的網(wǎng)絡(luò)研究機(jī)構(gòu)。
“云計(jì)算越來越接近進(jìn)入下一個(gè)時(shí)代了——全新的架構(gòu)定義、全新的軟件界面、硬件加速?!睆埥ㄤh表示:“我們錯(cuò)過了PC時(shí)代,但云這個(gè)時(shí)代大家起步是一樣的。大家在重新定義云的結(jié)構(gòu)的窗口期,如果我們定義好了,中國(guó)就可以在下一代的技術(shù)時(shí)代有自己的一席之地。”
他認(rèn)為,新一代的技術(shù)架構(gòu),會(huì)催生新一代的云原生應(yīng)用,也是中國(guó)軟件和企業(yè)數(shù)字化的巨大機(jī)會(huì)。所以,阿里云一方面會(huì)向下深耕技術(shù),另一方面,也會(huì)加大氣力推動(dòng)生態(tài)的建設(shè)。
中國(guó)工程院院士、清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系教授鄭緯民也認(rèn)為,這是中國(guó)爭(zhēng)奪云計(jì)算定義權(quán)的重要機(jī)會(huì)。
鄭緯民提出:“這幾年的云計(jì)算已經(jīng)進(jìn)入一個(gè)關(guān)鍵的轉(zhuǎn)換期。過去這些年,我國(guó)在云計(jì)算領(lǐng)域主要在軟件層面有創(chuàng)新,發(fā)展了一些開源生態(tài),但還是在傳統(tǒng)IT的格局下追趕?,F(xiàn)在,阿里云提出了CIPU技術(shù),把上一代計(jì)算架構(gòu)的中心完全打破了,在基礎(chǔ)技術(shù)上實(shí)現(xiàn)了世界領(lǐng)先,和國(guó)際IT巨頭站在同一個(gè)起跑線上。他們提出了CIPU,使得中國(guó)正在爭(zhēng)取云計(jì)算的定義權(quán)中處于有利的位置,改變了原本由西方技術(shù)制定的游戲規(guī)則,讓我國(guó)IT產(chǎn)業(yè)建立了全球領(lǐng)導(dǎo)力?;谶@一點(diǎn)改變格局的事情,我對(duì)中國(guó)在下一個(gè)技術(shù)時(shí)代擁有自己的一席之地表示樂觀?!?/p>
阿里云十二年自研“長(zhǎng)征路”
自創(chuàng)立以來,阿里云堅(jiān)持深耕核心技術(shù)。12年前,阿里云大力投入自研云操作系統(tǒng)“飛天”,立志打破國(guó)外在云計(jì)算底層技術(shù)上的壟斷。飛天是阿里云底層的核心技術(shù),也是國(guó)內(nèi)唯一自研的云計(jì)算操作系統(tǒng)。十多年來,飛天經(jīng)受“雙11”、12306春運(yùn)購票等極限并發(fā)場(chǎng)景挑戰(zhàn),解決了全球技術(shù)行業(yè)面臨的典型技術(shù)難題,并獲得2017年中國(guó)電子學(xué)會(huì)科技進(jìn)步獎(jiǎng)特等獎(jiǎng),這是該獎(jiǎng)項(xiàng)設(shè)立15年來首次頒發(fā)的特等獎(jiǎng)。
從飛天開始,阿里云不斷推出自研技術(shù)成果。
阿里自研的數(shù)據(jù)庫起源于“去IOE”浪潮。過去數(shù)據(jù)庫市場(chǎng)一直是Oracle等傳統(tǒng)數(shù)據(jù)庫巨頭的天下,阿里云十年來始終堅(jiān)持在數(shù)據(jù)庫領(lǐng)域投入,已經(jīng)突破了外國(guó)數(shù)據(jù)庫公司的封鎖。2020年,阿里云代表中國(guó)科技廠商,挺進(jìn)Gartner全球數(shù)據(jù)庫魔力象限領(lǐng)導(dǎo)者象限,成為基礎(chǔ)軟件領(lǐng)域首次進(jìn)入領(lǐng)導(dǎo)者象限的中國(guó)企業(yè)。從阿里巴巴自身“去IOE”,到全行業(yè)去IOE,阿里云94%以上的頭部用戶都購買了云數(shù)據(jù)庫產(chǎn)品。
在云存儲(chǔ)技術(shù)方面,使用阿里云自研的盤古分布式系統(tǒng),協(xié)同CIPU、高密存儲(chǔ)服務(wù)器和Solar-RDMA網(wǎng)絡(luò),可以讓延遲降低到30微秒,這意味著訪問存儲(chǔ)在遠(yuǎn)端的數(shù)據(jù),延遲比訪問本地的硬盤還低。
阿里云也是國(guó)內(nèi)最早投入自研綠色科技的云廠商之一。阿里云仁和數(shù)據(jù)中心(位于浙江杭州)是全國(guó)規(guī)模最大的單相浸沒液冷數(shù)據(jù)中心。初步估算,如果全國(guó)的數(shù)據(jù)中心都采用液冷技術(shù),一年可節(jié)省電量相當(dāng)于三峽電站2020年全年發(fā)電量的三分之二。
2021年云棲大會(huì),阿里云推出首款通用服務(wù)器芯片“倚天710”,以及“磐久”服務(wù)器家族,實(shí)現(xiàn)了芯片、服務(wù)器、操作系統(tǒng)的全棧技術(shù)自研。通過13年的技術(shù)積累、自主研發(fā),阿里云作為國(guó)內(nèi)云廠商的代表,正在世界云計(jì)算的舞臺(tái)上發(fā)出越來越高的聲量。
本文來自【科學(xué)網(wǎng)】,僅代表作者觀點(diǎn)。全國(guó)黨媒信息公共平臺(tái)提供信息發(fā)布傳播服務(wù)。
ID:jrtt