Top
首頁 > 正文

超融合數據中心網絡CloudFabric 3.0,新以太釋放新算力

發布時間:2021-06-22 17:08        來源:飛象網        作者:

 

導言:工業時代,電力是機械文明的基石,而邁入數字時代的今天,算力正在成為智能世界的底座。數據通過多場景聯接匯聚到數據中心進行分析和應用,驅動產業升級與商業模式創新。作為承載數據存儲、分析、計算的唯一載體,數據中心貫穿了數據從生產要素到商業價值轉換的全流程。數據中心算力成為新的生產力,數據中心量綱從原有的資源規模向算力規模轉變。

圖片7.jpg

華為數據中心網絡領域總裁 王雷

算力的關鍵在于數據流通與處理效率,融合是必然訴求

數據中心算力是服務器對數據進行處理后實現結果輸出的能力,是計算、存儲、網絡三大資源協同能力的綜合衡量指標。作為聯接數據中心各類資源的大動脈,數據中心網絡承載著保障數據高效流通的職責。

圖片8.jpg

根據聯接資源的不同,數據中心網絡分為:1)通用計算網絡:與外部用戶終端對接提供服務;2)數據存儲網絡:聯接存儲節點,支撐數據存儲、讀寫與備份;3)高性能計算網絡:聯接CPU/GPU服務器,支撐高性能計算或AI訓練。

在數據流通和處理過程中,這三張網絡需要深度協作,保證算力的最大化釋放。通用計算網絡普遍采用開放的以太協議,而傳統集中式存儲區以及高性能計算區則較多采用封閉的Fibre Channel(FC)以及InfiniBand專網技術。三套網絡協議各異、架構割裂,給數據跨節點和資源流通帶來阻礙。融合成為算力提升的必然要求。

三大變革驅動數據中心網絡全以太化,帶來融合契機

數據中心網絡服務于云應用、計算資源與存儲資源。三大服務對象的變革正在驅動數據中心網絡向以太化演進:

· 云化升級:云化加速浪潮之下,企業IT架構從本地集中式向云端分布式、甚至多云分布式演進。開放以太架構天然可被云靈活調用,具備良好的互通性、彈性、敏捷性以及多租戶安全能力,已經成為通用計算網絡的壓倒性協議。

· 存儲全閃存化:隨著機械硬盤向全閃存升級,存儲介質的讀寫性能提升了百倍。傳統FC最高32G/64G帶寬,不滿足全閃存高吞吐的需求,帶寬高達400GE的以太網成為新一代存儲網絡的事實標準。

· 計算單元去PCIe:業界CPU/GPU廠商正在通過去PCIe總線突破總線的速率瓶頸,直接出以太口來提供更高算力。

圖片9.jpg

在三大變革的驅動下,以太化正在向縱深推進。全球HPC TOP500統計數據表明,2016年起以太已經超越IB成為主流。2019年,計算機行業巨頭Intel放棄了源于InfiniBand的Omni-Path高速互連網絡技術,繼而在2021年推出了面向HPC場景的以太網交換機,同時HPC套件針對RoCE進行優化升級。隨著全以太化的網絡技術的快速發展,相關測試規范與標準陸續出臺,融合時間窗正式開啟。

融合之路并非坦途,全以太化數據中心網絡面臨三大挑戰

雖然業界普遍看好全以太化的趨勢,但要實現從網絡性能過硬到管理配套成熟并非易事。數據中心網絡全以太化面臨三大挑戰:

· 網絡丟包挑戰:以太網天然有丟包,無法滿足通信密集型HPC、高端存儲等場景下極端性能要求。

· 管理效率挑戰:近年來全球數據中心普遍采用集約化規?;慕ㄔO原則,中小型數據中心被大型、超大型數據中心替代。隨著管理規模的擴張,傳統分散的多工具多平臺的管理模式成為網絡運維的效率瓶頸。

· 多云多場景挑戰:一方面,為了滿足核心業務穩定的同時快速響應變化,企業數據中心基礎設施通常使用公有云-敏態業務與私有云-穩態業務雙架構;另一方面,業務場景極大豐富,不僅行業間網絡需求迥異,同一行業內不同業務場景下也有較大的不同。復雜的業務場景對網絡的開放性和服務化能力提出更高的要求。

華為超融合數據中心網絡CloudFabric 3.0,實現數據中心網絡三層融合

為應對全以太化網絡三大挑戰,華為推出超融合數據中心網絡CloudFabric 3.0方案,核心部件包括CloudEngine數據中心交換機與iMaster NCE網絡智能管控系統?;谌龑尤诤霞軜?,CloudFabric 3.0可最大化保障數據的流通和處理效率,充分釋放數據中心算力:

· 全無損以太架構:三張網統一為0丟包以太網架構,實現流量承載融合,打破異構協議限制;

· 全生命周期自動管理:實現網絡管控析融合,打破多工具多平臺管理數據割裂的限制;

· 全場景服務化能力:實現多業務場景融合,打破跨區域跨場景算力割裂的限制。

圖片10.jpg

全以太HPC網絡,100%釋放算力

傳統以太網丟包帶來性能瓶頸,0.1%的丟包會導致50%的算力損失。40多年來業界專家探索了很多路徑解決以太網丟包,但無一例外都失敗了:有通過流控反壓來控制流量發送速度,但粗暴的反壓機制會頻繁停發報文,導致吞吐量極低;在網絡應用流量越來越復雜的今天,控速時機也很難把握。華為創造性地將智能無損算法iLossless-DCN引入到網絡聯接中來,用算法代替專家經驗實現實時精準控速,保證網絡0丟包,實現規模不變,算力翻番。

全以太存儲網絡,存儲性能提升87%

對于存儲網絡,金融的雙活數據中心場景性能要求最為嚴苛。同城數據中心之間的距離一般在30公里到70公里不等,由于長距光纖數據傳輸存在靜態時延(5μs/公里),距離越長時延越大,與短距場景相比時延增長了百倍,流控復雜度指數級增加。為此,華為推出長距無損iLossless-DCI算法,在短距無損的基礎上增加了距離變量,基于大數據分析提前應對流量變化,最大可實現100GE鏈路70公里無損傳輸,跨數據中心鏈路較FC網絡可減少90%。在DC內和跨DC的同等距離場景下,IOPS較FC網絡可提升87%,時延降低42%。

全生命周期自動化,業務秒級部署與1-3-5智能運維

針對業界SDN“設計校驗靠人工,配置下發才自動”的半自動化運維模式,華為將數字孿生方法論引入網絡管理領域,實現建全生命周期的自動化?;诰W絡數字建模,可綜合評估400+影響網絡設計的因子,可推薦最優網絡設計方案并實現配置變更的秒級校驗?;诰W絡知識圖譜,可以實現故障1分鐘感知,3分鐘定位和5分鐘修復。通過大數據挖掘與建模,識別網絡對象與對象間的關聯關系與故障擴散規律,感知90%潛在風險。

全場景服務化體驗,跨云業務部署從月到天

多云場景下網絡異構成為常態,多廠商設備往往配套多種控制器。一方面,當跨云業務變更時,需求要分解到多個控制器;如果控制器能力不滿足,則需要依賴原廠商落入版本開發,周期在3~6個月不等。另一方面,企業云管平臺需要同時對接多個控制器,適配工作量巨大。南向和北向的多接口模式造成跨云網絡部署動輒耗時數月,成為算力跨區流通的瓶頸。為此,華為定義統一的設備網元模型并構筑開放的南向框架,可實現跨廠商設備的統一管理以及設備驅動程序的動態加載。同時,CloudFabric 3.0北向可提供上千種豐富的網絡API服務,實現云管平臺側靈活網絡編排,業務上線周期從數月縮短至一周。

全新CloudFabric 3.0,新以太釋放新算力

數據中心集合了極其豐富的軟硬件資源,從芯片到服務器,從存儲設備到網絡設施,從平臺軟件到應用軟件,不一而足。要構建強大算力,各類資源需要高度協同,深度融合。作為融合道路上的開拓者,華為推出超融合數據中心網絡CloudFabric 3.0,是對CloudFabric 2.0方案中無損以太和自動駕駛網絡兩大能力在全以太趨勢下的擴展與增強?;谌龑尤诤霞軜?,超融合數據中心網絡CloudFabric 3.0可助力數據高效流通與處理,100%釋放算力,為數字經濟和企業數字化轉型構筑堅實的算力底座。

專題訪談

合作站點
stat
色成人精品免费视频