英偉達算力稱霸暗線:交換機賽道熱戰

隨着英偉達的英偉市值持續創下新高,華爾街開始出現一種新的達算擔憂——「警惕成為下一個思科」。

在互聯網時代發展的力稱初期,思科作為全球網絡設備龍頭而備受熱捧,霸暗即便此後經歷了股價飛升又暴跌,線交但至今,換機其依然在核心交換機市場佔據優勢份額。賽道

身處智能計算加速時代的熱戰當下,英偉達和思科的英偉交集不僅限於不同時代華爾街的「當紅炸子雞」,還源於在交換機賽道的達算競速發展。

2019年,力稱英偉達宣布以69億美元收購以色列芯片廠商Mellanox,霸暗後者的線交優勢產品在於InfiniBand(以下簡稱「IB」)和以太網交換機等,這成為助推英偉達今天GPU霸主地位的換機一個重要後盾:數據中心部署離不開算力、存儲、賽道通信連接,交換機就是「連接」功能中的重要產品。

在今年3月的英偉達GTC(GPU技術大會)上,公司發布專為大規模AI量身訂製的全新網絡交換機「X800系列」,其中就包括NVIDIA Quantum-X800 InfiniBand網絡和NVIDIA Spectrum-X800以太網絡兩種路線對應的產品。

眼看着英偉達在構建加速計算解決方案的道路上越走越遠,競爭者也在蓄力。

2023年7月,超以太網聯盟(Ultra Ethernet Consortium,簡稱UEC)成立,其中成員包括AMD、Arista、博通、思科、Meta和微軟等,旨在解決以太網實際應用過程中的諸多不足。

在數據中心尤其是智算中心加速部署的當下,交換機重要性提升也引發華爾街新的關注。

考慮到Mellanox已被英偉達收購,二級市場開始重視第三方交換機市場的另一重要標的——Arista。巧合的是,這家公司和思科都是UEC成員。

記者觀察發現,Arista的股價約在2022年與2023年之交開始快速攀升,時間節點正契合了ChatGPT的發布,也與英偉達的股價飛升轉折點接近。

這顯示出算力網絡構建過程中不可忽視的一條暗線:以太網交換機和IB交換機之爭。

交換機大熱

作為重要的算力基礎設施,交換機到底是什麼?

Omdia數據中心IT團隊首席分析師Manoj Sukumaran對記者分析道,隨着越來越多的人工智能計算能力在建立,對網絡的需求也顯著增加。

運行人工智能訓練工作負載的服務器被聚集在一起,形成一個大型的高性能計算系統或分布式系統,大語言模型在這些系統中進行訓練。

這需要在這些系統之間擁有一個高容量、低延遲的網絡。高帶寬交換機和網絡接口卡正是被用於互連服務器以形成人工智能集群。

據IDC統計,目前全球Top級別交換機廠商包括思科、華為、Arista、HPE等,當然按照應用市場不同,這些廠商面向下游有各自優勢。

由此可見,隨着全球主流經濟體在加速推進智算中心部署,廠商之間競爭態勢可能存在一定變數。

至於具體廠商變化,IDC數據顯示,2023年思科非數據中心(Non-DC)收入占以太網交換機總收入的69.5%,全年同比增長28.6%;數據中心(DC)收入占剩餘部分,全年增長了9.7%;思科2023年以太網交換機市場份額為43.7%。Arista的以太網交換機收入中,91.4%來自數據中心,年增速35.2%;公司全年市場份額11.1%。華為的以太網交換機總收入在2023年增長了10.6%,全年其全球市場份額達9.4%。

國內多家上市公司也在積極參與市場發展。記者梳理財報發現,2023財年,中興通訊(000063.SZ)推出9900X系列數據中心交換機,核心器件已實現全自研,在國內運營商集採項目的中標份額顯著提升。

菲菱科思(301191.SZ)財報顯示,2023年已具備100G/400G數據中心主流的接口速率、高帶寬、大容量交換機的硬件開發能力,報告期內2.0T/8.0T數據中心交換機形成量產交付,12.8T等其他數據中心交換機也在穩步小批量驗證中。

共進股份(603118.SH)2023年國內客戶400G數據中心交換機已實現批量出貨,突破重點客戶800G高階交換機項目。銳捷網絡在去年推出業界首台支持LPO(線性可插拔光模塊)的51.2T數據中心交換機,以及採用直驅系統設計的800G交換機技術方案,規模交付200G/400G數據中心交換機。

中興通訊承載網副總經理李新雙對記者分析道,近年來,交換機市場確實展現出了蓬勃的增長態勢和快速的技術迭代。隨着各大運營商、雲服務提供商、互聯網廠商在數據中心的投資持續增加,交換機作為網絡核心設備,正迎來重大發展機遇。

「我們可以預見在AI大模型驅動下,具備高性能、高可靠、低功耗、低延時、0丟包特點的交換機將迎來快速發展機遇。」他進一步分析,隨着大模型的廣泛應用和網絡技術的不斷進步,交換機在算力互聯、數據傳輸方面的價值將進一步提升,促進數據中心交換機市場空間持續增長。

從應用趨勢看,李新雙指出,目前200G/400G交換機需求顯著增長,800G交換機也逐步出現。但當前智算網絡的發展仍處於初級階段,GPU部署仍以200G/400G為主,因此在短期內,200G/400G交換機仍是主流需求,800G可能會用於交換機內部互聯場景。預計隨着GPU能力提升,屆時800G交換機有望獲得更廣泛的應用。

Manoj Sukumaran也對記者分析,「目前,400GE交換機和200GE交換機被廣泛使用,向800GE交換機和400GE以太網適配器的遷移已經開始。Infiniband(IB)是最受歡迎的通信協議,但現在隨着RoCE v3的支持,以太網也開始從Infiniband手中搶佔市場份額。」

大模型拉動

按照應用市場不同,以太網交換機主要可以被分為數據中心交換機、非數據中心交換機。兩大類市場隨着大模型等新技術所驅動,可能將在未來呈現不同發展速度。

IDC統計顯示,2023年全球數據中心(DC)部分的市場收入同比增長13.6%,數據中心以太網交換機佔據整個市場總收入的41.5%;其餘部分為非數據中心部分。

IDC中國研究經理王子劍對記者表示,未來交換機廠商的核心競爭場景有可能會集中在數據中心交換機市場。「當前雲計算、大數據的快速發展,以及最近AI的火爆,成為持續推動數據中心交換機市場快速發展的主要因素。同時,在國家層面也不斷推出產業政策鼓勵和支持信息化建設,特別是『互聯網+』和新基建等,對數據中心行業提供了發展機遇。根據IDC預測,預計到2025年數據中心交換機佔比將接近50%,2026年開始佔比將超過園區交換機市場。」

數據中心的加速建設背後,也意味着對數據傳輸帶寬提出更高訴求。頭豹研究院分析師常喬雨則對記者表示,交換機市場向更大帶寬發展是一個必然趨勢。隨着5G和AI高速發展,數據傳輸的體量、質量和速度要求都愈來愈高,勢必需要更高更快的傳輸帶寬。

「當前200/400G的華為、新華三交換機產品已經在高速率場景下大範圍普及。未來隨着AI進一步發展,對於高性能計算集群和需求的不斷增長,200/400G的產品會遇到一定性能瓶頸,將會對800G的產品產生進一步需求,華為也在2023年提出800G的產品以對未來市場需求做出提前戰略布局。我們預計800G的交換機產品有望在三年內實現快速大規模商業化落地。」其續稱。

王子劍也對記者表示,根據IDC對中國市場的統計,2023年200G/400G速率成為部署增速最快的產品,佔比達8%,市場營收同比增長接近70%。AIGC的爆發以及人工智能領域各行業應用的不斷探索和深入,預計2024年200G/400G交換機在國內會成為主流產品,尤其在互聯網和頭部科技企業的需求會更明顯。

「當前各主流廠商已經推出800G數據中心交換機產品,預計2024年會有小批量測試應用。隨着AI技術的快速發展,特別是在AI大模型等應用場景下,對於高性能、高帶寬交換機的需求將進一步提升,可以預見800G交換機在中國市場的應用將會快速增長。」他續稱。

AI加速發展可能也會一定程度影響到廠商的產品迭代部署。李新雙對記者分析,技術趨勢方面,「在AI智算的驅動下,交換機市場正經歷着『單端口帶寬提升』『端到端協同』『水線調優』等一系列技術創新,對芯片、板卡、設備、算法等各個方面都提出了新的挑戰。只有具備強大自研能力的設備商才能在激烈的市場競爭中脫穎而出」。

對於具體應用市場,「據IDC統計,近兩年中興通訊數據中心交換機國內市場份額和市場收入增速明顯提升。中興已經在國內運營商網絡雲、公有雲、私有雲等新增市場項目中取得顯著成果,同時在互聯網、金融等行業逐步實現了突破。」他指出,中興的策略是多元化發展,「在數據中心交換機領域,2022年在中國區市場實現發貨增速第一,2023年實現收入增速第一;同時已經擁有一系列園區核心、匯聚、接入交換機產品。」

技術路線競賽

前文主要提到以太網交換機發展,而其競爭對手IB(InfiniBand)交換機,實際上主導廠商只有英偉達(收購的Mellanox公司)和英特爾(收購的Qlogic公司)。

與英偉達此前發展過程中藉助CUDA和NVLink構建強悍的閉環生態類似,在網絡傳輸方面,英偉達藉助Mellanox公司構建起相對私有的InfiniBand網絡生態。其優勢在於更適合高性能計算的能力需求,缺點是成本偏高。

Manoj Sukumaran對記者分析,InfiniBand現在確實有優勢。「目前大多數AI集群都部署了InfiniBand網絡,這是因為其低延遲、擁塞控制機制等特性。儘管InfiniBand在AI訓練集群中很受歡迎,但AI推理服務器通常通過以太網與主網絡互連。隨着推理能力成為AI工作負載的更大一部分,大多數AI推理服務器都將通過以太網連接。」

他指出,此外隨着這一趨勢的發展,如UltraEthernet等聯盟正在對以太網進行優化,以使其也適合AI訓練集群。「我們預計從2025年底或2026年開始,以太網標準的增強將解決AI集群擴展問題。從那時起,以太網將在AI訓練集群中獲得更多應用,並將成為InfiniBand的有力競爭者。」

華夏基金也認為,以太網具備通用性和硬件部署經濟性,在短期與InfiniBand有望形成抗衡,並隨着豐富生態中參與者的合作迭代,在長期勝出;以太網生態中的頭部供應商未來有望受益於AI催化下的硬件擴容和以太網佔有率提升的雙重利好因素。

在以太網交換機方面,新的技術路線也在積極應用。李新雙對記者分析,隨着雲計算市場蓬勃發展和大規模數據中心建設加速,對於更高效、更節能的數據處理與傳輸技術的需求日益凸顯。這一背景下,白盒交換機、液冷交換機及CPO硅光技術等新技術方向備受行業關注。

「就白盒交換機而言,隨着數據中心建設持續推進,其在互聯網行業商用已初具規模,並展現出進一步加速趨勢。中興通訊已經擁有成熟的白盒交換機產品,並陸續開始商用落地。」他進而分析,液冷技術已經發展至相對成熟的階段。「我們已推出支持液冷技術的交換機。未來隨着技術進一步發展和市場廣泛接受,液冷交換機將在數據中心領域發揮更大作用,為數據處理提供更加高效、穩定的支持。」

至於CPO技術是一種創新的數據中心網絡技術,「它具備大幅提高數據中心網絡速度、帶寬和密度的潛力,同時降低系統複雜度和成本。但目前,CPO技術的商用進程受到成熟度、成本以及客戶需求等多方面因素的影響。根據LightCounting預測,CPO出貨量預計將從800G和1.6T端口開始,於2024至2025年開始試點。中興作為光模塊行業和數據中心交換機行業的重要參與者,將密切關注CPO技術的研發進展和商用進程,並積極準備在CPO硅光技術的商用化道路上發揮關鍵作用。」李新雙表示。

常喬雨對記者指出,國內與國外在白盒交換機和液冷交換機的技術差異不大,國內在性能實現上已達國際領先水平。「目前白盒已經得到一定採用,國內互聯網巨頭早期成立了SIP項目,在促進白盒生態發展的前提下,也在向客戶推相關產品。尤其軟硬件解耦方面,是當前眾多大型央國企會去拓展的方向,以更好進行自主化與產品利舊。液冷技術與CPO硅光的想像空間較大,能夠極大程度緩解和解決當前光模塊功耗巨大的問題,也能更好地滿足綠色數據中心的建設標準,但當前建設成本還是過高,未來還需要通過產業鏈整合或技術突破發力,以成本優勢來實現大規模覆蓋。」

在多種技術和生態競速的當下,常喬雨認為,新一批AI驅動的交換機會迎來較大發展,具備支持高性能計算網絡、無損以太網(RoCE)、多元可靠聯接、場景化網絡調優等與AI性能更加匹配的交換機將會迎來快速發展機遇。

王子劍則對記者分析,隨着新技術推動、智算中心迭代升級,加上市場競爭加劇及客戶需求變化,確實有可能催化廠商競爭格局改變。「當前交換機市場競爭比較激烈,品牌、價格、技術和解決方案的競爭無時無刻在考驗廠商綜合實力,客戶數字化轉型和智能化升級的需求也在不斷變化,廠商不僅需要提供高性能、高可靠的產品,也需要靈活應對客戶需求並提供滿足其特定應用場景的解決方案,如此方能在未來競爭中拚出一席之地。」

(來源:21世紀經濟報道)

責任編輯: 文劼
苏ICP备16002488号-1