18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Spectrum X如何推動英偉達網(wǎng)絡業(yè)務實現(xiàn)31億美元收入

奇異摩爾 ? 來源:奇異摩爾 ? 2024-11-25 11:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英偉達數(shù)據(jù)中心收入繼續(xù)擴大

北京時間11月21日凌晨,英偉達發(fā)布本季度財報,公司實現(xiàn)營收350.8億美元,同比增長93.6%,好于彭博一致預期(332億美元)。公司收入增長,主要受數(shù)據(jù)中心業(yè)務需求增長的帶動。在AI等需求的帶動下,2025財年第三季度英偉達的數(shù)據(jù)中心業(yè)務在公司收入中的份額繼續(xù)擴大,本季度達到了87.7%。

b02b2104-a8ba-11ef-93f3-92fbcf53809c.png

(Source:海豚投研)

細分來看,數(shù)據(jù)中心業(yè)務中計算收入為276億美元,同比增長132%;網(wǎng)絡收入為31億美元,同比增長20%,這得益于益于Ethernet for AI,其中包括Spectrum X端到端以太網(wǎng)平臺。據(jù)統(tǒng)計,AI網(wǎng)絡NVIDIA Spectrum-X以太網(wǎng)AI收入同比增長超過3倍。

就在不久前,AI網(wǎng)絡產(chǎn)業(yè)剛爆出了一項大新聞。馬斯克僅用了122天就塑造了xAI 位于田納西州孟菲斯市的 Colossus 超級計算機集群,該集群使用10萬張NVIDIA Hopper GPU加速卡,超過1500個GPU機架,堪稱全球最大AI超級計算機集群。

實際上,該集群使用了 NVIDIA Spectrum-X 以太網(wǎng)網(wǎng)絡平臺,該平臺是專為多租戶、超大規(guī)模的 AI 工廠提供卓越性能而設計的 RDMA網(wǎng)絡而并不是InfiniBand網(wǎng)絡。

NVIDIA聲稱專門面向 AI 的 Spectrum-X 以太網(wǎng)網(wǎng)絡具有先進的功能,可在提供高效、可擴展的帶寬的同時,實現(xiàn)低延遲和短尾延遲,而這些功能之前是 InfiniBand 網(wǎng)絡所獨有的。

NVIDIA基于 AI 的 Spectrum-X 以太網(wǎng)系統(tǒng)是一整套AI Networking的全家桶組合包括需要購買Spectrum-X交換機、Bluefield SuperNIC以及相關光模塊及線纜組件。

基于以太網(wǎng)的Spectrum-X特性

我們根據(jù)超大以太網(wǎng)集群所面臨的通信挑戰(zhàn)來了解下基于以太網(wǎng)的Spectrum-X方案如何優(yōu)化基于以太網(wǎng)的RDMA功能。

部分內(nèi)容結合Nvidia AI Networking Whitepaper 編譯

基于以太網(wǎng)的NVIDIA Spectrum-X:專為生成式AI時代設計

AI云作為支持生成式AI工作負載的新型數(shù)據(jù)中心類別,正日益受到業(yè)界的關注。這類數(shù)據(jù)中心不僅繼承了傳統(tǒng)云的核心功能,如多租戶支持、安全性保障和多樣化的工作負載支撐,更在支持更大規(guī)模的生成式AI應用方面展現(xiàn)出卓越能力。生成式AI是一類基于訓練數(shù)據(jù)生成新輸出的人工智能算法,其以圖像、文本、音頻等多種形式創(chuàng)造全新內(nèi)容,與旨在識別模式和進行預測的傳統(tǒng)人工智能系統(tǒng)形成鮮明對比。 NVIDIA Spectrum-X構建了以太網(wǎng)多租戶、超大規(guī)模AI云而精心設計的革命性解決方案,它完美契合了生成式AI時代的發(fā)展需求。

無損網(wǎng)絡與RDMA

在有損網(wǎng)絡環(huán)境中,數(shù)據(jù)傳輸過程中面臨著丟失或質(zhì)量下降的風險。這種網(wǎng)絡傾向于優(yōu)先考慮數(shù)據(jù)傳輸?shù)乃俣榷菧蚀_性。然而,對于AI應用而言,丟包導致的后果可能是災難性的,包括性能下降、GPU資源的空閑浪費以及功耗的額外開銷。

b063641a-a8ba-11ef-93f3-92fbcf53809c.png

圖1:GPU-GPU的RDMA通信實現(xiàn)示意圖

無損網(wǎng)絡則完全改變了這一局面。在這種網(wǎng)絡中,數(shù)據(jù)傳輸?shù)耐暾缘玫絿栏癖U?,所有?shù)據(jù)包都能夠準確無誤地到達目的地。盡管以太網(wǎng)最初的設計確實允許一定的丟包率,但在InfiniBand網(wǎng)絡中,無損是基本要求。

隨著GPU計算和大規(guī)模AI應用場景在云環(huán)境中的廣泛應用,以太網(wǎng)也通過采用RoCE(RDMA over Converged Ethernet)和基于優(yōu)先級的流量控制(PFC,Priority Flow Control)等技術,結合無損網(wǎng)絡的實現(xiàn),使用NVIDIA Spectrum-X,為AI應用提供了更加可靠和高效的解決方案。 遠程直接內(nèi)存訪問(RDMA,Remote Direct Memory Access)技術的出現(xiàn),進一步提升了網(wǎng)絡傳輸?shù)男?。它允許數(shù)據(jù)在遠程系統(tǒng)、GPU和存儲器之間直接傳輸,無需經(jīng)過CPU的干預。傳統(tǒng)的網(wǎng)絡傳輸方式涉及多個復雜的步驟,包括數(shù)據(jù)的復制、網(wǎng)絡發(fā)送以及接收方的多步驟處理。而RDMA則直接跨越了這些繁瑣的中間環(huán)節(jié),實現(xiàn)了數(shù)據(jù)的高效傳輸。我們在之前的Kiwi Talks有敘述過目前RDMA面對大規(guī)模集群存在的問題及建議。

挑戰(zhàn)與方案1:自適應路由、多路徑與數(shù)據(jù)包噴灑

傳統(tǒng)數(shù)據(jù)中心的應用程序通常會產(chǎn)生大量的小數(shù)據(jù)流,這使得網(wǎng)絡流量的統(tǒng)計平均值能夠反映整體情況。在這種背景下,基于簡單靜態(tài)哈希的路由算法,如等價多路徑(ECMP,Equal Cost Multi-Path),足以應對常見的網(wǎng)絡流量問題。

然而,人工智能工作負載的特性卻截然不同。它們通常會產(chǎn)生少量的大數(shù)據(jù)流,被稱為“大象流”(elephant flows)。這些大象流會占用大量的鏈路帶寬,如果多個大象流被路由到同一鏈路,就會導致嚴重的擁塞和高延遲。在人工智能應用中,即使是在非阻塞拓撲中使用ECMP,大象流之間的碰撞幾率也非常高。由于AI作業(yè)的性能高度依賴于最壞情況下的表現(xiàn),這些碰撞會導致模型訓練時間既超出預期又變得極為不穩(wěn)定。

b0819bd8-a8ba-11ef-93f3-92fbcf53809c.png

圖2:NVIDIA:Spectrum-X以太網(wǎng)自適應路由的細粒度數(shù)據(jù)包示意圖

因此,NVIDIA引入自適應路由算法來動態(tài)平衡網(wǎng)絡中的數(shù)據(jù)傳輸。此外,路由的精細度也至關重要,以避免大象流之間的碰撞。即使按流量進行路由,仍然存在擁塞的可能性。然而,當采用數(shù)據(jù)包噴灑(Packet Spraying)技術,即按每個數(shù)據(jù)包進行路由時,數(shù)據(jù)包可能會以無序的方式到達目的地。為了實現(xiàn)數(shù)據(jù)包粒度的自適應路由,我們需要建立靈活的重新排序機制,確保自適應路由對應用程序來說是透明的。

挑戰(zhàn)與方案2:擁塞控制

在繁忙的多租戶AI云環(huán)境中,不同AI作業(yè)并行運行時,網(wǎng)絡擁塞問題往往難以避免。尤其是當大量發(fā)送方試圖向單一目的地或不同目的地(這些目的地可能已受到其它應用背景流量的影響)傳輸數(shù)據(jù)時,網(wǎng)絡擁塞現(xiàn)象尤為顯著。這種擁塞不僅會導致延遲飆升和有效帶寬急劇縮減,還可能引發(fā)網(wǎng)絡“熱點”的擴散,造成相鄰租戶的相互干擾,即受害者效應。

b094221c-a8ba-11ef-93f3-92fbcf53809c.png

圖3:NVIDIA:Spectrum-X以太網(wǎng)擁塞控制與交換機和NVIDIA BlueField SuperNIC協(xié)同工作

傳統(tǒng)的擁塞控制方法,如顯式擁塞通知(ECN,Explicit Congestion Notification),在支持生成式AI的以太網(wǎng)環(huán)境中顯得捉襟見肘。為了有效緩解擁塞,負責數(shù)據(jù)傳輸?shù)木W(wǎng)絡設備(如NIC或DPU)必須進行精確的流量控制。然而,ECN機制在交換機緩沖區(qū)接近滿載時才開始發(fā)揮作用,此時接收方會通知發(fā)送方限制其發(fā)送速率。但在大規(guī)模AI模型常見的突發(fā)流量場景下,這種延遲的擁塞反饋可能導致緩沖區(qū)迅速填滿,進而引發(fā)丟包問題。盡管深度緩沖交換機能夠降低緩沖區(qū)溢出的風險,但它們引入的額外延遲卻削弱了擁塞控制的初衷。

實現(xiàn)高效的擁塞控制需要交換機與網(wǎng)卡NIC之間的緊密協(xié)作。NVIDIA Spectrum-X通過利用Spectrum-4交換機的帶內(nèi)、硬件加速的遙測數(shù)據(jù),為BlueField-3 SuperNIC提供實時的流量計量信息。

挑戰(zhàn)與方案3:性能隔離與安全性多租戶環(huán)境如AI云,必須確保各個作業(yè)之間的性能隔離,以免受到其它作業(yè)的網(wǎng)絡流量干擾。遺憾的是,許多以太網(wǎng)ASIC設計在性能隔離方面考慮不足。這導致某些作業(yè)在面臨“近鄰干擾”(noisy neighbor)(即向同一端口發(fā)送流量的相鄰作業(yè))時,其有效帶寬可能會急劇下降。 以太網(wǎng)網(wǎng)絡在設計時還需考慮網(wǎng)絡公平性。AI云應支持多種異構應用程序的混合運行。由于不同應用程序可能使用不同大小的數(shù)據(jù)幀,如果沒有適當?shù)母綦x優(yōu)化措施,大數(shù)據(jù)幀可能會占用過多的帶寬資源,導致小數(shù)據(jù)幀傳輸受阻。

實現(xiàn)性能隔離和防止“近鄰干擾”的關鍵在于采用共享數(shù)據(jù)包緩沖區(qū)。通過為所有作業(yè)提供平等的緩存訪問權限,共享緩沖區(qū)能夠確?;旌螦I云工作負載的穩(wěn)定性和低延遲。

b0a51acc-a8ba-11ef-93f3-92fbcf53809c.png

圖4:強調(diào)通用共享數(shù)據(jù)包緩沖區(qū)架構與分割緩沖區(qū)實現(xiàn)之間重要性

除了從帶寬角度考慮性能隔離外,我們還應認識到性能隔離與零信任架構對于多租戶環(huán)境網(wǎng)絡安全的重要性。數(shù)據(jù)無論是在靜止狀態(tài)還是傳輸過程中,都需要得到嚴格的保護。高效的加密和認證工具能夠在不犧牲性能的前提下提供強大的安全保障。BlueField-3 DPU集成了安全引導功能,為基于硬件的信任根提供了堅實基礎,并支持MACsec和IPsec等協(xié)議用于數(shù)據(jù)加密,以及AES-XTS 256/512等加密算法用于靜態(tài)數(shù)據(jù)的保護。

以上是英偉達對基于以太網(wǎng)Spectrum-X解決方案的部分優(yōu)勢特性總結;

UEC 超以太聯(lián)盟對標 NVIDIA Spectrum

b0afe2c2-a8ba-11ef-93f3-92fbcf53809c.png

我們已經(jīng)了解UEC是專門為AI網(wǎng)絡Scale -out互聯(lián)成立的國際聯(lián)盟,目的是全面優(yōu)化RDMA的功能,從而實現(xiàn)更大規(guī)模的AI網(wǎng)絡集群的高效運作。

UEC 主要在Transport Layer傳輸層做了全面的優(yōu)化,不限于消息語義優(yōu)化、數(shù)據(jù)包傳輸、擁塞控制及可靠性安全性等目前大規(guī)模集群擴展需要優(yōu)化的功能。

UEC支持自適應路由及數(shù)據(jù)包噴灑

超以太聯(lián)盟下一代的Modernized RDMA將支持多路徑傳輸?shù)臄?shù)據(jù)包噴灑技術,從而優(yōu)化自適應路由。UEC支持了RUD,UET就可以將同一個流的不同包分散到多個路徑上同時傳輸,實現(xiàn)包噴灑功能。這讓交換機可以充分發(fā)揮ECMP甚至WCMP(Weighted Cost Multi- Pathing)路由能力,將去往同一目的地的數(shù)據(jù)包通過多條路徑發(fā)送,大幅度提高網(wǎng)絡利用率。

b0bee074-a8ba-11ef-93f3-92fbcf53809c.png

(來源:AMD

UEC將支持端到端遙測Telemetry

新的UEC對于擁塞做出了優(yōu)化機制:來自網(wǎng)絡的擁塞信息可以向參與者提供擁塞的位置和原因??s短擁塞信號路徑并向端點提供更多信息,能夠?qū)崿F(xiàn)更快速的擁塞控制。無論是發(fā)送方還是接收方安排傳輸,現(xiàn)代交換機都可以通過快速傳遞準確的擁塞信息給調(diào)度器或起搏器pacer,促進響應式的擁塞控制,從而提高擁塞控制算法的響應速度和準確性。結果是減少了擁塞、降低了丟包率和縮短了隊列長度——所有這些為改善尾部延遲提供了服務。

UEC支持安全性與加密

UEC傳輸協(xié)議從設計之初就融入了網(wǎng)絡安全概念,能夠加密并驗證AI訓練或推理作業(yè)中計算端點間發(fā)送的所有網(wǎng)絡流量。UEC傳輸協(xié)議借鑒了現(xiàn)代加密方法(如IPSec和PSP)中用于高效會話管理、認證和保密的核心技術。隨著作業(yè)規(guī)模的擴大,必須在不使主機和網(wǎng)絡接口的會話狀態(tài)急劇膨脹的前提下支持加密。為此,UET(UEC傳輸)引入了新的密鑰管理機制,允許成千上萬個參與同一作業(yè)的計算節(jié)點之間高效共享密鑰。它被設計成能在AI訓練和推理所要求的高速和大規(guī)模下高效實現(xiàn)。托管在大型以太網(wǎng)網(wǎng)絡上的高性能計算(HPC)作業(yè)具有類似的特征,同樣需要相當?shù)陌踩珯C制。這意味著UEC傳輸不僅能滿足AI領域的需求,也能適應HPC環(huán)境中對于安全性和性能的嚴格要求,確保數(shù)據(jù)在大規(guī)模網(wǎng)絡中的傳輸既高效又安全。

b0c41e0e-a8ba-11ef-93f3-92fbcf53809c.png

UEC成員Arista公司表示,“當PCI總線因主機CPU上的競爭工作負載或降速等原因出現(xiàn)擁塞時,通常需要使用ECN(顯式擁塞通知)標記。Arista在實現(xiàn)ECN標記方面經(jīng)驗豐富,可以對經(jīng)過擁塞隊列的數(shù)據(jù)包進行標記。此外,該公司還支持即將推出的多種網(wǎng)絡內(nèi)遙測(In-Network Telemetry)技術,它們能提供更細粒度的網(wǎng)絡擁塞隊列深度信息,從而全面支持網(wǎng)絡內(nèi)遙測。這項新技術預計將與超以太網(wǎng)的網(wǎng)卡和未來的RDMA一起發(fā)揮更大作用。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)中心

    關注

    16

    文章

    5432

    瀏覽量

    74372
  • AI
    AI
    +關注

    關注

    88

    文章

    37138

    瀏覽量

    291198
  • 英偉達
    +關注

    關注

    23

    文章

    4020

    瀏覽量

    96988

原文標題:AI網(wǎng)絡熱點 | NVIDIA Spectrum X如何推動英偉達網(wǎng)絡業(yè)務實現(xiàn)31億美元收入

文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA Spectrum-X 以太網(wǎng)交換機助力 Meta 和 Oracle 加速網(wǎng)絡性能

    基于?NVIDIA Spectrum-X 以太網(wǎng)交換機的 AI 數(shù)據(jù)中心網(wǎng)絡。 Meta 和 Oracle 正將 Spectrum-X 以太網(wǎng)交換機標準化為一種開放的加速
    的頭像 發(fā)表于 10-14 10:26 ?832次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Spectrum-X</b> 以太網(wǎng)交換機助力 Meta 和 Oracle 加速<b class='flag-5'>網(wǎng)絡</b>性能

    今日看點:蘋果認證中國快充品牌遭美調(diào)查;英偉擬向OpenAI投資最高1000美元

    英偉擬向OpenAI投資最高1000美元 近日,英偉和OpenAI宣布達成合作,包括建設龐
    發(fā)表于 09-23 10:09 ?189次閱讀

    安森美攜手英偉推動下一代AI數(shù)據(jù)中心發(fā)展

    安森美(onsemi,美國納斯達克股票代號:ON)宣布與英偉NVIDIA)合作,共同推動向800V直流(VDC)供電架構轉型。這一變革性解決方案將
    的頭像 發(fā)表于 08-06 17:27 ?1014次閱讀

    英偉2026財年Q1營收公布 一季度營收441美元 英偉Q1凈利潤187.8美元

    英偉的業(yè)績暴漲神話依然在繼續(xù),在5月29日英偉公司發(fā)布了2026財年第一季度財報。財報數(shù)據(jù)顯示,該季度英偉
    的頭像 發(fā)表于 05-29 17:58 ?589次閱讀

    從游戲到智能駕駛,英偉有哪些技術升級?

    兼首席執(zhí)行官黃仁勛在發(fā)布會上表示,未來自動駕駛汽車市場的潛力巨大,整體規(guī)模有望達到數(shù)萬億美元。他預測,到2026財年,英偉的汽車業(yè)務收入將有望達到50
    的頭像 發(fā)表于 05-16 09:02 ?549次閱讀
    從游戲到智能駕駛,<b class='flag-5'>英偉</b><b class='flag-5'>達</b>有哪些技術升級?

    英偉GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發(fā)表于 03-20 15:35 ?1086次閱讀

    NVIDIA推出全新硅光網(wǎng)絡交換機

    NVIDIA 今天推出了 NVIDIA Spectrum-XNVIDIA Quantum-X 硅光
    的頭像 發(fā)表于 03-20 14:52 ?730次閱讀

    英偉市值一夜蒸發(fā)近2萬億 英偉股價下跌超8%

    在美東時間周一,美股三大指數(shù)集體收跌,截至收盤,英偉股價下跌超8%,英偉市值一夜蒸發(fā)2650美元
    的頭像 發(fā)表于 03-04 10:19 ?871次閱讀

    英偉財報發(fā)布!Q4凈利潤220.91美元

    英偉達日前公布最新財報,其2025財年第四季度營收393美元,比去年同期增長78%,其中數(shù)據(jù)中心業(yè)務收入為356
    的頭像 發(fā)表于 02-27 15:30 ?714次閱讀

    英偉四季度營收393美元 英偉第四財季凈利潤增80%

    根據(jù)全球AI龍頭英偉公司發(fā)布的截至1月26日的2025財年第四財季營業(yè)數(shù)據(jù)報告顯示;第四財季營收達到393.31美元,較去年同期增長78%,高于分析師事前預期的380.5
    的頭像 發(fā)表于 02-27 15:18 ?967次閱讀

    剛剛!英偉最新回應!

    12月10日消息,據(jù)報道,英偉市值一夜蒸發(fā)掉了889美元(約合人民幣6460元)。 據(jù)此前媒體報道,近日
    的頭像 發(fā)表于 12-10 18:13 ?1052次閱讀

    Tenstorrent獲7美元融資,貝索斯參投挑戰(zhàn)英偉

    AI芯片初創(chuàng)公司Tenstorrent近日宣布獲得高達7美元的融資,公司估值也隨之攀升至26美元。此次融資旨在挑戰(zhàn)英偉
    的頭像 發(fā)表于 12-03 11:07 ?1044次閱讀

    行業(yè)動態(tài) | 英偉市值,躍升全球第一

    受專用人工智能芯片需求旺盛推動,英偉股價周五創(chuàng)下歷史新高,這也讓其取代蘋果成為全球市值最高的公司。LSEG的數(shù)據(jù)顯示,Nvidia的股票市值一度觸及3.53萬億
    的頭像 發(fā)表于 10-29 08:07 ?946次閱讀
    行業(yè)動態(tài) | <b class='flag-5'>英偉</b><b class='flag-5'>達</b>市值,躍升全球第一

    英偉2024年預計出貨10個RISC-V內(nèi)核

    近日,據(jù)消息爆料稱,英偉NVIDIA)在RISC-V峰會上透露了一項令人矚目的計劃:預計到2024年,英偉將出貨約10
    的頭像 發(fā)表于 10-28 17:15 ?828次閱讀

    英偉市值飆升,逼近蘋果

    近日,隨著人工智能技術的持續(xù)繁榮,英偉公司作為AI芯片生產(chǎn)的領軍者,其市值實現(xiàn)了驚人的飛躍。截至美國當?shù)貢r間21日,英偉的市值再創(chuàng)歷史新
    的頭像 發(fā)表于 10-23 09:31 ?879次閱讀