18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續(xù)費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內(nèi)不再提示

NVLink的演進

NVLink是Nvidia開發(fā)的一項用于GPU之間點對點高速互聯(lián)的技術，其旨在突破PCIe互聯(lián)帶寬的限制，實現(xiàn)GPU芯片間低延遲、高帶寬的數(shù)據(jù)互聯(lián)，使得GPU間更加高效地協(xié)同工作。在NVLink技術問世之前(2014年前)，GPU之間的互聯(lián)需要通過PCIe switch來實現(xiàn)，如下圖所示。GPU發(fā)出的信號需要先傳遞到PCIe switch, PCIe switch中涉及到數(shù)據(jù)的處理，CPU會對數(shù)據(jù)進行分發(fā)調(diào)度，這些都會引入額外的網(wǎng)絡延遲，限制了系統(tǒng)性能。彼時，PCIe協(xié)議已經(jīng)發(fā)展到Gen 3, 單通道的速率為8Gb/s, 16通道的總帶寬為16GB/s (128Gbps，1 Byte= 8 bits )，隨著GPU芯片性能的不斷提升，其互聯(lián)帶寬成為瓶頸。

(圖片來自https://en.wikichip.org/wiki/nvidia/nvlink)

2014年，NVLink 1.0發(fā)布，并應用在P100芯片上，如下圖所示。兩顆GPU之間有4條NVlink, 每個link中包含8個lane, 每條lane的速率是20Gb/s, 因此整個系統(tǒng)的雙向帶寬為160GB/s，是PCIe3 x16帶寬的5倍。

(圖片來自https://en.wikichip.org/wiki/nvidia/nvlink)

單個NVLink內(nèi)部含有16對差分線，對應兩個方向各8條lane的信道，如下圖所示，差分對的兩端為PHY，內(nèi)部包含SerDes。

(圖片來自https://www.nextplatform.com/2016/05/04/nvlink-takes-gpu-acceleration-next-level/)

基于NVLink 1.0，可以形成4個GPU的平面mesh結構，兩兩之間形成點對點直連，而8個GPU則對應cube-mesh，進而可以組成DGX-1服務器，這也對應常見的8卡配置，如下圖所示，需要注意的是，此時8個GPU并沒有形成all-to-all連接。

（圖片來自https://developer.nvidia.com/blog/dgx-1-fastest-deep-learning-system/）

2017年，Nvidia推出了第二代NVLink技術。兩顆GPU V100之間含6條NVLink, 每個link中包含8個lane, 每條lane的速率提升到25Gb/s, 整個系統(tǒng)的雙向帶寬變?yōu)?00GB/s，帶寬是NVLink 1.0的近2倍。與此同時，為了實現(xiàn)8顆GPU之間的all-to-all互聯(lián)，Nvidia推出了NVSwitch技術。NVSwitch 1.0含有18個port, 每個port的帶寬為50GB/s, 整體帶寬為900GB/s。每個NVSwitch預留了兩個port, 用于連接CPU。使用6個NVSwitch即可實現(xiàn)8顆GPU V100的all-to-all連接，如下圖所示。

（圖片來自https://en.wikichip.org/wiki/nvidia/nvswitch）

DGX-2系統(tǒng)則采用兩個上圖中的板子構建而成，如下圖所示，實現(xiàn)了16顆GPU芯片的all-to-all連接。

（圖片來自https://en.wikichip.org/wiki/nvidia/nvswitch）

2020年，NVLink 3.0技術誕生，兩顆GPU A100芯片之間存在12條NVLink, 每條NVLink含有4條lane, 單條lane的速率為50Gb/s, 因此整個系統(tǒng)的雙向帶寬提升到600GB/s，總帶寬相比NVLink 2.0提升了1倍。由于NVLink的數(shù)目增加了，NVSwitch的port數(shù)目也相應增加到36個，每個port的速率為50GB/s。由8顆GPU A100與4個NVSwitch組成了DGX A100, 如下圖所示。

(圖片來自http://www.eventdrive.co.kr/2020/azwell/DGX_A100_Azwellplus.pdf)

2022年，NVLink技術升級到第四代，兩個GPU H100芯片間通過18條NVLink互聯(lián)，每條link中含2條lane, 每條lane支持100Gb/s PAM4的速率，因此雙向總帶寬提升到900GB/s。NVSwitch也升級到第三代，每個NVSwitch支持64個port，每個port的速率為50GB/s。DGX H100由8顆H100芯片與4顆NVSwitch芯片構成，如下圖所示。圖中每個NVSwitch的另一側與多個800G OSFP光模塊相連。以左側第一個NVSwitch為例，其與GPU相連側的單向總帶寬為4Tbps (20NVLink*200Gbps)，與光模塊相連側的總帶寬為也為4Tbps (5*800Gbps)，兩者大小相等，是非阻塞(non-blocking)網(wǎng)絡。需要注意的是，光模塊中的帶寬是單向帶寬，而在AI芯片中一般習慣使用雙向帶寬。

(圖片來自https://blog.apnic.net/2023/08/10/large-language-models-the-hardware-connection/)

下表整理了每一代NVLink的指標參數(shù)。

而PCIe每一代的參數(shù)如下表所示，

從單條lane的速率來看，NVLink整體比同一時期的PCIe的指標高1倍左右，而總帶寬的優(yōu)勢更是明顯，NVLink是PCIe總帶寬的5倍左右。一直在超越，從未停止。

NVLink經(jīng)過近十年的發(fā)展，已經(jīng)成為Nvidia GPU芯片中的一個核心技術，是其生態(tài)系統(tǒng)中的重要一環(huán)，有效解決了GPU芯片之間高帶寬、低延遲的數(shù)據(jù)互聯(lián)難題，改變了傳統(tǒng)的計算架構。但由于該技術是Nvidia獨有，其它AI芯片公司只能采用PCIe或者其它互聯(lián)協(xié)議。與此同時，Nvidia正在探索利用光互連實現(xiàn)GPU之間的連接，如下圖所示，硅光芯片與GPU共封裝在一起，兩顆GPU芯片間通過光纖連接。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

gpu

gpu

+關注

關注
28

文章
5050

瀏覽量
134017
PCIe

PCIe

+關注

關注
16

文章
1406

瀏覽量
87211
PHY

PHY

+關注

關注
2

文章
330

瀏覽量
53596

原文標題：NVLink的演進

文章出處：【微信號：算力基建，微信公眾號：算力基建】歡迎添加關注！文章轉(zhuǎn)載請注明出處。

評論

精選推薦
更多

文章

資料

帖子

使用Keithley 4200A-SCS參數(shù)分析儀進行晶圓級可靠性測試

泰克科技
1天前

1961 閱讀

比特誤碼率測試儀接收端受限眼圖自動校準最佳實踐

泰克科技
1天前

1615 閱讀

如何對通過有損信道傳輸?shù)男盘枌崿F(xiàn)低噪聲測量

泰克科技
1天前

1734 閱讀

使用泰克MP5000系列實現(xiàn)高密度并行測試

泰克科技
1天前

1502 閱讀

HarmonyOS應用網(wǎng)絡連接安全配置方案

HarmonyOS開發(fā)者
1天前

1887 閱讀

激光束整形光學系統(tǒng)的設計

1045098026
238

免費

0下載

低頻電子線路

mintsy
10.1 MB

10積分

323下載

GoipScan golang版本極速掃描網(wǎng)段

ah此生不換
13.94 MB

免費

0下載

tckfc TrueCrypt密鑰尋找工具

李超
0.00 MB

2積分

1下載

wsshOps基于django開發(fā)的webssh堡壘機

吳湛
45.55 MB

免費

1下載

我要怎么校準或設置智能顯示模塊中的時間？

jf_10121737
1天前

223 閱讀

為什么裝上了電池RTC的顯示模塊在掉電以后還是無法保存時鐘時間？

jf_10121737
1天前

232 閱讀

【道生物聯(lián)TKB-623評估板試用】——2.TKB-623評估板休眠喚醒測試

jf_43382582
2天前

228 閱讀

SEIKI PRO SM40UNP 4K顯示器背光故障求解

jf_44155523
1天前

362 閱讀

飛凌嵌入式ElfBoard-系統(tǒng)IO接口之打開文件

jf_13411809
1天前

261 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

華秋（原“華強聚豐”）：

電子發(fā)燒友

華秋開發(fā)

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網(wǎng)站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅(qū)動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業(yè)應用

LEDs

汽車電子

音視頻及家電

通信網(wǎng)絡

醫(yī)療電子

人工智能

虛擬現(xiàn)實

可穿戴設備

機器人

安全設備/系統(tǒng)

軍用/航空電子

移動通信

工業(yè)控制

便攜設備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區(qū)塊鏈

新科技

特色內(nèi)容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

產(chǎn)品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評測試用

企業(yè)服務

產(chǎn)品

資料

文章

方案

企業(yè)

供應鏈服務

硬件開發(fā)

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網(wǎng)站廣告

在線研討會

活動策劃

新聞發(fā)布

新品發(fā)布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態(tài)

加入我們

聯(lián)系我們

舉報投訴

社交網(wǎng)絡

微博

移動端

發(fā)燒友APP

硬聲APP

WAP

聯(lián)系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內(nèi)容合作

黃晶晶：huangjingjing@elecfans.com

內(nèi)容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區(qū)合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發(fā)燒友APP

電子發(fā)燒友觀察

電子工程師社區(qū)

1-32層PCB打樣·中小批量

元器件現(xiàn)貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業(yè)動態(tài)

聯(lián)系我們

企業(yè)文化

企業(yè)宣傳片

加入我們

版權所有 ? 湖南華秋數(shù)字科技有限公司

長沙市望城經(jīng)濟技術開發(fā)區(qū)航空路6號手機智能終端產(chǎn)業(yè)園2號廠房3層（0731-88081133）
電子發(fā)燒友 （電路圖） 湘公網(wǎng)安備43011202000918 工商網(wǎng)監(jiān) 湘ICP備2023018690號-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
18video性欧美19sex