NVIDIA 發(fā)布了Jetson Xavier NX,這是世界上最小、最先進的嵌入式 AI 超級計算機,用于自主機器人和邊緣計算設(shè)備。Jetson Xavier NX 能夠在緊湊的 70x45mm 外形尺寸中部署服務(wù)器級性能,在 15W 功率下提供高達 21 TOPS 的計算,或在 10W 下提供高達 14 TOPS 的計算。Jetson Xavier NX 模塊(圖 1)與 Jetson Nano 引腳兼容,并基于 NVIDIA 的 Xavier SoC 的低功耗版本,該版本在邊緣 SoC 中領(lǐng)先于最近的MLPerf Inference 0.5結(jié)果,為部署要求苛刻的基于 AI 的邊緣的工作負載可能會受到尺寸、重量、功率和成本等因素的限制。

圖 2:Jetson Xavier NX 處理器引擎的框圖,包括高速 I/O 和內(nèi)存結(jié)構(gòu)。
如圖 2 所示,Jetson Xavier NX 包括一個集成的 384 核 NVIDIA Volta GPU,具有 48 個 Tensor 核心、6 核 NVIDIA Carmel ARMv8.2 64 位 CPU、8GB 128 位 LPDDR4x、雙 NVIDIA 深度學習加速器 (NVDLA)引擎、4K 視頻編碼器和解碼器、用于多達 6 個同步高分辨率傳感器流的專用攝像頭攝取、PCIe Gen 3 擴展、雙 DisplayPort/HDMI 4K 顯示器、USB 3.1 和 GPIO,包括 SPI、I2C、I2S、CAN 總線和UART。請參閱下表 1,了解功能列表和Jetson Xavier NX 模塊數(shù)據(jù)表,了解完整規(guī)格。共享內(nèi)存結(jié)構(gòu)允許處理器自由共享內(nèi)存,而不會產(chǎn)生額外的內(nèi)存副本(稱為 ZeroCopy),從而有效地提高了系統(tǒng)的帶寬利用率和吞吐量。

表 1:Jetson Xavier NX 計算模塊特性和功能
* CPU 最大工作頻率在 4/6 核模式下為 1400MHz,或在雙核模式下為 1900MHz
? 最大并發(fā)流數(shù)達到總吞吐量。支持的視頻編解碼器:H.265、H.264、VP9有關(guān)特定編解碼器和配置文件規(guī)范,
請參閱Jetson Xavier NX 模塊數(shù)據(jù)表。
?? MIPI CSI-2,D-PHY V1.2(每通道 2.5Gb/s,總計高達 30Gbps)。
? PCIe 1×1 僅支持根端口,1×1/2/4 支持根端口或端點模式
^ 工作溫度范圍,Xavier SoC 結(jié)溫 (Tj)
Jetson Xavier NX 得到 NVIDIA 完整的 CUDA-X 軟件堆棧和用于 AI 開發(fā)的JetPack SDK的支持,除了實時計算機視覺、加速圖形和豐富的多媒體應(yīng)用程序之外,還能在多個高分辨率傳感器流上同時運行流行的機器學習框架和復(fù)雜的 DNN在完整的桌面 Linux 環(huán)境中。Jetson 與 NVIDIA 的 AI 加速計算平臺的兼容性使得開發(fā)和云與邊緣之間的無縫遷移變得容易。
Jetson Xavier NX 模塊將于 2020 年 3 月以 399 美元的批量供貨,嵌入式設(shè)計人員可以參考可供下載的設(shè)計資料,包括Jetson Xavier NX 設(shè)計指南,為 Jetson Xavier NX 模塊創(chuàng)建生產(chǎn)設(shè)備和系統(tǒng)。與 Jetson Nano 的引腳兼容性允許共享設(shè)計和對 Jetson Xavier NX 的直接技術(shù)插入升級。Jetson 生態(tài)系統(tǒng)的硬件設(shè)計合作伙伴除了提供現(xiàn)成的載體、傳感器和配件外,還能夠提供定制設(shè)計服務(wù)和系統(tǒng)集成。
軟件開發(fā)人員現(xiàn)在可以開始為 Jetson Xavier NX 構(gòu)建 AI 應(yīng)用程序,方法是使用 Jetson AGX Xavier 開發(fā)工具包,并將設(shè)備配置補丁應(yīng)用到 JetPack,使設(shè)備表現(xiàn)得像 Jetson Xavier NX。除了設(shè)置整個系統(tǒng)的核心時鐘頻率和電壓外,它還將通過軟件改變可用的 CPU 和 GPU 核心的數(shù)量。該補丁是完全可逆的,可用于在硬件可用之前估算 Jetson Xavier NX 的性能。
Jetson Xavier NX 定義了 10 和 15W 的默認功率模式,根據(jù)活動模式實現(xiàn) 14 到 21 TOPS 的峰值性能。用于管理電源配置文件的 nvpmodel 工具調(diào)整 CPU、GPU、內(nèi)存控制器和其他 SoC 時鐘的最大時鐘頻率,以及在線 CPU 集群的數(shù)量——這些設(shè)置顯示在表 2 中,用于預(yù)定義的 10W 和Jetson Xavier NX 的 15W 模式。CPU 布置在三個集群中,每個集群有 2 個內(nèi)核,在 4/6 核模式下的最高工作頻率為 1400MHz,在雙核模式下最高可達 1900MHz,適用于可能需要更多單線程與多線程的應(yīng)用程序表現(xiàn)。

表 2:Jetson Xavier NX 在 10W 和 15W 功率模式下的最大工作頻率和核心配置。
* 使用 NVDLA 時,GPU 最高工作頻率為 600MHz(10W 模式)和 1000MHz(15W 模式)
根據(jù)工作負載,動態(tài)電壓和頻率縮放 (DVFS) 調(diào)節(jié)器在運行時將頻率縮放到活動 nvpmodel 定義的最大限制,因此在空閑時降低功耗并取決于處理器利用率。nvpmodel 工具還可以根據(jù)應(yīng)用要求和 TDP 輕松創(chuàng)建和自定義新的電源模式??梢跃庉嬰娫磁渲梦募⑵涮砑拥?/etc/nvpmodel.conf 配置文件中,并且在 Ubuntu 狀態(tài)欄中添加了一個 GUI 小部件,以便在運行時輕松管理和切換電源模式。
深度學習推理基準
NVIDIA 還宣布,它在MLPerf Inference 0.5基準測試的 5 個類別中的 4 個類別中奪冠,其中 Jetson AGX Xavier 是邊緣計算 SoC 的領(lǐng)導(dǎo)者,包括所有基于視覺的任務(wù):使用 Mobilenet 進行圖像分類和ResNet-50,以及使用 SSD-Mobilenet 和 SSD-ResNet 進行對象檢測。在 MLPerf 定義的所有五項推理測試中,NVIDIA GPU 是十種競爭芯片架構(gòu)中唯一提交結(jié)果的一種。
為了參考 Jetson 系列成員之間的可擴展性,我們還在流行的 DNN 模型上測量了 Jetson Nano、Jetson TX2、Jetson Xavier NX 和 Jetson AGX Xavier 的推理性能,用于圖像分類、對象檢測、姿勢估計、分割等。這些結(jié)果(如下圖 3 所示)是使用 JetPack 和 NVIDIA 的 TensorRT 推理加速器庫運行的,該庫可優(yōu)化網(wǎng)絡(luò)以實現(xiàn)實時性能,這些網(wǎng)絡(luò)在 TensorFlow、PyTorch、Caffe、MXNet 等流行的機器學習框架中進行了訓練。

圖 3. Jetson 系列中使用 TensorRT 的各種基于視覺的 DNN 模型的推理性能。
Jetson Xavier NX 的性能比 Jetson TX2 高出多達 10 倍,功率相同,占用空間減少 25%。在這些基準測試中,每個平臺都以最高性能運行(Jetson AGX Xavier 為 MAX-N 模式,Xavier NX 和 TX2 為 15W,Nano 為 10W)。最大吞吐量是在批處理大小不超過 16 毫秒延遲閾值的情況下獲得的,否則對于平臺超過此延遲閾值的網(wǎng)絡(luò),批處理大小為 1。這種方法在實時應(yīng)用程序的確定性低延遲要求和多流用例場景的最大性能之間提供了平衡。
在 Jetson Xavier NX 和 Jetson AGX Xavier 上,NVDLA 引擎和 GPU 以 INT8 精度同時運行,而在 Jetson Nano 和 Jetson TX2 上,GPU 以 FP16 精度運行。Jetson Xavier NX 中帶有 Tensor Cores 的 Volta 架構(gòu) GPU 能夠進行高達 12.3 TOPS 的計算,而該模塊的 DLA 引擎每個可產(chǎn)生高達 4.5 TOPS。
除了使用 TensorRT 運行神經(jīng)網(wǎng)絡(luò)之外,ML 框架還可以通過 CUDA 和 cuDNN 本地安裝在 Jetson 上,包括 TensorFlow、PyTorch、Caffe/Caffe2、MXNet、Keras 等。除了 AWS Greengrass 等物聯(lián)網(wǎng)框架和 Docker 和 Kubernetes 等容器引擎之外, Jetson Zoo還包括預(yù)構(gòu)建的安裝程序和構(gòu)建說明。
開發(fā)突破性的人工智能產(chǎn)品
Jetson Xavier NX 為部署下一代自主系統(tǒng)和智能邊緣設(shè)備開辟了新的機會,這些設(shè)備需要高性能 AI 和復(fù)雜的 DNN 在小尺寸、低功耗的足跡中——想想移動機器人、無人機、智能相機、便攜式醫(yī)療設(shè)備、嵌入式物聯(lián)網(wǎng)系統(tǒng)等等。支持 CUDA-X 的 NVIDIA JetPack SDK 提供了完整的工具來開發(fā)尖端的 AI 解決方案,并以世界領(lǐng)先的性能在云和邊緣之間擴展您的應(yīng)用程序。
關(guān)于作者
Dustin 是 NVIDIA Jetson 團隊的一名開發(fā)人員推廣員。Dustin 擁有機器人技術(shù)和嵌入式系統(tǒng)方面的背景,喜歡在社區(qū)中提供幫助并與 Jetson 合作開展項目。
審核編輯:郭婷
-
機器人
+關(guān)注
關(guān)注
213文章
30309瀏覽量
218406 -
AI
+關(guān)注
關(guān)注
88文章
37210瀏覽量
291822 -
無人機
+關(guān)注
關(guān)注
234文章
11051瀏覽量
191837 -
嵌入式AI
+關(guān)注
關(guān)注
0文章
36瀏覽量
1345
發(fā)布評論請先 登錄
嵌入式計算機AF208:自動化裝配管理集成方案核心
軍用導(dǎo)航領(lǐng)域嵌入式計算機分析
NVIDIA助力AI超級計算機Isambard-AI投入使用
NVIDIA技術(shù)賦能歐洲最快超級計算機JUPITER
市場上主流的端側(cè)AI MPU 大全
Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)
NVIDIA 宣布推出 DGX Spark 個人 AI 計算機
NVIDIA推出個人AI超級計算機Project DIGITS
飛凌嵌入式獲批建設(shè)「河北省嵌入式計算機控制系統(tǒng)技術(shù)創(chuàng)新中心」
NVIDIA發(fā)布高性價比生成式AI超級計算機
NVIDIA 推出高性價比的生成式 AI 超級計算機
云端超級計算機使用教程
NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級計算機

世界最小嵌入式AI超級計算機Jetson Xavier NX
評論