18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DPU性能評測系統(tǒng)框架與測試流程

智能計算芯世界 ? 來源:智能計算芯世界 ? 作者:智能計算芯世界 ? 2022-12-02 14:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文來自“專用數據處理器(DPU)性能基準評測方法與實現(2022)”介紹 DPU 性能測試系統(tǒng)框架與測試流程,包括測試系統(tǒng)、測試要求、測試活動三部分。具體的,測試系統(tǒng)定義了三種搭建 DPU 測試系統(tǒng)的方法,測試要求闡述了組建 DPU 測試系統(tǒng)時需要滿足的要求,測試活動定義了DPU Benchmark 的選擇策略、執(zhí)行前準備、執(zhí)行過程及測試結果報告。

DPU 測試系統(tǒng)(SUT)

DPU 測試系統(tǒng)(System Under Test,SUT)是測試 DPU 性能的平臺,其結構在不同應用場景中,主要分為三類:單端型測試系統(tǒng)(Single-End)、端到端型測試系統(tǒng)(End-to-End)和多端型測試系統(tǒng)(Multi-End)。

單端型(Single-End)測試系統(tǒng)是主機與 DPU 通過總線互聯構成的封閉測試系統(tǒng),主要用于模擬無網絡連接情況下,DPU 作為專用加速器執(zhí)行主機端特定業(yè)務的過程。在這種系統(tǒng)中,計算與數據傳輸僅在主機與 DPU 之間進行,DPU 不與其他設備通信,僅執(zhí)行特定計算業(yè)務。單端型測試系統(tǒng)主要測試 DPU 對特定計算任務的性能提升。

端到端型(End-to-End)測試系統(tǒng)將兩個單端型測試系統(tǒng)通過簡單網絡相連(網線直連),其中一個為請求發(fā)起者(Initiator/Client),另一個為請求接受者(Target/Server)。

端到端型測試系統(tǒng)主要模擬 DPU 作為網絡加速器執(zhí)行雙端操作的場景。在這種系統(tǒng)中,計算與數據傳輸不僅在主機與 DPU 之間進行,還通過網絡傳輸到其他系統(tǒng)。DPU 在Server 端接收主機端發(fā)起的網絡請求并通過網口轉發(fā),或者在 Client 端接收網絡的請求并向作出響應。端到端型測試系統(tǒng)能夠屏蔽網絡性能(轉發(fā)次數、交換設備的性能、轉發(fā)設備的性能)對 DPU 性能的影響,主要測試 DPU 對網絡協議卸載、網絡數據包處理的峰值能力。

多端型(Multi-End)測試系統(tǒng)是多個單端型測試系統(tǒng)通過復雜的網絡拓撲相連的開放測試系統(tǒng)。該測試系統(tǒng)主要模擬 DPU 作為網絡加速器在復雜環(huán)境中處理網絡任務的場景。在這種系統(tǒng)中,網絡環(huán)境(網絡拓撲)與資源分布(相同或者不同類型的 DPU 系統(tǒng))情況復雜,DPU 不僅承擔一對一的網絡任務,還可能接收一/多個其他系統(tǒng)的請求(含背景流量甚至惡意攻擊)或響應一/多個其他系統(tǒng)的請求。

單端型(Single-End)測試系統(tǒng)

主機與 DPU 通過總線(通常為 PCIe)直接相連形成的可獨立工作的系統(tǒng)為單端型測試系統(tǒng),系統(tǒng)包含支持 DPU 正常工作的軟件和硬件。在這種測試系統(tǒng)中,DPU 作為專用加速器執(zhí)行特點計算業(yè)務。

單端型測試系統(tǒng)模型的基本結構如圖2.1(a) 所示。運行時環(huán)境(Run Time Environ-ment,RTE)代表運行中的 DPU 測試程序,交換設備(Switch)為 DPU 與主機系統(tǒng)(Host System)的互連結構(通常為 PCIe)。在單端型測試系統(tǒng)中,DPU 作為專用加速器,主機使用 DPU 加速某些任務的處理,如數據庫查詢、AI 訓練等。任務數據首先從主機端搬運到 DPU,DPU 計算完成后,再將處理完的數據寫回主機。在這種工作模式中,DPU測試程序可以以數據處理時間、數據處理規(guī)模作為性能指標。

32837232-3ee1-11ed-9e49-dac502259ad0.png

單端型測試系統(tǒng)具體由硬件和軟件兩部分構成,硬件主要有 DPU、CPU 以及其他

保證系統(tǒng)正常進行的硬件(內存、硬盤等),軟件主要有操作系統(tǒng)、DPU 驅動、開源工具、DPU Benchmark,結構示意如圖。各部分組件要求如下:

1. DPU Benchmark,評測 DPU 系統(tǒng)性能的基準測試程序;

2. 開源工具(Open Source Tools),一些廣泛使用的性能測試工具,保證測試結果可重復,在不同的用戶測試時可以獲得相近的結果;

3. DPU Benchmark 驅動(Benchmark Driver),基于內核態(tài)的測試驅動或者基于用戶態(tài)的測試驅動;

4. DPU 驅動(DPU Driver),包括 DPU 最底層的抽象,也包括 DPU 所提供給用戶程序使用的接口;

5. 操作系統(tǒng)(Operating System),需要支持 DPU Benchmark 的版本,且相關信息需要在結果報告中明確寫出,如操作系統(tǒng)版本,內核版本等;

6. 計算設備(Computing Device),通用 CPU,其上運行操作系統(tǒng);

7. 連接設備(Connected Device),根據 DPU 板卡接口不同選擇不同,常見的有PCIe、CXL;

8. IO 硬件(I/O),鼠標、鍵盤等保證系統(tǒng)執(zhí)行所必須的硬件設備;

9. 被測 DPU 產品(DPU);

10. 其他硬件資源(Hardware Resources),如內存、硬盤。

端到端型(End-to-End)測試系統(tǒng)

端到端型測試系統(tǒng)是由兩個單端型測試系統(tǒng)通過網線直連的方式組成的測試系統(tǒng)。在這種測試系統(tǒng)中,屏蔽了復雜的網絡拓撲與其他系統(tǒng)流量的影響,可以測試 DPU 網絡加速的峰值性能。

端到端型測試系統(tǒng)由兩個單端型測試模型直接相連(如圖所示),每個單端測試系統(tǒng)分別運行 DPU Benchmark 測試程序,一般其中一個運行發(fā)起者程序 (Initiator/-Client),另一個運行接收者程序 (Target/Server)。通過發(fā)起者發(fā)送請求,接收者響應請求,測量基于網絡的端到端操作,例如 RDMA Send/Receive 操作,NVMe-oF 遠程訪問。在這種測試模型中,根據從一端 DPU 系統(tǒng)到另一端 DPU 系統(tǒng)的請求時間和流量等測試DPU 的延遲、吞吐量等性能。

329a2504-3ee1-11ed-9e49-dac502259ad0.png

端對端型測試系統(tǒng)在單端型測試系統(tǒng)的基礎上,增加網絡基礎設備(通常為網線)

用于直接連接兩個單端測試系統(tǒng),其結構如圖2.3所示。根據 DPU 所支持的網口速率不同,可采取不同的網絡連接設備,缺省值為 100Gbs 連接。

多端型(Multi-End)測試系統(tǒng)

多端型測試系統(tǒng)是由多個單端型測試系統(tǒng)經由復雜網絡(復雜的網絡拓撲)連接形

成的測試系統(tǒng)。在這種測試系統(tǒng)中,可以模擬 DPU 所處的真實網絡環(huán)境,測試 DPU 網絡處理的實際性能。

多端型測試系統(tǒng)模型主要用于模擬基于 DPU 構建的數據中心,通過復雜的網絡將

眾多 DPU 系統(tǒng) (功能相同或者不同) 互連起來,從而測試基于 DPU 系統(tǒng)實現的網絡、存儲或安全加速應用的真實性能,如NVMe-oF 讀取不同結點存儲系統(tǒng)的存儲資源、RDMA訪問不同結點的資源。在這種測試模型中,根據請求與響應時間、請求的數據量及并發(fā)的請求數等可以測試延時、吞吐量、連接能力等指標。

32c7fa6a-3ee1-11ed-9e49-dac502259ad0.png

多端型測試系統(tǒng)在單端型測試系統(tǒng)的基礎上,需要增加更復雜的網絡基礎設備用于連接不同節(jié)點的 DPU 系統(tǒng)。這些網絡基礎設施包括但不限于集線器、交換機、路由器等。

32f25ecc-3ee1-11ed-9e49-dac502259ad0.png

在 DPU Benchmark 執(zhí)行時,為了保證測試結果的準確性與可重復性,對于同一種測試用例執(zhí)行兩輪(特殊的情況在具體的測試用例說明)。每一輪分為三個部分:預熱 (Warmup Run) 部分排除初始化干擾;負載執(zhí)行 (Measured Run) 部分為真正的指標測試;結果檢查 (Result Check) 部分檢查結果的正確性 (數據傳輸的完整性,計算結果的正確性等)。每執(zhí)行完一輪需要恢復至初始狀態(tài) (Clear up)。在預熱部分與負載執(zhí)行之間不允許執(zhí)行其他任務。每一輪執(zhí)行的過程中,DPU 測試系統(tǒng)配置不可以發(fā)生變化。

在 DPU Benchmark 執(zhí)行過程中,DPU 測試系統(tǒng)不可以重啟或者重新開始。如果 DPU系統(tǒng)測試應用、操作系統(tǒng)或者硬件發(fā)生不可恢復的錯誤時,這一輪的執(zhí)行應作無效;如果 DPU 系統(tǒng)測試應用、操作系統(tǒng)或者硬件檢測到可恢復的錯誤,并且錯誤糾正并恢復正常,那么這一輪的執(zhí)行應作有效。在錯誤發(fā)生處理期間,測試者不能人工干預,否則,這一輪執(zhí)行應作無效。

測試報告中除了給出不同測試用例的性能指標,還需要給出測試過程中的全部配置信息,包括:配置參數,包括服務器、存儲、網絡等其他硬件設施;安裝的操作系統(tǒng)、文件系統(tǒng)、測試工具等軟件版本;在測試過程中使用到的其他軟件程序;程序編譯優(yōu)化選項。在執(zhí)行 DPU Benchmark 時如果系統(tǒng)發(fā)送異?;蛘咂渌闆r,需要在報告附錄中指出。

本文來自“專用數據處理器(DPU)性能基準評測方法與實現(2022)”介紹 DPU性能測試系統(tǒng)框架與測試流程,包括測試系統(tǒng)、測試要求、測試活動三部分。完整內容請參看原報告。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11192

    瀏覽量

    221679
  • 測試系統(tǒng)

    關注

    6

    文章

    891

    瀏覽量

    63493
  • DPU
    DPU
    +關注

    關注

    0

    文章

    404

    瀏覽量

    25850
  • 數據處理器
    +關注

    關注

    0

    文章

    26

    瀏覽量

    8860

原文標題:DPU性能評測系統(tǒng)框架與測試流程

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    《數據處理器:DPU編程入門》讀書筆記

    關注計算能力的提升,通信基礎設施的提升跟不上,那么數據中心的整體系統(tǒng)性能依然受限,無法發(fā)揮出真正的潛力。DPU的提出背景就是應對這些數據量和復雜性的指數級增長。未來,需要將計算移至接近數據的位置,這是
    發(fā)表于 12-21 10:47

    《數據處理器:DPU編程入門》DPU計算入門書籍測評

    一、DPU計算框架 通過一周多的時間翻閱這本書,基本上這本書是一本比較全面的,面向架構的新手指導數據。它在書中詳盡介紹了關于DPU在計算機架構中的應用。 對于DPU來說,是一種平行于
    發(fā)表于 12-24 10:54

    IaaS+on+DPU(IoD)+下一代高性能算力底座技術白皮書

    ,在其上掛載了各種計算、存儲資源的節(jié)點,對于系統(tǒng)的資源彈性、運行效率、性能都大有益處。但是這種使用方式的變化,需要對現有云計算架構進行一定程度的變革,才能充分發(fā)揮出 DPU的優(yōu)勢。云計算中的頭部企業(yè)
    發(fā)表于 07-24 15:32

    專?數據處理器 (DPU) 技術??書

    513.3. 應用場景三:安全功能卸載 554.DPU軟件棧五層模型584.1. 軟件棧開發(fā)面臨的挑戰(zhàn) 584.2. DPU異構計算架構五層開發(fā)模型 584.3. 典型軟件框架案例 635.業(yè)界產品概要介紹
    發(fā)表于 03-14 17:35

    【書籍評測活動NO.23】數據處理器:DPU編程入門

    ,擁有極高的安全性和強大的功能。 全球第一本系統(tǒng)性介紹DPU及其軟件開發(fā)的圖書 涵蓋新一代計算單元——DPU的簡介、技術優(yōu)勢及未來技術發(fā)展路徑 基于NVIDIA DOCA軟件框架開發(fā)軟
    發(fā)表于 10-24 15:21

    什么是DPU?

    DPU則進行數據處理?!?什么是DPU? 數據處理器 基于行業(yè)標準,高性能及軟件可編程的多核CPU 高性能網絡接口 靈活、可編程的加速引擎 DPU
    發(fā)表于 11-03 10:55

    《數據處理器:DPU編程入門》+初步熟悉這本書的結構和主要內容

    浪費等問題。DPU將數據處理和網絡功能集成到同一塊硬件中,可以實現更高效的數據處理和傳輸,同時減少系統(tǒng)復雜性和資源開銷。這種集成可以提供更低的延遲和更高的吞吐量,從而改善應用程序性能和用戶體驗。 2
    發(fā)表于 12-08 18:03

    ServerScope集成性能評測系統(tǒng)框架

    介紹了ServerScope 集成性能評測系統(tǒng)框架結構的設計與實現實踐證明利用框架技術顯著降低了性能
    發(fā)表于 06-28 15:18 ?18次下載
    ServerScope集成<b class='flag-5'>性能</b><b class='flag-5'>評測</b><b class='flag-5'>系統(tǒng)</b><b class='flag-5'>框架</b>

    NVIDIA發(fā)布用于BlueField DPU的軟件框架DOCA 1.1

    NVIDIA 發(fā)布 NVIDIA DOCA 1.1 —— 用于 BlueField DPU(全球最先進的數據處理器)的軟件框架。最新版本的 NVIDIA DOCA 將延續(xù) DOCA 搶先體驗計劃
    的頭像 發(fā)表于 08-04 10:17 ?2684次閱讀

    NVIDIA推出基于 NVIDIA BlueField DPU 的 DOCA 1.2 軟件框架

    NVIDIA 最近推出了基于 NVIDIA BlueField DPU 的 DOCA 1.2 軟件框架 。此最新版本讓已在 DOCA 早期訪問計劃中的合作伙伴和客戶,可加快 DPU 上應用程序和整體零信任解決方案的開發(fā)。
    的頭像 發(fā)表于 12-23 17:42 ?2400次閱讀

    NVIDIA BlueField-2 DPU性能測試方法

    DPU(數據處理器)將服務器和存儲之間的 IOPS 性能提升至 4100 萬以上,超過之前世界紀錄的四倍。
    的頭像 發(fā)表于 01-04 14:25 ?3555次閱讀

    中科馭數等單位牽頭發(fā)布行業(yè)首部DPU評測方法技術白皮書

    性能評測系統(tǒng)框架測試流程 三、面向網絡的基準評測
    的頭像 發(fā)表于 08-02 14:45 ?1664次閱讀
    中科馭數等單位牽頭發(fā)布行業(yè)首部<b class='flag-5'>DPU</b><b class='flag-5'>評測</b>方法技術白皮書

    被稱為數據中心“第三顆主力芯片”,DPU憑什么?

    2021年10月至今,中科院計算所面向全行業(yè)先后發(fā)布了《專用數據處理器(DPU)技術白皮書》和《專用數據處理器(DPU性能基準評測方法與實現》,兩份白皮書較為全面地解釋了,
    發(fā)表于 10-18 15:09 ?1129次閱讀
    被稱為數據中心“第三顆主力芯片”,<b class='flag-5'>DPU</b>憑什么?

    中科馭數發(fā)布軟件開發(fā)平臺HADOS 2.0 釋放DPU極致性能

    近日,中科馭數在2022 CNCC 中國計算大會上發(fā)布了HADOS敏捷異構軟件平臺2.0版本。該平臺可為馭數DPU系列產品提供通用且編程友好的軟件框架,充分釋放DPU產品性能,有望成為
    的頭像 發(fā)表于 12-28 11:52 ?2072次閱讀

    性能測試流程和步驟有哪些

    性能測試是軟件測試的一個重要環(huán)節(jié),主要目的是評估軟件在不同負載條件下的性能表現,以確保軟件能夠滿足用戶的需求。本文將詳細介紹性能
    的頭像 發(fā)表于 05-29 16:00 ?1641次閱讀