作者:AVNET 李鑫杰
一,YOLOv8介紹?
YOLOv8 由 Ultralytics 于 2023 年 1 月 10 日發(fā)布,在準(zhǔn)確性和速度方面提供了前沿的性能。YOLOv8 在之前 YOLO 版本的基礎(chǔ)上進(jìn)行了改進(jìn),引入了新的特性和優(yōu)化,使其成為各種應(yīng)用中各種目標(biāo)檢測(cè)
https://www.ultralytics.com/blog/a-guide-to-deep-dive-into-object-detection-in-2025
任務(wù)的理想選擇。
Github Repo: ultralytics/ultralytics: Ultralytics YOLO
https://github.com/ultralytics/ultralytics/tree/main
YOLOv8模型的卓越性能使其在多個(gè)領(lǐng)域具有廣泛的應(yīng)用前景,如自動(dòng)駕駛與智能交通、工業(yè)制造與質(zhì)量檢測(cè)、安全監(jiān)控與公共安全等。本文將介紹使用ROCm?在AMD? CPU、獨(dú)立顯卡、集成顯卡上優(yōu)化并部署YOLOv8模型。
二,ROCm?工具套件簡(jiǎn)介
AMD ROCm? 是一個(gè)開放式軟件棧,包含多種驅(qū)動(dòng)程序、開發(fā)工具和 API,可為從底層內(nèi)核到最終用戶應(yīng)用的 GPU 編程提供助力。ROCm? 已針對(duì)生成式 AI 和 HPC 應(yīng)用進(jìn)行了優(yōu)化,而且能夠輕松將現(xiàn)有代碼遷移到 ROCm? 軟件。不僅支持以卷積神經(jīng)網(wǎng)絡(luò)(CNN)為核心組件的預(yù)測(cè)式AI模型(Predictive AI),還支持以Transformer為核心組件的生成式AI模型(Generative AI)。ROCm? 能夠支持AMD的獨(dú)顯以及核顯,能夠加快AI模型部署到本地的獨(dú)顯以及CPU中的核顯上。下表使用的圖片來自于COCO數(shù)據(jù)集中的一幅圖片,已經(jīng)上傳到github倉(cāng)庫(kù)中,方便讀者復(fù)現(xiàn)。
三,搭建開發(fā)環(huán)境
在本地搭建開發(fā)環(huán)境。
首先,請(qǐng)克隆YOLOv8-AMD-ROCm到本地:
git clone git clone https://github.com/liebedir/YOLOv8-AMD-ROCm.git cd YOLOv8-AMD-ROCm
接著,安裝ROCm?:
wget https://repo.radeon.com/amdgpu-install/6.4.3/ubuntu/jammy/amdgpu-install_6.4.60403-1_all.deb
sudo apt install ./amdgpu-install_6.4.60403-1_all.deb
sudo apt update
sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)"
sudo apt install amdgpu-dkms
sudo apt install python3-setuptools python3-wheel
sudo usermod -a -G render,video $LOGNAME # Add the current user to the render and video groups sudo apt install rocm
設(shè)置添加環(huán)境變量到~/.bashrc,該環(huán)境變量與核顯的架構(gòu)相關(guān),11.0.0適用于RDNA3架構(gòu)核顯,其他架構(gòu)請(qǐng)參考github liebedir/PP-OCRv5-AMD-ROCm :
vi ~/.bashrc export HSA_OVERRIDE_GFX_VERSION=11.0.0
重啟計(jì)算機(jī)
安裝python環(huán)境與ROCm-onnxruntime
conda create -n ocr-rocm python==3.10 pip3 install onnxruntime-rocm -f https://repo.radeon.com/rocm/manylinux/rocm-rel-6.4.2/
安裝Pytorch
Previous PyTorch Versions
https://pytorch.org/get-started/previous-versions/
pip3 install torch torchvision --index-url https://download.pytorch.org/whl/rocm6.4
根據(jù)之前安裝的ROCm?版本安裝對(duì)應(yīng)的pytorch,版本向下兼容
安裝ultralytics
pip install ultralytics
至此,模型和環(huán)境準(zhǔn)備完成!
四,編寫YOLOv8-AMD-ROCm推理程序
YOLOv8-AMD-ROCm
https://github.com/liebedir/YOLOv8-AMD-ROCm
項(xiàng)目已將推理程序編寫完成,各文件功能如下:
執(zhí)行演示程序yolo-onnx.py,并指定模型路徑和推理硬件設(shè)備:
python yolo-onnx.py
運(yùn)行結(jié)果,如下圖所示:
五,總結(jié)
使用AMD CPU或GPU的客戶可以通過ROCm?軟件棧將YOLOv8模型部署到GPU或核顯硬件平臺(tái)上。
如果你有更好的文章,歡迎投稿!
稿件接收郵箱:nami.liu@pasuntech.com
更多精彩內(nèi)容請(qǐng)關(guān)注“算力魔方?”!
審核編輯 黃宇
-
gpu
+關(guān)注
關(guān)注
28文章
5044瀏覽量
133949 -
模型
+關(guān)注
關(guān)注
1文章
3616瀏覽量
51493
發(fā)布評(píng)論請(qǐng)先 登錄
單板挑戰(zhàn)4路YOLOv8!米爾瑞芯微RK3576開發(fā)板性能實(shí)測(cè)
求助,關(guān)于K230部署yolov8時(shí)遇到問題求解
請(qǐng)問yolov8訓(xùn)練模型如何寫雙線程?
YOLOv8轉(zhuǎn)換到kmodel時(shí)出現(xiàn)undefined symbol錯(cuò)誤怎么解決?
RK3576 Yolov11訓(xùn)練部署教程

如何提高yolov8模型在k230上運(yùn)行的幀率?
YOLOv8水果檢測(cè)示例代碼換成640輸入圖像出現(xiàn)目標(biāo)框繪制錯(cuò)誤的原因 ?
labview調(diào)用yolov8/11目標(biāo)檢測(cè)、分割、分類
RV1126 yolov8訓(xùn)練部署教程

RV1126 yolov8訓(xùn)練部署教程

RK3576 Yolov11訓(xùn)練部署教程

請(qǐng)問如何在imx8mplus上部署和運(yùn)行YOLOv5訓(xùn)練的模型?
YOLOv8中的損失函數(shù)解析

評(píng)論