完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > gpu
圖形處理器(英語:Graphics Processing Unit,縮寫:GPU),又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個(gè)人電腦、工作站、游戲機(jī)和一些移動(dòng)設(shè)備(如平板電腦、智能手機(jī)等)上圖像運(yùn)算工作的微處理器。
文章:4793個(gè) 瀏覽:133972次 帖子:301個(gè)
如何看懂GPU架構(gòu)?一分鐘帶你了解GPU參數(shù)指標(biāo)
GPU架構(gòu)參數(shù)如CUDA核心數(shù)、顯存帶寬、TensorTFLOPS、互聯(lián)方式等,并非“冰冷的數(shù)字”,而是直接關(guān)系設(shè)備能否滿足需求、如何發(fā)揮最大價(jià)值、是否...
NVIDIA Isaac Lab多GPU多節(jié)點(diǎn)訓(xùn)練指南
NVIDIA Isaac Lab 是一個(gè)適用于機(jī)器人學(xué)習(xí)的開源統(tǒng)一框架,基于 NVIDIA Isaac Sim 開發(fā),其模塊化高保真仿真適用于各種訓(xùn)練環(huán)...
大規(guī)模專家并行模型在TensorRT-LLM的設(shè)計(jì)
DeepSeek-V3 / R1 等模型采用大規(guī)模細(xì)粒度混合專家模型 (MoE) 架構(gòu),大幅提升了開源模型的質(zhì)量。Llama 4 和 Qwen3 等新發(fā)...
順絡(luò)電子核心產(chǎn)品破解AI服務(wù)器供電難題
2025年,人工智能正以前所未有的速度重塑全球經(jīng)濟(jì)格局,從大模型訓(xùn)練到行業(yè)應(yīng)用落地,AI服務(wù)器作為算力核心基礎(chǔ)設(shè)施,成為科技競爭的戰(zhàn)略高地。AI 服務(wù)器...
英偉達(dá) H100 GPU 掉卡?做好這五點(diǎn),讓算力穩(wěn)如泰山!
H100服務(wù)器停工一天損失的算力成本可能比維修費(fèi)還高。今天,我們給大家總結(jié)一套“防掉卡秘籍”,從日常管理到環(huán)境把控,手把手教你把掉卡風(fēng)險(xiǎn)壓到最低。一、供...
從自然仿真到智能調(diào)度——GPU并行計(jì)算的多場景突破
我們正在參加全球電子成就獎(jiǎng)的評選,歡迎大家?guī)臀覀兺镀薄x謝支持隨著復(fù)雜計(jì)算問題的不斷涌現(xiàn),傳統(tǒng)的CPU串行計(jì)算在處理大規(guī)模數(shù)據(jù)與高并發(fā)任務(wù)時(shí)逐漸顯露...
2025-09-03 標(biāo)簽:gpu仿真智能調(diào)度 413 0
NVIDIA RTX PRO 4500 Blackwell GPU測試分析
今天我們帶來全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產(chǎn)...
在之前的技術(shù)博客中,我們介紹了低延遲[1] 和高吞吐[2] 場景的優(yōu)化方法。對于生產(chǎn)部署,用戶還關(guān)心在滿足特定延遲約束的情況下,每個(gè) GPU 的吞吐表現(xiàn)...
Dynamo 0.4在NVIDIA Blackwell上通過PD分離將性能提升4倍
近期,OpenAI 的 gpt-oss、月之暗面的 Kimi K2 等多個(gè)新的前沿開源模型相繼問世,標(biāo)志著大語言模型 (LLM) 創(chuàng)新浪潮的加速。近日發(fā)...
Arm神經(jīng)超級采樣 以ML進(jìn)一步強(qiáng)化性能 實(shí)現(xiàn)卓越的移動(dòng)端圖形性能
作者:Arm 戰(zhàn)略與生態(tài)部主任工程師 Sergio Alapont 為滿足用戶對于手游體驗(yàn)的期望,例如更清晰的畫面、更流暢的游戲體驗(yàn),以及更長的電池續(xù)航...
如何在Linux系統(tǒng)開啟Persistence Mode
難道是驅(qū)動(dòng)老舊?資源不足?系統(tǒng)問題?都不是——真相藏在一個(gè)容易被忽略的小設(shè)置里:Persistence Mode(持久模式)。
如何在NVIDIA Blackwell GPU上優(yōu)化DeepSeek R1吞吐量
開源 DeepSeek R1 模型的創(chuàng)新架構(gòu)包含多頭潛在注意力機(jī)制 (MLA) 和大型稀疏混合專家模型 (MoE),其顯著提升了大語言模型 (LLM) ...
技術(shù)筆記 | RK3588 X11 桌面 GPU 性能實(shí)測
一、RK3588高性能芯片解析RK3588作為一款旗艦級處理器,憑借先進(jìn)制程與架構(gòu)設(shè)計(jì)成為嵌入式領(lǐng)域的熱門選擇。其CPU集成4核Cortex-A76+4...
使用NVIDIA GPU加速Apache Spark中Parquet數(shù)據(jù)掃描
隨著各行各業(yè)的企業(yè)數(shù)據(jù)規(guī)模不斷增長,Apache Parquet 已經(jīng)成為了一種主流數(shù)據(jù)存儲格式。Apache Parquet 是一種列式存儲格式,專為...
2025-07-23 標(biāo)簽:加速器數(shù)據(jù)gpu 485 0
如何在Ray分布式計(jì)算框架下集成NVIDIA Nsight Systems進(jìn)行GPU性能分析
在大語言模型的強(qiáng)化學(xué)習(xí)訓(xùn)練過程中,GPU 性能優(yōu)化至關(guān)重要。隨著模型規(guī)模不斷擴(kuò)大,如何高效地分析和優(yōu)化 GPU 性能成為開發(fā)者面臨的主要挑戰(zhàn)之一。
NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場景中的性能紀(jì)錄
本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個(gè) NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在...
TPU深度解析 一文搞懂 TPU 谷歌專用集成電路(ASIC)
簡單來說,TPU 是谷歌的專用集成電路 (ASIC),專注于兩個(gè)因素:極高的矩陣乘法吞吐量 + 高能效。TPU 的主要優(yōu)勢在于其可擴(kuò)展性。這是通過硬件(...
保證UI流暢運(yùn)行,我們需要多強(qiáng)的GPU性能?
圖形用戶界面(GUI)如今幾乎無處不在——從智能手機(jī)、電視,到汽車中控系統(tǒng)。過去十年中,GUI的復(fù)雜度持續(xù)提升,從簡單背景與基本圖標(biāo),發(fā)展為充滿3D元素...
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動(dòng)駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺 | 無人機(jī) | 三菱電機(jī) | ST |
伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |