隨著人工智能 (AI) 在數(shù)據(jù)中心、終端設(shè)備及各類中間場景中迅速普及,當(dāng)前的核心挑戰(zhàn)已不再是打造智能計算本身,而是構(gòu)建支撐其規(guī)?;瘧?yīng)用所需的基礎(chǔ)設(shè)施。
AI 并非單一維度的問題,而是一個由全球領(lǐng)先的科技企業(yè)共同塑造的龐大生態(tài)系統(tǒng)。在這場價值數(shù)萬億美元級別的產(chǎn)業(yè)變革中,Arm 架構(gòu)持續(xù)脫穎而出。
AI 數(shù)據(jù)中心:
由行業(yè)領(lǐng)袖企業(yè)定義,以 Arm 技術(shù)為基石
AI 領(lǐng)域的領(lǐng)軍企業(yè),如 NVIDIA、亞馬遜云科技 (AWS)、微軟、Google、Oracle 和 OpenAI 正與 Arm 攜手,共同推動下一代數(shù)據(jù)中心的建設(shè)。據(jù)估計,為了滿足模型訓(xùn)練、推理和具有成本效益的規(guī)?;瘮U展需求,AI 基礎(chǔ)設(shè)施領(lǐng)域的投資將突破萬億美元級別。
預(yù)計到 2025 年,出貨到頭部超大規(guī)模云服務(wù)提供商的算力中,將有近 50% 是基于 Arm 架構(gòu)。目前,AWS (Graviton)、Google Cloud (Axion) 和 Microsoft Azure (Cobalt) 均已在其云基礎(chǔ)設(shè)施中部署了基于 Arm 架構(gòu)的芯片,從而顯著節(jié)省能源和成本,并提升可擴展性。NVIDIA 的 Grace CPU 基于 Arm Neoverse 平臺構(gòu)建,是 NVIDIA Grace Blackwell AI 超級芯片的核心組件;該超級芯片廣受市場青睞,僅全球前四大超大規(guī)模云服務(wù)提供商就已訂購 360 萬顆。事實上,目前已有超過 10 億顆基于 Arm Neoverse 平臺的 CPU 部署至數(shù)據(jù)中心,這一數(shù)據(jù)充分凸顯了 Arm 架構(gòu)在全球數(shù)據(jù)中心建設(shè)中的核心地位。
在當(dāng)今先進的 AI 數(shù)據(jù)中心技術(shù)棧中,Arm 架構(gòu)作為普遍采用的基礎(chǔ)平臺,提供了傳統(tǒng)架構(gòu)難以企及的可擴展性、效率和靈活性,其性價比和能效優(yōu)勢包括:
與 x86 系統(tǒng)相比,NVIDIA 的 Grace-Hopper 超級芯片的模型訓(xùn)練速度提升高達 8 倍,LLM 推理性能提升高達 4.5 倍[1]。
與 x86 相比,Google 的 Axion 推薦性能提升高達 3 倍[2],推理能力提升 2.5 倍,同時成本降低達 64%[3]。
截至 2024 年 12 月,AWS EC2 云服務(wù)的算力中,超過 50% 基于 AWS Graviton 所構(gòu)建[4]。
此外,根據(jù)咨詢公司 Signal65 近期的分析報告顯示,基于 Arm Neoverse 平臺的 AWS Graviton4 芯片,不僅在性價比方面領(lǐng)先業(yè)界,更在企業(yè)級工作負載的整體性能上遠超 AMD 和英特爾推出的同類 x86 芯片。例如,Signal65 的基準(zhǔn)測試結(jié)果表明,Graviton4 的大語言模型 (LLM) 推理性能比 AMD 同類產(chǎn)品高 168%,性價比高 220%;同時網(wǎng)絡(luò)吞吐量比英特爾同類產(chǎn)品高出 53%,機器學(xué)習(xí) (ML) 訓(xùn)練速度快于 34%。這些數(shù)據(jù)充分印證了 Arm 在 AI 和通用計算任務(wù)方面的顯著架構(gòu)優(yōu)勢。
從云端到邊緣側(cè),AI 亟需新型計算平臺
AI 正在突破數(shù)據(jù)中心的邊界,向更廣闊的應(yīng)用場景延伸。如今,無論是智能手機、個人電腦 (PC) 還是物聯(lián)網(wǎng)設(shè)備——小至低功耗傳感器,大到高性能工業(yè)應(yīng)用——都需要端側(cè)生成式 AI 來重塑用戶體驗。
在此趨勢下,Arm 同樣獨具優(yōu)勢。面向消費電子設(shè)備的全新Arm Lumex 計算子系統(tǒng) (CSS) 平臺,可支持智能助手、語音翻譯和個性化服務(wù)等實時端側(cè) AI 應(yīng)用場景,而搭載 SME2 技術(shù)的全新 Arm CPU則可實現(xiàn)高達 5 倍的 AI 性能提升。同時,全球首個基于 Armv9 架構(gòu)的邊緣 AI 計算平臺,專為物聯(lián)網(wǎng)應(yīng)用中的邊緣 AI 工作負載優(yōu)化,可支持參數(shù)規(guī)模超 10 億的端側(cè) AI 模型運行。
Arm 正在驅(qū)動一場從云端到邊緣端的變革,憑借其本身的架構(gòu)優(yōu)勢賦能全場景的規(guī)?;渴?。
軟件鑄就差異化優(yōu)勢,Arm 工具為 AI 時代賦能
在 AI 領(lǐng)域,硬件構(gòu)筑底層基礎(chǔ),而軟件決定用戶體驗。隨著 AI 工作負載日益復(fù)雜、應(yīng)用場景不斷拓展,開發(fā)者亟需一個能夠緊跟創(chuàng)新步伐的生態(tài)系統(tǒng)。而這正是 Arm 的優(yōu)勢所在:一套統(tǒng)一的架構(gòu),搭配從云端到邊緣端、強大且經(jīng)過優(yōu)化的軟件生態(tài)系統(tǒng)。
多達 2,200 萬規(guī)模的 Arm 開發(fā)者群體將受益于這一協(xié)同生態(tài)系統(tǒng),無論是數(shù)據(jù)中心的大規(guī)模模型訓(xùn)練,還是邊緣側(cè)的實時推理,相同的代碼、工具與框架均可在不同設(shè)備上無縫運行。這種架構(gòu)一致性顯著加速開發(fā)進程,簡化優(yōu)化路徑,實現(xiàn)更廣泛的部署落地,避免冗余工程投入。
PyTorch ExecuTorch、TensorFlow Lite 和MediaPipe等主要框架,現(xiàn)已通過 Arm KleidiAI 與基于 Arm 架構(gòu)的系統(tǒng)實現(xiàn)深度集成和優(yōu)化。Arm KleidiAI 是輕量級的開源優(yōu)化層,可激活基于 Arm 架構(gòu)進行優(yōu)化的底層微內(nèi)核。如此一來,開發(fā)者無需修改代碼即可自動獲取性能增益——從超大規(guī)模云平臺到智能手機、嵌入式設(shè)備,全場景適用。
例如,在 Graviton4 上,KleidiAI 的集成使 Llama 3 的詞元 (token) 首次響應(yīng)時間較基準(zhǔn)提升了 2.5 倍;而在移動端,基于 MediaPipe 的方案在 Gemma 2B 等模型上,也實現(xiàn)了高達 30% 的性能提升。無論是管理 AI 工廠,還是在邊緣側(cè)部署聊天機器人,開發(fā)者均可獲得可預(yù)測、高性能和高能效的軟件體驗。
這種無縫、具備系統(tǒng)感知能力的軟件賦能方式,正是 Arm 平臺的核心差異化所在。開發(fā)者無需應(yīng)對碎片化技術(shù)棧的困擾,也無需重復(fù)開展后端重構(gòu)工作;相反,他們能夠直接借助這套軟硬件協(xié)同設(shè)計的生態(tài)系統(tǒng),實現(xiàn) AI 的性能和效率優(yōu)勢。
在“每瓦性能”至關(guān)重要的 AI 時代,Arm 的軟件生態(tài)系統(tǒng)不僅緊跟行業(yè)需求,更能貼合開發(fā)者的實際場景,加速其創(chuàng)新進程。
AI 規(guī)?;l(fā)展的核心支柱
從萬億美元級的數(shù)據(jù)中心,到下一代智能手機與智能車載系統(tǒng),AI 正在以前所未有的規(guī)模快速發(fā)展。作為貫通這些場景的橋梁,Arm 架構(gòu)正發(fā)揮著關(guān)鍵作用。
憑借超大規(guī)模云服務(wù)提供商的廣泛部署、靈活的邊緣計算能力,以及充滿活力、AI 就緒的軟件生態(tài)系統(tǒng),Arm 已成為當(dāng)下和未來 AI 基礎(chǔ)設(shè)施的核心支柱。
-
ARM
+關(guān)注
關(guān)注
135文章
9462瀏覽量
386427 -
cpu
+關(guān)注
關(guān)注
68文章
11192瀏覽量
221679 -
AI
+關(guān)注
關(guān)注
88文章
37125瀏覽量
291178
原文標(biāo)題:從云端到邊緣,Arm 為何是擴展 AI 技術(shù)棧的理想之選
文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
AI應(yīng)用創(chuàng)新與全棧技術(shù)融合分論壇即將召開
NVIDIA全棧加速代理式AI應(yīng)用落地
芯茂微 LP2179B:小家電電源的理想之選
MacBook擴展塢怎么選?
愛普生FC1610AN5G手機中替代傳統(tǒng)晶振的理想之選
Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)
Arm Kleidi擴展到汽車市場 Arm Kleidi實現(xiàn)性能自動優(yōu)化
Arm推出GitHub Copilot新擴展程序,助力快速遷移至Arm架構(gòu)服務(wù)器
Arm推出GitHub Copilot新擴展程序
理想汽車申請“理想AI Talk”商標(biāo)
Arm平臺引領(lǐng)AI云計算革新
TNC接頭:為什么是射頻連接的穩(wěn)固之選

Arm為何是擴展AI技術(shù)棧的理想之選
評論