電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))要說跟上AI時代的進(jìn)程,RISC-V相對其他架構(gòu)來說也一點(diǎn)不慢。從各個初創(chuàng)公司的產(chǎn)品或者路線圖也可以看出,AI計(jì)算是他們最為重視的一環(huán),甚至重要性要超過通用計(jì)算。畢竟這是RISC-V可以后發(fā)制人的一大領(lǐng)域,甚至不會有太多架構(gòu)設(shè)計(jì)上的歷史桎梏。為此,不少廠商也都從AI出發(fā),設(shè)計(jì)出了定位不一的RISC-V產(chǎn)品。
高性能AI計(jì)算
Esperanto作為為數(shù)不多的幾家沖擊高性能AI計(jì)算的公司,如今也開始察覺到了AI市場的風(fēng)向變動,于是決定將重心從過去的推薦加速改為大語言模型和HPC。Esperanto走進(jìn)大眾視野的方式相當(dāng)特別,他們的第一款產(chǎn)品就是千核RISC-V芯片ET-SOC-1。
ET-SOC-1基于臺積電7nm工藝打造,集成了1088個64位ET-Minion RISC-V核心和4個ET-Maxion核心,提供了超高的單線程性能。雖說ET-SOC-1對ML進(jìn)行了優(yōu)化,是一個理想的推理芯片選擇,但Esperanto為其打造的軟件棧主要還是以推薦場景打造。直到他們近期推出了新的AI軟件開發(fā)工具包,并專門針對LLM進(jìn)行了優(yōu)化,并展示了運(yùn)行300億參數(shù)的OPT模型。
據(jù)Esperanto表示,目前他們的生成式AI應(yīng)用已經(jīng)可以運(yùn)行最新的LLM和圖片生成模型,比如LLaMA2、Vicuma和Stable Diffusion等等。不過在千變?nèi)f化的AI市場下,單個模型往往難以維持長時間的熱度,所以Esperanto的計(jì)劃是持續(xù)跟進(jìn)最流行的開源模型。
IP廠商也不例外,除了SiFive、平頭哥、Tenstorrent等已經(jīng)推出高性能AI IP或?qū)ΜF(xiàn)有產(chǎn)品線進(jìn)行AI升級的公司外,Semidynamics也發(fā)布了最新完全可定制的矢量單元,用于配合其Atrevido CPU核心。該矢量單元有多個矢量內(nèi)核構(gòu)成,每個內(nèi)核都有算數(shù)單元,可以執(zhí)行加減、乘加等數(shù)字與邏輯運(yùn)算。
這個矢量單元的最大特色在于全定制性,與其他廠商只有部分配置選項(xiàng)不同,為了應(yīng)對未來各種AI模型的精度要求,Semidynamics的矢量單元在定制化后,可以支持FP64、FP32、FP16、BF16、INT64、INT32、INT16或INT8的數(shù)據(jù)類型。
盡管ASIC、GPU和FPGA常被視為最合適進(jìn)行AI計(jì)算的三大硬件,但在如今的市場環(huán)境下,無論是服務(wù)器還是消費(fèi)終端,CPU也都需要一些可觀的AI計(jì)算特性。所以開源社區(qū)推出了LLaMA.cpp這一模型,該模型是基于Meta的LLaMA模型打造而成,無需PyTorch等庫的外部依賴,僅靠C/C++編譯即可生成執(zhí)行文件,且無需GPU,只靠CPU就可以運(yùn)行。
曠視科技參考并借鑒了LLaMA.cpp項(xiàng)目,推出了InferLLM這一輕量級的LLM模型推理管家,且除了常見的Arm、x86和CUDA外,他們也針對RISCV-Vector做了專門的優(yōu)化,目前已經(jīng)可以部署在群芯閃耀科技發(fā)布的Milk-V Pioneer RISC-V主板上,而該主板用到的64位CPU正是算能科技的算豐SG2042。
算豐SG2042采用了單芯片64個RISC-V內(nèi)核的設(shè)計(jì),支持雙路CPU互聯(lián)、4通道DDR4和32通道PCIe 4.0,典型功耗為120W,可以說是典型的服務(wù)器芯片設(shè)計(jì)。但很明顯,即便是高性能CPU,在一些非重型AI負(fù)載下,也能有可觀的表現(xiàn)。
低功耗的邊緣端
盡管云端的生成式AI已經(jīng)變得越來越普及,企業(yè)在花了大成本購置硬件資源后也能在本地運(yùn)行更多的AI計(jì)算負(fù)載降低效率提高安全性。但對于消費(fèi)者而言,似乎真正部署在端側(cè)的生成式AI才更加值得關(guān)注,在實(shí)用性上也剛強(qiáng)一些,而且不只是手機(jī)這種使用高端芯片的產(chǎn)品,不少IoT產(chǎn)品也在規(guī)劃著如何接入生成式AI,因此大算力的邊緣AI芯片就成了首選。
云天勵飛作為國內(nèi)首批闖入AI賽道的廠商,此前一直在主攻AI算法領(lǐng)域,但單靠算法的泛化能力相對較弱,于是云天勵飛也就開始加入芯片設(shè)計(jì)賽道,比如2018年推出的DeepEye 1000等。
而在今年舉辦的第三屆滴水湖中國RISC-V論壇上,云天勵飛展示了去年成功流片,如今已經(jīng)接近量產(chǎn)的邊緣AP級SoC Deep Edge10V。從芯片結(jié)構(gòu)上看,Edge10V采用了Chiplet設(shè)計(jì),滿足國產(chǎn)Chiplet UCIE標(biāo)準(zhǔn)。CPU部分采用了1.2GHz的雙核C920,還集成了一個500MHz的NNP400T NPU,算力高達(dá)12TOPS@INT8。在視頻處理能力上,Edge10V也配備了支持H265/H264視頻編解碼的多媒體子系統(tǒng)。
另外值得一提的是,Edge10V僅僅是Edge10系列中的一環(huán),由于Chiplet設(shè)計(jì)支持多die擴(kuò)展,所以也可以在Edge10Max這一產(chǎn)品上實(shí)現(xiàn)高達(dá)64Tops的算力。云天勵飛芯片BD總監(jiān)張福林表示,Edge10V主要應(yīng)用于邊緣計(jì)算,而Edge10Max則應(yīng)用于邊緣CV大模型,比如Pytorch、Caffe、Tensorflow等框架下的模型。從應(yīng)用上來看,Edge10V的主要應(yīng)用場景還是云天勵飛擅長的機(jī)器視覺領(lǐng)域,比如機(jī)器人、智能安防之類的邊緣端。
本屆滴水湖論壇上,普林芯馳也展示了他們的智能離線語音交互MCU SPV20系列芯片。該系列的特色在于,除了基于SiFive E21RISC-V核心打造的CPU外,還有基于CEVA TL420核心的DSP與集成普林芯馳自有算法的NPU。該NPU支持CNN、DS-CNN等深度壓縮語音識別模型,可用于家電的智能語音控制。
嘉楠科技的第二代AI推理芯片,勘智K510,同樣是針對邊緣側(cè)AI開發(fā)的產(chǎn)品。這一芯片采用了雙核RISC-V 64位CPU,主頻最高達(dá)到800MHz。勘智K510支持INT8和BF16雙數(shù)據(jù)類型,且具備2.5TFLOPS的算力,還支持Tensorflow、Pytorch和ONNX等多種框架的算子庫。
用生成式AI設(shè)計(jì)RISC-V芯片
隨著生成式AI在代碼生成上日益精進(jìn)的表現(xiàn),如今利用生成式AI來設(shè)計(jì)芯片也成了可能。近日,開源硬件平臺Efabless就舉辦了一屆生成式開源芯片設(shè)計(jì)挑戰(zhàn)賽,其中清華RIOS Lab團(tuán)隊(duì)的RISC-V芯片,CyberRio獲得了亞軍。
據(jù)其Github頁面所示,該芯片的大部分Verilog代碼都是使用GPT-4生成的,從而基于一個經(jīng)典的5級流水線設(shè)計(jì)出了CyberRio。CyberRio也在Skywater提供的130nm的工藝平臺上得到了流片驗(yàn)證,這也意味著全球第一個由LLM完成主要涉及的CPU被成功制造出來。
不過開放團(tuán)隊(duì)也表示,GPT-4對硬件語言的理解并不算完整,無論是對設(shè)計(jì)語言本身的理解,還是對握手或并行處理等設(shè)計(jì)概念。這很可能是GPT-4訓(xùn)練過程本身的缺陷,不過開發(fā)團(tuán)隊(duì)也提出了Langchain之類的替代方案或許可以解決GPT-4信息缺失造成的問題。
寫在最后
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報(bào)投訴
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
30309瀏覽量
218383 -
控制
+關(guān)注
關(guān)注
5文章
1030瀏覽量
124918 -
AI
+關(guān)注
關(guān)注
88文章
37210瀏覽量
291751
發(fā)布評論請先 登錄
相關(guān)推薦
熱點(diǎn)推薦
大象機(jī)器人攜手進(jìn)迭時空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品
、lightrack)等模型。倉庫將持續(xù)更新支持最前沿的模型應(yīng)用,滿足各種復(fù)雜 AI任務(wù)。
AI智慧零售套件
通過CPU融合AI的創(chuàng)新設(shè)計(jì),
發(fā)表于 04-25 17:59
FPGA與RISC-V淺談
全球半導(dǎo)體產(chǎn)業(yè)競爭格局正在經(jīng)歷深刻變革,物聯(lián)網(wǎng)、邊緣計(jì)算等新興技術(shù)的蓬勃發(fā)展,讓RISC-V憑借其開源、精簡以及模塊化的靈活優(yōu)勢,日益成為業(yè)界焦點(diǎn),也為全球半導(dǎo)體產(chǎn)業(yè)注入新的活力與挑戰(zhàn)
發(fā)表于 04-11 13:53
?499次閱讀
首款RISC-V架構(gòu)服務(wù)器,助力行業(yè)精準(zhǔn)適配AI場景
RISC-V融合服務(wù)器RS-SRM120為2U雙路異構(gòu)服務(wù)器產(chǎn)品,搭載雙RISC-V指令集64核處理器SG2042,通過高效的雙芯互聯(lián)架構(gòu),提供強(qiáng)大的智算能力。支持CV模型、LLM等多種深度學(xué)習(xí)
關(guān)于RISC-V芯片的應(yīng)用學(xué)習(xí)總結(jié)
、智能網(wǎng)關(guān)等物聯(lián)網(wǎng)設(shè)備。此外,RISC-V的模塊化設(shè)計(jì)使得開發(fā)者可以根據(jù)具體需求靈活剪裁指令集,進(jìn)一步優(yōu)化功耗和性能。
在嵌入式系統(tǒng)方面,RISC-V芯片同樣表現(xiàn)出色。嵌入
發(fā)表于 01-29 08:38
新的一年 RISC-V前景如何呢?
1 月 7 日消息,RISC-V 領(lǐng)軍企業(yè) SiFive 成立中國分公司,中文名稱定為“芯伍科技”。
1 月 14 日消息,專注傳統(tǒng)與 AI 業(yè)務(wù),Imagination 放棄 RISC-V CPU 開發(fā)。
新的
發(fā)表于 01-24 16:19
RISC-V MCU技術(shù)
的研究團(tuán)隊(duì)弄出來的,目的就是想搞個新的、開放的指令集架構(gòu),能跟上現(xiàn)代計(jì)算的需要。到了2015年,專門成立了個RISC-V基金會,讓這個架構(gòu)更標(biāo)準(zhǔn),也更好地推廣開了。這幾年啊,這個RISC-V
發(fā)表于 01-19 11:50
進(jìn)迭時空亮相RISC-V產(chǎn)業(yè)發(fā)展大會:新AI CPU引領(lǐng)大模型時代
12月28日,以“發(fā)揮標(biāo)準(zhǔn)優(yōu)勢,繁榮產(chǎn)業(yè)發(fā)展”為主題的RISC-V產(chǎn)業(yè)發(fā)展大會在北京亦莊經(jīng)開區(qū)通明湖會展中心舉行。作為基于新一代RISC-V架構(gòu)的計(jì)算生態(tài)企業(yè),進(jìn)迭時空受邀出席此次大會。進(jìn)迭時空
RISC-V架構(gòu)及MRS開發(fā)環(huán)境回顧
MounRiver Studio(MRS)是一款針對RISC-V/ARM雙核MCU的嵌入式集成開發(fā)環(huán)境,由MounRiver團(tuán)隊(duì)基于GNU Eclipse深度定制而成,提供了包括定制版GCC、宏
發(fā)表于 12-16 23:08
如何使用 RISC-V 進(jìn)行嵌入式開發(fā)
RISC-V是一種開源的指令集架構(gòu)(ISA),它允許任何人設(shè)計(jì)、制造和銷售基于RISC-V的處理器,這為嵌入式開發(fā)提供了極大的靈活性和創(chuàng)新空間。以下是使用
Rivos全新產(chǎn)品采用Andes晶心科技NX45 RISC-V處理器
專注于加速數(shù)據(jù)分析和生成式AI工作負(fù)載的RISC-V主要會員公司Rivos與32/64位RISC-V處理器內(nèi)核的領(lǐng)先供貨商、
關(guān)于RISC-V學(xué)習(xí)路線圖推薦
向量指令集、密碼指令集等)進(jìn)行硬件加速和優(yōu)化。
嵌入式系統(tǒng)開發(fā) :
掌握RISC-V在嵌入式系統(tǒng)中的應(yīng)用,如物聯(lián)網(wǎng)設(shè)備、智能家居等。目前AI、大模型
發(fā)表于 11-30 15:21
《RISC-V能否復(fù)制Linux 的成功?》
的產(chǎn)品,Linux成為開源軟件發(fā)展的基石。
這種成功是否可以復(fù)制到開源硬件上呢?RISC-V這樣的指令集架構(gòu)(ISA)是否也可以像Linux內(nèi)核作為開源軟件的基礎(chǔ)一樣,成為開源硬件發(fā)展的基石呢?
這個
發(fā)表于 11-26 20:20
什么是RISC-V?以及RISC-V和ARM、X86的區(qū)別
前言
RISC-V是基于RISC精簡指令集架構(gòu)開發(fā)的一個開放式指令集架構(gòu),它是由加州大學(xué)伯克利分校的計(jì)算機(jī)科學(xué)教授Krste Asanovic(克里斯蒂安·阿薩諾維奇)領(lǐng)導(dǎo)的團(tuán)隊(duì)開發(fā),
發(fā)表于 11-16 16:14
RISC-V,即將進(jìn)入應(yīng)用的爆發(fā)期
RISC-V是一種開放標(biāo)準(zhǔn)指令集架構(gòu) (ISA),最初由加州大學(xué)伯克利分校的研究人員于2010年開發(fā)。業(yè)界稱,這種開源特性為芯片設(shè)計(jì)者提供了極大的靈活性,可以根據(jù)具體需求定制AI加速器。
而A
發(fā)表于 10-31 16:06
RISC-V在AI領(lǐng)域的發(fā)展前景怎么樣?
隨著人工智能的不斷發(fā)展,現(xiàn)在的視覺機(jī)器人,無人駕駛等智能產(chǎn)品的不斷更新迭代,發(fā)現(xiàn)ARM占用很大的市場份額,推出的ARM Cortex M85性能也是杠杠的,不知道RISC-V在AI領(lǐng)域有哪些參考方案?
發(fā)表于 10-25 19:13

大模型與生成式AI,RISC-V也想分一杯羹
評論