燧原科技于7月7日在上海發(fā)布第二代人工智能訓(xùn)練產(chǎn)品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”訓(xùn)練加速卡和“云燧T21”訓(xùn)練OAM模組,全面升級的“馭算TopsRider”軟件平臺以及全新的“云燧集群”,成為國內(nèi)首家發(fā)布第二代人工智能訓(xùn)練產(chǎn)品組合的公司。
這是繼2019年12年發(fā)布第一代訓(xùn)練芯片,邃思1.0及云燧T10/T11,2020年12月發(fā)布第一代推理產(chǎn)品云燧i10之后,燧原科技的又一力作。
?
燧原科技CEO趙立東(左)與 燧原科技COO張亞林(右)共同發(fā)布“云燧T20”訓(xùn)練加速卡和“邃思2.0”芯片
燧原產(chǎn)品的商業(yè)落地場景包括,液冷超大規(guī)模集群,加速視頻內(nèi)容生產(chǎn);強化學(xué)習(xí)使能游戲AI,改變數(shù)字娛樂的方式;強大的視覺能力,保駕護航金融安全;邊緣部署融合多數(shù)據(jù),構(gòu)建新型智能化交通;高效推理算力集群,建設(shè)園區(qū)AI視頻云。
隨著第二代產(chǎn)品的發(fā)布,將加速這些場景的商業(yè)化落地。
云燧智算集群
隨著自然語言處理、強化學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、多模態(tài)和認(rèn)知模型等的發(fā)展,在知識圖譜、智慧大腦、游戲引擎、融合媒體和通用人工智能的應(yīng)用上,綠色一體化的超級智算集群是關(guān)鍵趨勢。
燧原發(fā)布CloudBlazer Matrix云燧智算集群,它代表世界最高水平,最高8192Enflame CloudBlazer訓(xùn)練卡和DTU芯片,最高1.3E(130000T)單精度智能算力集群。液冷/每一體化PUE降到1.15以下。最高160T單精度張量訓(xùn)練卡以及80%的線性度。

這是為智能計算和新基建算力而推出的集群化產(chǎn)品。CloudBlazer Matrix 2.0將包括邃思DTU2.0,云燧CloudBlazer T20/T21板卡,和馭算軟件Topsrider2.0。
打造中國最大的計算芯片,邃思DTU2.0性能強悍
邃思DTU2.0是中國最大的計算芯片,突破封裝的極限。DTU2.0采用2.5D高級封裝,整合9顆芯片,其中1顆DTU芯片、4顆三星HBM2E等構(gòu)成先進封裝。封裝尺寸為57.5mm*57.5mm。
?
DTU2.0的計算能力,單精度FP32達40FLOPS,支持單精度張量TF32,達160T FLOPS。TF32格式被認(rèn)為是在數(shù)據(jù)中心最先進的數(shù)據(jù)模式。
此外,DTU2.0植入完全可編程的數(shù)據(jù)流,軟件指令驅(qū)動的傳輸和數(shù)據(jù)計算,標(biāo)量、向量和張量的高效數(shù)據(jù)處理,和多地址廣播等。
存儲方面,邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64GB內(nèi)存,帶寬達1.8TB/s,是中國第一個支持世界最先進存儲HBM2E和單芯片64 GB內(nèi)存的產(chǎn)品。

6個LARE卡間互聯(lián)端口,每一個端口雙向50GB/s,總集群互聯(lián)帶寬300GB/s。
云燧T21\T20訓(xùn)練產(chǎn)品,分別為OAM標(biāo)準(zhǔn)模組和全高全長PCIE板卡。

以Benchmark數(shù)據(jù)來看,云燧T20與友商次旗艦相比,在圖像識別/分類、NLP、目標(biāo)檢測、圖像分割、推薦等均有明顯優(yōu)勢。

馭算Topsrider2.0架構(gòu)
馭算TopsRider是燧原科技自主知識產(chǎn)權(quán)的計算及編程平臺,通過軟硬件協(xié)同架構(gòu)設(shè)計,充分發(fā)揮邃思2.0的性能;基于算子泛化技術(shù)及圖優(yōu)化策略,支持主流深度學(xué)習(xí)框架下的各類模型訓(xùn)練;利用Horovod分布式訓(xùn)練框架與GCU-LARE互聯(lián)技術(shù)相互配合,為超大規(guī)模集群的高效運行提供解決方案。開放升級的編程模型和可擴展的算子接口,為客戶模型的優(yōu)化提供了自定義的開發(fā)能力。

云端訓(xùn)練計算產(chǎn)品路線圖
訓(xùn)練產(chǎn)品方面,燧原計劃第三代T30/T31產(chǎn)品將于2023年發(fā)布,每瓦的能效將提升14倍。同時升級到Matrix3.0。

推理計算方面,2021年下半年將發(fā)布i20推理芯片,以及2023年將發(fā)布i30。其每瓦能效將分別提升4倍和16倍。

另外,在Topsrider2.x的基礎(chǔ)上,還將進一步升級至Topsrider3.x,致力于泛AI生態(tài)。
生態(tài)建設(shè)
AI生態(tài)也是跨行業(yè)的、復(fù)雜的生態(tài)競爭。燧原推出的異構(gòu)計算生態(tài)燎原計劃,將聚集生態(tài)的三大特征:原始創(chuàng)新、標(biāo)準(zhǔn)化和生態(tài)共建。
燎原計劃將建立繁榮開放的開發(fā)者生態(tài),健康互利的產(chǎn)業(yè)生態(tài),持續(xù)創(chuàng)新的科研生態(tài)。打造以人工智能為起點構(gòu)建通用異構(gòu)計算生態(tài),構(gòu)建標(biāo)準(zhǔn)化的技術(shù)體系,共建完整生態(tài)服務(wù)數(shù)字中國。將涵蓋深度學(xué)習(xí)計算,通用異構(gòu)計算以及視覺計算。

趙立東表示,未來行業(yè)的發(fā)展趨勢表明,以芯片為核心的算力,是工業(yè)4.0兵家必爭之地。工業(yè)4.0時代,人工智能是關(guān)鍵動力。摩爾定律放緩,異構(gòu)計算加速,基于小芯片、封裝技術(shù),人工智能落地將改變互聯(lián)網(wǎng)重塑傳統(tǒng)行業(yè)。算力需示爆炸,算力成為人工智能技術(shù)發(fā)展的基礎(chǔ)。燧原科技要建立世界水平的本土化研發(fā)和工程化團隊,開發(fā)國產(chǎn)自主創(chuàng)新的核心技術(shù),布局云端AI+高端芯片雙賽道。我們?yōu)閿?shù)據(jù)中心打造最優(yōu)的云端AI產(chǎn)品,形成訓(xùn)練推理完整的閉環(huán)解決方案。
本文由電子發(fā)燒友原創(chuàng),作者黃晶晶,微信號kittyhjj,轉(zhuǎn)載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿發(fā)郵件到huangjingjing@elecfans.com。
這是繼2019年12年發(fā)布第一代訓(xùn)練芯片,邃思1.0及云燧T10/T11,2020年12月發(fā)布第一代推理產(chǎn)品云燧i10之后,燧原科技的又一力作。
?燧原科技CEO趙立東(左)與 燧原科技COO張亞林(右)共同發(fā)布“云燧T20”訓(xùn)練加速卡和“邃思2.0”芯片
燧原產(chǎn)品的商業(yè)落地場景包括,液冷超大規(guī)模集群,加速視頻內(nèi)容生產(chǎn);強化學(xué)習(xí)使能游戲AI,改變數(shù)字娛樂的方式;強大的視覺能力,保駕護航金融安全;邊緣部署融合多數(shù)據(jù),構(gòu)建新型智能化交通;高效推理算力集群,建設(shè)園區(qū)AI視頻云。
隨著第二代產(chǎn)品的發(fā)布,將加速這些場景的商業(yè)化落地。
云燧智算集群
隨著自然語言處理、強化學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、多模態(tài)和認(rèn)知模型等的發(fā)展,在知識圖譜、智慧大腦、游戲引擎、融合媒體和通用人工智能的應(yīng)用上,綠色一體化的超級智算集群是關(guān)鍵趨勢。
燧原發(fā)布CloudBlazer Matrix云燧智算集群,它代表世界最高水平,最高8192Enflame CloudBlazer訓(xùn)練卡和DTU芯片,最高1.3E(130000T)單精度智能算力集群。液冷/每一體化PUE降到1.15以下。最高160T單精度張量訓(xùn)練卡以及80%的線性度。

這是為智能計算和新基建算力而推出的集群化產(chǎn)品。CloudBlazer Matrix 2.0將包括邃思DTU2.0,云燧CloudBlazer T20/T21板卡,和馭算軟件Topsrider2.0。
打造中國最大的計算芯片,邃思DTU2.0性能強悍
邃思DTU2.0是中國最大的計算芯片,突破封裝的極限。DTU2.0采用2.5D高級封裝,整合9顆芯片,其中1顆DTU芯片、4顆三星HBM2E等構(gòu)成先進封裝。封裝尺寸為57.5mm*57.5mm。
?
燧原科技第二代通用人工智能訓(xùn)練芯片“邃思2.0”
DTU2.0的計算能力,單精度FP32達40FLOPS,支持單精度張量TF32,達160T FLOPS。TF32格式被認(rèn)為是在數(shù)據(jù)中心最先進的數(shù)據(jù)模式。
此外,DTU2.0植入完全可編程的數(shù)據(jù)流,軟件指令驅(qū)動的傳輸和數(shù)據(jù)計算,標(biāo)量、向量和張量的高效數(shù)據(jù)處理,和多地址廣播等。
存儲方面,邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64GB內(nèi)存,帶寬達1.8TB/s,是中國第一個支持世界最先進存儲HBM2E和單芯片64 GB內(nèi)存的產(chǎn)品。

6個LARE卡間互聯(lián)端口,每一個端口雙向50GB/s,總集群互聯(lián)帶寬300GB/s。
云燧T21\T20訓(xùn)練產(chǎn)品,分別為OAM標(biāo)準(zhǔn)模組和全高全長PCIE板卡。

以Benchmark數(shù)據(jù)來看,云燧T20與友商次旗艦相比,在圖像識別/分類、NLP、目標(biāo)檢測、圖像分割、推薦等均有明顯優(yōu)勢。

馭算Topsrider2.0架構(gòu)
馭算TopsRider是燧原科技自主知識產(chǎn)權(quán)的計算及編程平臺,通過軟硬件協(xié)同架構(gòu)設(shè)計,充分發(fā)揮邃思2.0的性能;基于算子泛化技術(shù)及圖優(yōu)化策略,支持主流深度學(xué)習(xí)框架下的各類模型訓(xùn)練;利用Horovod分布式訓(xùn)練框架與GCU-LARE互聯(lián)技術(shù)相互配合,為超大規(guī)模集群的高效運行提供解決方案。開放升級的編程模型和可擴展的算子接口,為客戶模型的優(yōu)化提供了自定義的開發(fā)能力。

云端訓(xùn)練計算產(chǎn)品路線圖
訓(xùn)練產(chǎn)品方面,燧原計劃第三代T30/T31產(chǎn)品將于2023年發(fā)布,每瓦的能效將提升14倍。同時升級到Matrix3.0。

推理計算方面,2021年下半年將發(fā)布i20推理芯片,以及2023年將發(fā)布i30。其每瓦能效將分別提升4倍和16倍。

另外,在Topsrider2.x的基礎(chǔ)上,還將進一步升級至Topsrider3.x,致力于泛AI生態(tài)。
生態(tài)建設(shè)
AI生態(tài)也是跨行業(yè)的、復(fù)雜的生態(tài)競爭。燧原推出的異構(gòu)計算生態(tài)燎原計劃,將聚集生態(tài)的三大特征:原始創(chuàng)新、標(biāo)準(zhǔn)化和生態(tài)共建。
燎原計劃將建立繁榮開放的開發(fā)者生態(tài),健康互利的產(chǎn)業(yè)生態(tài),持續(xù)創(chuàng)新的科研生態(tài)。打造以人工智能為起點構(gòu)建通用異構(gòu)計算生態(tài),構(gòu)建標(biāo)準(zhǔn)化的技術(shù)體系,共建完整生態(tài)服務(wù)數(shù)字中國。將涵蓋深度學(xué)習(xí)計算,通用異構(gòu)計算以及視覺計算。

趙立東表示,未來行業(yè)的發(fā)展趨勢表明,以芯片為核心的算力,是工業(yè)4.0兵家必爭之地。工業(yè)4.0時代,人工智能是關(guān)鍵動力。摩爾定律放緩,異構(gòu)計算加速,基于小芯片、封裝技術(shù),人工智能落地將改變互聯(lián)網(wǎng)重塑傳統(tǒng)行業(yè)。算力需示爆炸,算力成為人工智能技術(shù)發(fā)展的基礎(chǔ)。燧原科技要建立世界水平的本土化研發(fā)和工程化團隊,開發(fā)國產(chǎn)自主創(chuàng)新的核心技術(shù),布局云端AI+高端芯片雙賽道。我們?yōu)閿?shù)據(jù)中心打造最優(yōu)的云端AI產(chǎn)品,形成訓(xùn)練推理完整的閉環(huán)解決方案。
本文由電子發(fā)燒友原創(chuàng),作者黃晶晶,微信號kittyhjj,轉(zhuǎn)載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿發(fā)郵件到huangjingjing@elecfans.com。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
AI
+關(guān)注
關(guān)注
88文章
37210瀏覽量
291818 -
燧原科技
+關(guān)注
關(guān)注
0文章
147瀏覽量
9498
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
全球首款“可逆計算”冰河芯片誕生,相比普通芯片節(jié)能30%
近日,國內(nèi)芯片研發(fā)團隊正式宣布全球首款基于可逆計算架構(gòu)的 “冰河芯片” 成功誕生,經(jīng)第三方權(quán)威機構(gòu)測試,該芯片相比同性能傳統(tǒng)
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片
、分布式群體智能
1)物聯(lián)網(wǎng)AGI系統(tǒng)
優(yōu)勢:
組成部分:
2)分布式AI訓(xùn)練
7、發(fā)展重點:基于強化學(xué)習(xí)的后訓(xùn)練與推理
8、超越大模型:神經(jīng)符號計算
三、AGI
發(fā)表于 09-18 15:31
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+神經(jīng)形態(tài)計算、類腦芯片
AI芯片不僅包括深度學(xué)細(xì)AI加速器,還有另外一個主要列別:類腦芯片。類腦芯片是模擬人腦神經(jīng)網(wǎng)絡(luò)架構(gòu)的芯片
發(fā)表于 09-17 16:43
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力
持續(xù)發(fā)展體現(xiàn)在:
1、收益遞減
大模型的基礎(chǔ)的需要極大的算力,這首先源于昂貴的高性能AI芯片,然后是寶貴的電力、水等與環(huán)境相關(guān)的資源。
收益遞減體現(xiàn)在:
①模型大小
②訓(xùn)練數(shù)據(jù)量
③訓(xùn)練
發(fā)表于 09-14 14:04
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)
算法
5.2加速矩陣乘法的芯片架構(gòu)
①新的矩陣乘法器架構(gòu)
②基于RISC-V的矩陣乘法擴展指令集
③用信息論的思想來減少AI推理計算量
三、用于邊緣側(cè)訓(xùn)練或推理的
發(fā)表于 09-12 17:30
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)
②Transformer引擎③NVLink Switch系統(tǒng)④機密計算⑤HBM
FPGA:
架構(gòu)的主要特點:可重構(gòu)邏輯和路由,可以快速實現(xiàn)各種不同形式的神經(jīng)網(wǎng)絡(luò)加速。
ASIC:
介紹了幾種ASIC AI芯片
發(fā)表于 09-12 16:07
AI 芯片浪潮下,職場晉升新契機?
、新架構(gòu)不斷涌現(xiàn)。能夠在工作中提出創(chuàng)新性的解決方案,推動 AI 芯片性能、功耗、成本等關(guān)鍵指標(biāo)的優(yōu)化,將極大提升在職稱評審中的競爭力。例如,在芯片設(shè)計中引入新的計算范式,如存算一體技術(shù)
發(fā)表于 08-19 08:58
今日看點丨兩家國產(chǎn)頭部廠商發(fā)布新一代AI芯片 ;臺積電在美先進封裝布局啟動
? ? H20重返中國在即,兩家國產(chǎn)頭部廠商發(fā)布新一代AI芯片 ? 日前,燧原科技和沐曦這兩家頭部國產(chǎn)A
發(fā)表于 07-28 10:41
?2046次閱讀
AI芯片:加速人工智能計算的專用硬件引擎
人工智能(AI)的快速發(fā)展離不開高性能計算硬件的支持,而傳統(tǒng)CPU由于架構(gòu)限制,難以高效處理AI任務(wù)中的大規(guī)模并行計算需求。因此,專為AI優(yōu)
海思SD3403邊緣計算AI數(shù)據(jù)訓(xùn)練概述
AI數(shù)據(jù)訓(xùn)練:基于用戶特定應(yīng)用場景,用戶采集照片或視頻,通過AI數(shù)據(jù)訓(xùn)練工程師**(用戶公司****員工)** ,進行特征標(biāo)定后,將標(biāo)定好的訓(xùn)練
發(fā)表于 04-28 11:11
Deepseek海思SD3403邊緣計算AI產(chǎn)品系統(tǒng)
海思SD3403邊緣計算AI框架,提供了一套開放式AI訓(xùn)練產(chǎn)品工具包,解決客戶低成本AI系統(tǒng),針
發(fā)表于 04-28 11:05
燧原科技正式納入飛槳例行版本發(fā)布體系
燧原科技與飛槳經(jīng)過長時間的適配合作和持續(xù)集成(CI)建設(shè),對飛槳合?的每?行代碼都在燧原硬件上進?了驗證。如今,燧原正式納入飛槳例行版本發(fā)布體系。未來,
燧原科技亮相2024中國人工智能大會
近日,燧原科技創(chuàng)新研究院首席研究員石恒博士受邀在2024中國人工智能大會的“AI芯片與智能計算創(chuàng)新生態(tài)”專題論壇上,發(fā)表了《面向
亞馬遜轉(zhuǎn)向Trainium芯片,全力投入AI模型訓(xùn)練
,亞馬遜AWS推出了兩款芯片:Inferentia和Trainium。其中,Inferentia主要用于AI推理,而Trainium則專注于AI模型的訓(xùn)練。 然而,隨著生成式
Untether發(fā)布人工智能(AI)芯片
初創(chuàng)企業(yè)Untether發(fā)布了一款專為汽車、農(nóng)業(yè)裝備及極端環(huán)境AI應(yīng)用設(shè)計的人工智能(AI)芯片。
相較于英偉達和AMD的旗艦AI

中國最大的計算芯片誕生!燧原科技發(fā)布邃思2.0 AI訓(xùn)練芯片
評論