18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國(guó)際首創(chuàng)新突破!中國(guó)團(tuán)隊(duì)以存算一體排序架構(gòu)攻克智能硬件加速難題

半導(dǎo)體芯科技SiSC ? 來(lái)源:半導(dǎo)體芯科技SiSC ? 作者:半導(dǎo)體芯科技SiS ? 2025-07-02 16:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2025 年 6 月 25 日,北京大學(xué)團(tuán)隊(duì)在智能計(jì)算硬件方面取得領(lǐng)先突破,國(guó)際上首次實(shí)現(xiàn)了基于存算一體技術(shù)的高效排序硬件架構(gòu) (A fast and reconfigurable sort-in-memory system based on memristors),解決了傳統(tǒng)計(jì)算架構(gòu)面對(duì)復(fù)雜非線性排序問(wèn)題時(shí)計(jì)算效率低下的瓶頸問(wèn)題,在這一極難攻克的人工智能基礎(chǔ)算子加速領(lǐng)域形成優(yōu)勢(shì),將為具身智能、大語(yǔ)言模型、智能駕駛、智慧交通、智慧城市等人工智能應(yīng)用提供更高效算力支持。該成果由北京大學(xué)集成電路學(xué)院楊玉超教授、人工智能研究院陶耀宇研究員組成的團(tuán)隊(duì)完成,已在國(guó)際頂級(jí)學(xué)術(shù)期刊《自然?電子》上發(fā)表。

chaijie_default.png

chaijie_default.png

排序加速:存算一體架構(gòu)中難啃的 “硬骨頭”

排序,作為人工智能系統(tǒng)中最常用、最耗時(shí)的基礎(chǔ)操作之一,廣泛存在于自然語(yǔ)言處理、信息檢索、圖神經(jīng)網(wǎng)絡(luò)、智能決策等人工智能相關(guān)領(lǐng)域中。在傳統(tǒng)的馮?諾依曼計(jì)算架構(gòu)中,處理器與存儲(chǔ)器分離的特點(diǎn)導(dǎo)致數(shù)據(jù)被頻繁搬運(yùn),嚴(yán)重制約了計(jì)算速度和系統(tǒng)能效,因此將存儲(chǔ)與計(jì)算融合的 “存算一體” 架構(gòu)是突破硬件性能的必由之路。

例如在智能駕駛場(chǎng)景中,車(chē)輛在高速公路等簡(jiǎn)單環(huán)境中,只需對(duì)周邊幾臺(tái)車(chē)的行進(jìn)路線進(jìn)行排序就能判斷是否會(huì)對(duì)自身安全產(chǎn)生影響,整個(gè)耗時(shí)可控制在毫秒級(jí)別,但在復(fù)雜的城市環(huán)境中風(fēng)險(xiǎn)來(lái)自周邊的數(shù)百個(gè)乃至更多的各類(lèi)交通參與者,排序的復(fù)雜程度和硬件延遲大幅提高;再比如,在抖音、小紅書(shū)等平臺(tái)大的規(guī)模檢索與推薦系統(tǒng)中,用戶(hù)點(diǎn)擊、評(píng)分、相似度計(jì)算后,常需要對(duì)海量的候選內(nèi)容進(jìn)行快速排序,找出最相關(guān)項(xiàng),排序性能直接影響系統(tǒng)的響應(yīng)時(shí)間和可擴(kuò)展性;此外,在大語(yǔ)言模型訓(xùn)練、機(jī)器人路徑規(guī)劃、強(qiáng)化學(xué)習(xí)搜索等場(chǎng)景中,快速評(píng)估多個(gè)決策或行動(dòng)的優(yōu)劣并進(jìn)行排序,也是必不可少而又極為費(fèi)時(shí)的步驟。

然而,在傳統(tǒng)計(jì)算架構(gòu)下,大規(guī)模的非線性排序難以在端側(cè)或邊緣設(shè)備高效完成,這一過(guò)程消耗大量時(shí)間與功耗,極大制約了具身智能、智能駕駛等新興技術(shù)的發(fā)展與普及。 近年來(lái),“存算一體” 被認(rèn)為是突破傳統(tǒng)硬件架構(gòu)計(jì)算瓶頸的關(guān)鍵技術(shù),已經(jīng)在矩陣計(jì)算等規(guī)則性強(qiáng)的數(shù)值計(jì)算中取得顯著成果。然而由于排序存在邏輯復(fù)雜、操作非線性、數(shù)據(jù)訪問(wèn)不規(guī)則,缺乏通用、高效的硬件排序原語(yǔ)等諸多障礙,目前國(guó)際主流的存算一體架構(gòu)均無(wú)法解決大數(shù)據(jù)排序問(wèn)題,這一難題成為了制約下一代人工智能計(jì)算硬件發(fā)展的前沿焦點(diǎn)與核心卡點(diǎn)問(wèn)題。

科研團(tuán)隊(duì)圍繞 “讓數(shù)據(jù)就地排序” 的第一性原理目標(biāo),在存算一體架構(gòu)上攻克了多個(gè)核心技術(shù)難題,實(shí)現(xiàn)了排序速度與能效的數(shù)量級(jí)提升。主要突破包括:首先,開(kāi)發(fā)了一套基于新型存內(nèi)陣列結(jié)構(gòu)的高并行比較機(jī)制;第二,開(kāi)創(chuàng)性地引入了 “憶阻器陣列”,實(shí)現(xiàn)了低延遲、多通路的硬件級(jí)并行排序電路設(shè)計(jì);第三,在算子層面,優(yōu)化了面向人工智能任務(wù)的算法 - 架構(gòu)協(xié)同路徑,同時(shí)兼容現(xiàn)有矩陣計(jì)算;第四,完全自主設(shè)計(jì)的器件 - 電路 - 系統(tǒng)級(jí)技術(shù)棧整合。

在人工智能系統(tǒng)中,排序通常作為數(shù)據(jù)預(yù)處理或決策中間環(huán)節(jié)存在,一旦執(zhí)行效率不高,將成為整個(gè)系統(tǒng)的主要瓶頸。論文第一作者、北京大學(xué)集成電路學(xué)院博士生余連風(fēng)介紹道,“排序的核心是比較運(yùn)算,需要精準(zhǔn)地實(shí)現(xiàn)‘條件判斷 + 數(shù)據(jù)搬移’,在復(fù)雜的應(yīng)用場(chǎng)景中,要對(duì)不同因素的優(yōu)先級(jí)進(jìn)行比較,因此排序的邏輯非常復(fù)雜。一般排序過(guò)程需要構(gòu)建支持多級(jí)‘比較 - 選擇’的比較器單元,而傳統(tǒng)存算一體架構(gòu)主要面向‘乘加’、‘累加’等操作,難以支持這樣的復(fù)雜運(yùn)算,我們的工作成功解決了這一難題,設(shè)計(jì)了一種‘無(wú)比較器’的存算一體排序架構(gòu)?!?/span>

據(jù)實(shí)測(cè)結(jié)果顯示,該硬件方案在典型排序任務(wù)中提升速度超 15 倍,面積效率提升超過(guò) 32 倍,具備并行處理百萬(wàn)級(jí)數(shù)據(jù)元素排序任務(wù)的潛力,功耗僅為傳統(tǒng) CPUGPU 處理器的 1/10。在人工智能推理場(chǎng)景中,支持動(dòng)態(tài)稀疏度下的推理響應(yīng)速度可提升 70% 以上,特別適用于要求極高實(shí)時(shí)性的任務(wù)環(huán)境。論文通訊作者、北京大學(xué)人工智能研究院陶耀宇研究員說(shuō),“正因?yàn)榕判蛴?jì)算在人工智能中是高頻、通用、基礎(chǔ)且極難處理的一類(lèi)操作,這一難題的突破意味著存算一體從‘適合特定應(yīng)用’走向‘可支持更廣泛的通用計(jì)算’,為人工智能相關(guān)任務(wù)構(gòu)建了全鏈路的底層硬件架構(gòu)支持?!?/span>

提高計(jì)算效率,打造加速引擎

據(jù)悉,該技術(shù)具有廣泛的應(yīng)用前景,可用于智慧交通圖像排序系統(tǒng)、金融智能風(fēng)控評(píng)分引擎、邊緣監(jiān)控設(shè)備的目標(biāo)優(yōu)先識(shí)別模塊等場(chǎng)景。在測(cè)試中該技術(shù)展現(xiàn)出高速度與低功耗的顯著優(yōu)勢(shì)。例如,在智慧交通場(chǎng)景中,系統(tǒng)有望在毫秒級(jí)內(nèi)完成十萬(wàn)級(jí)事件優(yōu)先級(jí)評(píng)估,為超大規(guī)模交通決策、應(yīng)急響應(yīng)調(diào)度等提供高效的實(shí)時(shí)算力支持。存算一體超高性能排序加速架構(gòu)的成功突破,不僅是一次架構(gòu)創(chuàng)新的勝利,更是將科研成果轉(zhuǎn)化為實(shí)際應(yīng)用、服務(wù)國(guó)家重大戰(zhàn)略需求的重要行動(dòng)。

“根據(jù)初步測(cè)算,若該技術(shù)在智能終端、工業(yè)控制、數(shù)據(jù)中心等核心應(yīng)用場(chǎng)景中推廣,僅在邊緣 AI 芯片市場(chǎng)就可形成百億元級(jí)年產(chǎn)值潛力,大幅提升傳統(tǒng)算力系統(tǒng)的性能。北京大學(xué)科研團(tuán)隊(duì)正是瞄準(zhǔn)了‘算力’這個(gè)牛鼻子,聚焦‘存算一體’這一關(guān)鍵技術(shù)開(kāi)展高強(qiáng)度科研攻關(guān),實(shí)現(xiàn)了從器件到系統(tǒng)的全棧自主設(shè)計(jì)。這一成果不僅是技術(shù)層面的突破,更是攻克了存算一體化排序加速的‘硬骨頭’難題,在面向人工智能基礎(chǔ)操作的硬件加速領(lǐng)域?qū)崿F(xiàn)了突破,將為我國(guó)建設(shè)科技強(qiáng)國(guó),實(shí)現(xiàn)高水平科技自立自強(qiáng)注入新算力。

來(lái)源:半導(dǎo)體芯科技

【2025全年計(jì)劃】

隸屬于ACT雅時(shí)國(guó)際商訊旗下的兩本優(yōu)秀雜志:《化合物半導(dǎo)體》&《半導(dǎo)體芯科技》2025年研討會(huì)全年計(jì)劃已出。

線上線下,共謀行業(yè)發(fā)展、產(chǎn)業(yè)進(jìn)步!商機(jī)合作一覽無(wú)余,歡迎您點(diǎn)擊獲??!

https://www.compoundsemiconductorchina.net/seminar/

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 半導(dǎo)體
    +關(guān)注

    關(guān)注

    336

    文章

    29611

    瀏覽量

    253073
  • 智能硬件
    +關(guān)注

    關(guān)注

    205

    文章

    2393

    瀏覽量

    110767
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    后摩爾定律時(shí)代,3D-CIM+RISC-V打造國(guó)產(chǎn)一體新范式

    ,力、能效與帶寬瓶頸成為行業(yè)前行的關(guān)鍵阻礙,而美西方的技術(shù)禁運(yùn)更讓中國(guó)芯片產(chǎn)業(yè)面臨嚴(yán)峻挑戰(zhàn)。 ? 在這大背景下,
    發(fā)表于 09-17 09:31 ?4953次閱讀
    后摩爾定律時(shí)代,3D-CIM+RISC-V打造國(guó)產(chǎn)<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>新范式

    科技榮獲2025半導(dǎo)體市場(chǎng)創(chuàng)新表現(xiàn)獎(jiǎng)

    8月26日,第22屆深圳國(guó)際電子展(elexcon2025)現(xiàn)場(chǎng)正式揭曉聚焦行業(yè)技術(shù)突破與價(jià)值創(chuàng)造的“2025半導(dǎo)體市場(chǎng)創(chuàng)新表現(xiàn)獎(jiǎng)” ,知科技憑借WTM系列
    的頭像 發(fā)表于 08-28 17:09 ?1120次閱讀

    突破傳統(tǒng)桎梏,PPEC Workbench 開(kāi)啟電源智能化設(shè)計(jì)新路徑

    輸出等環(huán)節(jié)為工程師提供專(zhuān)業(yè)支持。 3、 高效協(xié)同:打破信息孤島 ■ 團(tuán)隊(duì)協(xié)同開(kāi)發(fā): 提供一體化的協(xié)同設(shè)計(jì)環(huán)境,支持團(tuán)隊(duì)成員協(xié)同開(kāi)發(fā),保障項(xiàng)目高效推進(jìn)。 ■ 選型采購(gòu)一體化: 平臺(tái)整合
    發(fā)表于 08-26 11:40

    在TR組件優(yōu)化與一體架構(gòu)中構(gòu)建技術(shù)話語(yǔ)權(quán)

    電磁兼容性、熱管理在內(nèi)的12項(xiàng)專(zhuān)業(yè)能力評(píng)估。\"這種評(píng)估體系,正是行業(yè)對(duì)技術(shù)人才的分級(jí)認(rèn)證標(biāo)準(zhǔn)。 1.2 異構(gòu)計(jì)算架構(gòu)下的能力矩陣 一體架構(gòu)
    發(fā)表于 08-26 10:40

    文看懂“一體

    今天這篇文章,我們來(lái)聊個(gè)最近幾年很火的概念——一體。為什么會(huì)提出“
    的頭像 發(fā)表于 08-18 12:15 ?688次閱讀
    <b class='flag-5'>一</b>文看懂“<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>”

    睿海光電領(lǐng)航AI光模塊:超快交付與全場(chǎng)景兼容賦能智時(shí)代——創(chuàng)新實(shí)力助力全球客戶(hù)構(gòu)建高效力底座

    到全場(chǎng)景兼容,從800G量產(chǎn)突破到1.6T前瞻布局,睿海光電始終客戶(hù)需求為導(dǎo)向,技術(shù)創(chuàng)新為引擎,為全球AI基礎(chǔ)設(shè)施建設(shè)提供堅(jiān)實(shí)底座。憑借智能
    發(fā)表于 08-13 19:03

    一體技術(shù)加持!后摩智能 160TOPS 端邊大模型AI芯片正式發(fā)布

    ,同步推出力擎?系列M.2卡、力謀?系列加速卡及計(jì)算盒子等硬件組合,形成覆蓋移動(dòng)終端與邊緣場(chǎng)景的完整產(chǎn)品矩陣。這系列動(dòng)作標(biāo)志著后摩智能
    的頭像 發(fā)表于 07-30 07:57 ?7258次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>技術(shù)加持!后摩<b class='flag-5'>智能</b> 160TOPS 端邊大模型AI芯片正式發(fā)布

    緩解高性能一體芯片IR-drop問(wèn)題的軟硬件協(xié)同設(shè)計(jì)

    在高性能計(jì)算與AI芯片領(lǐng)域,基于SRAM的一體(Processing-In-Memory, PIM)架構(gòu)因兼具計(jì)算密度、能效和精度優(yōu)勢(shì)成為主流方案。隨著
    的頭像 發(fā)表于 07-11 15:11 ?626次閱讀
    緩解高性能<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>芯片IR-drop問(wèn)題的軟<b class='flag-5'>硬件</b>協(xié)同設(shè)計(jì)

    蘋(píng)芯科技 N300 一體 NPU,開(kāi)啟端側(cè) AI 新征程

    隨著端側(cè)人工智能技術(shù)的爆發(fā)式增長(zhǎng),智能設(shè)備對(duì)本地力與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構(gòu)在數(shù)據(jù)處理效率上存在瓶頸,“內(nèi)存墻”問(wèn)題成為制約端側(cè)AI性能
    的頭像 發(fā)表于 05-06 17:01 ?765次閱讀
    蘋(píng)芯科技 N300 <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b> NPU,開(kāi)啟端側(cè) AI 新征程

    梯度科技推出DeepSeek智一體機(jī)

    近日,梯度科技搭載DeepSeek大模型的智一體機(jī)正式發(fā)布。該產(chǎn)品基于“國(guó)產(chǎn)服務(wù)器+國(guó)產(chǎn)GPU+自主算法”核心架構(gòu),搭載梯度科技人工智能應(yīng)用開(kāi)發(fā)平臺(tái),形成了軟硬
    的頭像 發(fā)表于 02-17 09:53 ?1205次閱讀

    一體行業(yè)2024年回顧與2025年展望

    2024年,大模型技術(shù)的迅猛發(fā)展成為人工智能領(lǐng)域的核心驅(qū)動(dòng)力,其對(duì)硬件力和存儲(chǔ)效率的極致需求,促使
    的頭像 發(fā)表于 01-23 11:24 ?1520次閱讀

    開(kāi)源芯片系列講座第24期:基于SRAM的高效計(jì)算架構(gòu)

    種先進(jìn)的計(jì)算架構(gòu)技術(shù),克服傳統(tǒng)馮諾依曼架構(gòu)中計(jì)算單元與存儲(chǔ)單元分離導(dǎo)致的“內(nèi)存墻”問(wèn)題。基于SRAM的
    的頭像 發(fā)表于 11-27 01:05 ?1129次閱讀
    開(kāi)源芯片系列講座第24期:基于SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b>的高效計(jì)算<b class='flag-5'>架構(gòu)</b>

    直播預(yù)約 |開(kāi)源芯片系列講座第24期:SRAM一體:賦能高能效RISC-V計(jì)算

    RISC-V計(jì)算報(bào)告簡(jiǎn)介一體種先進(jìn)的計(jì)算架構(gòu)技術(shù),克服傳統(tǒng)馮諾依曼
    的頭像 發(fā)表于 11-16 01:10 ?956次閱讀
    直播預(yù)約 |開(kāi)源芯片系列講座第24期:SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>:賦能高能效RISC-V計(jì)算

    一體化與邊緣計(jì)算:重新定義智能計(jì)算的未來(lái)

    隨著數(shù)據(jù)量爆炸式增長(zhǎng)和智能化應(yīng)用的普及,計(jì)算與存儲(chǔ)的高效整合逐漸成為科技行業(yè)關(guān)注的重點(diǎn)。數(shù)據(jù)存儲(chǔ)和處理需求的快速增長(zhǎng)推動(dòng)了對(duì)計(jì)算架構(gòu)的重新設(shè)計(jì),“
    的頭像 發(fā)表于 11-12 01:05 ?1146次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>化與邊緣計(jì)算:重新定義<b class='flag-5'>智能</b>計(jì)算的未來(lái)

    一體架構(gòu)創(chuàng)新助力國(guó)產(chǎn)大力AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計(jì)算(HPC)應(yīng)用論壇》上,億鑄科技高級(jí)副總裁徐芳發(fā)表了題為《一體架構(gòu)創(chuàng)新助力國(guó)產(chǎn)大
    的頭像 發(fā)表于 10-23 14:48 ?1150次閱讀