18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息發(fā)布"元腦SD200"超節(jié)點,面向萬億參數(shù)大模型創(chuàng)新設計

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2025-08-08 22:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息發(fā)布面向萬億參數(shù)大模型的超節(jié)點AI服務器"元腦SD200"。該產(chǎn)品基于浪潮信息創(chuàng)新研發(fā)的多主機低延遲內(nèi)存語義通信架構,以開放系統(tǒng)設計向上擴展支持64路本土GPU芯片。元腦SD200可實現(xiàn)單機內(nèi)運行超萬億參數(shù)大模型,并支持多個領先大模型機內(nèi)同時運行及多智能體實時協(xié)作與按需調(diào)用,目前已率先實現(xiàn)商用。在實際評測中,元腦SD200運行DeepSeek R1和Kimi K2等全參模型的64卡整機推理性能實現(xiàn)超線性擴展。

wKgZO2iWBvSAWSl0AAD6jZAs1Wk311.jpg


當前,混合專家模型(MoE)的高效架構正在驅(qū)動大模型參數(shù)規(guī)模持續(xù)擴展,國內(nèi)外前沿大模型的參數(shù)量快速突破萬億規(guī)模,這給算力系統(tǒng)架構提出新的挑戰(zhàn)。一方面,模型參數(shù)量增加和序列長度增加帶來的鍵值緩存(KV cache)激增,需要智能計算系統(tǒng)具有超大顯存空間承載,依靠單芯片或節(jié)點的性能提升已難以為繼;且其推理過程作為通信敏感型計算,對分布式計算通信延時要求極高,需要構建更大向上擴展(Scale up)高速互連域。另一方面,智能體AI開啟多模型協(xié)作的新范式,其推理過程需要生成比傳統(tǒng)模型多近百倍的數(shù)據(jù)詞元(token),導致計算量激增。

元腦SD200超節(jié)點AI服務器是浪潮信息面向萬億參數(shù)大模型AI時代而設計,創(chuàng)新研發(fā)多主機低延遲內(nèi)存語義通信架構,基于開放總線交換技術構建,在單機內(nèi)實現(xiàn)了64路GPU芯片的高速統(tǒng)一互連,成功解決萬億大模型對超大顯存空間和超低通信延時的核心需求。在開放架構之上,元腦SD200通過智能總線管理和開放的預填充-解碼(Prefill-Decoder)分離推理框架實現(xiàn)軟硬件深度協(xié)同,智能化管理復雜AI計算任務。

- 在架構層面,元腦SD200基于自主研發(fā)的開放總線交換技術首創(chuàng)多主機三維網(wǎng)格系統(tǒng)架構,實現(xiàn)64路本土GPU芯片高速互連;通過創(chuàng)新遠端GPU虛擬映射技術,突破多主機交換域統(tǒng)一編址難題,實現(xiàn)顯存統(tǒng)一地址空間擴增8倍,單機可以提供最大4TB顯存和64TB內(nèi)存,為萬億參數(shù)、超長序列大模型提供充足鍵值緩存空間。同時,依托百納秒級超低延遲鏈路,構建64卡大高速互連域統(tǒng)一原生內(nèi)存語義通信,實測結(jié)果表明,在推理過程常見的小數(shù)據(jù)包通信場景中,全規(guī)約(All Reduce)性能表現(xiàn)優(yōu)異,顯著提升計算與通信效率。

- 在系統(tǒng)層面,根據(jù)萬億參數(shù)大模型計算、通信需求特征,浪潮信息開發(fā)智能總線管理系統(tǒng),實現(xiàn)超節(jié)點64卡全局最優(yōu)路由的自動創(chuàng)建,支持不同拓撲切換,資源按需切分。對于全規(guī)約、全聚集(All Gather)等典型通信算子,開展不同數(shù)據(jù)量大小的細粒度通信策略設計,如多層級通信機制等,實現(xiàn)通信延時進一步降低。同時依托開放的PD分離框架,支持異步KV Cache高效傳輸與差異化并行策略,在提升業(yè)務服務級別目標的同時保持對多元算力的兼容性,實現(xiàn)計算與通信架構的深度協(xié)同優(yōu)化。

元腦SD200超節(jié)點AI服務器通過軟硬協(xié)同系統(tǒng)創(chuàng)新,成功向上擴展突破芯片性能邊界,在大模型場景中展示出優(yōu)異的性能表現(xiàn)。結(jié)合優(yōu)化的PD分離框架,SD200超節(jié)點滿機運行DeepSeek R1全參模型推理性能超線性提升比為3.7倍,滿機運行Kimi K2全參模型推理性能超線性提升比為1.7倍。

wKgZPGiWBvWAcd4gAADlyNPyP2o769.jpg


當前,開源模型的飛躍式進步正在加速智能時代的到來,推動研發(fā)范式從封閉走向開放協(xié)作。同時,隨著大模型參數(shù)量的持續(xù)提升,對算力基礎設施的建設提出了更高要求。浪潮信息通過開放系統(tǒng)架構創(chuàng)新,為開源大模型的規(guī)?;涞睾蛻脛?chuàng)新提供關鍵支撐。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 半導體
    +關注

    關注

    336

    文章

    29611

    瀏覽量

    253073
  • 大模型
    +關注

    關注

    2

    文章

    3360

    瀏覽量

    4780
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    開源大模型算力革命下:電子谷連接技術的堅守與未來

    推動算力系統(tǒng)向節(jié)點架構轉(zhuǎn)型。"SD200";等新一代服務器通過開放總線技
    的頭像 發(fā)表于 09-19 08:03 ?245次閱讀
    開源大<b class='flag-5'>模型</b>算力革命下:電子谷連接技術的堅守與未來

    面向萬億參數(shù)模型,“節(jié)點”涌現(xiàn)

    UniPoD系列節(jié)點產(chǎn)品,旨在為萬億參數(shù)模型的訓練與推理提供更強勁、更智能且更綠色的算力支持。 ? H3C UniPoD系列
    的頭像 發(fā)表于 08-03 02:37 ?7857次閱讀
    <b class='flag-5'>面向</b><b class='flag-5'>萬億</b>級<b class='flag-5'>參數(shù)</b>大<b class='flag-5'>模型</b>,“<b class='flag-5'>超</b><b class='flag-5'>節(jié)點</b>”涌現(xiàn)

    萬億參數(shù)企智一體機率先支持Kimi K2大模型

    北京2025年7月21日 /美通社/ --?浪潮信息宣布企智一體機已率先完成對Kimi K2 萬億參數(shù)
    的頭像 發(fā)表于 07-22 09:27 ?331次閱讀
    <b class='flag-5'>萬億</b><b class='flag-5'>參數(shù)</b>!<b class='flag-5'>元</b><b class='flag-5'>腦</b>企智一體機率先支持Kimi K2大<b class='flag-5'>模型</b>

    地熱發(fā)電環(huán)網(wǎng)柜局放監(jiān)測設備:清潔能源電網(wǎng)的&amp;amp;quot;安全衛(wèi)士&amp;amp;quot;

    文章由山東華科信息技術有限公司提供在&quot;雙碳&quot;目標驅(qū)動下,地熱發(fā)電作為穩(wěn)定基荷電源,其電網(wǎng)接入設備的可靠性至關重要。環(huán)網(wǎng)柜作為地熱電站與主網(wǎng)連接的關鍵節(jié)點,其內(nèi)部絕緣
    的頭像 發(fā)表于 07-16 10:15 ?325次閱讀
    地熱發(fā)電環(huán)網(wǎng)柜局放監(jiān)測設備:清潔能源電網(wǎng)的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;安全衛(wèi)士&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    電纜局部放電在線監(jiān)測:守護電網(wǎng)安全的&amp;amp;quot;黑科技&amp;amp;quot;

    文章由山東華科信息技術有限公司提供在萬家燈火的背后,有一張覆蓋全國的&quot;能源神經(jīng)網(wǎng)絡&quot;晝夜不息地運轉(zhuǎn)。電纜作為電力輸送的&quot;主動脈&
    的頭像 發(fā)表于 04-14 18:12 ?577次閱讀
    電纜局部放電在線監(jiān)測:守護電網(wǎng)安全的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黑科技&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    隧道管廊變壓器局放在線監(jiān)測:為地下&amp;amp;quot;電力心臟&amp;amp;quot;裝上智能聽診器

    文章由山東華科信息技術有限公司提供在城市的地下脈絡中,隧道管廊承載著電網(wǎng)的&quot;主動脈&quot;,而變壓器堪稱其中的&quot;動力心臟&q
    的頭像 發(fā)表于 04-09 16:37 ?574次閱讀
    隧道管廊變壓器局放在線監(jiān)測:為地下&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;電力心臟&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;裝上智能聽診器

    筑基&amp;quot;AI+人才&amp;quot;培養(yǎng),浪潮信息攜手伙伴拓爾思推出智慧教育新平臺

    北京2025年3月22日?/美通社/ -- 近期,生態(tài)伙伴拓爾思信息技術股份有限公司(以下簡稱:拓爾思)攜手浪潮信息,聯(lián)合為高校AI人才培養(yǎng)推出"AI
    的頭像 發(fā)表于 03-27 16:56 ?547次閱讀
    筑基&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;AI+人才&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;培養(yǎng),<b class='flag-5'>浪潮信息</b>攜手<b class='flag-5'>元</b><b class='flag-5'>腦</b>伙伴拓爾思推出智慧教育新平臺

    浪潮信息EPAI已接入DeepSeek,大幅提升DeepSeek企業(yè)應用準確率

    北京2025年2月21日?/美通社/ -- 浪潮信息宣布企智EPAI企業(yè)大模型開發(fā)平臺已全面接入支持DeepSeek大模型。通過
    的頭像 發(fā)表于 02-23 07:32 ?789次閱讀
    <b class='flag-5'>浪潮信息</b>:<b class='flag-5'>元</b><b class='flag-5'>腦</b>EPAI已接入DeepSeek,大幅提升DeepSeek企業(yè)應用準確率

    浪潮信息發(fā)布R1推理服務器

    近日,浪潮信息正式推出了其創(chuàng)新R1推理服務器。這款服務器通過系統(tǒng)的創(chuàng)新與軟硬件的協(xié)同優(yōu)化,實現(xiàn)了對DeepSeek R1 671B
    的頭像 發(fā)表于 02-17 10:32 ?914次閱讀

    浪潮信息與智源研究院攜手共建大模型多元算力生態(tài)

    人工智能技術的快速發(fā)展。浪潮信息與智源研究院將充分整合各自在算力、算法和技術創(chuàng)新方面的優(yōu)勢資源,共同探索大模型多元算力的新應用和新模式。 目前,智源研究院的Triton算子庫FlagGems已正式接入
    的頭像 發(fā)表于 12-31 11:49 ?785次閱讀

    浪潮信息與智源研究院達成戰(zhàn)略合作協(xié)議

    正式接入浪潮信息企智EPAI企業(yè)大模型開發(fā)平臺,助力企業(yè)實現(xiàn)更快速、更廣泛、更高效的多元算力適配與使用。
    的頭像 發(fā)表于 12-26 10:25 ?791次閱讀

    浪潮信息發(fā)布&amp;quot;源&amp;quot;Yuan-EB,刷新RAG檢索最高成績

    檢索任務的第一名,以78.41的平均精度刷新了大模型RAG檢索的最高成績。 "源"Yuan-EB的發(fā)布,標志著浪潮信息在知識向量化技術方面取得了重要進展。該模型基于
    的頭像 發(fā)表于 12-25 15:54 ?728次閱讀

    浪潮信息與17家伙伴共簽億級分銷協(xié)議

    。 此次簽約標志著浪潮信息與這些伙伴將在產(chǎn)品技術創(chuàng)新、市場拓展及解決方案等多個領域展開深入合作。雙方將充分發(fā)揮各自優(yōu)勢,共同推動技術革新,加速智能化轉(zhuǎn)型的步伐,為千行百業(yè)的數(shù)字化轉(zhuǎn)
    的頭像 發(fā)表于 12-25 15:46 ?1104次閱讀

    借助浪潮信息企智EPAI高效創(chuàng)建大模型RAG

    生成能力,提高生成質(zhì)量和可靠性。但企業(yè)構建知識檢索系統(tǒng)并非易事,通常面臨開發(fā)門檻高、生成內(nèi)容差等難題。而借助浪潮信息企智EPAI企業(yè)大模型開發(fā)平臺,企業(yè)僅需三步即可高效創(chuàng)建大
    的頭像 發(fā)表于 12-19 14:32 ?965次閱讀
    借助<b class='flag-5'>浪潮信息</b><b class='flag-5'>元</b><b class='flag-5'>腦</b>企智EPAI高效創(chuàng)建大<b class='flag-5'>模型</b>RAG

    浪潮信息發(fā)布KOS AI定制版,大幅提升大模型訓練效率

    浪潮信息近期推出了“服務器操作系統(tǒng)KOS AI定制版”,為人工智能領域帶來了革命性的變化。這款定制版操作系統(tǒng)通過簡單的兩步操作,即可實現(xiàn)大模型訓練環(huán)境的快速部署。
    的頭像 發(fā)表于 10-30 17:23 ?1180次閱讀