18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

vLLM Meetup上海站成功舉辦

沐曦MetaX ? 來(lái)源:vLLM ? 2025-08-27 13:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來(lái)源:vLLM

2025年8月23日,vLLM Meetup上海站成功舉辦。活動(dòng)匯聚技術(shù)專家、社區(qū)開(kāi)發(fā)者及行業(yè)用戶,圍繞vLLM(一種用于大型語(yǔ)言模型的高性能推理引擎)的技術(shù)進(jìn)展、生態(tài)建設(shè)及應(yīng)用展開(kāi)深度探討。會(huì)議涵蓋社區(qū)貢獻(xiàn)指南、分布式推理架構(gòu)、多模態(tài)模型集成等前沿議題,現(xiàn)場(chǎng)互動(dòng)熱烈,并提出每年舉辦vLLM Con大會(huì)的倡議,為AI推理領(lǐng)域的技術(shù)落地注入新動(dòng)能。

本次Meetup由沐曦與紅帽公司聯(lián)合主辦,紅帽作為全球開(kāi)源社區(qū)vLLM的重要貢獻(xiàn)者,長(zhǎng)期參與上游協(xié)作并分享實(shí)踐經(jīng)驗(yàn),推動(dòng)社區(qū)發(fā)展;沐曦則結(jié)合國(guó)產(chǎn)硬件優(yōu)勢(shì),積極探索vLLM在本土計(jì)算平臺(tái)上的適配與應(yīng)用。沐曦開(kāi)源生態(tài)總監(jiān)章津楠與紅帽亞太CTO辦公室首席架構(gòu)師張家駒共同開(kāi)場(chǎng),對(duì)到場(chǎng)嘉賓及觀眾表示歡迎?;顒?dòng)設(shè)置五大核心議題,并穿插開(kāi)發(fā)者提問(wèn)環(huán)節(jié),最終以沐曦聯(lián)合創(chuàng)始人、CTO兼首席軟件架構(gòu)師楊建博士的開(kāi)源生態(tài)趨勢(shì)分享及書(shū)籍簽贈(zèng)環(huán)節(jié)收尾,現(xiàn)場(chǎng)氣氛活躍。

活動(dòng)核心環(huán)節(jié)圍繞五大技術(shù)方向展開(kāi),專家團(tuán)隊(duì)通過(guò)案例解析與方案演示,系統(tǒng)呈現(xiàn)vLLM在社區(qū)生態(tài)、分布式架構(gòu)、多模態(tài)集成等領(lǐng)域的創(chuàng)新實(shí)踐。

在題為《vLLM: Building, Testing and Contributing》演講中, vLLM社區(qū)貢獻(xiàn)者、Red Hat資深專家Daniele Trifirò深入剖析了vLLM社區(qū)的發(fā)展現(xiàn)狀,為愛(ài)好者及開(kāi)發(fā)者提供了系統(tǒng)性指南。他詳細(xì)闡述了項(xiàng)目構(gòu)建流程、關(guān)鍵測(cè)試規(guī)范,并指導(dǎo)開(kāi)發(fā)者如何高效貢獻(xiàn)代碼。通過(guò)豐富的代碼實(shí)例、實(shí)踐案例及參考鏈接,演講極大降低了初學(xué)者入門(mén)門(mén)檻,獲得現(xiàn)場(chǎng)開(kāi)發(fā)者高度認(rèn)可。

在《Disaggregated P/D for Wide EP》主題分享中,vLLM社區(qū)貢獻(xiàn)者、Red Hat技術(shù)專家Nicolò Lucchesi重點(diǎn)介紹了利用llm-d實(shí)現(xiàn)vLLM分布式推理的方案,核心目標(biāo)是通過(guò)預(yù)填充/解碼(P/D)解耦與寬專家并行(EP)擴(kuò)展大模型推理能力,尤其針對(duì)長(zhǎng)上下文和混合專家(MoE)模型場(chǎng)景,關(guān)鍵技術(shù)方案包括P/D解耦部署、通過(guò)NIXL實(shí)現(xiàn)高效KV Cache傳輸、支持預(yù)填充(P)與解碼(D)階段采用不同TP并行度、將MoE模型中的專家分布至不同GPU等實(shí)現(xiàn)細(xì)節(jié)。

百度高級(jí)產(chǎn)品經(jīng)理王凱在《ERNIE 4.5 + vLLM: Multimodal Model Integration》演講中,系統(tǒng)解析了百度ERNIE 4.5多模態(tài)模型與vLLM的集成實(shí)踐。內(nèi)容涵蓋ERNIE 4.5 的特性、與 vLLM 集成的原因以及 vLLM 為 ERNIE 4.5 模型提供的全面支持,包括密集模型、MoE 模型和用于加速生成的MTP。同時(shí)還介紹了正在進(jìn)行的開(kāi)發(fā)工作,例如專家并行性負(fù)載均衡和視覺(jué)-語(yǔ)言支持。

Mooncake核心開(kāi)發(fā)者蘇金陽(yáng)在《Mooncake x LMCache 性能優(yōu)化分享》的主題分享中重點(diǎn)介紹了 Mooncake(特別是其傳輸引擎和存儲(chǔ))與 LMCache 的集成,以在 vLLM 中實(shí)現(xiàn)高性能 KV Cache 重用。LMCache 被認(rèn)為是用于 KV Cache 管理(卸載、重用、P/D 分離、RAG 緩存)的流行 vLLM 社區(qū)擴(kuò)展。此次集成旨在提高數(shù)據(jù)分發(fā)效率和整體系統(tǒng)性能。

沐曦vLLM推理引擎專家張廉潔在《vLLM-metax: Bridging CUDA to MetaX MACA》演講中,詳細(xì)介紹了vLLM-metax 如何通過(guò) cu-bridge 在 MACA 上實(shí)現(xiàn)接近零成本的 CUDA 執(zhí)行,允許在不修改源代碼的情況下進(jìn)行原生編譯。同時(shí)還解釋了在 vLLM 中使用插件架構(gòu)支持 MetaX 的方式,概述了修補(bǔ)方法(patch補(bǔ)丁和文件替換)和限制。演講還公布了2025年路線圖。

提問(wèn)環(huán)節(jié)中,開(kāi)發(fā)者圍繞社區(qū)貢獻(xiàn)規(guī)范、分布式推理落地、國(guó)產(chǎn)硬件支持等議題提出建議,嘉賓以技術(shù)細(xì)節(jié)回應(yīng),討論貫穿全場(chǎng)。

本次活動(dòng)彩蛋,沐曦聯(lián)合創(chuàng)始人、CTO兼首席軟件架構(gòu)師楊建博士驚喜亮相現(xiàn)場(chǎng),他不僅生動(dòng)分享了沐曦在開(kāi)源生態(tài)和vLLM推理技術(shù)的最新趨勢(shì),還熱情地為獲得《沐曦異構(gòu)并行計(jì)算軟件?!窌?shū)籍的幸運(yùn)觀眾親筆簽名留念。

本次Meetup不僅展示了vLLM在分布式推理、多模態(tài)集成及硬件適配領(lǐng)域的最新成果,更通過(guò)技術(shù)交流與生態(tài)合作,為AI推理引擎的規(guī)?;瘧?yīng)用提供了實(shí)踐范本。行業(yè)專家與開(kāi)發(fā)者的深度互動(dòng),進(jìn)一步強(qiáng)化了vLLM在開(kāi)源社區(qū)的技術(shù)影響力,為下一代AI基礎(chǔ)設(shè)施的研發(fā)奠定基礎(chǔ)。

關(guān)于沐曦

沐曦致力于自主研發(fā)全棧高性能GPU芯片及計(jì)算平臺(tái),為智算、通用計(jì)算、云渲染等前沿領(lǐng)域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟(jì)發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    462

    文章

    53250

    瀏覽量

    455345
  • 開(kāi)源
    +關(guān)注

    關(guān)注

    3

    文章

    3892

    瀏覽量

    45344
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3618

    瀏覽量

    51541

原文標(biāo)題:vLLM Meetup上海站圓滿落幕

文章出處:【微信號(hào):沐曦MetaX,微信公眾號(hào):沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    2025開(kāi)放原子校源行上海成功舉辦

    10月15日,開(kāi)放原子校源行(上海)在復(fù)旦大學(xué)成功舉辦。本次活動(dòng)作為復(fù)旦大學(xué)計(jì)算機(jī)建系50周年系列活動(dòng)之一,邀請(qǐng)?jiān)菏繉<摇⒏咝nI(lǐng)導(dǎo)、知名開(kāi)源社區(qū)代表、頭部科技企業(yè)代表以及來(lái)自復(fù)旦大學(xué)
    的頭像 發(fā)表于 10-17 11:01 ?269次閱讀

    2025 NVIDIA創(chuàng)業(yè)企業(yè)展示北京成功舉辦

    近日,2025 NVIDIA 創(chuàng)業(yè)企業(yè)展示——北京(AI 智能體與物理 AI 出海專場(chǎng))在北京量子銀座集智會(huì)議中心舉辦。
    的頭像 發(fā)表于 09-16 10:43 ?717次閱讀

    匯川技術(shù)匯英行動(dòng)人才雙選日蘇州成功舉辦

    金秋九月,匯聚英才。 匯英行動(dòng)人才雙選日·蘇州于9月6日在匯川技術(shù)蘇州總部大廈成功舉辦
    的頭像 發(fā)表于 09-11 17:12 ?878次閱讀

    2025紫光同創(chuàng)FPGA技術(shù)研討會(huì)成都成功舉辦

    近日,“2025紫光同創(chuàng)FPGA技術(shù)研討會(huì)”成都成功舉辦,來(lái)自通信、工業(yè)、圖像視頻、消費(fèi)、汽車等領(lǐng)域近200名專業(yè)觀眾參會(huì)交流,現(xiàn)場(chǎng)座無(wú)虛席,氣氛熱烈。自此,本年度紫光同創(chuàng)線下研討會(huì)系列活動(dòng)圓滿收官!
    的頭像 發(fā)表于 09-08 17:26 ?816次閱讀

    格羅方德2025年度技術(shù)峰會(huì)北美成功舉辦

    格羅方德2025年度技術(shù)峰會(huì)(GlobalFoundries Technology Summit 2025, GTS 2025)北美于8月28日在美國(guó)加利福尼亞州圣克拉拉市成功舉辦。
    的頭像 發(fā)表于 09-03 17:29 ?663次閱讀

    開(kāi)放原子園區(qū)行重慶成功舉辦

    8月29日,開(kāi)放原子“園區(qū)行”(重慶)在渝州賓館成功舉辦,活動(dòng)以“共建智能汽車操作系統(tǒng)開(kāi)源生態(tài)”為主題,匯聚政府機(jī)構(gòu)、高校及科研院所、OEM廠商、汽車軟件開(kāi)發(fā)企業(yè)、芯片企業(yè)、開(kāi)源社區(qū)的近100位代表,共探開(kāi)源模式如何破解智能汽
    的頭像 發(fā)表于 09-01 18:10 ?767次閱讀

    2025開(kāi)放原子園區(qū)行上海成功舉辦

    近日,以“開(kāi)源賦能智能,協(xié)同創(chuàng)新共筑AI未來(lái)”為主題的開(kāi)放原子“園區(qū)行”(上海)在上海市徐匯區(qū)成功舉辦。本次活動(dòng)由開(kāi)放原子開(kāi)源基金會(huì)與
    的頭像 發(fā)表于 07-07 18:12 ?733次閱讀

    2025開(kāi)放原子校源行廣東海洋大學(xué)活動(dòng)成功舉辦

    近日,由開(kāi)放原子開(kāi)源基金會(huì)主辦,廣東海洋大學(xué)和北京中軟國(guó)際教育科技股份有限公司承辦的“開(kāi)放原子校源行”(廣東海洋大學(xué))活動(dòng)成功舉辦
    的頭像 發(fā)表于 06-30 10:02 ?501次閱讀

    2025開(kāi)放原子校源行太原成功舉辦

    近日,開(kāi)放原子“校源行”(太原)在中北大學(xué)成功舉辦。工業(yè)和信息化部信息技術(shù)發(fā)展司、山西省工信廳、山西省教育廳,以及地方工信部門(mén)、高校、頭部科技企業(yè)代表等600余人共話開(kāi)源生態(tài),推進(jìn)開(kāi)源教育。
    的頭像 發(fā)表于 06-28 17:44 ?924次閱讀

    Wolfspeed助力捷豹TCS車隊(duì)FE上海成功衛(wèi)冕

    !從第一回合遭遇低谷,到第二回合成功衛(wèi)冕,捷豹 TCS 車隊(duì)逆風(fēng)翻盤(pán)!“KIWI”組合上海兩年兩冠,續(xù)寫(xiě)傳奇!
    的頭像 發(fā)表于 06-06 09:12 ?592次閱讀

    2025年開(kāi)放原子校源行清華大學(xué)成功舉辦

    近日,由開(kāi)放原子開(kāi)源基金會(huì)、清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系、清華大學(xué)軟件學(xué)院主辦的開(kāi)放原子“校源行”(清華)在清華大學(xué)成功舉辦
    的頭像 發(fā)表于 04-22 16:46 ?641次閱讀

    開(kāi)放原子園區(qū)行太原成功舉辦

    近日,由開(kāi)放原子開(kāi)源基金會(huì)、山西省工業(yè)和信息化廳、山西轉(zhuǎn)型綜合改革示范區(qū)管委會(huì)聯(lián)合主辦的開(kāi)放原子“園區(qū)行”(太原)活動(dòng)在太原市同昌創(chuàng)業(yè)園成功舉辦
    的頭像 發(fā)表于 04-02 16:54 ?676次閱讀

    2025芯來(lái)RISC-V技術(shù)研討會(huì)蘇州成功舉辦

    近日,2025芯來(lái)RISC-V技術(shù)研討會(huì)@蘇州活動(dòng)成功舉辦。此次蘇州研討由芯來(lái)科技與勞特巴赫中國(guó)聯(lián)合主辦,同時(shí)也感謝上海開(kāi)放處理器產(chǎn)業(yè)創(chuàng)
    的頭像 發(fā)表于 03-26 11:50 ?935次閱讀

    索尼新品品鑒會(huì)上海成功舉辦

    近日,索尼攜手《家庭影院技術(shù)》雜志成功舉辦了“把影院帶回家,索尼家用投影P9(VPL-XW8100)新品品鑒會(huì)”全國(guó)巡展的上海。來(lái)自華東地區(qū)眾多行業(yè)人士和影音愛(ài)好者,共同見(jiàn)證了索尼“
    的頭像 發(fā)表于 12-19 15:20 ?808次閱讀

    vLLM項(xiàng)目加入PyTorch生態(tài)系統(tǒng),引領(lǐng)LLM推理新紀(jì)元

    近日,vLLM項(xiàng)目宣布正式成為PyTorch生態(tài)系統(tǒng)的一部分,標(biāo)志著該項(xiàng)目與PyTorch的合作進(jìn)入了一個(gè)全新的階段。本文將從以下幾個(gè)方面進(jìn)行介紹,特別提醒:安裝方案在第四個(gè)部分,可選擇性閱讀
    的頭像 發(fā)表于 12-18 17:06 ?1324次閱讀
    <b class='flag-5'>vLLM</b>項(xiàng)目加入PyTorch生態(tài)系統(tǒng),引領(lǐng)LLM推理新紀(jì)元