18video性欧美19sex,欧美高清videosddfsexhd,性少妇videosexfreexxx片中国,激情五月激情综合五月看花,亚洲人成网77777色在线播放

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

京東:基于多類目MoE模型的電商搜索引擎

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 2023-01-06 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

商品索引擎是電商平臺滿足用戶購物需求的一個重要系統(tǒng),它根據(jù)用戶輸入的搜索詞,返回個性化的排序列表。商品一般會被歸為某一大類下某個小類目,例如電子產(chǎn)品,在電子產(chǎn)品這個大類目下面還有更細粒度的類目(冰箱或者電視)。這種體系用于構(gòu)造查詢類別的層次結(jié)構(gòu)。在不同的查詢類別中,價格和品牌知名度等特征的分布差異很大。在CTR(點擊率)/CVR(轉(zhuǎn)化率)預估問題中,特征重要性在不同類目間也是不一樣的。本文主要介紹專家混合模型(MoE)在京東搜索精排中的應用,以及結(jié)合實際場景對MoE模型進行的一系列改進。

Part1. 背景介紹

越來越多的人轉(zhuǎn)向電子商務來滿足他們的購物需求,這給搜索排名帶來了新的挑戰(zhàn)。電子商務搜索排名的一個關(guān)鍵輸入是產(chǎn)品類別標簽,店主通常被要求用特定的類別來標記他們的產(chǎn)品,以方便搜索索引。從這些產(chǎn)品類別中,可以構(gòu)造查詢類別的概念,通常是通過聚合在查詢下正確檢索到的最頻繁出現(xiàn)的產(chǎn)品類別。目前大多數(shù)電子商務排名系統(tǒng)都沒有為每個查詢類別部署專用模型的工程資源,即使是主要的查詢類別也是如此。但是作為人工編目員,自然的策略是首先確定查詢最可能屬于的類別,然后檢索該類別中的項目。不同類別的特性對于產(chǎn)品排名的重要性可能不同。直觀地說,根據(jù)用戶購買反饋判斷,不同類別的單獨排名策略應該能夠提高整體產(chǎn)品搜索相關(guān)性。
??京東電商平臺有一套完整的以樹形結(jié)構(gòu)組織的多層級類目結(jié)構(gòu)。下圖是一個兩層級類目結(jié)構(gòu)的示意圖,不同的Top-Categories 之間,用戶的購物行為會有比較明顯的差異,例如:當用戶搜索食品相關(guān)商品時,可能選擇銷量高的;而當搜索服飾相關(guān)商品時,可能會更關(guān)注風格、品牌等信息。相反同一個Top-Categories下的Sub-Categories之間,用戶的購物行為一般比較接近。

01a6ab4c-8d5c-11ed-bfe3-dac502259ad0.png

此外,對于一些小類目的商品,在訓練集樣本量上和大類目相比差距懸殊,在模型訓練過程中會被大類目商品的樣本所影響和主導。針對類目差異和小類目學習這兩個問題,本文提出了一種多類目MoE(Mixture of Experts)模型。

Part2. 多類目MoE模型

MoE模型

MoE 主要包括兩個核心部分:門網(wǎng)絡(gating network)和專家網(wǎng)絡(expert network)。門網(wǎng)絡的輸出作為對應的專家網(wǎng)絡的權(quán)重,用于對專家網(wǎng)絡的輸出進行加權(quán)求和。MoE 模型的輸出可以寫成下面的公式:

其中,N表示專家網(wǎng)絡的個數(shù),G表示門網(wǎng)絡,Q表示專家網(wǎng)絡。

Top-K gating MoE模型

模型會根據(jù)門網(wǎng)絡的輸出,選擇最大的K個權(quán)重所對應的專家網(wǎng)絡進行激活,然后只對選中的K個專家網(wǎng)絡的輸出進行加權(quán)求和。計算公式如下:

在Top_k MoE模型中,如果一個專家網(wǎng)絡對應的權(quán)重值不在最高的K個集合里,那么經(jīng)過softmax函數(shù)之后權(quán)重會變?yōu)?。從而在模型訓練中這些專家網(wǎng)絡不會被激活,能降低模型的計算復雜度。

多類目MoE的模型

針對上述提到的類目差異和小類目學習兩個問題,本文在Top_K MoE 的基礎上加入了兩種改進方法,提出了多類目MoE的模型結(jié)構(gòu),如下圖:

01b7c71a-8d5c-11ed-bfe3-dac502259ad0.png

(1)Hierarchical Soft Constraint(HSC)網(wǎng)絡

針對小類目樣本學習問題,本文的改進是增加一個與MoE門網(wǎng)絡結(jié)構(gòu)相同的HSC門網(wǎng)絡(圖種藍色部分)。HSC門網(wǎng)絡的輸入是Top-Category,輸出與MoE的門網(wǎng)絡結(jié)構(gòu)維度一致,代表了不同專家網(wǎng)絡對于Top-Category 的重要程度。同時將激活的專家網(wǎng)絡對應的權(quán)重和HSC門網(wǎng)絡對應的權(quán)重的L2距離作為模型訓練的一個損失項,加入到模型的訓練過程中。
??具體來說,圖2中的Top-Category和Sub-Category具有層次關(guān)系,Top-Category是父節(jié)點,Sub-Category是子節(jié)點。為了進一步強調(diào)不同門網(wǎng)絡的功能,我們分別將它們稱之為inference MoE gate(綠色部分)和constraint HSC gate(藍色部分)。

a. Inference MoE Gate

將Sub-Category的嵌入向量,輸入inference gate,其輸出代表專家的權(quán)重。定義inference gate函數(shù)如下:

其中,是一個 q×N的可訓練的權(quán)重矩陣,q表示embedding的維度,N表示expert的個數(shù)。
??為了節(jié)省計算,只在中保留前K個值,并將其余值設置為?∞。然后應用softmax函數(shù)從前K個中得到如下的概率分布:
,如果
,如果<

由于有K個大于0的值,為了節(jié)省計算,只激活這些對應的專家。模型的計算復雜度取決于單個專家的網(wǎng)絡和K的取值。

b. Inference MoE Gate

在模型中,constraint gate和inference gate具有相同的結(jié)構(gòu)。用表示constraint gate,表示inference gate,constraint gate的輸入特征記為,是Top-Category的嵌入向量,定義inference gate和constraint gate之間的分層軟約束(HSC)如下:



??通過上述HSC網(wǎng)絡,可以讓相同Top-Category下的所有Sub-Category所激活的專家網(wǎng)絡盡量的接近。尤其對于樣本量少的小類目,可以利用到相同Top-category下的其他類目信息,能一定程度上解決小樣本學習難的問題。

(2)Adversarial Regularization

第二個改進是Adversarial Regularization。在Top_K門網(wǎng)絡結(jié)構(gòu)中,對于每條樣本,專家網(wǎng)絡都會分為激活的專家網(wǎng)絡和沒有激活的專家網(wǎng)絡。Adversarial Regularization的目的是在訓練過程中讓不同專家網(wǎng)絡盡量區(qū)別開,避免專家網(wǎng)絡的預測結(jié)果相同。即鼓勵激活的專家網(wǎng)絡和沒有被激活的專家網(wǎng)絡給出的預測結(jié)果差異較大。Adversarial Regularization計算公式如下:
其中, 表示激活的專家網(wǎng)絡集合, 表示沒有被激活的專家網(wǎng)絡集合。
??增加了HSC網(wǎng)絡和Adversarial Regularization之后,模型的損失函數(shù)如下所示:

Part3. 實驗結(jié)論

作者在Amazon和In-house兩個數(shù)據(jù)集上分別評估了所提出模型的效果。表格中的Adv-MoE和HSC-MoE分別表示只有Adversarial Regularization和HSC loss的兩個模型,Adv&HSC-MoE表示作者提出的最終多類目模型。
??作者首先在In-house數(shù)據(jù)集上測試了模型的整體效果、類目差異的效果以及在小樣本類目上的提升效果。表3給出了各個模型在AUC和NDCG兩個指標上結(jié)果。與DNN模型相比,本文提出的Adv&HSC-MoE模型在AUC指標上實現(xiàn)了0.96%的增益(NDCG為0.99%),具有較好的泛化性能。

01c91bdc-8d5c-11ed-bfe3-dac502259ad0.png

同時,作者也在amazon數(shù)據(jù)集上做了實驗,下表顯示改進后的Adv-MoE、HSC-MoE和Adv& HSC-MoE結(jié)果與In-house一致,驗證了對抗正則化和分層軟約束技術(shù)的一般適用性。

01d89fee-8d5c-11ed-bfe3-dac502259ad0.png

MoE模型門網(wǎng)絡的輸出代表了各個專家網(wǎng)絡的權(quán)重,作者同樣測試了不同類目下門網(wǎng)絡的輸出結(jié)果,以評估模型對于類目差異的學習效果。本文將門網(wǎng)絡的輸出結(jié)果使用T-SNE降維展示出來,以便觀察不同類目的聚類效果。圖5中藍色表示日用百貨類目,綠色表示電器類目,紅色表示流行服飾類目。結(jié)果顯示,本文的方法聚類效果更好,這表明對于相似的類目,本文提出的模型更傾向于選擇相似的專家網(wǎng)絡,差異大的類目,更傾向于選擇不同的專家網(wǎng)絡。

01ee71d4-8d5c-11ed-bfe3-dac502259ad0.png

Part4. 總結(jié)

本文提出的對抗性正則化和層次軟約束技術(shù)是在產(chǎn)品搜索中開發(fā)類別感知排名模型的有效方法。它在行業(yè)規(guī)模的數(shù)據(jù)集上取得了顯著的改進,主要體現(xiàn)在以下幾個方面:(1)同一Top-Categories下的Sub-Categories可以共享相似的專家,從而克服了有限訓練數(shù)據(jù)下的參數(shù)稀疏性;(2)對抗性正則化鼓勵專家“獨立思考”,從不同角度處理每個問題。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 網(wǎng)絡
    +關(guān)注

    關(guān)注

    14

    文章

    8043

    瀏覽量

    92420
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3618

    瀏覽量

    51541
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1229

    瀏覽量

    25961

原文標題:京東:基于多類目MoE模型的電商搜索引擎

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    根據(jù)標題獲取商品鏈接評論接口的技術(shù)實現(xiàn)

    [調(diào)用評論API] F --?> G[數(shù)據(jù)清洗存儲] ? 關(guān)鍵組件說明: 搜索引擎接口 :通過電平臺開放API實現(xiàn)標題搜索 $$ text{API}_{search} = text{https://api.ecommerce.
    的頭像 發(fā)表于 10-20 16:03 ?339次閱讀
    根據(jù)標題獲取商品鏈接評論接口的技術(shù)實現(xiàn)

    京東:利用商品管理API自動調(diào)整商品上下架狀態(tài),優(yōu)化搜索排名

    ? 京東:利用商品管理API自動調(diào)整商品上下架狀態(tài),優(yōu)化搜索排名 在運營中,高效管理商品狀態(tài)是提升銷售的關(guān)鍵。京東作為領先的
    的頭像 發(fā)表于 09-08 16:09 ?571次閱讀
    <b class='flag-5'>京東</b>:利用商品管理API自動調(diào)整商品上下架狀態(tài),優(yōu)化<b class='flag-5'>搜索</b>排名

    京東 API 接口,訂單管理高效解決方案!

    ? 在當今高速發(fā)展的時代,京東作為領先的平臺,其 API 接口為商家和開發(fā)者提供了強大的工具,幫助實現(xiàn)訂單管理的高效化。本文將逐步解
    的頭像 發(fā)表于 07-04 16:12 ?444次閱讀
    <b class='flag-5'>京東</b><b class='flag-5'>電</b><b class='flag-5'>商</b> API 接口,訂單管理高效解決方案!

    微軟面臨法國反壟斷機構(gòu)調(diào)查

    據(jù)媒體報道,微軟目前正在接受法國反壟斷機構(gòu)的深入調(diào)查。此次調(diào)查的核心關(guān)注點在于,微軟是否在搜索引擎聯(lián)盟市場中濫用其市場支配地位。 知情人士透露,法國監(jiān)管機構(gòu)正在仔細評估微軟的行為,特別是其是否向那些
    的頭像 發(fā)表于 02-11 10:57 ?798次閱讀

    OpenAI免費開放ChatGPT搜索功能

    近日,OpenAI宣布了一項重大決策:向所有用戶免費開放ChatGPT搜索功能。這一舉措無疑將為用戶帶來更加高效、智能的搜索體驗。 與谷歌等傳統(tǒng)搜索引擎的收錄模式相比,ChatGPT搜索
    的頭像 發(fā)表于 02-06 14:35 ?714次閱讀

    LZO Data Compression,高性能LZO無損數(shù)據(jù)壓縮加速器介紹,F(xiàn)PGA&amp;ASIC

    無損數(shù)據(jù)壓縮2.可配置的數(shù)據(jù)塊分段和搜索窗口大小[8KB,16KB,32KB]3.可配置的并行處理等級[搜索引擎的數(shù)量,1~32]4.可配置的字典深度[8K,16KB],字典RAM類型[BRAM
    發(fā)表于 01-24 23:53

    javascript:void(0) 是否影響SEO優(yōu)化

    使用 javascript:void(0) 確實可能對SEO優(yōu)化產(chǎn)生負面影響 。以下是關(guān)于 javascript:void(0) 對SEO影響的具體分析: 搜索引擎爬蟲的理解問題 搜索引擎爬蟲(如
    的頭像 發(fā)表于 12-31 16:08 ?882次閱讀

    HTTP 協(xié)議對于SEO優(yōu)化的影響

    搜索引擎優(yōu)化(SEO)是提高網(wǎng)站在搜索引擎中的可見性和排名的過程。HTTP協(xié)議作為互聯(lián)網(wǎng)通信的基礎,對SEO有著深遠的影響。 1. HTTP狀態(tài)碼 HTTP狀態(tài)碼是服務器響應客戶端請求的結(jié)果。這些
    的頭像 發(fā)表于 12-30 09:29 ?860次閱讀

    蘋果為谷歌支付數(shù)十億美元辯護,參與搜索案反壟斷審判

    近日,蘋果公司已正式要求參與谷歌即將在美國舉行的在線搜索反壟斷審判,此舉旨在為其與谷歌之間的收入分成協(xié)議進行辯護。該協(xié)議使得谷歌成為Safari瀏覽器的默認搜索引擎,而谷歌每年因此向蘋果支付數(shù)十
    的頭像 發(fā)表于 12-26 10:41 ?637次閱讀

    SSR的優(yōu)勢和劣勢分析

    SSR(Server-Side Rendering,服務器端渲染)的優(yōu)勢和劣勢分析如下: SSR的優(yōu)勢 SEO友好 : 由于搜索引擎爬蟲的性質(zhì),更容易識別和抓取服務端渲染的頁面內(nèi)容,因此提升了網(wǎng)站
    的頭像 發(fā)表于 11-18 11:27 ?2205次閱讀

    阿里國際推出全球首個B2B AI搜索引擎Accio

    近日,在歐洲科技峰會Web Summit上,阿里國際正式推出了全球首個B2B領域的AI搜索引擎——Accio。這一創(chuàng)新產(chǎn)品面向全球商家開放,標志著阿里國際正式入局當前備受矚目的AI Search賽道。
    的頭像 發(fā)表于 11-15 16:53 ?1567次閱讀

    阿里國際推出B2B領域AI搜索引擎Accio

    近日,阿里國際宣布正式進軍AI搜索領域,并面向全球商家推出了首個B2B領域的AI搜索引擎——Accio。這一創(chuàng)新產(chǎn)品的推出,標志著阿里國際在電子商務和人工智能技術(shù)結(jié)合方面邁出了重要一步。 Accio
    的頭像 發(fā)表于 11-14 11:47 ?1261次閱讀

    租用ip云服務器可以帶來哪些好處?應用場景有哪些?

    租用ip云服務器可以為用戶帶來多種好處和應用場景,主要包括: 1、SEO優(yōu)化: 搜索引擎優(yōu)化(SEO)通常推薦使用多個ip地址來托管不同的網(wǎng)站,以減少網(wǎng)站之間的潛在負面影響,提高搜索引擎
    的頭像 發(fā)表于 11-04 11:33 ?665次閱讀

    OpenAI推出ChatGPT搜索功能

    查找網(wǎng)絡信息時,往往需要通過傳統(tǒng)的搜索引擎進行檢索,然后從中篩選出有價值的內(nèi)容。而現(xiàn)在,有了ChatGPT搜索,用戶可以更加便捷地獲取所需信息。 OpenAI表示,ChatGPT搜索不僅能夠幫助用戶像在網(wǎng)絡上一樣
    的頭像 發(fā)表于 11-04 10:34 ?839次閱讀

    Meta開發(fā)新搜索引擎,減少對谷歌和必應的依賴

    近日,Meta正在積極進軍人工智能領域,并試圖跟上OpenAI的發(fā)展步伐。為實現(xiàn)這一目標,Meta正在開發(fā)一款全新的搜索引擎,該搜索引擎具備網(wǎng)絡爬蟲功能,能夠為用戶提供有關(guān)時事的對話答案,而這些答案
    的頭像 發(fā)表于 10-29 11:49 ?970次閱讀