短視頻如何做到千人千面？FM GBM排序模型深度解析

萬(wàn)皇之皇 2018-09-17

展開全文

阿里妹導(dǎo)讀：信息流短視頻能夠滿足用戶的碎片化閱讀需求，目前已是移動(dòng)互聯(lián)網(wǎng)流量風(fēng)暴的中心。各互聯(lián)網(wǎng)大廠紛紛涉足此領(lǐng)域，推出自己的短視頻產(chǎn)品，群雄爭(zhēng)霸，逐鹿短視頻市場(chǎng)。今天，UC事業(yè)部國(guó)際研發(fā)團(tuán)隊(duì)，將為大家介紹排序?qū)拥哪Ｐ脱葸M(jìn)過程，帶你深入了解模型創(chuàng)新部分。

作者：馬澤鋒、邢日良、彭衛(wèi)華

背景

信息流短視頻以算法分發(fā)為主，人工分發(fā)為輔，依賴算法實(shí)現(xiàn)視頻的智能分發(fā)，達(dá)到千人千面的效果。整個(gè)分發(fā)流程分為：觸發(fā)召回、排序與重排三個(gè)階段。排序?qū)釉谄渲衅鹬猩蠁⑾碌淖饔茫欠浅Ｖ匾囊粋€(gè)環(huán)節(jié)。在排序?qū)觾?yōu)化的過程中，除了借鑒業(yè)界前沿的經(jīng)驗(yàn)和做法，我們也做了模型上的一些創(chuàng)新。

信息流短視頻排序目前使用是以CTR預(yù)估為目標(biāo)的Wide&Deep模型。通過引入時(shí)長(zhǎng)特征、點(diǎn)擊+時(shí)長(zhǎng)多目標(biāo)優(yōu)化等工作，我們?nèi)〉昧瞬诲e(cuò)的收益：

增加視頻平均播放時(shí)長(zhǎng)特征，作為用戶真實(shí)體感信號(hào)，帶來用戶消費(fèi)時(shí)長(zhǎng)提升；
通過消費(fèi)時(shí)長(zhǎng)樣本加權(quán)，實(shí)現(xiàn)點(diǎn)擊+時(shí)長(zhǎng)多目標(biāo)優(yōu)化，實(shí)現(xiàn)點(diǎn)擊率與消費(fèi)時(shí)長(zhǎng)的提升；
引入多個(gè)視頻下發(fā)場(chǎng)景的樣本數(shù)據(jù)，實(shí)現(xiàn)多場(chǎng)景樣本融合；

在優(yōu)化排序模型的過程中，我們也調(diào)研了DeepFM/DeepCN等深度模型，這些模型無論從離線還是線上指標(biāo)上，都沒有明顯優(yōu)勢(shì)。在優(yōu)化Wide&Deep模型的同時(shí)，更迫切的需求，是跳出原有的框架，尋找新的收益點(diǎn)。

引入GBM對(duì)submodel和高級(jí)特征等信號(hào)做集成學(xué)習(xí)，效果要優(yōu)于單模型。從計(jì)算學(xué)習(xí)理論上看，Wide&Deep是high-variance模型，容易過擬合(wd模型的訓(xùn)練比評(píng)估指標(biāo)高7%)。GBM通過boosting的方式組合集成多個(gè)submodel和高級(jí)特征，更好地發(fā)揮各自不同的作用和優(yōu)勢(shì)互補(bǔ)，同時(shí)從整體上有更好的可解釋性。

上面是對(duì)信息流短視頻排序模型演進(jìn)的簡(jiǎn)要介紹；而其中的FM+GBM模型是我們團(tuán)隊(duì)比較有開創(chuàng)性的一項(xiàng)工作，下面稍微展開介紹。

模型

向量分解機(jī)（Factorization Machines, FM）是一種應(yīng)用較為廣泛的推薦模型，其發(fā)明者Steffen Rendle目前供職于Google。FM是對(duì)傳統(tǒng)LR模型在處理高階交互特征問題上的優(yōu)化和改進(jìn)：LR通過特征交叉的方式，將組合后的特征作為新特征加入到模型中，模型復(fù)雜度為O(N^2)（N為交互特征的數(shù)量，下同），記憶性較強(qiáng)而泛化性偏弱；FM通過將特征表征為隱向量，通過隱向量的相似度（內(nèi)積）來表示特征關(guān)聯(lián)這種方式來巧妙地提升模型的泛化能力；FM模型的復(fù)雜度為O(N*k)（k為隱向量維度超參）。

以二階交互的FM模型為例，其模型定義如下：

其中：

為方便討論，我們進(jìn)一步將模型表達(dá)簡(jiǎn)化如下：

其中：

FM本質(zhì)上是一個(gè)線性模型，不同項(xiàng)之間以線性組合的方式影響模型的輸出。如果要考慮更加復(fù)雜的模型組合，計(jì)算復(fù)雜度將會(huì)非常高。盡管學(xué)術(shù)界也有像張量分解（Tensor Decomposition）這類處理高階交互特征的模型；但在工業(yè)級(jí)，考慮到效果與性能的折衷，往往只考慮二階的交互。但在此基礎(chǔ)上，我們可以考慮引入非線性的模型來優(yōu)化FM模型。

在非線性模型中，樹模型（CART/GBM/Random Forest）的應(yīng)用非常廣泛。我們引入GBM作為組合FM的非線性模型：

其中：

F是整個(gè)CART的假設(shè)空間，q是某個(gè)特定的將輸入空間映射到葉子節(jié)點(diǎn)的樹結(jié)構(gòu)。其損失函數(shù)定義如下：

其中：

FM+GBM一期（純GBM）

一期主要打通整個(gè)實(shí)驗(yàn)框架和數(shù)據(jù)流，并沒有引入額外的信號(hào)。GBM使用的信號(hào)包括：wd/lr模型等sub-model打分、點(diǎn)擊率/時(shí)長(zhǎng)和體感特征，以及一些簡(jiǎn)單的匹配度特征。整個(gè)實(shí)驗(yàn)框架比較簡(jiǎn)單：精排流程新增GBMScorer，實(shí)現(xiàn)以下2個(gè)功能：

分發(fā)服務(wù)器通過流量分桶決定精排是否使用GBM打分，由GBMScorer具體執(zhí)行；
特征歸一化和回流。提取的特征經(jīng)歸一化后返回給分發(fā)服務(wù)器，由分發(fā)服務(wù)器回流至日志服務(wù)器落盤。點(diǎn)擊日志也同時(shí)經(jīng)由日志服務(wù)器落盤。點(diǎn)擊-展現(xiàn)日志通過reco_id+iid對(duì)齊，經(jīng)清洗、過濾和反作弊處理后，提取回流特征用于模型訓(xùn)練；

在調(diào)研和實(shí)驗(yàn)的過程中，以下是一些經(jīng)驗(yàn)和教訓(xùn)：

樣本與超參的選擇：為了讓模型盡可能地平滑，我們從7天滑動(dòng)窗口的數(shù)據(jù)中隨機(jī)抽取樣本，并按比例分割訓(xùn)練/驗(yàn)證/測(cè)試集。通過交叉驗(yàn)證的方式選擇超參；在所有的超參中，樹深度對(duì)結(jié)果的影響比較大，深度為6時(shí)效果明顯優(yōu)于其他選擇。在調(diào)參過程中，auc和loss這兩項(xiàng)評(píng)估指標(biāo)在訓(xùn)練/評(píng)估/測(cè)試數(shù)據(jù)集上并沒有明顯的差異，由此可見GBM模型的泛化性。
離線評(píng)估指標(biāo)：auc是排序模型常用的離線評(píng)估指標(biāo)之一，但全局auc粒度太粗，可以結(jié)合業(yè)務(wù)計(jì)算一些細(xì)粒度的auc。行業(yè)有采用以Query為粒度，計(jì)算QAUC，即單個(gè)Query的auc，再按均值或者加權(quán)的方式融合得到的auc，比起全局auc指標(biāo)更加合理。我們采用類似做法，以單次下發(fā)為粒度計(jì)算auc，再計(jì)算均值或者按點(diǎn)擊加權(quán)。需要注意的是，auc計(jì)算的粒度決定了劃分?jǐn)?shù)據(jù)集的粒度。如果按照單次下發(fā)為粒度計(jì)算，那么一次下發(fā)的所有樣本都必須同時(shí)落在訓(xùn)練/評(píng)估/測(cè)試數(shù)據(jù)集上。除此之外，單次下發(fā)中如果零點(diǎn)擊或者全點(diǎn)擊，這部分?jǐn)?shù)據(jù)也是需要廢棄的。
特征的歸一化：尤其是對(duì)與用戶相關(guān)的特征進(jìn)行歸一化尤為重要。通過分析精排打分（wd），我們發(fā)現(xiàn)不同用戶間的精排打分分布的差異較為顯著：同一用戶的打分方差小，分布比較集中；不同用戶用戶打分均值的方差比較大。如果不對(duì)精排打分做歸一化處理，GBM訓(xùn)練過程很難收斂。

GBM和精排打分也會(huì)隨特征回流。日志對(duì)齊后，可以對(duì)這兩個(gè)模型在離線評(píng)估指標(biāo)上做比較fair的對(duì)比。從全局auc/單次下發(fā)粒度auc與小流量實(shí)驗(yàn)的結(jié)果來看，細(xì)粒度auc與在線實(shí)驗(yàn)的效果更加趨于一致。

FM+GBM二期

一期搭建了實(shí)驗(yàn)框架和數(shù)據(jù)流，二期開始考慮引入新的信號(hào)。

縱觀眼下GBM用到的信號(hào)，主要分為兩類：一是item側(cè)信號(hào)，這類特征從各個(gè)維度刻畫了item的特性：熱度、時(shí)長(zhǎng)、質(zhì)量等。這類特征有助于我們篩選精品內(nèi)容，提升推薦質(zhì)量baseline。二是相關(guān)性特征，用于刻畫用戶和視頻的關(guān)聯(lián)度（關(guān)聯(lián)度可以通過點(diǎn)擊刻畫，也可以通過時(shí)長(zhǎng)刻畫；目前主要通過點(diǎn)擊），提升推薦的個(gè)性化，做到千人千面。個(gè)性化水平才是信息流的核心競(jìng)爭(zhēng)力。

目前相關(guān)性特征通過長(zhǎng)短期用戶畫像計(jì)算和視頻在一級(jí)/二級(jí)類目和TAG上的匹配程度，至少存在2個(gè)問題：

BoW稀疏的特征表達(dá)無法計(jì)算語(yǔ)義層面的匹配度；例如，帶足球標(biāo)簽的用戶和梅西的視頻通過這種方式計(jì)算得到的匹配度為0。
目前視頻結(jié)構(gòu)化信息的準(zhǔn)確率/覆蓋率較低，會(huì)直接影響這類特征的效果。

wd/lr模型能夠一定程度解決上述問題。尤其wd模型，通過embedding技術(shù)，將用戶和視頻本身及各個(gè)維度的結(jié)構(gòu)化信息嵌入到一個(gè)低維隱向量，能夠一定程度緩解這個(gè)問題。但是這類隱向量缺乏靈活性，無法脫離wd模型單獨(dú)使用：計(jì)算用戶和視頻的匹配度，除了需要用戶和視頻的隱向量，還要結(jié)合其他特征，并經(jīng)過一系列隱層的計(jì)算才能得到。

業(yè)界主流公司的做法，是通過FM模型，將所有id特征都分成在同一個(gè)空間內(nèi)的隱向量，因而所有的向量都是可比的：不僅用戶與視頻本身和各個(gè)維度的匹配度，甚至用戶之間、視頻之間，都可以通過簡(jiǎn)單的向量運(yùn)算得到匹配度。從模型結(jié)構(gòu)看，F(xiàn)M模型可以認(rèn)為是能夠更加緊密刻畫這種匹配度的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。為此，我們引入FM模型分解點(diǎn)擊-展現(xiàn)數(shù)據(jù)，得到用戶和視頻本身及各個(gè)維度的隱向量。通過這些隱向量計(jì)算用戶和視頻的匹配度。這些信號(hào)和與其它sub-model和高級(jí)特征一起，通過GBM進(jìn)行點(diǎn)擊率預(yù)估。

這種做法與Facebook在KDD'14發(fā)表的LR+GBDT模型有相似之處，差異在于： LR+GBDT本質(zhì)上是線性模型，而FM+GBM是樹模型，能夠處理信號(hào)與目標(biāo)間高度非線性的復(fù)雜關(guān)系，也具備更好的可解釋性。整個(gè)算法框架如圖所示：

由于FM需要例行訓(xùn)練，用戶隱向量灌庫(kù)和視頻隱向量加載之間存在時(shí)間差，而不同版本模型的隱向量之間是不可比的。為此我們?cè)O(shè)計(jì)了簡(jiǎn)單的版本對(duì)齊機(jī)制：所有隱向量都會(huì)保留最近2個(gè)版本的數(shù)據(jù)；在FM在線計(jì)算模塊中，實(shí)現(xiàn)版本對(duì)齊的邏輯，用對(duì)齊后最新版本的隱向量計(jì)算匹配度。由于例行訓(xùn)練的時(shí)間窗口為4~6個(gè)小時(shí)，保留2個(gè)版本的數(shù)據(jù)是足以保證絕大部分隱向量能夠?qū)R。在更加高頻的模型訓(xùn)練中，可以增加版本的數(shù)量來確保模型對(duì)齊。

效果上：一期+二期離線AUC提升10%，在線CTR和人均點(diǎn)擊提升6%。

結(jié)語(yǔ)

信息流短視頻排序?qū)咏?jīng)過一段時(shí)間的迭代優(yōu)化，目前已經(jīng)形成 LR->WD->FM+GBM這套相對(duì)比較完備體系。這種漏斗體系有助于排序?qū)釉谛阅芎托Чgtrade-off：越往后，模型越復(fù)雜/特征越高級(jí)/計(jì)算量越大，而參與計(jì)算的視頻數(shù)據(jù)量更少。

后續(xù)我們的優(yōu)化目標(biāo)將從點(diǎn)擊率預(yù)估轉(zhuǎn)向時(shí)長(zhǎng)預(yù)估，由感知相關(guān)性轉(zhuǎn)向真實(shí)相關(guān)性。這種轉(zhuǎn)換是合理且必要的：用戶點(diǎn)擊容易受到標(biāo)題和封面等因素的干擾，而真正體現(xiàn)用戶興趣的是消費(fèi)時(shí)長(zhǎng)。時(shí)長(zhǎng)模型以及點(diǎn)擊率預(yù)估模型與時(shí)長(zhǎng)模型的融合實(shí)現(xiàn)收益的最大化，將是下一個(gè)要重點(diǎn)攻克的問題。

你可能還喜歡

點(diǎn)擊下方圖片即可閱讀

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：萬(wàn)皇之皇 > 《IT互聯(lián)》

舉報(bào)/認(rèn)領(lǐng)