美團推薦系統的整體框架與關鍵工作

推薦系統的好壞直接影響著銷售額,如何基于大用戶群體搭建更精準的推薦系統,美團有自己的說法。今天介紹文章來自美團推薦與個性化團隊技術經理沈國陽在CSDN分享的實錄。

01

沈國陽重點介紹了美團推薦系統的架構和特色,以及在排序層面的主要工作。

 

沈國陽表示, 對于推薦系統的效果提高,排序比候選集的貢獻要大很多。美團排序的主要工作包括:模型及建模,樣本采樣及 label 處理,去除 position bias ,特征工程,Interleaving 的使用,以及 Online Learning 的嘗試等。
以下為分享內容文字整理:

美團推薦產品

沈國陽首先介紹了美團的幾個重要的推薦產品:

1.猜你喜歡:美團最重要的推薦產品,目標是讓用戶打開美團 App的時候,可以最快找到他們想要的團購服務。已經做了2年多,交易額占比從最初的0.7%提高到7~8%。

2.首頁頻道推薦:若干頻道是固定的,若干頻道是根據用戶的個人偏好推薦出來的。這個區域為美團 app帶來40%以上交易額。

3.今日推薦個性化推送:美團的個性化推送的產品,目的是在用戶打開美團 App前,就把他們最感興趣的服務推送給他們,促使用戶點擊及下單,從而提高用戶的活躍度。

4.品類列表的個性化排序:美團首頁的那些品類頻道區,點進去的列表的智能排序,也是我們進行個性化優化的重要位置。相對于搜索,這個位置用戶的意圖不是非常明確,個性化程度較高;但是相對于首頁的猜你喜歡,這個位置用戶的意圖則要強一些,個性化程度稍低一些。

美團推薦系統的目標

美團推薦系統的目標,首先是要幫助用戶快速找到所需。推薦系統作為美團C端平臺的重要組成部分,其目標就是為消費者快速找到“高品質,低價格”的服務。判斷是否實現目標,主要是看消費者看了推薦結果以后的下單轉化效果。

 

另外,美團希望消費者對美團的品牌認知是“吃喝玩樂”的大平臺,所以也希望推薦出來的結果包含多個品類的結果,即推薦結果有多樣性。

 

目前,美團的目標還主要集中在下單轉化效果,隨著下單率效果的大幅度提高,今后會把重心轉到多樣性。

推薦系統的整體框架

沈國陽接下來介紹了美團提高推薦下單轉化效果的實現路徑。其推薦系統的整體框架如下:

02

沈國陽解釋說,最頂層顯示的是推薦系統對外的服務接口。由于不同展位的輸入輸出參數差異較大,因此這一層沒有做過多的抽象,每個展位有自己特定的接口形式。

 

接口層會調用 ab測試?配置模塊,對接入的流量按照uuid、城市等維度進行分流量的配置。 abtest 對于推薦系統是很重要的基礎模塊,美團對這個模塊的要求,是可以有友好的配置界面,靈活根據不同不同維度進行分流量配置,并且立即生效,無需重啟服務。

 

Abtest 配置模塊之下,是推薦候選集的生成,排序和業務處理模塊。候選集生成和排序模塊,除了針對不同展位有不同邏輯以外,對同一展位的不同策略也有不同的邏輯。abtest 模塊在配置流量策略的時候,可以根據需要單獨配置候選集策略和排序策略。業務規則處理模塊,則有統一的處理邏輯,也有每個展位獨特的邏輯,而同一展位的不同策略,通常來說在這一層處理邏輯不會有區別。

 

重新從接口層開始換個方向來看這個框架。在響應請求的同時,會打印一些必要的日志,記錄這次請求的一些必要的上下文信息以及用戶及item相關的特征信息,以便生成訓練數據。這些日志通過flume傳輸到HDFS上面。除了推薦系統以外的美團App其他后臺服務,也會把各自的日志傳遞給HDFS,以方便后續進行數據挖掘。借助Hadoop、Hive、Spark等平臺以及美團自己實現的一些機器學習/推薦通用算法,對原始日志進行處理,從而得到需要的各種數據及模型:包括用戶的profile信息,用戶之間的相似度,item之間的相似度,后續我們將要重點介紹的地理位置與item之間的關聯關系,以及轉化率預估模型。

 

這些數據及模型在剛才介紹的候選集生成模塊,排序模塊,業務處理模塊會被使用到。

 

在推薦系統的候選集生成這一塊,美團重度使用了傳統的user based,item based協同過濾算法。這里面需要注意的是,美團引入了時間衰減的因子,從而使新的行為起的作用大于老的行為,從結果來看,這確實對于效果會有提升。同時,美團嘗試了不同的相似度計算方式,發現基于llr(Log-likelihood ratio)的相似度計算比cosine相似度計算的最終效果要好一些。在首頁的猜你喜歡這個展位上,美團發現user based算法比item based效果要好很多。原因和user based算法更容易推薦出有一定新穎性的item有關。

美團推薦平臺的重要特點

上述傳統協同過濾算法,需要在用戶行為較豐富的情況下才能奏效。而對于那些行為稀少的用戶,需要根據平臺的特點進行做好冷啟動策略。沈國陽介紹美團平臺的幾個重要特點如下:

1. 冷啟動用戶占比高

03

2. 移動終端占比高

美團的移動終端用戶占比和移動終端交易額,都已經超過美團整體交易額的90%。這導致美團用戶的使用場景往往是這樣的,和朋友約定到哪個shopping mall逛街,逛完了再用美團看看周邊有什么飯館,決定要去哪里吃飯。或者看完一場電影,出來再上美團看看,決定去哪個酒店。

 

這就引出美團平臺交易的另外2個特點。

 

3. 持券時間短

用戶從下單到消費的時間間隔。下圖顯示的是美團平臺上不同類型交易在持券時間上的分布。從中可以看出,電影,美食這樣的高頻品類的持券時間都非常短,40%的用戶在一個小時以內消費。只有像攝影寫真,美發這樣的低頻品類,持券時間會比較長。而美團平臺上,美食,電影這種高頻品類的交易額占比非常高。

04

4. 持券距離近

持券距離指的是用戶下單地點和消費地點之間的距離。上圖縱軸表示對應城市的某個品類的所有交易訂單中,持券距離最近的top 80%的交易中的最遠的持券距離。可見,大部分城市和品類,top 80%持券距離在2000米以內。

 

“本地人熱單”策略

 

基于以上特點,美團在用戶冷啟動上,研發了“本地人熱單”策略。如下圖所示,就是指一定區域內的用戶,瀏覽或者購買較多的top items。

05

這里面又有一個問題,這個區域多大范圍,怎么定義呢?

 

美團的目標是,使這個區域足夠細,同時又能夠使這個區域內的用戶行為統計有一定的統計意義。目前使用的是商圈,平均覆蓋范圍在十幾平方公里。

 

給用戶進行推薦時,主要根據用戶的實時商圈進行推薦該商圈的本地人熱單。但是,由于技術原因或者其他原因,用戶的實時位置并不總是能夠獲取到,或者用戶的實時商圈,可推薦的item數量太少。這時候,需要采用其他的替代方案。美團在用戶地理位置方面進行了大量挖掘工作。例如,用戶周末/平時常去商圈,用戶的周末/平時常消費商圈,用戶的工作地/居住地附近商圈等,用這些商圈信息,可以根據具體情況,豐富推薦的item。

 

不同時間段的用戶需求是不一樣的,因此每個時間段的本地人熱單應該是變化的。然而劃分太細的時間段,數據量往往又太稀疏,因此通過把其他時段的數據根據時間相似度加權統計進來,效果又會有進一步的提高。

06

美團排序的主要工作

沈國陽還分享了美團排序經驗。他表示,對于推薦系統的效果提高,排序比候選集的貢獻要大很多。美團在排序方面所做的主要工作如下:

1.模型及建模

目前美團的推薦系統的排序模型主要是Additive Groves模型,另外也在探索FTRL這樣的在線學習模型。AG模型是一種決策樹類型的模型,屬于非線性模型。這種非線性模型的特點,是一定程度上能夠自動進行特征組合的工作,不需要人工進行大量這類工作。

 

建模方法和傳統的ctr預估建模方法一樣,是point wise的模型。每一個item對一個用戶的每次展示可以作為一個樣本,這個item是否被點擊或者是否被下單作為標記。美團會為這些樣本抽取一些item特征,用戶特征,上下文特征,item與用戶的交叉特征。

 

2.樣本采樣及label處理

由于我們的最終目標是提高item的下單轉化效果,所以我們需要重點采用用戶下單行為作為標記。但是如果只用下單行為,又會導致數據較為稀疏,有很大比例的用戶很長時間內是沒有下單行為的。所以我們還需要使用點擊行為作為標記。而對點擊行為和下單行為對于訓練目標的價值是不一樣的,對它們需要做不同的處理。美團嘗試了2種方式,在參數取得比較合適的情況下,二者的結果效果都很好。一種方式是提高下單樣本的采樣比例,比如相對點擊樣本提高30倍。一種方式是提高標記值。比如下單行為的標記值為30,點擊行為的標記值為1。

 

3.去除position bias

item在展示列表中的位置,對item的點擊概率和下單概率是有非常大影響的,排名越靠前的item,越容易被點擊和下單,這就是position bias的含義。在抽取特征和訓練模型的時候,就需要很好去除這種position bias。我們在兩個地方做這種處理:一個是在計算item的歷史ctr和歷史cvr的時候,首先要計算出每個位置的歷史平均點擊率ctr_p,和歷史平均下單率cvr_p,然后在計算item的每次點擊和下單的時候,都根據這個item被展示的位置,計算為ctr_0/ctr_p及cvr_0/ctr_p;一個是在產生訓練樣本的時候,把展示位置作為特征放在樣本里面,并且在使用模型的時候,把展示位置特征統一置為0。

 

4.特征工程

特征工程是排序模型的最重要工作,排序帶來的效果提升,大部分是由特征工程帶來的。但是提起這部分工作,又會比較枯燥,就是不斷地去接觸和理解業務數據,試圖從中挖掘出和用戶轉化相關的特征。美團使用的主要特征包括:
上下文特征:如時間,地理位置(商圈),天氣,溫度等。
item特征:如團購服務的價格,銷量,用戶評分。這部分特征用得很多,但是過多公開容易引起作 弊,所以不詳細介紹。
用戶特征:用戶的屬性特征,如年齡,性別,婚育狀態,品類偏好,價格偏好等。

 

5. Interleaving的使用

美團進行策略效果對比所使用的方法是abtest。abtest的好處是能夠對多個策略的效果差異給出定量的評估,但是也存在一些問題,比如,如果兩個策略的效果差異較小,abtest容易給出波動較大的結果,需要較長時間(一般是一周)才能判斷結果,會導致效果迭代速度較慢。為了解決這個問題,美團采用interleaving效果評估方式作為補充。Interleaving方式的好處是所需流量較小,靈敏度較高,一般24小時之內可以給出結論,但是它只能給定性結論而不能給定量結論。Interleaving的基本思想是把兩個策略的結果混合在一起,通過統計分析用戶選擇哪個策略的概率更大。具體列表混合的實現方式有多種。下面介紹比較簡單使用的一種,叫Balanced方式。

07

兩種參與對比的策略的列表如圖所示,為A列表及B列表。A列表的順序為a,bcdgh,B列表的順序為beafgh。Balanced合并方式的A first方式如下:A列表的a,B列表b,A列表的b重復了,順延到B列表的e,如此循環下去。

 

采用這種列表混合方式的效果評估方式如下:

08

統計所有用戶對這個列表的下單情況。用戶點擊的item在A列表排序靠前,則wins(A)++,用戶點擊的item在B列表排序靠前,則wins(B)++,中間情況則ites(A,B)++。德爾塔ab為正表示A策略優于B策略。

 

例如,wins(A)=40%,wins(B)=30%,tie=30%,計算結果為5%,意味著A策略比B策略的效果好。

 

6.Online Learning的嘗試

美團還嘗試引入Online Learning。沈國陽表示,互聯網上的機器學習和傳統機器學習存在很重要的區別:互聯網上的機器學習面對的是活生生的用戶,而用戶群體的行為是受很多因素的影響不斷變化的,季節因素,天氣因素,空氣質量,社會潮流,甚至一檔電視節目,都會對用戶的行為產生很大的影響,比如前段時間的奔跑吧兄弟,引發了撕名牌的熱潮。為

 

了能夠更快捕捉用戶行為模式的變化,非常有必要引入Online Learning。

 

美團online learning的工作正在進展中,效果還不夠穩定。沈國陽預告說,美團將會在9月中旬舉行的美團第二屆技術沙龍活動中著重介紹其Online Learning算法。

 

本文轉載自:微信公眾號:數據分析

 

吆喝科技:國內唯一同時支持前端(Web/H5、iOS、Android)及后端(Node.js、PHP、Java 等) A/B 測試服務的專業 SaaS 平臺。支持線上灰度發布、多維度數據統計分析、科學的流量分配系統、一鍵發布新版本無需應用市場審核、定向測試。

用數據幫助用戶優化產品,提升轉化、留存和你想要的一切。 AppAdhoc 用數據驗證最佳方案,提高產品設計、研發、運營和營銷效率,降低產品決策風險。

9136 Views
即刻實踐文章理論 A/B測試 灰度發布 產品優化 免費申請
Please wait...

訂閱我們

對于每位訂閱讀者,每兩周,吆喝科技會為您發送4篇精選文章,可能是最新的A/B測試實踐,也會是你所期待的增長干貨。
qq宠物捕鱼大师 四肖期期准准i 体彩江西11选五玩法 现在彩票平台有哪些 时时每天赢5万的方法 广东时时走势图百度百度贴吧 平特什么意思 篮球彩票怎么算大小分 王中王论坛资料大全 重庆老时时技巧 赛马会精选六肖