商务出差和女老板同房2在线观看_国产91变态调教视频_狠狠干亚洲最新电影av_美女自慰在线123区

您當前位置: 唯學網 » 用戶增長師 » 用戶增長師教育新聞 »

云音樂用戶增長預測之Prophet模型

云音樂用戶增長預測之Prophet模型

唯學網 • 教育培訓

2022-4-11 10:13

唯學網 • 中國教育電子商務平臺

加入收藏

云音樂用戶增長預測之Prophet模型

導讀:Prophet模型是Meta公司開發(fā)并應用于Facebook/Twitter等產品的開源時間序列模型,適用于MAU/DAU和新增的預測。在云音樂的業(yè)務中,此模型不僅能用于DAU預測,也能用于評估活動和波動分析等多種場景。

本文將從Prophet模型的原理出發(fā),基于對云音樂實際業(yè)務的思考,優(yōu)化和改良了原模型,提高了模型預測準確性,并探究了優(yōu)化后該模型在多種業(yè)務場景中的應用。

1

關于Prophet

Prophet模型是Meta公司開發(fā)并應用于Facebook/Twitter等產品的開源時間序列模型,適用于MAU/DAU和新增的預測。它僅僅使用序列的自相關性就能產生高質量的預測結果,不依賴其他的參數(shù),所以使用起來非常簡單便利,需要的計算資源也非常小。主要特點包括:

簡單易用,使用者只需懂得簡單的時間序列知識就可以使用

泛用性高,能廣泛應用于多個業(yè)務場景,也可以根據(jù)具體需要微調

解釋性好,模型易于解釋

不僅如此,了解Prophet最重要的不在于使用Prophet本身,而在于通過這一綜合的預測模型來了解預測時間序列的模式和方法,并將業(yè)務產生的價值和日常的波動分離開。

例如,通過將長期趨勢、季節(jié)因素、節(jié)假日分離開,Prophet可以幫助我們回答以下幾個其他模型難以回答的業(yè)務問題:

一些活動經常與節(jié)假日重合,例如元旦活動會帶來活躍但用戶在元旦本身就會更活躍,如何剝離元旦本身的影響來評估元旦活動帶來的額外價值?

一到9月,受開學影響,活躍會下降,但定量來說,開學的影響到底有多大?

在解釋DAU波動時,今年和去年同期都上升或下降但幅度不同,為什么?

原版Prophet模型只需要輸入時間戳和對應的值就可以輸出預測,但準確性偏低;我們通過結合業(yè)務特點,改良了Prophet模型,使得模型預測6個月DAU準確度從 ~85%提升到了 ~95%

2

Prophet 的原理

首先根據(jù)Harvey & Peters (1990),Prophet模型將輸入的時間序列拆分為三個部分

其中g(t)表示整體趨勢,并不包含任何周期性的因素,例如長期增長或者下跌;s(t) 表示周期性因素,例如季節(jié)性的因素,一周內的波動等等;h(t)代表重復的但非周期性的因素,例如假期;最后的μt則表示測量誤差(error term)。這一形式和Generalized Additive Model (GAM) 有非常多類似的地方,但是在Prophet模型中,這些關系間都是線性的,但是在每個因素內部則允許非線性的回歸。

如下圖所示,對于許多線上app來說,時間與日期往往對DAU或MAU有顯著的影響,例如在假期中MAU,DAU可能會有快速的增長,而在一般的工作日中DAU又可能會下跌。Prophet模型剝離出了日常的波動與長期的趨勢,這使得該模型不僅能夠更準確的預測波動,也能夠幫助剝離日常的波動而關注長期的趨勢。

通過上述的式子,Prophet模型將時間序列問題轉換為了曲線擬合的問題。

2.1長期趨勢

在業(yè)務的不同的階段,長期趨勢的表現(xiàn)可能是不同的,在app上線的初期可能會有非?焖俚脑鲩L,但是隨著時間的推移增長會逐漸趨于0。與之對應,在運營動作上,當業(yè)務快速增長時,拉新可能是最重要的,但是當增長逐漸放緩時,老客運營與召回可能有逐漸變得更有意義,所有準確的預測長期趨勢,不僅能夠反映目前的業(yè)務狀態(tài),也能夠幫助業(yè)務同學找到目前的重點。

對于許多業(yè)務而言,長期增長一般與自然界人口增長的模式比較接近,都有快速增長期,也存在著某一天花板例如上網人數(shù)。針對這些特征,一個常用的模型是 logistic growth model:

C就是capacity,也就是增長的天花板,k是增長速率,m則是抵消增長速率的參數(shù)。

2.2 季節(jié)因素

Prophet模型使用傅里葉級數(shù)來預測季節(jié)因素

這一公式的優(yōu)點在于可以不需要任何輸入就進行預測,但因為不需要任何輸入所以在長周期的預測中會不準確。

3

模型在云音樂業(yè)務中的應用&改良

根據(jù)云音樂的業(yè)務特點,我們對Prophet模型進行了如下改進:

結合市場及新業(yè)務板塊,設置了隨時間變化的天花板 C(t)

結合重大業(yè)務動作及市場事件,設置了關鍵的轉折點s

結合業(yè)務規(guī)律,為周期性因素預測引入了新的模型

以某模擬的業(yè)務數(shù)據(jù)為例,預測其DAU,準確率95%以上

3.1 模型改進一:業(yè)務轉折點&天花板

單純的logistic growth model并不適用于云音樂:

這個模型假定了一個固定的市場天花板C,但云音樂能觸達到人群并不是一成不變的,從單純的音樂播放到直播,社區(qū)等新業(yè)務,云音樂能觸達到的人群也在不斷擴大;

云音樂業(yè)務增長的速度k并不是不變的,隨著市場狀態(tài)的改變和不同的業(yè)務動作,增長速率在不斷改變。

針對上述兩個缺點:

以隨時間變化的C(t)代替常數(shù)C

定義業(yè)務的轉折點 s∈S,即當k發(fā)生改變的時候:

定義基礎的增長k和修正參數(shù)δ∈R s , 其中 δj 是轉折點 sj 的修正參數(shù),那么對任意時刻,總的增長速率是

定義集合a(t),上式可以寫為 k + a(t)^Tδ ,其中

因為增長速率k在轉折點會變化,相應的參數(shù)m也會變化來保證曲線是連續(xù)的并最終趨向0,定義

經調整的logistic growth model可以表示成

轉折點選擇

一般在預測中,轉折點出現(xiàn)的頻率并不會很高,通?梢赃x擇一個范圍,例如:一周可能會有一次轉折,一月一轉折等等)在選擇完范圍后可以通過拉普拉斯分布進行判斷是否存在大于0的轉折點,即假設,τ是一個控制分布的參數(shù),當τ越高時模型會選擇出更多的轉折點,反之亦然。轉折點也可以根據(jù)業(yè)務進行人工輸入。

轉折點選擇的標準是:可能對長期增長產生永久性影響的業(yè)務動作或者事件。例如,音樂領域反壟斷的出臺以及重大版權回歸。在選擇了可能的轉折點之后,還需要判斷轉折點是否顯著,我們用了兩種做法:

1)與歷史上類似的轉折點比較,觀察轉折點前后是否有明顯不同,依賴主觀判斷

2)比較R^2 ,比較加入該轉折點后預測準確性有沒有顯著的提升

天花板的確定

對于一個業(yè)務來說,能觸達到的用戶數(shù)是有限的,我們采用了三種方法確定天花板:1)成熟的業(yè)務,如音視頻等,直接采用研報和調研數(shù)據(jù);

2)成長期的業(yè)務,以自身指標及調研的市場份額進行估計;

3)對于初創(chuàng)期的業(yè)務,結合業(yè)務經營和市場調研的結果,對整體市場的成長率進行曲線擬合,得到整體市場的增長趨勢在應用于天花板。

最后,會根據(jù)app內不同業(yè)務的用戶重合度以及得到的天花板進行折算,最終計算出全站dau的天花板。

3.2 模型改進二:周期性因素的處理

對于云音樂來說,受到開學,放假等周期事件的影響較大,所以在通常情況下,我們只用傅里葉級數(shù)預估周末/周中的影響,即P = 7;對于月的周期影響會在排除了長期趨勢,周內周期后,結合其他的參數(shù)進行估計,例如9月上學的影響會與當年學生人數(shù),7月放假時dau提升及其他因素有關可以表示為:

除去長期趨勢,季節(jié)因素(周,月),Prophet 模型也提供了假期的估計方法:

v 是控制假期影響的一個參數(shù),模型內默認是10,但因為我們根據(jù)業(yè)務特點,在之前的周期預測的時候實際上可能已經考慮了一部分節(jié)假日的因素,所以實際上應用中通常設置v=8。

4

其他應用場景拓展&總結

預測DAU/MAU僅僅是該模型一個功能,在不同的業(yè)務中,Prophet可以有很多變體和表現(xiàn)形式,例如:

4.1評估活動影響

通過模型來評估活動影響有兩種方式:

1)將每重復的活動視為一個節(jié)假日,例如云音樂的年度歌單發(fā)布視為一個節(jié)假日;這種方式的優(yōu)點在于比較容易處理,但缺點也顯而易見,就是當活動與節(jié)假日重合的時候沒有辦法分離出節(jié)假日與活動影響,而且沒有辦法觀察活動的長尾影響。

2)將實際DAU減去長期趨勢,季節(jié)因素,節(jié)假日因素,最后得出活動帶來的增量,即

4.2 波動分析

該模型的每一部分都是獨立的,這使得我們可以結合業(yè)務特點,針對DAU的各個成分進行分析。

針對長期趨勢的分析可以找到各個關鍵的轉折點,一方面可以評估某一事件對指標長期的影響,另一方面也可以發(fā)現(xiàn)目前指標下降是否是之前某個事件的累積效應。對比今年和之前的長期趨勢,則可以更科學的判斷目前業(yè)務的狀態(tài)。

針對季節(jié)性波動和節(jié)假日的分析則可以更精確的拆分波動的來源。不僅如此,在實踐中,通過對不同端的周中,周末的波動分析,我們甚至發(fā)現(xiàn)了一些使用不同手機用戶的特點,幫助業(yè)務團隊進行更精準的運營投放。

5

Prophet 模型的局限性&思考

業(yè)界對Prophet的評價褒貶不一,因為Prophet 模型的輸入非常少,所以Prophet 模型的準確性非常依賴大量的數(shù)據(jù)進行預測。在實踐中,Prophet模型對DAU這類比較密集的指標預測往往能取得比較好的效果,但是對于MAU這類相較稀疏的指標預測則表現(xiàn)的比較差。

Prophet模型綜合了許多預測方法,通過Prophet拋磚引玉可以調整出適合自己業(yè)務的模型。

來源:一個數(shù)據(jù)人的自留地

以上是關于用戶增長師的相關信息,以供大家查看了解。想要了解更多用戶增長師信息,第一時間了解用戶增長師相關資訊,敬請關注唯學網用戶增長師欄目,如有任何疑問也可在線留言,小編會為您在第一時間解答!


0% (10)
0% (0)
已有條評論