抖音首次公開演算法原理:推薦系統不打標籤只預估行為動作
近日,抖音安全與信任中心網站上線,並首次公開抖音推薦演算法原理,介紹其推薦演算法如何預估使用者行為機率,並透過多目標建模等方式實現更優質、豐富的內容推薦。

抖音在2016年上線,恰逢推薦演算法開始進入深度學習時代,抖音所應用的推薦演算法也是深度學習演算法的一種。據了解,抖音推薦演算法主力模型包括Wide&Deep模型等。
在2025中國網路媒體論壇上,抖音總裁韓尚佑在會上表示,許多人對推薦演算法技術有誤解,認為演算法是給內容打上對應標籤,再透過給用戶對應的屬性,最後透過資料運算,把對應標籤的內容,推薦給有對應屬性的用戶。
但隨著機器學習技術的發展,抖音的推薦系統已經幾乎不依賴對內容或使用者打標籤,而是透過一系列神經網路運算,直接預估每一個使用者對每一個內容的目標行為,例如按讚、追蹤、分享、評論的機率,並挑選出機率最大的部分內容,推薦給使用者。這意味著,演算法無需理解內容類型或語義,就能直接預測使用者行為。
針對“推薦只預估行為動作”,抖音在安全與信任中心網站上也作出了解釋:當用戶打開抖音時,抖音的推薦演算法會給候選視頻打分,並把得分最高的視頻推送給用戶。用戶在觀看時可以對看到的影片做出各種互動,這些互動體現了用戶對這個影片的興趣。
例如,用戶按讚比不按讚好,看完比沒看完好,沒有點不喜歡比點不喜歡好。在這裡,「看完了」就是一次回饋動作,「按讚」也是回饋動作。用戶對觀看的影片的每一次回饋,都有正面或負面的價值。
抖音指出,抖音的推薦排序模型學習的也就是這種行為回饋,推薦系統的目標就是把回饋價值最高的影片推給使用者。其推薦演算法的核心邏輯可以簡化為「推薦優先公式」:綜合預測用戶行為機率×行為價值權重=影片推薦優先順序。
那麼抖音推薦演算法如何預估使用者動作率呢?抖音安全與信任中心網站也分享了其具體步驟,首先是演算法學習,即學習用戶行為數據,其中既有即時的新數據,也有用戶歷史行為的數據;其次是機率模型預測,推薦演算法會透過演算法模型預測用戶對候選視訊的行為機率;接著是價值模型評估,透過價值模型,抖音會對使用者的互動行為進行價值計算,並透過不斷調整參數,對各類價值進行加權,綜合考慮多個因素來評估候選內容的價值;最後是動態調整,透過實現「分鐘級」即時回饋更新,助力演算法更精準地預判使用者行為。
為了引導推薦系統分發更豐富多元的訊息,抖音建構並平衡了「收藏」等100多個不同目標,解決單一目標下系統容易重複推相似內容的問題。抖音的演算法裡設定了專門的探索流量,幫助用戶持續拓展興趣內容。抖音也加強了推薦系統中對搜尋行為的應用,讓系統更即時地根據使用者搜尋興趣進行調整。抖音也優化了「不感興趣」「設定屏蔽詞」等功能,實現使用者對演算法的調控。