抱歉,“大數據殺熟”無藥可救
“大數據殺熟”並非一個新鮮玩意了,但它所引起的重視遠遠不夠。我們希望通過採訪專業的程序員、算法工程師、法律專家等人士來找到哪怕一絲的使用技巧和方式,來避開所謂的“大數據殺熟”。讓人難過的是,得到的回復大多是“沒辦法”“不可能”“看運氣”“維權渺茫”。
出品|虎嗅科技組
作者|張雪
編輯|宇多田
這只是一個結論。當我們深入研究了“大數據殺熟”過程、維權方式和途徑之後,生出一種“人為刀俎,我為魚肉”的無力感,也壓著被大數據“殺熟”的每一個人。
那麼大數據背後的技術路徑是怎樣的?這種做法背後隱藏的商業邏輯又成為了誰的“致富經”呢?
大數據這樣殺熟
“大數據殺熟”,對於每個活在互聯網世界裡的人都不是個陌生詞彙,據公開資料記載,“大數據殺熟”是在2018年被廣泛關注和報導的。
不過,我的一位程序員朋友告訴我,早在2017年,他就在滴滴上經歷了大數據殺熟:“比如我和我媳婦同時打車,同時發起,同樣的起止點,我的定價每次都會貴一些,因為我每天都要打這個路線的車,我媳婦是偶爾會打,就感覺是分析出來熟客吃定的感覺。”
無獨有偶。
我身邊的同事也分享了她被大數據殺熟的經歷,巧合的是,她同樣也是在使用滴滴。
“2016年左右,我家住在丰台區的怡海花園,每天到海淀的上班距離很固定,那時候最開始打車每次只需要20多塊錢,但是差不多就在三個月時間內,就漲到了50多。”
關於滴滴的這種情況,滴滴總裁曾親自澄清稱“滴滴出行不存在大數據殺熟的行為。”
但可以肯定的是,真實存在的大數據殺熟要比我們已知的出現時間更早。
在目前市面上已有的報導中,並不缺乏這樣的案例,甚至在剛剛過去的雙十一,這樣的戲碼也依舊在上演。
據央視報導,北京的韓女士使用手機在某電商平台購物時,中途錯用了另一部手機結賬,卻意外發現,同一商家的同樣一件商品,註冊至今12年、經常使用、總計消費近26萬元的高級會員賬號,反而比註冊至今5年多、很少使用、總計消費2400多元的普通賬號,價格貴了25塊錢。
仔細對比才發現,原來普通賬號頁面多出來一張“滿69減25”的優惠券。韓女士認為自己遇到了大數據“殺熟”。
那麼大數據背後的殺熟原理究竟是怎樣的呢?總結來看,簡單的流程如下圖所示。
圖片來源:CSDN博客
如果非要給“大數據殺熟”一個定義,就是“老客戶看到的價格會高於新用戶”。而企業這樣做的目的,主要是為了增加新用戶的粘性。
其實在現實生活中,我們會遭遇大數據殺熟的移動應用無非是兩種:
一是使用在線旅遊類的App,比如攜程,去哪兒,飛豬等;另一種則是使用電商類App,比如淘寶,京東,美團等。而在電商類App中,具體在什麼時間對你進行殺熟,又要分平時消費與節假日促銷兩種情況。
這裡需要指出,在任何場景下,大數據殺熟一定是基於你的行為習慣來進行分析的。
所以,就有了這樣一個事實,我們通過App進行的大部分行為都在被實時獲取,它們會變成一個個小標籤,標記我們的同時,也成為了商家算計我們的利器。
以在OTA軟件為例,這些標籤中,除了基本的男女,地區,是否使用蘋果手機之外,還會有你幾點幾分瀏覽了什麼商品,看了多久,價位如何等等。
簡言之,就是幾乎每個會影響你消費的行為都在被標記。
但一位程序員告訴我們,在電商場景中,還存在另一種“殺熟”現象。
她舉例稱:假如我平時瀏覽服裝和寵物用品時間比較多,那麼某寶在給我推薦這類產品時,需要推薦相似但性價比高的產品,因為花費了較多時間,會產生“價格敏感” ——因為常用,我會對這些商品價格區間更為熟稔。
反之,當我突然開始瀏覽平時不怎麼看的產品,比如機械鍵盤,男生球鞋,且瀏覽時間不長,那麼算法就會傾向於推薦價格較高的產品。
而原因也呼之欲出——我不熟。
幾年前,在一次採訪中阿里雲的程序員曾滿臉自豪地講到,“我們現在已經能夠做到全中國幾億人口的淘寶界面都是不一樣的,而且幾乎做到了秒級更新。 ”
而那個階段也正是阿里發力“千人千面”的新零售的高潮,這裡的“千人千面”可以簡單地理解為每個人的淘寶界面都不一樣,都是基於算法進行“量身定制”的。
也正是因為所謂的“千人千面”的存在,所以當我在這次採訪中,追問到底我們什麼樣的行為關鍵詞會觸發大數據殺熟機制時,並沒有得到一個唯一的答案。
因為我們每一個人,都被一套特定的算法所“操縱”。
一位多年的行業從業人員告訴我:“首先,行為關鍵詞屬於算法的一部分,而算法對於公司來講屬於商業機密;其次,具體的測算方式不唯一,每個人的行為都會被進行無數次分析,然後進行個性化推薦,效果最好的才會被採用。”
為了更形像地解釋,他還舉了這樣一個例子:假設我們每個人的數據是一個面積不同的正方形,我們要在正方形中找到一個特定最佳的面積值。
我們需要在這個正方形中從各個角度畫無數條線,直到找到那個最優解。而這條帶來最優解的線就是“專屬於你的算法”。
對於用戶A,可能紫色線是最優解,而對於用戶B,可能黃色的是最優解。
不過,一個很有意思的特殊案例也在最近出現了,它證明了“大數據殺熟”不能被完全判定為“不利於消費者的漲價行為”。
今年十一期間,電影《奪冠》上映。出於娛樂的心態,我一個朋友購買了電影票,但一刷之後,她備受情節鼓舞。於是在接下來的一周內,她又去同一影院刷了三次。
在這期間,戲劇性的一幕發生了,她發現自己每次買票都比上一次便宜。第一次價格是將近100元,但四刷的電影票只需要26元。
當然,被大數據殺熟而減價的事情肯定並不常見,因為我們也無法判斷這是否是影院為了市場回暖而採取的特殊降價舉措。
但從商家來講,降低了客單價,同時又增加了用戶粘性,也不失為一個經商之道。
低成本,高回報
了解這樣一套操作流程後,不知道大家是否跟我一樣,會考慮到大數據殺熟的成本問題,畢竟這樣看似複雜多變而又個性化的操作,顯然不是一日之功。
於是,我又把這個問題拋給了算法工程師們,以期大數據技術在操作難度和成本上為我們的權益上一道鎖。
然而,我的天真想法卻再一次落空。
“搭建企業大數據系統後台當然是需要花費一定時間和金錢,但搭建系統的目的是為了App的正常使用,而’殺熟’,恰好是可以捎帶上的一個能力。”一位在多個OTA平台工作的算法工程師告訴了我真相。
換句話說,“我們被殺熟”只是隨著數據、系統與產品愈加豐滿而出現的一個附加能力,但沒想到讓企業取得了意想不到的效果。
“沒你想像得那麼難,打標籤這項工作不需要付出很多成本。而至於怎麼來殺熟,那隻是用樣本驗證模型的事情。”另一位產品負責人補充道。
成本如此之低,那回報又是如何呢?
很遺憾我們並沒有從國內的企業方獲得這樣的相關估算,不過曾有人為Netflix算過這樣一筆賬,或許能帶給我們一些啟示。
根據美國布蘭戴斯大學經濟學系助理教授Benjamin Shiller,基於Netflix的研究發現,使用傳統人口統計資料的個性化定價方法,可以使Netflix增加0.3%的利潤,但根據用戶網絡瀏覽歷史,使用機器學習技術,來估算用戶願意支付的最高價格,可以使Netflix 的利潤增加14.55% 。
當然,這也只是冰山一角。
雖然很不願意承認,但是我國的數據隱私保護意識自互聯網時代之初,就十分一言難盡。所以我們有理由推測,用更多數據訓練出來的中國式推薦算法,為企業帶來的營收增長幅度要遠超Netflix。
另外,還有一個最近被熱議的“帶頭盔”看房的事件。據報導,目前很多售樓部都安裝了類似監控設備的人臉識別系統。
這套系統主要是用來採集潛在購房者的面部信息,一來記錄該購房者是自己走進售樓部還是被中介引導走進售樓部,二來是記錄購房者進來的次數。
而記錄這些信息的原因則在於,被中介引導進門的購房者和第一次進售樓處並下單的購房者,能夠享受更多的優惠。
所以,大數據殺熟從商業層面也為企業帶來了穩定可靠的收入,或許這也是讓這些App戒不掉大數據殺熟的根本原因,畢竟在商言商,誰不想賺個缽滿盆滿。
維權難上加難
當大數據殺熟成了互聯網消費中的頑疾,除了引發全民的關注度持續高漲,大數據殺熟事件的頻發也帶來了司法部門的關注。
據公開資料顯示,為了治理大數據殺熟行為,司法部門也及時擬定了法律條文,包括但不限於以下內容:
當普通大眾有了這樣的維權武器。那些站在上帝視角的企業也紛紛低下了高傲的頭顱,在被發現對用戶進行大數據殺熟行為後,他們一個接一個地發布了否認聲明。
當然,他們也並沒有隻是在口頭上下功夫。據知情人士透露,在大數據殺熟相關法律出台之後,各大App會把產品的真實價格顯示給用戶,只不過這樣的真實價格基本躲在十幾頁甚至幾十頁之後。
而這樣的擦邊球做法也無形中增加了消費者維權的難度。
讓人有些無奈的是,拿十月份剛剛出台的在線旅游處理辦法來看,消費者維權,企業最高只需要支付50萬的賠償金。這樣的處罰程度,對動輒幾十億,上百億市值的企業來說,簡直是九牛一毛。
更何況,現實中能夠真正去花費時間、精力去維權的人又少之又少,其他的絕大部分人則會選擇無奈搖頭,自認倒霉。
上海市新閔律師事務所高級合夥人莊帆律師的真實體會也正好證實了我們的看法。他表示,從他的經歷來看,因被大數據殺熟而維權的案例市面上其實寥寥無幾。
他舉例稱,由於律師是一個出差頻繁的職業,他和他的同行經常要定機票和酒店,正是如此,也都或多或少,也有過被“殺熟”的經歷。
“大家頂多把自己的經歷發到群裡,抱怨幾句,幾乎沒人去真正地維權,一來,我們明白取證太難,二來,需要付出很多時間成本。”莊帆說。
另外,他還指出了另一個糟心的事實:“連我們這些懂法律的人,都放棄了維權,可見普通人的維權意願也不會太強,如此一來,就助長了這不良的風氣。”
學會了算法,丟掉了信任
如今看來,在商業利益和用戶信任之間,國內精明的商人們肯定會選擇前者。但如果長此以往,這樣聰明的算法又真正算計了誰呢?
值得欣慰的是,現在國家監管層面已經開始在互聯網領域推出了反壟斷法。
11月10日上午,國家市場監管總局發布《關於平台經濟領域的反壟斷指南(徵求意見稿)》公開徵求意見。
其中,互聯網平台基於大數據和算法技術優勢實行的某些交易行為,也需警惕是否構成“無正當理由對交易條件相同的交易相對人實施差別待遇,排除、限制市場競爭”。
其中,在分析是否構成差別待遇時,可以考慮的因素包括:根據交易相對人的支付能力、消費偏好、使用習慣等,實行差異性交易價格或者其他交易條件等。也就是說”二選一和大數據殺熟或被認定壟斷。”
我們一直清楚技術具有兩面性,但“黑暗面”卻似乎在國內被物盡其用的更加徹底。究其原因,企業的趨利性、法律的漠視、個體的默認,沒有一方可以免於責任,置身事外。
水能載舟,亦能覆舟。
沒有人能永遠擁有行業壟斷之勢,商家丟掉客戶的信任與客戶流失並無二致。而已經在中國幾億網民身上嘗盡了甜頭的互聯網與技術巨頭們,相信會在某一天因我們的信任而付出有償的代價。