大數據殺熟仍未絕跡 工程師:公開「黑盒」演算法幾乎不可能
“電視裡放著關於故宮的紀錄片,打開手機電商App首頁就被推送大量文創類商品。” 喜歡看歷史節目的雲雲(化名)說道。 “手機’偷聽’+演演算法推薦”似乎已經成為線民們見怪不怪的平常事,”比你自己更瞭解你”的各種互聯網應用在消費端變幻出五花八門的玩法,只為滿足你的所謂”需求”。
近日,上海制定發佈的《上海市網路交易平臺網路營銷活動演算法應用指引(試行)》(以下簡稱《指引》)提出了多種存在風險的網路行銷活動演算法應用方式,包含了數據處理、參數設置、消費者畫像、差別待遇、資訊推送或商業行銷等。
同時,《指引》也提出了相關合規管理建議,其中”鼓勵平臺經營者通過公開演算法原理、目的意圖、決策規則、可能產生的影響等資訊,提供演算法應用結果解釋等方式提升公眾對演算法應用的理解”值得關注。
價格”私人定制”
“大數據殺熟”一詞進入大眾的視野可以追溯到2018年,成為當時年度社會生活類十大流行語之一。
“大數據殺熟”的主要表現形式在於”不同人不同價”。 北京市消協曾發佈的”大數據殺熟”問題調查結果顯示,88.32%的被調查者認為”大數據殺熟”現象普遍或很普遍,沒有被調查者認為”大數據殺熟”現象不存在。 此外,還有56.92%的被調查者表示有過被「大數據殺熟」的經歷,而網購平臺、在線旅遊、網約車類移動用戶端或網站是「重災區」。
圖源:北京市消協
《IT時報》記者在黑貓投訴平臺輸入「大數據殺熟」,一共出現了1882條投訴資訊,排在前10條的幾乎都和2021年「雙11」有關。 “本人在某商城領取優惠券購買商品最終價格1349元,而用另一個不常用的賬號領取相同優惠券,最終價格1249元。 主號和不常用的號最終價格相差100元”;”原價3.8元的坐墊,從購物平臺的簽到頻道進去購買,同一個店鋪的同一款商品變成5.8元”。
比起價格上的顯性差異,有些「大數據殺熟」則是潛移默化的。 “因為’大數據殺熟’,所以我一直不買某自營生鮮平臺的會員。” 嘉嘉(化名)告訴記者,”正因為我不是會員,所以經常可以收到平臺給我發放的大額優惠券,比如’99減50”199減100’等。 而我的同事辦了會員之後就收不到這類優惠券了,大多是會員每月領取的’79減5”109減7’之類。 不過,由於我使用次數增多,現在這種大額優惠券也很少收到了。 ”
中南財經政法大學數字經濟研究院執行院長、教授盤和林在接受記者採訪時指出:”‘大數據殺熟’是互聯網平臺收集特定用戶的資訊,對用戶進行畫像。 比如如果你經常買奶粉,系統就給你貼上一個『媽媽』的標籤;如果你經常買貴的奶粉,系統就給你貼上一個『購買力強』的標籤;如果演算法判定你的價格敏感度低,演算法就推送較高的報價,從而抬高產品售價。 這裡的關鍵是精準性,也就是『大數據殺熟』必須是演算法針對個人做出的精準報價,其前提是演算法通過個人用戶的數據收集而完成對個人使用者的定位。 ”
對此,《IT時報》記者測試同時在某網購平臺搜索「兒童鞋」,並按照價格升序排列。 相比之下,年輕媽媽因為經常搜索兒童類產品,所以最低價格的鞋子為33元;而另一位記者從未搜過兒童類產品,最低價為21元,相差12元。 隨後兩位記者又用「兒童舞蹈裙」關鍵詞進行了測試,得到了類似的結果,年輕媽媽得到的推薦商品更貴。
从未搜过儿童产品的用户的搜索页面
经常搜索儿童产品的年轻妈妈的搜索页面
“不能说的秘密”
“大数据杀熟”的前提是通过各种渠道收集用户数据,而技术的成熟,使得算法在互联网行业大规模应用成为现实。
算法工程师阿石(化名)在一次算法研讨会上提及:“有一次客户提出想让我们提高部分用户对曾经购买过产品的回购次数,如口红、酒等。客户提供用户的相关数据,让我们定位用户信息,给用户做合适的推送。针对这样的要求,我们的团队就要考虑这样做合不合适,要不要接单。”
某互聯網公司軟體測試工程師阿蔚(化名)告訴《IT時報》記者:”很多演算法是數據互通的,尤其在屬於同一公司產品時比較明顯。 說白了就是使用者被A平臺搜集的數據,被B平臺檢索到,B平臺也能直接掌握你的喜好、習慣等,並嘗試精準推送,採集到的數據越多,推送就會越精準。 ”
對消費者來說,他們往往無法掌握規則,雖然質疑互聯網平臺存在「大數據殺熟」行為,但又沒有明確證據。
《指引》指出,鼓勵平台經營者提供演算法應用結果解釋等方式提升公眾對演算法應用的理解。 對於演算法公開,演算法從業者阿林(化名)告訴《IT時報》記者:”演演算法分為’白盒’與’黑盒’。 ‘白盒’演算法比較直接,程式師編寫程式代碼后能夠知道輸出的結果。 而『黑盒』演算法則根據獲得的數據自動升級,數據越多升級越快,一直都處於更改狀態,而最後輸出的結果程式師自己也不清楚,也不可控。 相比之下,『黑盒』演算法運用更多,也很難公開。 ”
盤和林表示,對於平台來說,一方面擔憂演算法機制洩露降低自身競爭能力,因為演算法公開需要大量調出長期累積的演算法數據,這也是平台技術能力的一部分;另一方面,平臺也擔心演算法公開後引起爭議,比如某些數據在用戶看來是很敏感的,由於恐懼隱私洩露,大多數人會選擇不要推薦。
互聯網行業自律的平衡點
“大數據殺熟”是由互聯網平臺實施差異化營銷導致的。 在日常生活中,我們經常會碰到這類行銷方式。 比如點開一個視頻網站,系統根據用戶平時的觀看種類、時長等推薦一些影片,避免使用者在海量影庫中搜索。 如果推薦影片正好使用者喜歡,用戶就願意花錢購買。 這種差異化行銷既使得平臺營收增加,又節約了使用者的搜索時間。
在很長一段時間里,社會和產業對「大數據殺熟」的定義邊界並沒有那麼清晰。 有的時候使用者希望獲得相關推薦;當演算法推薦損害利益的時候,使用者又希望能夠通過一些手段阻止;更多的時候,”大數據殺熟”是無形的,使用者並不確定自己是否正在被殺熟。
上海申倫律師事務所律師夏海龍在接受媒體採訪時表示:”‘大數據殺熟’和差異化營銷的真實關係是一體兩面,站在企業的角度是差異化行銷,站在使用者的角度就是被殺熟。 ”
“演算法規則的制定並不是針對具體的某個人,但演算法在執行過程中可能傷害到了某些人群。” 同濟大學CIMS研究中心副研究員馬雲龍認為,「大數據殺熟」並不是一個互聯網化的概念,但是互聯網平臺利用它的壟斷地位,掌握大量的用戶數據實現利益最大化,造成的交易不公平侵害了個人消費者的權益。 這次上海出臺的《指引》是希望互聯網行業能夠從自律的角度去找到一個平衡點。 ”
《指引》更多鼓勵網路交易平臺經營者根據自身業務類型、規模大小等,建立相適應的演算法應用合規管理制度,加強對演算法應用的風險防控和隱患排查治理。
電子商務研究中心主任曹磊也認為:「由於數據掌握在平臺手中,對於數據的處理方式外人不得而知,對於殺熟現象的規避還要依靠企業的自覺,只有平臺正視大數據的價值,對其進行合理的管理與應用,才能更好地服務消費者。 ”
來源:IT時報