以隱私的名義,一場數據的戰爭打響了
在三藩市的”新矽谷”SOMA 區,通往海灣大橋的高速公路旁,佇立著一塊鴨子看板,上面寫著:”谷歌在追蹤你。 我們不會。 “說這話的鴨子來自 DuckDuckGo,一家主打隱私保護的搜尋引擎公司。 在美國,DuckDuckGo 有 2245 塊看板,在歐洲是 2261 塊。 這對於一家科技公司來說並不尋常。
DuckDuckGo 在三藩市「新矽谷」SOMA地區的看板|圖片來源:WIRED
通常,科技公司更傾向於在線上投放廣告。 根據用戶數據生成的定向廣告可以讓公司更高效地找到他們的目標使用者。 DuckDuckGo 選擇了看板這種老派的方式——這是為了以行動樹立這家企業的價值觀:不追蹤使用者。
去年,DuckDuckGo 的應用下載量超過了 5000 萬次,比之前所有年份的總和還多,年收入也相應突破了 1 億美元(約合 6.5 億元人民幣)。 要知道,這家成立於 2008 年的公司,在上一輪融資過後,估值也就 7480 萬美元(約合 4.86 億元人民幣)。 看起來,它主打隱私的價值觀奏效了。
最近,DuckDuckGo 憑藉 2.42% 的市佔率,超越必應、雅虎成為了美國第二的移動搜素引擎。 而第一名的谷歌,是 94.36%,DuckDuckGo 的 39 倍。
這是一個大衛挑戰哥利亞的故事,但在這個故事中,「大衛」揮舞的不是石子,而是「隱私」這桿大旗。
種種數據表明:在巨頭格局確立,新秀創業公司本沒有多少增長空間的當下,以隱私為名的新一代數據之爭已經拉開序幕。
蘋果掀起的數據戰爭
2020 年 6 月,蘋果的隱私工程經理凱蒂· 史金納(Katie Skinner)在 WWDC(世界開發者大會)上用 20 秒介紹了 iOS 14 的一個”小小更新”:App 在搜集用戶數據之前,必須徵求使用者同意。 一旦使用者不同意,就會關閉IDFA碼(Identifier For Advertisers),蘋果的廣告主標識符。
這個搜集用戶數據的 IDFA 開關,在去年 6 月之前還是預設開啟的。 但在 iOS 14 上,這成為了一個顯性的可選項。 當使用者第一次打開App時,iOS會彈窗詢問:「是否同意App對你進行跨網站、App的追蹤? “顯然,多數使用者並不會同意,這就直接切斷了定向廣告的數據來源。
這是蘋果應用追蹤透明度(App Tracking Transparency,ATT)的一部分。 2021年5月,一項針對美國300名iPhone用戶的調查指出,73%的受訪者對這項隱私政策都表示贊同。 蘋果的CEO蒂姆· 庫克(Tim Cook)也在 2021 年第三季度的財報電話會議上回應,在 ATT 推出之後,蘋果受到了相當積極的回饋。
“你的 App 想要追蹤你的數據給你發廣告,你同意追蹤嗎?” |圖片來源:Apple
但對於所有以線上廣告為商業模式的公司來說,這可能是一場性命攸關的大震蕩。 反應最激烈的是Facebook。 2020 年 12 月,它買了下了《紐約時報》的一整個版面,公開反對蘋果。
在 Facebook 的口徑中,蘋果的做法嚴重限制了中小企業的生存。 大企業有足夠的財力進行大規模廣告投放,但中小企業如果沒有精準投放技術,就很難找到潛在的使用者群,廣告投放的效率會大大降低。 根據 Facebook 說法,這會平均降低中小企業 60% 的收入。
Facebook 認為蘋果的做法扼殺了中小企業,而 Facebook 將立場鮮明地與中小企業站在一起。 |圖片來源:Twitter@DaveStangis
雖然 Facebook 的言論看起來是純粹利他的,但和大眾印象不同,表面上是一家科技公司的 Facebook 其實是一家廣告公司。 2020 年四季度財報顯示,Facebook 的 280.7 億美元(約合 1825.84 億元人民幣)的收入中,96.8% 都來自廣告。 Facebook 曾在iOS 14測試版上小規模測試過,結果廣告收入出現了50%的下跌。
在财报公布后的电话会议上,Facebook 的 CEO 扎克伯格更是直白地说道:“苹果嘴上说他们在帮助用户,但实际上这件事显然是利益驱使。”
Facebook 和苹果的本质矛盾在于这两家公司商业模式的不同。广告是 Facebook 的核心业务,广告商是它的主要客户。但苹果是一家电子消费品公司,面向的是 C 端用户,包括 iPhone、iPad、Mac 和其他可穿戴式设备的硬件销售才是它的主要收入。
实际上,让业界如此在意的 IDFA 就是苹果隐私政策的产物。在 IDFA 问世之前,App 可以直接读取到手机的唯一识别码,无论是 MAC 地址、UDID 还是 UUID。IDFA 的不同之处在于用户可以重置或者关闭这个识别码。虽然 IDFA 的关闭入口隐藏得很深,但苹果给了用户一个选择:是否要让 App 给你推送定向广告。需要注意的是,关闭 IDFA 并不会减少广告数量,只是定向广告的精度会下降。
但扎克伯格的“攻击”不是没有来由,苹果并非隐私保护的“天使”。在打击竞争对手广告业务的同时,苹果也在扩大自身的广告版图。
苹果的广告业务主要有两种,App Store 的搜索广告和新闻、股市应用的展示广告。目前,苹果的搜索广告业务(Apple Search Ads)已经在中国上线。这项在 2016 年就推出的业务允许开发者以竞价的方式投放广告。
而根据 FT 中文网的报道,苹果正在计划为 App Store 增加第二个广告位。
以抖音為例,在App Store搜索「抖音」後,排名第一的是「快手」的廣告
事實上,蘋果一直在試圖進入廣告業務。 早在 2010 年,蘋果就推出了行動廣告平臺 iAd。 在賈伯斯看來,當時的移動廣告”實在太爛了”。 他不想把 iAd 做成低俗的廣告平臺,而是希望這個平臺上可以呈現優雅的、不會讓使用者反感的廣告。 也因此,iAd 設立了 50 萬美元的高門檻,這讓很多中小公司望而卻步。 最終 iAd 於 2016 年 6 月關閉。
三年前,蘋果也自己設計了一套廣告追蹤框架——SKAdNetwork。 它和IDFA一樣可以追蹤廣告投放的效果,但出於種種數據保護方面的限制,也很難稱得上好用。 但是在眼下「嚴苛」的蘋果新政面前,SKAdNetwork 可能是廣告主們最好的選擇了。
雖然目前廣告業務只占蘋果營收中非常小的一部分,但是對於既當”裁判”又做”守門員”的蘋果來說,它用一套新的隱私規則,完成了”清場”。
根據投資管理公司 Alliance Bernstein 的分析師托尼· 薩克納吉(Toni Sacconaghi)估計,蘋果公司在 2021 財年的廣告收入將從 2017 財年的 3 億美元增加到 30 億美元左右。 到 2023 或 2024 財年,蘋果廣告的年銷售額可能會增至 70 億至 100 億美元之間,這將推動蘋果服務業務的增長高達 3 個百分點。
自 2011 年 iPhone4 問世以來已經過去了 10 年,蘋果領先業界的硬體優勢逐漸被各大安卓手機廠商追平,甚至超越。 當使用者需要一個”為什麼非得是蘋果而不是安卓”的理由時,隱私保護可能就是非常重要的一環。
在賈伯斯選擇封閉系統開始,就為iOS種下了隱私保護的基因。 蘋果的隱私政策並非橫空出世,而是在逐步收緊。 IDFA 的風波切中了一個我們當下這個時代必須回應的問題:技術在侵犯用戶隱私嗎?
個人數據,21 世紀的石油?
2006 年的時候,英國數學家克萊夫· 漢比(Clive Humby)首次把「數據」比喻成了「新的石油」。。 此後,這種說法就在經濟學家、學者和CEO的口中頻頻出現。
石油的珍貴在於它是不可再生的能源,但數據是可以無限產生和重複利用的,今天的互聯網上每天都在產生海量的數據。
這個比喻成立的邏輯在於,整個 20 世紀,標準石油、荷蘭皇家殼牌、英國石油公司,這些控制著石油的公司也控制著經濟的命脈。 放在今天,是谷歌、Facebook 這些科技巨頭。
本世紀初,手握海量數據的科技巨頭們發展出了一門新生意——線上定向廣告。 到 2019 年,全球網路廣告的市場規模已經突破 3000 億美元(約合 1.95 萬億元人民幣)。
在廣告業一直流傳著這麼一句話:「我知道在廣告上的投資有一半是無用的,但問題是我不知道是哪一半。 “說這話的是百貨業之父約翰· 沃納梅克 (John Wanamaker),那是 100 多年前,傳統廣告的黃金時代。
情況在互聯網時代發生了變化,科技的進步讓廣告成為了一件很高效的事情。 某種程度上,沃納梅克的迷思已經不再成立,各大科技公司可以很方便地追蹤用戶行為、記錄廣告投放所獲得的下載或購買轉化次數,而廣告主以此決定向各流量平臺支付多少廣告費用。
你或許有過這樣的經歷,在網頁搜索咖啡之後,就會在電商平台發現咖啡相關的推薦商品,手機App似乎在時刻監視你的網路生活。 很多人甚至懷疑App在竊聽使用者,這在理論上可行,但實際上並不成立。
即時監聽對話有很高的頻寬成本,巨大的流量很容易被使用者察覺,也會給公司帶來很高的存儲和人員壓力,是一筆不划算的買賣。 並且,僅就定向推薦而言,已經有很成熟的技術支持,亞馬遜在二十年前就使用的鄰近演算法推薦在今天依舊在廣泛運用。
最為關鍵的是,竊聽使用者本身就是違法的,越是大公司,對數據合規就越謹慎。
而科技公司之所以能做到這種近乎監控式的廣告推送,都建立在對使用者的信息採集上。 科技公司通常會搜集三類用戶數據——行為數據:比如網頁瀏覽歷史、停留時長、使用了哪些在線服務;消費記錄:比如你購買了哪些商品、退換貨記錄;個人資訊:用戶的年齡、學歷、性別、所在地區等。
這些資訊在後台就是一個個事實標籤。 通過演算法,這些標籤就形成了所謂的用戶畫像。 在大公司內部,這些數據是流通的。 這也就是為什麼你在谷歌搜索的商品會出現在 Youtube 的前插廣告中,早在 2006 年,谷歌就以 16.5 億美元(約合 107.25 億元人民幣)的價格收購了 Youtube。
除此之外,這些大公司也會為中小App、網站提供相似的使用者分析服務,並通過平臺聯繫廣告主投放廣告,形成廣告聯盟。
這種做法最早由亞馬遜發明,時至今日,大型的科技公司幾乎都創建了類似的廣告聯盟,Facebook 的 Audience Network,谷歌的 Adsence,阿裡巴巴的友盟,騰訊的廣點通和位元組跳動的穿山甲。
在這些公司對外的口徑中,所有的數據都是經過脫敏處理的,所輸出的是一個群體畫像,無法從中反推出個人資訊。 但這些資訊是如何採集的,又是如何在公司的內部和外部流通的,對於普通用戶來說依舊是一個無法打破的黑箱。 而目前也並沒有一家科技公司明確地地向使用者披露這個過程。
當科技公司頻頻爆出數據洩漏醜聞時,這種”不透明”就成為了使用者恐懼的源頭。 2018年,英國諮詢公司劍橋分析(Cambridge Analytica)就被爆出在未經 Facebook 使用者同意的情況下,利用 5000 萬用戶數據為美國前總統唐納德· 特朗普(Donald Trump)的競選活動提供説明。
事後,有人在 Twitter 上發起了 #DeleteFacebook 的運動,好萊塢導演羅素兄弟甚至以此為題材拍攝了一部電影。
“為什麼我的數據,成為了你牟利的工具?” 這可能是絕大多數 Facebook 使用者的心聲。 尤其當數據交易已經成為一門事實上的生意時,數據的歸屬權,就成為了一個繞不開的問題。
尚無定論的「數據確權」問題
等價交換是通行千年的交易準則,買賣雙方一手交錢,一手交貨,完成價值交換。
而對於定向廣告而言,交易的雙方發生在公司和廣告主之間,使用者並不從中獲利。 很多使用者對於信息採集的反感都來自於此:我好像失去了什麼東西,但並沒有得到相應的回報,而那些科技公司卻輕鬆賺取了上億的利潤。
關於數據的歸屬權,主流的評論大致有兩種觀點。
有一方觀點認為數據的歸屬權應該歸平臺所有,因為使用者享受了科技公司提供的免費服務。 經濟學家薛兆豐曾經引用過著名的「科斯定律」。。
一項有價值的資源,不管從一開始他的產權歸誰,最後這項資源都會流動到最善於利用他、能最大化利用其價值的人受理區。 這是科斯定律的一個重要含義。 而在制度設計中,我們應該盡量讓這種資源的流動和分配更方便、容易,從而提高各項經濟資源的使用效率。
簡單來說,薛兆豐的結論是,(資源)誰用得好,就應該歸誰。 從經濟學的角度來說,這是效率最高的方式。
市場研究公司愛德曼· 博嵐(Edelman Berland)曾對全球15個國家的1.5萬名使用者展開調查:「你願意以犧牲一些隱私為代價,換取更多便利與舒適嗎? “有 51% 的受訪者表示不願意,27% 表示願意,剩下的受訪者沒有意見或不知道如何回答。
這揭示了一個關於隱私的悖論:公眾越來越意識到在線共用數據的風險,但是,為了某種便利,人們依舊在披露自己的數據。
因為使用者往往是最沒有話語權的,也很難對數據使用產生有效的監督。 當科技公司的產品已經成為了某種意義上的基礎設施時,用戶沒有別的選擇。 舉個例子,即使你不同意微信的隱私條款,也很難不使用微信,因為你所有的社交關係幾乎都在微信上。
另一方觀點認為數據理所當然應該歸使用者所有。 2018年5月25日生效的《歐盟通用保護數據條列》(General Data Protection Regulations,GDPR)號稱”史上最嚴格的隱私保護法”。 在這部條列中,人類首次在法律層面上明確了用戶數據的擁有權屬於使用者,而平臺只能管理及合理使用這些數據。
但是在我國,數據的歸屬權問題還沒有明確的結論。 我國 2021 年實施的《民法典》明確了”個人資訊”的定義和處理原則,必須徵得個人同意才能處理個人資訊,但沒有明確個人資訊的歸屬權。 而 2017 年生效的《網路安全法》,包括正在審議的《數據安全法》和《個人信息保護法》,也都未明確個人信息的歸屬權。 法律的缺位,造成了個人數據確權的模糊。
技術帶來的問題,最終要靠技術來解決
20 世紀 30 年代,由於攝影技術的進步,新聞業開始在報紙中大量使用照片。 但這些照片往往未經個人同意。
1980 年,律師薩繆爾· 沃倫(Samuel D. Warren)和路易士· 布蘭戴斯(Louis Brandeis)就這個問題在《哈佛法學評論》發表文章《隱私權》,這是法學界首次提出了隱私權的概念。
沃倫和布蘭戴斯發表在《哈佛法學評論》上的文章:《隱私權》|圖片來源:布蘭戴斯大學
技術的擴張侵犯了個人的邊界,從一開始,技術就與隱私相伴而生。
在眼下數據流通越來越嚴格,而數據紅利將盡的情況下,包括谷歌、英特爾、微眾銀行在內的許多公司都在開發一種叫做聯邦學習或者共用學習的技術。
由於數據合規或者商業競爭的關係,許多數據在行業甚至公司內部都無法流通,這就是公司們頭疼的”數據孤島”問題。
聯邦學習是隱私計算的一種。 在手機上訓練模型后,它只將模型加密上傳,而把用戶的數據留在了本地。
微眾銀行的首席 AI 官楊強曾經把這個模型比作是”羊”,而數據就是”草料”。
過去訓練模型的做法是從各個草場運草過來餵羊。 但是在運送過程中,草有丟失的風險,這就是數據洩漏。
聯邦學習的做法是,讓這頭”羊”走起來,到各個草場自己吃草。 這樣,草就永遠只留在本地,也就沒有了丟失的風險。
主人不知道羊吃了哪些草,但羊依舊長大了|圖片來源:微眾銀行
其實把模型訓練比作「耕牛」可能更好理解,這些耕牛原來是吃八方來的數據草料,變得強壯后再成為企業服務客戶的”生產力”。 而現在是把「耕牛」送到使用者的田地里,吃用戶數據草料,也直接更好地服務使用者。 加上「數據模型的集體升級能力」 這讓你家的牛也和其他的牛可以一起成長,更好地服務你。
顯然,通過技術模式的進步,才可以根本上避免數據洩露和惡意使用。 對於日趨白熱化的數據爭奪而言,有了這種根本性的改變,才可以讓公司間的數據共享成為可能。 而在技術上建立一套數據保護的制度,也才能贏得使用者的信任。
說到底,沒有任何的公司,可以依靠價值觀來成為個人數據問題的救世主。 這些由技術帶來的問題,最終還是需要由技術來解決它。
來源:極客公園 採寫/湯一濤 編輯/衛詩婕