微軟與哈佛大學合作開源差分隱私平台
微軟與哈佛大學OpenDP Initiative合作研發並開源了首個用於差分隱私的平台。這項工作已持續了將近一年,去年九月,微軟首席數據分析管John Kahan曾宣布項目的開展:“我們需要找到一種分析數據的方式,以釋放數據的全部潛力,同時又不冒擁有數據者隱私的風險。”
差分隱私(differential privacy)這一概念由來自微軟研究院的Cynthia Dwork和哈佛大學計算機科學教授Gordon McKay共同研究數年,並於2006年提出。它能夠做到在不洩露個體隱私信息的情況下,對整體數據集進行分析,得出有效結論,並防止差分攻擊。
這主要是通過添加誤差或噪音來實現。適量的噪音會被添加到統計結果中,以掩蓋單個數據點的貢獻。通過差分隱私保護手段,任何人都無法從數據集中推斷出任何特定的個人信息,甚至無法判斷特定個人是否包含在數據集裡。
該項技術仍處於發展階段,微軟表示開源平台對於技術的日趨成熟和廣泛使用都非常重要。“大型且開放的數據集具有超出想像的潛力,而差分隱私平台為人們貢獻、協作和利用這些數據鋪平了道路”。
OpenDP平台現已開源,可用於測試及構建。目前包含八個倉庫,平台系統、核心、算法和样本示例等等都在其中,主要開發語言為Python和Rust。