前NSA與亞馬遜工程師攜手創立數據託管協作平台Gretel
對於想要構建新功能和更好地開展創新的開發者與工程師們來說,數據有著極高的價值。然而現實是,這些數據通常高度敏感且無法訪問,在合規性和鎖定狀態的處理上也相當麻煩。好消息是,大約半年前,由前美國國家安全局(NSA)和亞馬遜工程師組建的一支團隊,就已經在致力於打造一個“適用於數據託管的GitHub平台”了。
據悉,前NSA 和亞馬遜工程師們創立了一家名叫Gretel 的初創企業,旨在幫助開發者對敏感數據展開實時、安全地共享。
聯合創始人之一的Alex Watson(其他創始人包括John Myers、Ali Golshan 和Laszlo Bock)描繪了一個常見的問題:
通常情況下,開發者無需訪問數據庫的完整權限,而是隻請求一部分或某個特定的示例。然而在用於酷炫的案例之前,平台首先得確保數據能夠被安全地共享。
好消息是,以GitHub 為代表的企業,已經證實了此類源碼分享平台的廣闊前景、且有助於簡化代碼的訪問和協作。目前他們缺少的,只是與GitHub 體量相當的數據。
Alex Watson 補充道:“外媒當前正在開發的軟件,已允許開發者自動檢出數據集的匿名版本”。
這種所謂的’合成數據’,實質上是人造出來的。其外觀和工作方式,有些類似於常規的敏感用戶數據。
Gretel 使用機器學習對數據進行分類(如名稱、地址和其它客戶標識符),並為數據分配盡可能多的類型標籤。
一旦該數據被標記,即可應用訪問策略。然後藉助匿名處理大量數據的差異化隱私技術,使之不再與客戶信息捆綁到一起。
顯然,這種借助機器學習生成的完全人造的數據集,已經引起了業內的廣泛關注。此外值得一提的是,Gretel 計劃採用與亞馬遜雲服務類似的按需收費政策。
目前這家初創企業已經拿到由Greylock Partners 牽頭的350 萬美元種子輪資金,其它投資者包括Moonshots Capital、Village Global 和幾位天使投資人。