蘋果公司在WWDC詳解人工智慧模型如何保護資料隱私
在本週一舉行的WWDC 大會上,蘋果公司發布了Apple Intelligence,這套功能為iPhone、iPad 和Mac 帶來了改寫電子郵件草稿、匯總通知和創建自訂表情符號等人工智慧生成工具。蘋果公司在主題演講中花了很大篇幅來解釋這些工具有多有用,並用幾乎同樣多的時間向客戶保證新的人工智慧系統將如何保護你的資料隱私。
蘋果公司在其主題演講中開始解釋這種生成式人工智慧的雙重方法,並在隨後的論文和演講中提供了更多細節。他們表示,Apple Intelligence 以設備為基礎,可以快速完成用戶所需的常見人工智慧任務,如轉錄電話內容和安排日程。不過,蘋果智慧還可以向雲端伺服器發送更複雜的人工智慧請求,包括發送個人上下文資料–確保兩者都能提供良好的結果,同時確保資料的隱私是蘋果的工作重點。
最大的新聞是,蘋果正在為”蘋果智能”(Apple Intelligence)使用自製的人工智慧模型。蘋果公司指出,它不使用私人資料或使用者互動來訓練模型,這與其他公司相比是獨一無二的。相反,蘋果同時使用授權資料和由該公司的Applebot 網路爬蟲抓取的公開線上資料。如果出版商不想讓蘋果公司取得他們的數據,就必須選擇退出,這聽起來與Google和OpenAI 的政策類似。蘋果也表示,它會省略輸入網路上流傳的社會保險號和信用卡號,並忽略”褻瀆和其他低品質內容”。
蘋果智慧系統的一大賣點是它與蘋果作業系統和應用程式的深度整合,以及該公司如何優化其模型以提高能源效率並使其尺寸適合iPhone。將人工智慧請求保持在本地是消除許多隱私擔憂的關鍵,但這樣做的代價是在設備上使用更小、功能更弱的模型。
為了讓這些本地模型發揮作用,蘋果採用了微調技術對模型進行訓練,使其在校對或總結文本等特定任務中發揮更好的作用。這些技能以”適配器”的形式存在,可以鋪設在基礎模型上,並根據手頭的任務進行更換,類似於在角色扮演遊戲中為角色應用增強屬性。同樣,蘋果公司為Image Playground 和Genmoji 設計的擴散模型也使用適配器來獲得不同的藝術風格,如插畫或動畫(使人和寵物看起來像廉價的皮克斯角色)。
蘋果表示,它已經對模型進行了優化,以加快從發送提示到做出響應的時間,並採用了”投機解碼”、”上下文剪除”和”分組查詢關注”等技術,以利用Apple Silicon的神經引擎。晶片製造商最近才開始在晶片中添加神經核心(NPU),這有助於在處理機器學習和人工智慧演算法時減輕CPU 和GPU 的頻寬。這也是只有配備M 系列晶片的Mac 和iPad 以及iPhone 15 Pro 和Pro Max 支援蘋果智慧的部分原因。
這種方法與我們在Windows 領域看到的情況類似:英特爾推出的第14 代Meteor Lake 架構採用了具有NPU 的晶片,高通公司為微軟Copilot Plus PC打造的全新Snapdragon X 晶片也配備了NPU。因此,Windows 上的許多AI 功能都被限制在新的裝置上,這些裝置可以在這些晶片上執行本機工作。
根據蘋果的研究,在750 個文字摘要的測試回覆中,蘋果設備上的人工智慧(配有適當的適配器)比微軟的Phi-3-mini 模型更能吸引人類。如今大多數聊天機器人服務都在雲端使用大得多的模型來實現更好的效果,而這正是蘋果在隱私問題上努力謹慎行事的地方。為了與更大型的機型競爭,蘋果正在構思一種無縫流程,向雲端伺服器發送複雜的請求,同時也試圖向用戶證明他們的資料仍然是私密的。
如果使用者請求需要功能更強的人工智慧模型,蘋果會將請求傳送到其私有雲端運算(PCC)伺服器。 PCC 在基於”iOS 基礎”的自有作業系統上運行,它有自己的機器學習堆棧,為蘋果智慧提供動力。據蘋果公司稱,PCC 擁有自己的安全啟動和安全飛地(Secure Enclave),用於保存只適用於請求設備的加密金鑰,而可信任執行監控器(Trusted Execution Monitor)則確保只有經過簽名和驗證的程式碼才能運行。
蘋果公司稱,用戶的裝置在發送請求前會與PCC 叢集建立端對端加密連線。蘋果表示,由於PCC 中沒有伺服器管理工具,因此無法存取PCC 中的數據,也就不存在遠端shell。蘋果也沒有為PCC 提供任何持久性儲存空間,因此從蘋果智慧語義索引中提取的請求和可能的個人上下文資料顯然會在之後被雲端刪除。
PCC 的每個構建都將有一個虛擬構建,供公眾或研究人員檢查,只有被記錄為檢查過的簽名構建才會投入生成。
其中一個懸而未決的問題是,究竟哪些類型的請求會被轉移到雲端。在處理請求時,Apple Intelligence 有一個名為”協調”(Orchestration)的步驟,它可以決定是在裝置上進行還是使用PCC。我們現在還不知道什麼是足夠複雜的請求,以至於要觸發雲端處理,可能要等到秋季Apple Intelligence 上市後才能知道。
蘋果公司還有一種解決隱私問題的方法:把它變成別人的問題。蘋果改進後的Siri可以向雲端的ChatGPT發送一些查詢,但只有在你提出一些非常棘手的問題後才會得到許可。這個過程將隱私問題轉移到了OpenAI 和用戶手中,前者有自己的政策,後者必須同意卸載他們的查詢。蘋果執行長庫克(Tim Cook)在接受馬克斯-布朗利(Marques Brownlee)採訪時說,如果請求涉及”世界知識”,而”超出了個人語境的範疇”,就會要求使用ChatGPT。
蘋果公司對蘋果智慧型系統採用本地和雲端分離的方法並不完全新穎。 Google的Gemini Nano 型號可以在Android設備上本地運行,而Pro 和Flash 型號則在雲端處理。同時,微軟的Copilot Plus PC 可以在本地處理人工智慧請求,同時該公司繼續依靠與OpenAI 的合作,並建立自己的MAI-1 模型。相較之下,蘋果的競爭對手都沒有如此徹底地強調自己的隱私承諾。
當然,這一切在演示和編輯的文件中看起來都很不錯。然而,真正的考驗將在今年晚些時候,當我們看到蘋果智慧的實際應用時。我們將拭目以待,看看蘋果能否在優質人工智慧體驗和隱私保護之間取得平衡,並在未來幾年繼續發展。