Apple Watch的數據「黑匣子」會給研究帶來問題
據外媒報導,哈佛大學的一名生物統計學家在發現Apple Watch收集的心率變異性數據存在不一致性后,正在重新考慮將Apple Watch作為研究專案的一部分的計劃。 他發現,同一時期收集的數據似乎在毫無預警的情況下發生了變化。
“這些演算法就是我們所說的黑匣子–它們並不透明,”哈佛大學公共衛生學院生物統計學副教授、開源數據平臺Beiwe開發者JP Onnela告訴The Verge。
通常情況下,Onnela的研究不會使用像Apple Watch等這樣的商用可穿戴設備。 在大多數情況下,他的團隊使用的是為科學研究收集數據而設計的研究級設備。 不過,作為跟布列根和婦女醫院神經外科合作的一部分,他對市面上可以購買到的產品也很感興趣。 雖然他知道這些產品有時會出現數據問題,但他的團隊想要在開始之前檢查這些問題到底有多嚴重。
為此,他們查看了他的合作夥伴、布列根和婦女醫院的研究員Hassan Dawood從其佩戴的Apple Watch輸出的心率數據。 Dawood兩次導出他的每日心率變異性數據:一次是在2020年9月5日,第二次是在2021年4月15日。 在這項實驗中,他們查看了在同一時間段–從2018年12月初到2020年9月–收集的數據。
由於兩個導出的數據集包含了同一時間段的數據,所以理論上兩個數據集的數據應該是相同的。 不過Onnela表示,他預計會有一些不同。 可穿戴演算法的「黑匣子」一直是研究人員面臨的挑戰。 這些產品通常只允許研究人員在經過某種演算法的分析和過濾后輸出資訊,而不是顯示設備收集的原始數據。
由於企業會在沒有預警的情況下定期更換演算法,因此2020年9月的輸出數據可能包含了跟2021年4月出口不同的演算法分析的數據。 “令人驚訝的是它們是如此的不同。 這可能是我所見過的關於這一現象的最清晰的例子,”Onnels說道。
蘋果則告訴The Verge,對其演算法的任何修改都只適用於未來的數據,而這款手錶不會重新計算過去的數據。 除了用於匯出數據的第三方應用出現問題外,蘋果並沒有對這一差異做出解釋。
密歇根大學研究可穿戴設備和應用程序數據的睡眠研究員Olivia Walch表示,看到差異如此清晰地展現出來,令人震驚。 長期以來,Walch一直主張研究人員使用原始數據–直接從設備感測器提取的數據,而不是通過其軟體過濾的數據。