人工智能的隱形敵人:生物學家直面數字”暗物質”的挑戰
人工智能已經滲透到我們的日常生活中。最初,它在一些機器人和大熱的ChatGPT中為人所知,而現在它在比薩餅和啤酒廣告中都不難發現。雖然人工智能可能不完全可靠,但似乎有時我們自己對人工智能的處理也不完全值得信賴。
冷泉港實驗室(CSHL)助理教授Peter Koo發現,使用流行的計算工具來解釋人工智能預測的科學家在分析DNA時發現了太多的”噪音”,在這種情況下是一種額外的信息干擾。他找到了一種方法來解決這個問題。現在,只需幾行新代碼,科學家就可以從被稱為深度神經網絡的強大人工智能中獲得更可靠的解釋,這意味著他們可以繼續追尋更準確的計算後的DNA特徵。這些特徵可能只是健康和醫學的下一個突破的信號,但是,如果信號被太多的噪音所淹沒,科學家就不會看到這些信號。
那麼,是什麼導致了這些意外亂入的噪音?這是一個神秘的、不可見的來源,如數字”暗物質”。物理學家和天文學家認為,宇宙中的大部分都充滿了暗物質,一種施加引力效應的物質,但還沒有人看到。同樣地,Koo和他的團隊發現,人工智能被訓練的數據缺乏關鍵信息,導致了重大盲點。更糟糕的是,在解釋人工智能對DNA功能的預測時,這些盲點會被考慮進去。
Koo說:”深度神經網絡正在納入這種隨機行為,因為它到處學習功能。但DNA只在其中的一個小子空間。而且它引入了很多噪音。因此我們表明,這個問題實際上確實在各種突出的人工智能模型中引入了大量的噪音。”
數字暗物質是科學家們藉用計算機視覺人工智能的計算技術的結果。DNA數據與圖像不同,被限制在四個核苷酸字母的組合中: 但像素形式的圖像數據可以是長而連續的。換句話說,我們正在給人工智能提供一個它不知道如何正確處理的輸入。
通過應用Koo的計算校正,科學家可以更準確地解釋AI的DNA分析。他說:”我們最終看到的結果變得更加清晰和乾淨,而且其他區域的虛假噪音也更少。”
Koo認為噪音干擾影響的不僅僅是基於AI的DNA分析儀。他認為這是在涉及類似類型數據的計算過程中普遍存在的一種困擾。值得慶幸的是,新發明的工具可以幫助科學家走出黑暗,走向光明。