不可重複≠失敗:引力常量300多年來一直測不准
計量學的歷史對於重複實驗結果、提高科研可信度具有重要啟示。人人都在談論可重複性(reproducibility)——至少在生物醫學和社會科學領域如此。過去十年裡,人們越來越意識到,一項結果必須能被獨立重複出來,才能被接受為真。
計量學的歷史對於重複實驗結果、提高科研可信度具有重要啟示。
在亨利·卡文迪許(Henry Cavendish)利用扭秤測得引力常量兩個多世紀後,計量學家依然無法就該常量的精確值達成一致意見。來源:The Royal Society
物理科學也需要關注可重複性。《自然-物理》有一期內容專門探討了這個話題,計量學家Martin Milton和Antonio Possolo撰文指出,人們應該換一種眼光看待可重複性。兩人寫道,當測量科學的結果不能被重複時,它體現了不同研究方法的效果,是幫助公眾了解科學過程的好機會。(M。 J。 T。 Milton and A。 Possolo Nature Phys。 26, 117–119; 2020)。
兩位作者分別來自國際計量局(International Bureau of Weights and Measures)和美國國家標準與技術研究院(National Institutes of Standards and Technology),他們列舉了三個案例,都是人類在測量某個自然界基本常數過程中的嘗試。
具體包括光速(c);普朗克常數(h)——將光子能量與其頻率關聯起來;引力常量(G)——衡量兩個物體之間的引力強度。
就普朗克常數和光速來說,不同的實驗室利用不同的方法得到了相同的數值——這就是可重複性。其中,普朗克常數的值由於得到了普遍認可,去年5月被規定用來定義國際單位制中的千克。
不過,雖然過去三個世紀裡開展過不計其數的實驗,但G的精確值一直未得到確定。科學家對這種不確定性的根源一籌莫展:可能是因為測量這個值的方法還存在未知的誤差,也可能標誌著迫切需要新物理學。科學家正在探索的一種可能是G值會隨時間變化,這種情況下,科學家可能先要改變認為G是常數的想法。
雖說物理學家覺得可能性不大,但如果確實如此,它將成為一個例子,說明不可重複的數據也是科學過程的一部分:實驗結果對長期公認的理論提出質疑,或是直接指向了另一種可能的理論。
生物醫學和社會科學領域的問題無法簡化為測定自然界的一個基本常數。和計量學相比,癌症生物學等領域的結果重複性實驗可能包括更多的可變性來源,而且極難控制。
不過,計量學提醒我們,當研究人員嘗試重複實驗結果時,他們都會遵循一套通用而且非常精確的實驗標準,這在測量領域被稱為量值溯源(metrological traceability)。作者認為,正是這一點幫助建立了科學研究過程的可靠度和可信度。
我們從Milton和Possolo的評論中得到的啟示是,不同領域的研究人員應該保持對話,分享他們在可重複性上的經驗。與此同時,當研究人員遵循最受認可的標準,重複某個結果而不得時,我們也不要輕言肯定是有什麼貓膩。
不可重複性不應被自動貼上失敗的標籤。它可能是一種提醒:是時候重新思考我們的假設了。