心理學領域的“復制性危機”成為了全世界范圍的轟動話題。
去年,為了確定心理學研究實驗的“可復制性”,由270名科學家組成的非營利機構“開放科學中心”(CenterforOpenScience)試圖重現(xiàn)100個已發(fā)表的研究結果。而超過半數(shù)的研究結果以失敗告終,即無法復制。該研究得出結論認為,超過半數(shù)的心理學實驗不可復制。一時之間使得心理學領域的“復制性危機”成為了全世界范圍的轟動話題。
今年3月3日,兩位哈佛教授和弗吉尼亞大學的科學家稱,這篇去年發(fā)表在《科學》雜志上的研究結果是錯誤的。哈佛大學和弗吉尼亞大學的科學家們認為,這項研究的研究方法設計糟糕,不恰當?shù)貞煤鸵肓隋e誤的統(tǒng)計數(shù)據(jù),因此結果嚴重高估了失敗率。
哈佛大學和弗吉尼亞大學的科學家們經(jīng)過深入調查數(shù)據(jù)后發(fā)現(xiàn),“開放科學中心”犯了很嚴重的錯誤,使其得出了完全無根據(jù)的悲觀結論。他們撰寫批判文章,并于3月4日作為評論發(fā)表在《科學》雜志上。
復制研究與原始研究方法不同
哈佛大學心理學家丹尼爾?吉爾伯特(DanielGilbert)是這篇批評文章的首席作者,他在3月3日的一份聲明中稱,這樣的結論對心理學研究有嚴重危害,“它導致了許多科學期刊的政策變化,導致基金捐助機構優(yōu)先級的變化,也嚴重破壞了心理學的公眾認知!
許多復制研究的方法與原始研究有很大不同。研究人員稱,這些“失真”有兩個重要的后果。
首先,引入數(shù)據(jù)統(tǒng)計誤差的方法導致“開放科學中心”明顯低估了本應在偶然條件下失敗的復制。如果100個原始研究結果準確無誤,將統(tǒng)計誤差考慮進去的話,統(tǒng)計中失敗率不高于人們期待的失敗率。
其次,吉爾伯特等科學家發(fā)現(xiàn),低保真研究失敗的可能性是高保真研究的4倍,這表明當復制器偏離了原始的方法進行研究時,他們會使自己的研究失敗。
最后,“開放科學中心”使用了一個“低能量”設計。當四個研究人員應用這種設計公布高重復率的數(shù)據(jù)庫時,它也會顯示出低重復率,這點表明“開放科學中心”的設計從一開始就低估了心理學科學的可重復性。吉爾伯特稱,這些問題足以讓從事這項研究的科研人員提出質疑。
復制研究的篩選并非隨機
當這些問題出現(xiàn)時,正如大多數(shù)閱讀“開放科學中心”論文的科學家那樣,吉爾伯特等人感到震驚而失望。但是當他們開始仔細研究方法并再次分析原始數(shù)據(jù)后,他們立即注意到,根源在于復制器如何選擇100個原始實驗。
哈佛大學定量社會科學研究所主任蓋瑞?金(GaryKing)說,“如果你想估計一個人口的參數(shù),那么你必須隨機從人口中提取樣本或修正統(tǒng)計數(shù)據(jù),而“開放科學中心”在這兩點上都沒有做到。”
他們并非隨機選擇需要復制的研究。“他們做的是創(chuàng)建一個特殊的、隨機的抽樣規(guī)則列表,該列表從樣本中排除大部分心理學分支學科,排除那些在研究方法上可能是最好的一類研究,等等!惫鸫髮W科學家們指出,“然后他們繼續(xù)違反規(guī)則。更糟的是,他們實際上允許一些復制器選擇他們想要復制的實驗。所以我們首先意識到的就是,無論他們發(fā)現(xiàn)什么??好的或者壞的消息??他們無法估計心理學研究的再現(xiàn)性,而他們的論文標題卻宣稱可以做到!
沒有考慮到偶然性失敗
“而這只是個開始!鄙w瑞?金說,“如果你要重復100個實驗,其中一些將會偶然性失敗,這是基本的采樣理論。所以你必須用統(tǒng)計數(shù)據(jù)來估計有多少實驗預計將偶然失敗,否則的話,失敗率數(shù)據(jù)是沒有意義的。”
根據(jù)蓋瑞?金所言,“開放科學中心”做了這些工作,但犯了一個關鍵的錯誤。
“當他們做計算時,沒有考慮這樣的事實,即他們的重復性實驗不僅僅是用來自同樣人口中的新樣本。這些樣本往往在許多方面都不同于原初的樣本,這些差異是統(tǒng)計誤差的來源。因此,我們重新運用了正確的計算方法,然后應用到他們的數(shù)據(jù)上。你猜怎么著?他們觀察到的失敗的實驗數(shù)量只是本應觀察到的偶然性事件??即使所有100個最初實驗都準確無誤。與原初實驗相匹配的重復性實驗的失敗是復制的失敗,而不是原實驗的失敗!
并非完全照搬原始研究
吉爾伯特指出,許多重復性實驗都有很驚人的差異??這些差異甚至很難令人理解他們?yōu)楹文鼙环Q為復制。
吉爾伯特指出,大多數(shù)人都會知道,復制實驗就是重復原始研究!白x者肯定認為,如果一組科學家做了100個復制實驗,那么他們必須使用相同的方法來研究同一群人。但是他們的研究不符合這種假設。復制當然總是會多少不同于原件,但如果你像我們一樣仔細閱讀他們的報告,就會發(fā)現(xiàn)許多重復性實驗都有很驚人的差異??這些差異甚至很難令人理解他們?yōu)楹文鼙环Q為復制。”
吉爾伯特舉了個例子,某項原始實驗是讓一群斯坦福大學的白人學生觀看四個斯坦福大學的學生討論大學招生政策的視頻。視頻中的三人是白人,另一個是黑人。在討論中,一名白人學生對平權法案發(fā)表了攻擊性言論。
“那么他們是怎么做重復性實驗的呢?用阿姆斯特丹大學的學生!”吉爾伯特說,“他們讓荷蘭的學生觀看遠在5000英里外的斯坦福大學的學生用英語討論平權法案的視頻!睋Q句話說,不像原始實驗中的參與者,重復性實驗中的參與者將觀看異國學生用不同的語言討論和他們毫無關聯(lián)的事件。
根據(jù)吉爾伯特所言,這還不是方法論上最麻煩的部分!伴_放科學中心”的研究者意識到在荷蘭做這項實驗可能會是個問題,所以他們明智地決定在美國做另外一個版本的實驗來挽救局面。這一次他們選擇了斯坦福大學的學生。但是吉爾伯特及其團隊成員發(fā)現(xiàn),這一次實驗是可以復制的。但是這次實驗結果卻沒有在“開放科學中心”的論文中得到承認。
蓋瑞?金認為,“他們希望公眾聽到‘心理學研究不可復制’而不是‘如果正確實驗,這一項心理學研究可以復制’,因為后者并不是一個讓人興奮的標題!
“這是科學批判,不是人身攻擊”
盡管在這一里程碑意義的研究中發(fā)現(xiàn)了嚴重的問題,吉爾伯特和蓋瑞?金強調,他們的批評并不是壞事,而只是正常的科學調查過程中的一部分!拔覀円宄瑳]有一個參與這項研究的人試圖欺騙任何人,他們只是犯了錯誤,就像科學家們有時犯的一樣。許多研究人員都是我們的朋友。所以,這不是人身攻擊,而是科學批判。我們都關心同樣的事情:做好科學,發(fā)現(xiàn)真相。很高興看到他們對我們評論的回復,‘開放科學中心’糾結于一些小問題,但在大問題上做了退讓(承認了大的錯誤),即他們的報告并沒有為消極結論提供事實證明!
“開放科學中心”的這項研究花了4年,由270名科學家一同完成,由“開放科學中心”主任、弗吉尼亞大學心理學研究員布雷恩?諾斯克(BrianNosek)領導。對于批評聲,諾斯克稱這是因為看待數(shù)據(jù)的方式不同!芭u者給出的解釋是,問題在于復制方法存在問題,而我們的解釋是數(shù)據(jù)存在不確定因素!薄叭绻氵`反了科學的基本規(guī)則,你會得到錯誤的答案!鄙w瑞?金說。
本文來自:逍遙右腦記憶 http://www.yy-art.cn/gaozhong/967997.html
相關閱讀:習近平給北京大學學生回信勉勵當代青年