人類如何學(xué)會(huì)語(yǔ)言?小嬰兒是如何從外界接受語(yǔ)言信號(hào),逐漸建立起自己的語(yǔ)言能力,與人交流?這些一直都是科學(xué)家們非常感興趣的,但又一直找不到一個(gè)普遍認(rèn)可的答案。美國(guó)的一名科學(xué)家為了解決這個(gè)問(wèn)題,決定觀察嬰兒學(xué)習(xí)語(yǔ)言的過(guò)程。
據(jù)英國(guó)廣播公司(BBC)5 月19日?qǐng)?bào)道,美國(guó)麻省理工學(xué)院教授迪布·羅伊喜獲貴子后,決定借此便利觀察他的兒子是如何學(xué)習(xí)語(yǔ)言的,將通過(guò)三年的錄音、錄像等手段記錄下這個(gè)寶貴的過(guò)程,并希望通過(guò)數(shù)據(jù)分析最終獲得人類初生如何學(xué)習(xí)語(yǔ)言的答案。記錄已經(jīng)開(kāi)始十一個(gè)月,本報(bào)記者通過(guò)郵件采訪了羅伊教授,向他了解開(kāi)始和進(jìn)展情況。
14個(gè)麥克風(fēng) 11部全方位攝像機(jī)記錄嬰兒成長(zhǎng)過(guò)程
羅伊教授和他的研究小組把這一計(jì)劃稱為Human Speechome(人類家庭語(yǔ)言)計(jì)劃。11個(gè)月前當(dāng)羅伊教授的兒子出生后離開(kāi)醫(yī)院,這個(gè)計(jì)劃便啟動(dòng)了。14個(gè)麥克風(fēng)和11個(gè)全方位攝像機(jī)將在這個(gè)新生兒來(lái)到這個(gè)世界的最初三年里一直保持工作狀態(tài)。在羅伊的兒子醒著的時(shí)間里,他的一切活動(dòng)和發(fā)音都被這些設(shè)備記錄。監(jiān)視系統(tǒng)在早上八點(diǎn)打開(kāi)直到晚上十點(diǎn)關(guān)閉,每天收集大約350吉伯的壓縮數(shù)據(jù)。
這11部全方位數(shù)字?jǐn)z像機(jī)和14個(gè)麥克風(fēng)隱藏在各個(gè)房間的天花板上,包括廚房、餐廳、客廳、游戲室、門口、健身房、三個(gè)臥室、走廊和衛(wèi)生間。攝像機(jī)可以捕捉到房里發(fā)生的任何可能是潛在的嬰兒學(xué)習(xí)語(yǔ)言的因素,每秒鐘可以記錄14個(gè)畫面,任何微小的動(dòng)作都被記錄。不過(guò),由于現(xiàn)有技術(shù)的程度限制,諸如眨眼等非常細(xì)微的面部表情都還無(wú)法被捕捉,這些表情都被認(rèn)為是學(xué)習(xí)語(yǔ)言非常重要的線索。
14個(gè)麥克風(fēng)組成層級(jí)式錄音系統(tǒng),記錄這所房子里任何的聲音資料。在記錄聲音的過(guò)程中,錄音系統(tǒng)會(huì)自動(dòng)地將噪音削弱。14個(gè)麥克風(fēng)可以把所有房間的聲音記錄,通過(guò)14個(gè)頻道刻錄到CD盤中。當(dāng)房間中沒(méi)有雜音時(shí),即使是輕聲的耳語(yǔ)都不會(huì)被漏掉。
經(jīng)過(guò)計(jì)算,3年的記錄工作將記錄下33.8萬(wàn)小時(shí)的數(shù)據(jù),其中包括14.2萬(wàn)小時(shí)的視頻和19.6萬(wàn)小時(shí)的音頻。
龐大系統(tǒng)共同繪制一幅幼兒經(jīng)歷的感官刺激的完整圖畫
羅伊教授介紹說(shuō),數(shù)據(jù)搜集工作結(jié)束后,隱藏在天花板里的數(shù)據(jù)線將會(huì)把這些數(shù)據(jù)資料傳送到麻省理工學(xué)院媒體實(shí)驗(yàn)室的一個(gè)巨大容量的磁盤儲(chǔ)存系統(tǒng)中,該系統(tǒng)儲(chǔ)存容量達(dá)到5千兆。所有的圖像都會(huì)通過(guò)10臺(tái)串聯(lián)的電腦進(jìn)行大規(guī)模數(shù)據(jù)分析,而聲音數(shù)據(jù)將會(huì)儲(chǔ)存在地下室的一個(gè)標(biāo)本取樣器中。
據(jù)羅伊教授介紹,目前對(duì)語(yǔ)言進(jìn)行數(shù)據(jù)分析有兩個(gè)途徑。第一個(gè)是通過(guò)自動(dòng)語(yǔ)言識(shí)別器轉(zhuǎn)錄,但是即使是最好的自動(dòng)語(yǔ)言識(shí)別器出錯(cuò)率也很高,很多噪音也可能被作為有用信息轉(zhuǎn)錄。因此還有第二種途徑是通過(guò)人工轉(zhuǎn)錄,通過(guò)人工識(shí)別,是嬰兒產(chǎn)生的聲音,還是噪音,盡量減小轉(zhuǎn)錄過(guò)程中的誤差。而現(xiàn)今的一些轉(zhuǎn)錄設(shè)備用于大量的語(yǔ)音轉(zhuǎn)錄工作都不是很理想。羅伊教授和他的研究組在這些轉(zhuǎn)錄設(shè)備的基礎(chǔ)上自行設(shè)計(jì)了一套系統(tǒng),可以自動(dòng)識(shí)別長(zhǎng)時(shí)間記錄中的語(yǔ)音,通過(guò)數(shù)學(xué)運(yùn)算,描繪出類似于光譜的聲音圖像。在有聲音活動(dòng)的區(qū)域,該系統(tǒng)會(huì)將聲音自動(dòng)記錄重放進(jìn)行轉(zhuǎn)錄。根據(jù)之前的實(shí)驗(yàn),每一分鐘的對(duì)話,都需要2.5分鐘的轉(zhuǎn)錄時(shí)間。
本文來(lái)自:逍遙右腦記憶 http://yy-art.cn/youjiao/1054841.html
相關(guān)閱讀: