如何讓大腦思路清晰但患有失語癥的人正常說話?現(xiàn)在有了新的研究成果。
近日,加州大學的研究人員在《自然》雜志上發(fā)表的研究成果表明,他們所研發(fā)的人類語音合成系統(tǒng),可以解碼人類下頜、喉嚨、舌頭、嘴巴等發(fā)音部位的生物信號,最終合成受試者想要說的話。
也就是說,這個腦機接口系統(tǒng)可以將腦活動轉(zhuǎn)化為語音,腦袋里的意念不用自己動嘴說,可以借助機器合成的語音表達出來。
類似的研究早前也有人做過,主要是將腦活動直接解碼為語音。此次研究的突破之處在于解碼過程分成了兩步,并降低了語音失真率。
第一步,聲道、舌頭、嘴唇等發(fā)音部位的運動由大腦控制,為了獲得該過程腦信號與肌肉運動的關聯(lián),他們訓練了一個 RNN 神經(jīng)網(wǎng)絡對這個過程進行深度學習。
第二步,把發(fā)音部位的運動,轉(zhuǎn)換成合成的語音,這一步也使用了一個 RNN 神經(jīng)網(wǎng)絡。
有業(yè)內(nèi)人士認為,該項研究可以幫助因疾病喪失語言功能的人,其中包括肌萎縮側(cè)索硬化、中風等失語癥患者。
著名科學家史蒂芬 · 霍金患有肌萎縮側(cè)索硬化,數(shù)十年間委身于狹窄的輪椅,患病后的他曾通過單個按鍵的鼠標操作電腦打字,后來手部肌肉衰弱變,利用眼鏡上的紅外探測器識別眼球和肌肉的運動,最后通過語音合成器讀出文本。
這種用殘余肌肉控制機器打字的方式,雖然可以幫助患者對外表達,但速度很有限。要想讓失語癥患者能夠流暢地表達,借助腦機接口和機器學習技術合成語音是一個有效的方向。
腦機接口(BCI,Brain Computer Interface)的相關研究從二十世紀八十年代就已經(jīng)開始了,至今超過 30 年。
腦機接口技術主要是從大腦等神經(jīng)中樞中提取特定的生物電信號,依據(jù)現(xiàn)有的認知神經(jīng)科學理論進行解碼,在與外部系統(tǒng)建立聯(lián)系和溝通??梢宰屓伺c機器之間的協(xié)作達到「人機合一」的境界。
2004 年,布朗大學研發(fā)的 BrainGate 系統(tǒng)被植入到 13 個癱患者大腦的運動皮層中。這個系統(tǒng)可以監(jiān)測植入者的神經(jīng)元,如果被植入者想要做出移動手臂等動作,大腦中的神經(jīng)元就會釋放電信號,BrainGate 再將這些電信號解碼傳送到人體外的系統(tǒng)。
BrainGate 已經(jīng)讓一個四肢癱瘓的女士在無看護的情況下喝到飲料,還讓另一個四肢癱瘓的女士在飛行模擬器上駕駛 F-35 戰(zhàn)斗機。
俄羅斯億萬富豪伊茨科夫于 2011 年創(chuàng)立了一個名為「俄羅斯 2045」的計劃,企圖打造人類的「不死之身」。這個計劃有個基金的時間表:到 2020 年,要實現(xiàn)人腦對機器人「化身」的遙控;到 2025 年,要把人腦移植到機器人身上;到 2035 年,要破解人類大腦之謎,打造出「人造大腦」;到 2045 年,要創(chuàng)造出真實版的全息「虛擬人」。
這個人類永生計劃的技術關鍵,就是腦機接口。
就目前而言,像《黑客帝國》或者《阿凡達》這些科技電影所呈現(xiàn)的腦機接口技術依然很遙遠,不過這項技術已經(jīng)逐漸在臨床上用于恢復人體部分功能喪失。