《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > 人腦信號(hào)生成文本新實(shí)驗(yàn),準(zhǔn)確率高達(dá)97%

人腦信號(hào)生成文本新實(shí)驗(yàn),準(zhǔn)確率高達(dá)97%

2020-04-25
來(lái)源:與非網(wǎng)
關(guān)鍵詞: AI 人腦信號(hào) 人工智能

與非網(wǎng) 4 與 24 日訊,近日,一個(gè)由加州大學(xué)舊金山分校的研究團(tuán)隊(duì)打造的新型人工智能系統(tǒng)可根據(jù)人腦信號(hào)來(lái)生成文本,準(zhǔn)確率最高可達(dá) 97%。目前該研究的結(jié)果已經(jīng)發(fā)表在《自然神經(jīng)科學(xué)》雜志上。

 

近幾年,亞馬遜和谷歌等科技公司打造的虛擬助手已經(jīng)比較成熟,語(yǔ)音識(shí)別能力比起幾年前進(jìn)步驚人,人們?cè)诼_(kāi)始領(lǐng)會(huì)它們的威力。

 

然而,最近一項(xiàng)更令人驚嘆、更匪夷所思的里程碑式技術(shù)創(chuàng)新可能即將實(shí)現(xiàn)。它的出現(xiàn)讓語(yǔ)音識(shí)別技術(shù)完全相形見(jiàn)絀,這是一個(gè)十分強(qiáng)大的人工智能(AI)系統(tǒng),可以根據(jù)人們的大腦活動(dòng)直接生成完整的文本,整個(gè)過(guò)程完全不需要聽(tīng)到任何一個(gè)單詞。這不完全是科幻小說(shuō)中的概念。近幾十年來(lái),從動(dòng)物模型到人類(lèi)參與者,腦機(jī)接口技術(shù)的發(fā)展可謂突飛猛進(jìn)。事實(shí)上,這類(lèi)技術(shù)已經(jīng)在嘗試將這種概念從幻想變成現(xiàn)實(shí)。

 

 

加拿大研究團(tuán)隊(duì)就曾對(duì)此評(píng)論過(guò),以目前來(lái)看,通過(guò)該技術(shù)將人腦信號(hào)轉(zhuǎn)換成的文本結(jié)果還不很準(zhǔn)確。為此,他們團(tuán)隊(duì)還使用了一種全新的方法來(lái)解碼腦皮質(zhì)電圖:通過(guò)植入大腦的電極,來(lái)獲取皮質(zhì)活動(dòng)中所產(chǎn)生的電脈沖記錄。

 

具體而言,該實(shí)驗(yàn)團(tuán)隊(duì)在四名癲癇患者身上使用了這種植入物,以便監(jiān)測(cè)他們的身體狀況引起的癲癇發(fā)作情況。研究團(tuán)隊(duì)還進(jìn)行了一項(xiàng)附帶實(shí)驗(yàn):讓參與者大聲、反復(fù)地朗讀一些預(yù)先準(zhǔn)備的句子,同時(shí)通過(guò)電極來(lái)記錄他們?cè)诖似陂g的大腦活動(dòng)。然后,這些數(shù)據(jù)被輸入到一個(gè)神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)根據(jù)實(shí)驗(yàn)的音頻記錄,分析出與特定語(yǔ)音特征(如元音、輔音或口型)相對(duì)應(yīng)的大腦活動(dòng)模式。最后,另一個(gè)神經(jīng)網(wǎng)絡(luò)對(duì)這些大腦表現(xiàn)進(jìn)行解碼——參與者反復(fù)朗讀 30 到 50 個(gè)句子時(shí)產(chǎn)生的大腦活動(dòng)數(shù)據(jù)——并據(jù)此來(lái)嘗試預(yù)測(cè)人們所說(shuō)的話(huà),預(yù)測(cè)根據(jù)他們朗讀單詞時(shí)所產(chǎn)生的皮層信號(hào)來(lái)進(jìn)行。

 

在實(shí)驗(yàn)條件順利的情況下,該系統(tǒng)在將其中一名參與者的大腦信號(hào)轉(zhuǎn)化成文本時(shí),詞錯(cuò)率(WER)只有 3%——至少在這些嚴(yán)格限定的實(shí)驗(yàn)條件下,這個(gè)詞錯(cuò)率也許已經(jīng)接近于迄今為止人工智能讀取人的想法的最佳表現(xiàn)。

 

而在最不理想的情況中,神經(jīng)網(wǎng)絡(luò)的錯(cuò)誤完全莫名其妙,不管是在語(yǔ)音上還是在語(yǔ)義上,都與實(shí)際的句子完全搭不著邊:“她穿著溫暖的羊毛工裝褲”被預(yù)測(cè)為“綠洲是海市蜃樓”。

 

對(duì)此,該實(shí)驗(yàn)團(tuán)隊(duì)稱(chēng),盡管這些顯而易見(jiàn)的錯(cuò)誤有些詭異,但總的來(lái)說(shuō),該系統(tǒng)也許還是刷新了基于 AI 的大腦活動(dòng)解碼的最佳表現(xiàn),畢竟它表現(xiàn)最好時(shí)的詞錯(cuò)率只有 5%,能夠與專(zhuān)業(yè)的人工語(yǔ)音轉(zhuǎn)錄相提并論。

 

不過(guò),要應(yīng)付日常發(fā)言的專(zhuān)業(yè)轉(zhuǎn)錄員必須得有數(shù)以萬(wàn)計(jì)的詞匯量。相比之下,這個(gè)系統(tǒng)只能從有限的短句中學(xué)習(xí)到大約 250 個(gè)單詞的皮層特征,所以拿二者相比較并不公平。

 

雖然還有許多障礙需要克服,但該研究團(tuán)隊(duì)認(rèn)為,該系統(tǒng)有朝一日可能會(huì)讓那些失去說(shuō)話(huà)能力的人能夠重新“開(kāi)口”說(shuō)話(huà)。如果這樣的事情成為可能,會(huì)有望產(chǎn)生巨大的影響——為一些人提供一種與周?chē)澜缃涣鞯姆绞健宜鶐?lái)的影響可能會(huì)遠(yuǎn)遠(yuǎn)超出人們目前的想象。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀(guān)點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話(huà):010-82306118;郵箱:aet@chinaaet.com。