近日,來自瑞士聯(lián)邦理工學(xué)院的一組研究人員在美國光學(xué)學(xué)會的高影響因子期刊 Optica 上發(fā)表文章報告其研究成果。他們利用深度神經(jīng)網(wǎng)絡(luò)對經(jīng)過多模光纖傳輸的數(shù)字圖像進(jìn)行精確重建,在長達(dá)一公里的光纖上實(shí)現(xiàn)了 90% 的準(zhǔn)確率。圖像經(jīng)過光纖傳輸后輸出的是散斑圖,人眼無法辨認(rèn)其內(nèi)容,該研究小組利用深度神經(jīng)網(wǎng)絡(luò)模仿人腦學(xué)習(xí)過程,把模糊難認(rèn)的散斑圖轉(zhuǎn)換成可識別的數(shù)字圖像,該神經(jīng)網(wǎng)絡(luò)還能夠處理因環(huán)境對光纖的擾動而造成的失真。該研究有望改進(jìn)內(nèi)窺鏡成像等醫(yī)療程序和通信應(yīng)用。
多模光纖輸出的圖像散斑圖(speckle pattern)輸入到深度神經(jīng)網(wǎng)絡(luò)的隱藏層,并被重建為數(shù)字 3。(圖源:Demetri Psaltis, Swiss Federal Institute of Technology Lausanne)
一個研究小組創(chuàng)造性地使用神經(jīng)網(wǎng)絡(luò)來模擬人腦處理圖像的過程,并且報告了其對在長達(dá)一公里的光纖上傳輸?shù)膱D像進(jìn)行精確重建的研究工作。
研究人員在美國光學(xué)學(xué)會(OSA)高影響因子期刊「Optica」上報告了他們的研究,他們訓(xùn)練一種被稱為深度神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法,基于數(shù)字圖像傳輸?shù)焦饫w遠(yuǎn)端所生成的散斑圖來重建數(shù)字圖像。該研究可以改進(jìn)用于醫(yī)學(xué)診斷的內(nèi)窺鏡成像,提高光纖通信網(wǎng)絡(luò)的承載信息量,或者提高光纖的光功率。
瑞士聯(lián)邦理工學(xué)院的 Demetri Psaltis 稱:「我們使用現(xiàn)代深度神經(jīng)網(wǎng)絡(luò)架構(gòu)從光纖的雜亂輸出中檢索出輸入圖像?!顾c同事 Christophe Moser 一同領(lǐng)導(dǎo)了這項研究。他補(bǔ)充道:「我們證明了,在長達(dá) 1 公里的光纖上完成這個過程是可能的?!共⑶覍⒃摴ぷ鞣Q作「一個重要的里程碑」。
解碼模糊圖案
光纖通過光傳輸信息。多模光纖比單模光纖具有更強(qiáng)的信息傳輸能力。它們具有許多通道(被稱為空間模式,因?yàn)樗鼈兙哂胁煌目臻g形狀),這些通道可以同時傳輸不同的信息流。
盡管多模光纖非常適合傳輸基于光的信號,但要用它傳輸圖像還存在一些問題。來自圖像的光穿過所有的通道后,從另一端傳出的是一種人眼無法解碼的散斑圖。
為了解決這個問題,Psaltis 和他的團(tuán)隊決定使用深度神經(jīng)網(wǎng)絡(luò),這是一種運(yùn)作方式與人腦類似的機(jī)器學(xué)習(xí)算法。深度神經(jīng)網(wǎng)絡(luò)可以賦予計算機(jī)識別圖像中物體的能力,還能幫助改進(jìn)語音識別系統(tǒng)。輸入數(shù)據(jù)通過幾層人工神經(jīng)元進(jìn)行處理,每層神經(jīng)元在進(jìn)行一個小運(yùn)算后將結(jié)果傳遞給下一層神經(jīng)元。機(jī)器通過識別與輸入相關(guān)的輸出模式來學(xué)習(xí)識別輸入圖像。
參與該項目的博士生 Eirini Kakkava 解釋道:「如果我們思考一下神經(jīng)網(wǎng)絡(luò)的起源(即人腦),就會發(fā)現(xiàn)它的工作機(jī)制很簡單。當(dāng)一個人盯著一個物體看的時候,大腦中的神經(jīng)元就會被激活,這個過程表示對一個熟悉的物體進(jìn)行識別。我們的大腦之所以能夠做到這一點(diǎn),是因?yàn)樗谖覀兊纳钪袝邮芡活愇矬w的圖像或信號的訓(xùn)練,這改變了神經(jīng)元之間連接的強(qiáng)度?!篂榱擞?xùn)練一個人工神經(jīng)網(wǎng)絡(luò),研究人員基本上遵循相同的處理過程,教會神經(jīng)網(wǎng)絡(luò)識別某些圖像(在本文中指手寫數(shù)字),直到它能夠識別之前從未見過、但與訓(xùn)練圖像屬于同一類別的圖像。
從數(shù)字中學(xué)習(xí)
為了訓(xùn)練系統(tǒng),研究人員使用了一個包含 20000 個手寫數(shù)字樣本的數(shù)據(jù)庫,所有樣本是 0-9 的數(shù)字。他們選擇了其中的 16000 個樣本作為訓(xùn)練數(shù)據(jù),留出 2000 個樣本作為驗(yàn)證集,剩下的 2000 個樣本則用來測試已驗(yàn)證的系統(tǒng)。他們用激光照射每一個數(shù)字,并且將光束通過大約有 4500 個通道的光纖傳輸?shù)竭h(yuǎn)端的相機(jī)上。他們用一臺計算機(jī)測量輸出光的強(qiáng)度是如何在捕獲到的圖像中變化的。他們?yōu)槊總€數(shù)字收集了一系列實(shí)例。
盡管為每個數(shù)字收集的散斑圖對人眼來說都差不多,但神經(jīng)網(wǎng)絡(luò)能夠辨別出其中的細(xì)微差異,并識別出與每個數(shù)字相關(guān)的光強(qiáng)度模式。測試表明,該算法對在 0.1 米長的光纖中傳輸?shù)膱D像達(dá)到了 97.6% 的識別準(zhǔn)確率,在 1 公里長的光纖中達(dá)到了 90% 的識別準(zhǔn)確率。
這是一種更簡單的方法
研究小組的另一位成員 Navid Borhani 說,與其它需要對輸出進(jìn)行全息測量的方法相比,這種機(jī)器學(xué)習(xí)方法能夠更簡單地重建通過光纖傳輸?shù)膱D像。該神經(jīng)網(wǎng)絡(luò)還能夠處理因環(huán)境對光纖的擾動而造成的失真,例如溫度波動或氣流引起的光纖移動,這些擾動會增加圖像的噪聲,而這種情況會隨著纖維長度的增加而變得更糟。
Psatis 表示:「深度神經(jīng)網(wǎng)絡(luò)具備檢索通過多模光纖傳輸?shù)男畔⒌淖吭侥芰?,這將有利于內(nèi)窺鏡成像等醫(yī)療過程和通信應(yīng)用?!雇ㄐ判盘柾ǔP枰┰饺舾晒锏墓饫w,并且可能失真,而他們的這項技術(shù)可以修正這一現(xiàn)象。醫(yī)生可以使用超薄光纖探針收集人體內(nèi)的神經(jīng)束和動脈圖像,無需復(fù)雜的全息記錄儀,也不用擔(dān)心操作時移動幅度過大。Psatis 說:「呼吸或血液循環(huán)造成的微小運(yùn)動會導(dǎo)致通過多模光纖傳輸?shù)膱D像失真?!苟麄儎?chuàng)建的深度神經(jīng)網(wǎng)絡(luò)方法是處理這種噪聲的高效解決方案。
Psaltis 和他的團(tuán)隊打算通過生物樣本測試這項技術(shù),看看是否和識別手寫數(shù)字一樣有效。他們希望利用不同類型的圖像進(jìn)行一系列研究,以探討這項技術(shù)的可能性和局限性。