摘 要: 通過對語音識別原理的系統(tǒng)分析,結(jié)合特定人語音識別的具體情況,研究了動態(tài)規(guī)整算法(DTW),應(yīng)用凌陽SPCE061A單片機,實現(xiàn)了基于實時語音識別的門禁系統(tǒng)的總體設(shè)計。試驗表明,在1.3 s內(nèi),系統(tǒng)誤差率低于8%。該系統(tǒng)可應(yīng)用于現(xiàn)代建筑的電子門鎖類產(chǎn)品中,對實現(xiàn)智能化控制具有較強的實用價值。
關(guān)鍵詞: 語音識別;智能門禁;DTW;SPCE061A
隨著社會的發(fā)展,無論在企業(yè)還是民宅中,人們對門禁系統(tǒng)的使用越來越廣泛。然而傳統(tǒng)門禁無法滿足各種使用場合的復(fù)雜性和智能性,于是綜合應(yīng)用語音識別、指紋識別、虹膜識別、紅外感應(yīng)等最新生物識別技術(shù)的門禁系統(tǒng)廣泛吸引了人們的注意,并將逐步成為門禁系統(tǒng)發(fā)展的主流與趨勢[1]。
本文提出了基于高性價比的凌陽SPCE061A單片機,以16位的μ′nSP為主控芯片,通過添加部分外圍元件,即可搭建一個經(jīng)濟的、功能相對完善的智能實時語音門禁系統(tǒng)。該系統(tǒng)具有成本低、功耗低等優(yōu)點,是一種安全有效、有市場價值的門禁系統(tǒng)解決方案。
1 語音識別的基本原理
語音識別技術(shù)就是對不同說話人的不同說話內(nèi)容進行準確的識別,其本質(zhì)是屬于模式識別的范疇。系統(tǒng)原理框圖如圖1所示。從圖中可以看出,識別結(jié)果的正確與否與模式匹配息息相關(guān)。計算機首先從特定人處取得語音信號并訓練制作成語音的特征模型庫。當系統(tǒng)需要進行語音識別時,對新輸入的語音信號進行分析,抽取其語音特征參數(shù)。通過與語音系統(tǒng)中所儲存的特征模型進行對比,在一些特定的搜索和匹配策略下尋找最優(yōu)的匹配模板。通過查表系統(tǒng)就能給出語音識別的結(jié)果。其主要步驟分為:預(yù)處理、特征參數(shù)提取、語音的訓練與識別。
在進行語音的預(yù)處理以及特征參數(shù)的提取之后,就要運用某種識別方法辨識出測試的說話人,說話人識別算法部分是整個說話人識別處理流程中最核心的一環(huán),直接決定著系統(tǒng)的識別性能[2]。主要任務(wù)是將預(yù)處理后的所有需要辨識的語音信號進行特征參數(shù)的提取,經(jīng)過訓練形成參考模板庫,然后將某個特定的需要識別的說話人的語音以同樣的方法得到其測試模板,最后用此模板與庫中的模板進行模式匹配,以達到識別的目的。常用的識別算法有矢量量化VQ(Vector Quantization)、動態(tài)時間規(guī)整法DTW(Dynamic Time Warping)、隱馬可夫模型HMM(Hidden Markov Model)和人工神經(jīng)網(wǎng)絡(luò)ANN(Artificial Neural Networks)等[3]。
2 語音門禁系統(tǒng)硬件設(shè)計
圖2為系統(tǒng)總體的硬件設(shè)計框圖,系統(tǒng)主控制模塊以凌陽SPCE061A單片機為核心部件,麥克風輸入模塊采集語音聲波信號轉(zhuǎn)換為模擬電壓信號,采樣調(diào)理電路對電信號進行濾波,去除噪聲干擾。通過單片機自帶的AD采集模塊實現(xiàn)對說話人識別確認的功能。輸出部分采用兩路輸出的形式。一路輸出為揚聲器模塊,可以語音播報識別的結(jié)果信息;另一路輸出為電子門鎖驅(qū)動模塊,驅(qū)動門鎖的開合。
3.2 軟件流程
本系統(tǒng)軟件的開發(fā)使用了凌陽公司的μ′nSP IDE集成開發(fā)平臺,這個高效的開發(fā)環(huán)境支持匯編與C語言的混合編寫,還支持編譯、鏈接等功能,集成了調(diào)試和實時分析等實用功能,為開發(fā)提供了便利。
語音識別門禁系統(tǒng)的軟件總體流程如圖3所示。本程序分為3個模塊,分別為中斷模塊、訓練模塊和識別模塊。
首先獲取語音信息,經(jīng)過模數(shù)轉(zhuǎn)換、預(yù)加重、自動增益等處理后根據(jù)中斷類別進入訓練或者識別模塊。訓練模塊將經(jīng)過處理的語音信號通過特征提取,存入語音特征模型庫。而識別模塊通過改進識別算法將輸入語音信號的特征與訓練后語音特征模型庫進行對比分析。
4 試驗結(jié)果與結(jié)論
本文實現(xiàn)的基于SPCE061A的實時語音識別門禁系統(tǒng)具有識別特定人條件下短時語音的功能。樣機經(jīng)過測試,對特定人進行語音采樣和辨識訓練后,對100次語音輸入訪問測試,正確通過為93次,識別率達到93%;樣本有效但拒絕訪問請求7次,拒識率為7%,達到了預(yù)期的設(shè)計要求。
參考文獻
[1] 黎育紅.基于語音識別技術(shù)的門禁系統(tǒng)的研究[J].電子技術(shù)應(yīng)用,2006,32(12):88-91.
[2] 趙力.語音信號處理[M].北京:機械工業(yè)出版社,2005.
[3] 胡文靜.基于SPCE061A語音識別門禁系統(tǒng)實現(xiàn)的研究[J].計算技術(shù)與自動化,2011,30(2):111-114.
[4] 宋大杰.基于DTW的說話人識別及其在DSP上的實現(xiàn)[D].江西:東華理工大學,2012.
[5] 蔣曄.基于短語音和信道變化的說話人識別研究[D].江蘇:南京理工大學,2013.
[6] 白瑜.語音信號特征參數(shù)的提取[J].科技傳播,2011,12(24):228-229.
[7] 姚燁豪.基于語音識別和RFID技術(shù)的智能門禁系統(tǒng)研究[J].科技信息,2012(2):31-32.