摘要:作為汽車智能化的重要組成部分,智能座艙的感覺體驗是最直接的,近年來,其智能化程度在肉眼上有所增加。未來智能座艙將發(fā)展成為我們的第三大生活空間。“大型全高清數(shù)字儀表盤 + 大型高清浮游娛樂中的大屏幕控制”已不能滿足部分汽車企業(yè)的胃口,汽車屏幕、副駕駛座娛樂屏幕增長態(tài)勢明顯。智能飛屏、車機(jī)聯(lián)動功能不斷擴(kuò)展,物理按鍵交互逐漸取代,與娛樂化的結(jié)合越來越緊密。除了駕駛艙娛樂系統(tǒng)、信息系統(tǒng)、通信系統(tǒng)、人機(jī)交互、駕駛員監(jiān)控、乘員狀態(tài)檢測等之外,基于感知了解駕駛艙內(nèi)外場景,為駕駛艙或用戶提供更多場景、新服務(wù)、可以提供一種新的人機(jī)交互方式。
關(guān)鍵詞:汽車智能化;智能座艙;人機(jī)交互;發(fā)展趨勢
作者:李函遙 王馨 郁淑聰
1、引言
目前,汽車不僅在動力源、驅(qū)動方式和駕駛體驗上發(fā)生了變化,駕駛艙也告別了傳統(tǒng)的枯燥機(jī)械和電子空間,智能化水平飆升,成為繼家庭和辦公室以外人們生活之后的“第三空間”。通過人臉;指紋識別、語音 / 手勢交互、多屏聯(lián)動等高新技術(shù),使當(dāng)今汽車智能座艙在環(huán)境感知、信息采集和處理方面的能力顯著增強(qiáng),成為人類駕駛的“智能助手”。智能座艙告別簡單的電子化,進(jìn)入智能助理階段的顯著標(biāo)志之一是人與駕駛艙的相互作用從被動式進(jìn)入主動式,這種“被動的”和“主動的”是以駕駛艙本身為中心定義的。過去的信息交流主要由人發(fā)起,現(xiàn)在人和機(jī)器都可以啟動,人和機(jī)器的交互水平已經(jīng)成為定義智能座艙產(chǎn)品水平的重要標(biāo)志。
2、人機(jī)交互發(fā)展背景
從電腦與手機(jī)的歷史可以折射出機(jī)械與人互動方法的發(fā)展脈絡(luò),并從繁雜到單純簡約從抽象的動作到自然的互動。未來最主要的人機(jī)交互發(fā)展趨勢,便是將機(jī)械由被動響應(yīng)進(jìn)入了主動式交互。沿著這種趨勢的延長線來看,人與機(jī)器相互作用的終極目標(biāo)是將機(jī)器擬人化,使人與機(jī)器的相互作用像人與人的交流一樣自然順暢。也就是說,人機(jī)交互的歷史就是人從適應(yīng)機(jī)器到通過機(jī)械適應(yīng)人的歷史。智能座艙的發(fā)展也有類似的過程。隨著電子技術(shù)的進(jìn)展和車主的期望,汽車內(nèi)外的電子信號和功能也越來越多,以便讓車主降低對注意力資源的浪費,從而降低行車分氣,汽車互動方法也因此而逐步改變:物理旋鈕 / 鍵盤——數(shù)字觸摸屏——語言操控—自然狀態(tài)互動。
2.1 自然交互是下一代人機(jī)交互方式的理想模型
2.1.1 什么是自然交互?簡而言之,即通過動作、目光追蹤、語言等實現(xiàn)交流。這里的意識模態(tài)更具體地說類似于人的 “ 感知 ”,其形態(tài)中混合著各種感知,并對應(yīng)了人的視野、聆聽、觸覺、嗅覺、味覺等五大感知。相應(yīng)的信息介質(zhì)包括各種傳感器,例如聲音、視頻、文字和紅外、壓力、雷達(dá)。智能汽車實質(zhì)上就是一個載人機(jī)器人,其最關(guān)鍵的二個功能就是自己控制的以及與人互動的功能,沒有其中之一,將無法高效的工作于人。所以,一種智慧的人機(jī)交互系統(tǒng)是十分必要的。
2.1.2 自然交互的實現(xiàn)方式座艙內(nèi)融合了越來越多的傳感器,傳感器提高了形態(tài)多樣化、數(shù)據(jù)豐富性和準(zhǔn)確性的能力。一方面使駕駛艙內(nèi)的計算力需求飛躍,另一方面也提供了更好的感知能力支持。這一趨勢使更豐富的駕駛艙場景創(chuàng)新、更好的互動體驗成為可能。其中,視覺處理是駕駛艙人機(jī)交互技術(shù)的關(guān)鍵。而且融合技術(shù)才是真正王道,比如在嘈雜條件下的語音識別時,光靠麥克風(fēng)是沒有的。人在這種情況下能選擇性地聽某人講話,不僅靠耳朵,還靠眼睛。因此,通過視覺上確定音源并閱讀唇語,能夠得到比單純的聲音識別更好的效果。如果傳感器是人的五感,那么計算力便是一個自動交互的人腦,AI 算法把視覺與語音結(jié)合到一起,通過各種認(rèn)知方法,能夠進(jìn)行人臉、動作、姿態(tài)、語音等多種信號的辨識。由此,可以實現(xiàn)更智能的人的目標(biāo)交互,包括眼球追蹤、語音識別、口語識別聯(lián)動和駕駛員的疲勞狀態(tài)檢測等。座艙人員交互的設(shè)計通常需要通過邊緣運(yùn)算,而非云運(yùn)算來完成。三點:安全性、實時性和隱私安全性。云計算依賴于網(wǎng)絡(luò),對于智能汽車來說,依賴于無線網(wǎng)絡(luò)無法保證其連接的可靠性。同時,數(shù)據(jù)傳輸延遲不可控,不能保證交互平滑。要確保面向自動運(yùn)行安全域的完整用戶體驗,破局之道在于邊緣計算。但是,個人信息安全也是面臨的問題之一。駕駛室內(nèi)的私密空間,安全性保障方面尤為明顯。現(xiàn)在的個性化聲音識別主要都是依靠在云上實現(xiàn)的,里面的聲紋等私人生物信息能夠更方便的顯示私人身份信息。而利用在汽車端的邊緣 AI 設(shè)計,就能夠把圖片、聲音等私人生物信息,轉(zhuǎn)變成汽車語義信息,再上傳到云端,從而有效地保障了汽車的個人信息安全。
2.1.3 自動駕駛時代,交互智能必須跟駕駛智能相匹配在可預(yù)期的未來,無人機(jī)協(xié)同飛行將成為一個長期存在的現(xiàn)象,座艙的無人機(jī)交互成為人掌握主動飛行技能的第一個界面。目前,智能駕駛領(lǐng)域面臨進(jìn)化不均衡的問題,人機(jī)交互水平落后于自動駕駛水平的提升,造成自主行車問題的頻出,阻礙自動駕駛的發(fā)展。人機(jī)交互合作行為的特點是人的操作回路上。所以,人機(jī)交互功能必須和自動駕駛功能保持一致。否則將導(dǎo)致嚴(yán)重的預(yù)期功能安全風(fēng)險,絕大多數(shù)自動駕駛致命事件與此有關(guān)。一旦人機(jī)交互接口可以提供自己行車的認(rèn)知結(jié)果,可以進(jìn)一步了解自動駕駛系統(tǒng)的能量邊界這將大大有助于提高 L + 級自動駕駛功能的接受度。當(dāng)然,目前智能座艙的交互方式主要是手機(jī)安卓生態(tài)的延申,主要是通過主機(jī)屏幕支持。現(xiàn)在的顯示器也越來越大,而這其實是由于低優(yōu)先級的功能占用了高優(yōu)先功能的空間,帶來額外的信號干擾,影響運(yùn)行安全。在未來,雖然實物顯示屏仍然存在,但我相信在未來,取而代之的將是自然人機(jī)交互+AR-HUD。如果把智能駕駛系統(tǒng)發(fā)展到 L四以上,人將從枯燥疲勞的駕駛中解放出來,汽車也將成為 “ 人的第三生活空間 ”。這樣,未來駕駛室內(nèi)的娛樂區(qū)和安全功能區(qū)(人機(jī)交互和自動操縱)的位置會進(jìn)行改變,安全區(qū)則變成為主控制區(qū)。自動駕駛是汽車與環(huán)境的互動,人與人的互動是人與汽車的互動,兩者融為一體,完成人、車、環(huán)境三者的協(xié)同,形成完整的駕駛閉環(huán)。第二,自動對話方式+AR-HUD 的對話界面更加安全,在用語言或者手勢溝通的情形下,可以避免對駕車者視線的轉(zhuǎn)移,從而提高了行駛安全。在駕駛艙大屏幕上根本就無法實現(xiàn)這一點,而 ARHUD 則能夠在顯示自動行駛感知信號的同時規(guī)避了這一問題。第三,自然交談方法是一個隱性的、簡潔的、具有感情的自然交談方法。你不能過分占有車?yán)飳氋F的物理空間,但你可以隨時隨地陪伴自在者周圍。所以,未來智慧行車和智慧駕駛艙的域內(nèi)結(jié)合是一種更加安全的發(fā)展方式,最后發(fā)展的是汽車中央的系統(tǒng)。
2.2 人機(jī)交互實戰(zhàn)原理2.2.1 觸控交互早期的中控臺屏幕只是顯示收音機(jī)的信息,大部分面積都容納了超多的物理交互按鈕,這些按鈕基本上都是通過觸覺交互來實現(xiàn)與人類的溝通。隨著智能交互的發(fā)展,出現(xiàn)了中央控制的大屏幕,物理交互按鈕開始逐漸減少。中控大屏幕越來越大,占據(jù)越來越重要的位置。中控臺的物理按鍵已經(jīng)減少到?jīng)]有了,此時乘員已經(jīng)無法用觸覺與人進(jìn)行交互,但在這個階段逐漸轉(zhuǎn)變?yōu)橐曈X交互,人們不再用觸覺與人進(jìn)行溝通,而是主要用視覺進(jìn)行操作。但如果只用視覺與智能座艙的人類進(jìn)行對話,人們將絕對不方便。特別是在駕駛過程中,90% 的人類視覺注意力必須投入到路況的觀察中,才能長期將視線投入到畫面之上,與智能座艙對話。
2.2.2 語音交互(1)語音交互的原理。自然語音的理解——語音識別——語音轉(zhuǎn)化語音。(2)語音交互需要的場景。語音控制的場景應(yīng)用主要有二個要素,一是能夠代替在觸摸屏上沒有提示的功能,與人機(jī)界面自然對話,二是最小化了人機(jī)界面手動控制所帶來的影響,提高安全性。第一,當(dāng)你下班回家的時候,你想在開車的過程中快速控制車輛,查詢信息,查詢空調(diào)、座椅等。在長途旅行中,中途調(diào)查服務(wù)區(qū)和加油站,調(diào)查日程。第二個是用語音把一切鏈接起來。車上的音樂、子屏幕娛樂都能迅速喚起。所以我們要做的就是快速控制車輛。首先就是對汽車實現(xiàn)快速操控,基本功能包括調(diào)整車內(nèi)氛圍燈光、調(diào)整音量、調(diào)控車內(nèi)空調(diào)溫度控制、調(diào)節(jié)窗戶、調(diào)節(jié)后視鏡,快速控制車輛的本意是讓駕駛員更快速地控制車輛,減少注意力分散有助于增加安全運(yùn)行系數(shù)。遠(yuǎn)程語言交互是實現(xiàn)整個系統(tǒng)的重要入口,因為系統(tǒng)必須了解司機(jī)的語音指令,提供智能導(dǎo)航。我們不但能夠被動接受任務(wù),而且還能夠為您提供關(guān)于目的地介紹和日程安排等的附加服務(wù)。接著,是車輛和駕駛員的監(jiān)視,在實時運(yùn)行中,能夠隨時詢問輪胎壓力、箱的溫度、冷卻劑、發(fā)動機(jī)油等車輛的性能和車輛的狀態(tài)。實時信息查詢有助于駕駛員提前處理信息。當(dāng)然到達(dá)警戒臨界點的時候也要實時注意。除了對內(nèi)監(jiān)控外當(dāng)然也需要對外監(jiān)控,生物識別和語音監(jiān)控的混合監(jiān)控可以監(jiān)控駕駛員的情緒。在適當(dāng)?shù)臅r候提醒駕駛員打起精神來避免交通事故的發(fā)生。以及長時間行駛的疲勞聲音的注意事項。最后,在多媒體娛樂方面,開車的場景、播放音樂和廣播是最高頻的操作和需求。除了簡單的播放、暫停、歌曲切換等功能外,還等待著收藏、賬號注冊、播放歷史的開啟、播放順序的切換、現(xiàn)場互動等個性化功能的開發(fā)。2.2.3 容納錯誤語音對話中必須允許容錯機(jī)制?;镜娜蒎e也按場景進(jìn)行處理。一是聽不懂,此時讓用戶再說一遍,二是聽了但沒有處理問題的能力,三是識別為錯誤信息,這可以再確認(rèn)。
2.2.4 人臉識別(1)人臉識別的原理。駕駛艙的人臉特征識別技術(shù)一般包含以下三方面:人臉特征檢查、模式識別。隨著互聯(lián)網(wǎng)整體信息的生物化,多平臺輸入人臉信息,汽車作為萬物互聯(lián)的一個重點,隨著更多移動終端使用場景移動到車內(nèi),賬戶注冊、身份認(rèn)證需要在車內(nèi)進(jìn)行。(2)人臉識別使用場景。行駛前,必須上車驗證車主信息,注冊應(yīng)用 ID。行走中,面部識別是行走中閉眼疲勞的主要工作場景,電話提醒,無眼前,打哈欠。單純的相互作用可以讓駕駛員更不方便。例如,僅憑語音,容易發(fā)生誤指令、單純觸摸操作,駕駛員無法滿足 3 秒的原則。只有語音、手勢、視覺等多種交互方式融合在一起,智能系統(tǒng)才能更加準(zhǔn)確、方便、安全地在各種場景中與駕駛員進(jìn)行溝通。
2.3 人機(jī)交互挑戰(zhàn)與未來
2.3.1 人機(jī)交互的挑戰(zhàn)理想的自然互動是從使用者感受入手,創(chuàng)造安全、順暢、可預(yù)見的互動感受。但不管人生如何豐富,總要腳踏實地的從事實出發(fā),目前的挑戰(zhàn)依然很多。目前自然交互的誤認(rèn)仍然很嚴(yán)重,全工況、全天候的可靠性、準(zhǔn)確性還遠(yuǎn)遠(yuǎn)不夠。因此,在手勢辨識中,依靠視覺的手勢識別率目前仍很低,所以必須研發(fā)各種算法來提高辨識的精度與速率。無意中打手勢,或許會被人誤認(rèn)為是命令動作,但其實這只是無數(shù)誤認(rèn)之一,在移動情況下,對光線的投射、振動、遮擋等都是重大技術(shù)的問題。因此,配合運(yùn)轉(zhuǎn)場景,采用多傳感器融合驗證方式、聲音確認(rèn)等方式,為了降低誤識別率,需要綜合性地加持各種技術(shù)手段。其次,目前自然交互的流暢性問題仍是當(dāng)前必須克服的困難,要求更先進(jìn)的傳感器、更強(qiáng)大的能力、更高效率的計算。同時,自然的語言處理能力與意圖表達(dá)還處在起步階段,還需算法技術(shù)的深入研究。2.3.2 未來,座艙人機(jī)交互走向虛擬世界與情感連接消費者愿意為汽車移動之外附加的智能化功能買單的原因之一是對話和體驗。我們在上面提到,未來智能座艙的發(fā)展是以人為本的,它將在人們的生活中演化為第三個空間。這種人機(jī)交互絕不是簡單的呼叫響應(yīng),而是多渠道、多級、多模式的交流感覺。從乘員視角,未來的智能座艙人機(jī)交互系統(tǒng)將以智能語言為主要交流手段,并以觸摸、手勢、動態(tài)、表情等為輔助交流手段,解放乘員手與眼睛,以減少駕駛員操控風(fēng)險。隨著駕駛艙內(nèi)傳感器的增加,人機(jī)交互服務(wù)對象以駕駛員為中心向全車乘客服務(wù)轉(zhuǎn)移是一種確定性趨勢。智能座艙構(gòu)建虛擬空間,人與人的自然互動將帶來全新的沉浸式擴(kuò)展現(xiàn)實娛樂體驗。強(qiáng)大的配置,結(jié)合駕駛艙強(qiáng)大的互動設(shè)備,可以構(gòu)建車內(nèi)的元宇宙,提供各種沉浸式游戲。智能座艙可能是原太空的好載體。
人機(jī)的自然互動也帶來情感上的聯(lián)系,駕駛艙成為人的伴侶,更智能的伴侶,學(xué)習(xí)車主的行為、習(xí)慣、偏好,感知駕駛艙內(nèi)的環(huán)境,結(jié)合車輛當(dāng)前的位置,在需要時積極提供信息和功能提示。隨著人工智能的發(fā)展,在我們有生之年,有機(jī)會看到人類的情感聯(lián)系逐漸滲透到我們的個人生活中,確保技術(shù)向善,也許是那時我們必須面對的另一個重大問題。但無論如何,技術(shù)都會朝這個方向發(fā)展。
3、智能座艙人機(jī)交互總結(jié)
在當(dāng)前慘烈的汽車產(chǎn)業(yè)競爭中,人工智能座艙系統(tǒng)已然變成了實現(xiàn)整機(jī)廠功能差異性的關(guān)鍵問題,因為駕駛艙人機(jī)交互系統(tǒng)和人的交流行為、語言文化等都息息相關(guān),所以需要高度本地化。智能車輛人機(jī)交互是中國智能車輛企業(yè)品牌升級的重要突破口,是中國智能車輛科技引導(dǎo)世界技術(shù)發(fā)展趨勢的突破口。這些相互作用和相互作用的整合,未來將提供更全面的沉浸體驗,繼續(xù)推動新的互動方式和技術(shù)的成熟,期望從目前的體驗提升功能演化為未來智能座艙的必備功能。未來智能座艙交互技術(shù)無論是基本安全需求還是更深層次的歸屬感、自我實現(xiàn)心理需求,都有望涵蓋多種多樣的出行需求。
更多信息可以來這里獲取==>>電子技術(shù)應(yīng)用-AET<<