基于微機電(MEMS)技術(shù)的3D手勢辨識技術(shù)正大幅擴展其在智慧手機和電視遙控器領(lǐng)域的應(yīng)用,而不再僅限于最初的兒童游戲了。
今年可說是3D手勢辨識技術(shù)突破傳統(tǒng)在一般游戲應(yīng)用框架的一年。從最初作為任天堂(Nintendo) Wii的無線游戲介面首次出現(xiàn)在消費市場后,歷經(jīng)數(shù)年的發(fā)展,基于MEMS 感測器的手勢辨識技術(shù)已將觸角延伸到了智慧手機,并準備搶占最具有象征性的消費者介面:電視遙控器。
自從Wii于2006年問世后,任天堂公司的競爭對手們都紛紛開發(fā)出各自的3D手勢辨識和處理技術(shù)。Sony公司專為追逐高精確度控制的游戲玩家們開發(fā)出Move Playstation所用的動態(tài)控制器;微軟(Microsoft)則以Xbox Kinect實現(xiàn)游戲介面的免持功能。
蘋果(Apple)率先利用MEMS感測器的潛能,成功地打造出更直觀的智慧手機介面,并于2007年在iPhone中增加了MEMS加速度計,2010年又增加了MEMS 陀螺儀。蘋果公司的競爭對手們緊隨其后,很快地,各種3D指令(如以搖動表示取消、提起表示接聽,以及反轉(zhuǎn)手機表示斷線)將成為標準的智慧手機功能。
而今,消費OEM們正為其產(chǎn)品線中增加3D手勢辨識功能。有些公司使用GestureTek公司的相機技術(shù)授權(quán),其它公司則取得Hillcrest Laboratories公司或Movea公司的MEMS技術(shù)授權(quán)。Movea公司擁有250多項相關(guān)專利,涵蓋像使用陀螺儀控制游標之類的技術(shù);Hillcrest公司擁有100多項專利,包括使用加速度計和陀螺儀以追蹤動作的專利。這兩家公司都為3D手勢設(shè)計者提供了加值的軟體開發(fā)工具──分別是Movea公司的Gesture Builder和Hillcrest公司的Freespace MotionStudio。
谷歌(Google)方面則是在代號為'姜餅'(Gingerbread)的Andr??oid作業(yè)系統(tǒng)中增加了基于MEMS的手勢辨識應(yīng)用程式介面,以便能夠辨識諸如傾斜、旋轉(zhuǎn)、插入和切削等動作。
“動作處理終將受到主流消費者的廣泛接受,”InvenSense公司創(chuàng)始人Steve Nasiri表示,“我們預(yù)測用于動作處理和手勢辨識的硬體將像會變得像照相機模組一樣,廣泛地應(yīng)用在智慧手機中。”InvenSense公司是首家在單一晶片上整合加速度計和陀螺儀的MEMS晶片制造商。
InvenSense在其陀螺儀以及加速度計/陀螺儀整合晶片中嵌入一個動作處理器,以執(zhí)行辨識用戶手勢時必要的復雜感測器融合演算法,同時減輕應(yīng)用處理器的任務(wù)負載。InvenSense公司計劃明年將在單一晶片上整合加速度計、陀螺儀和磁力計(電子羅盤)。
在國際消費電子展(CES)上,InvenSense公司的動作處理資料庫首次出現(xiàn)于電視遙控器和智慧手機中──使電視遙控器可控制3D手勢辨識,并以智慧手機實現(xiàn)基本電話功能(如只需將手機拿起來靠近耳朵就能接聽電話)。這兩種產(chǎn)品都是LG Electronics公司的產(chǎn)品─??─Magic Motion遙控器用于LG Infinia系列3D電視機;而LG公司新款僅9.2mm寬的Optimus Black智慧手機據(jù)稱是全球最薄的智慧手機,可辨識多種獨特的手勢指令。
其它MEMS晶片制造商同樣將手勢辨識演算法整合于其加速度計與陀螺儀產(chǎn)品中。例如,Kionix公司提供數(shù)十種內(nèi)建手勢辨識演算法的產(chǎn)品系列,該公司的Gesture Designer軟體開發(fā)套件也能協(xié)助OEM設(shè)計出客制化的手勢控制效果。
“電視遙控器公司們正在努力將手勢辨識技術(shù)整合于其產(chǎn)品中,這需要利用非常先進復雜的動作控制技術(shù)。”Kionix公司CEO Greg Galvin指出,“其精華是將視聽輸入功能融合于電視機中,讓用戶可透過一個遙控器切換頻道、下載音樂、欣賞照片集或圖庫、進行文字處理或瀏覽網(wǎng)際網(wǎng)路。”
在IPTV上執(zhí)行應(yīng)用程式和瀏覽網(wǎng)路內(nèi)容時,遙控器必須具備像滑鼠一樣的精確度,才能實現(xiàn)點選和基于手勢的控制功能。“這些應(yīng)用確實需要利用MEMS技術(shù)。”Galvin表示。
智慧電視元年
Hillcrest公司創(chuàng)始人兼CEO Dan Simpkins認為,2011年是'智慧電視元年',并補充道,“50多年來,電視市場終于首次迎來了一種全新的輸入技術(shù)。”Hillcrest公司開發(fā)出一種空中滑鼠──Loop指向器,專門針對那些想要將電腦與電視機連接起來的消費者而設(shè)計;同時,該公司并為IPTV開發(fā)出一款Kylo瀏覽器。
LG公司在CES上展示的Magic Motion遙控器使用的是Hillcrest公司的Freespace手勢辨識技術(shù),可讓助用戶透過復雜的點選螢?zāi)唤槊鏋g覽網(wǎng)路和傳統(tǒng)電視內(nèi)容。
其它競爭技術(shù)還包括飛利浦(Philips)公司的uWand。飛利浦的掌上型控制器選用整合式紅外線攝影機檢測電視機發(fā)出的紅外光,無需采用陀螺儀就能實現(xiàn)精確的動作追蹤。但大多數(shù)其它IPTV遙控器使用的是MEMS陀螺儀。
例如,Movea公司在CES上宣布,臺灣筆記型電腦鍵盤供應(yīng)商精元電腦(Sunrex)公司今年稍晚即將推出的控制器產(chǎn)品中,將會使用Movea公司基于MEMS的MotionIC平臺以及SmartMotion技術(shù),以實現(xiàn)3D手勢辨識。
“下一代動作遙控器將能辨識所有種類的新手勢。”Movea公司全球行銷經(jīng)理Dave Rothenberg表示,“例如,父母透過在空中揮動簽名手勢,即可解鎖電視中的成人內(nèi)容,而當小孩走進房內(nèi)時再以相同的動作來啟動監(jiān)護控制功能。”
同時,微軟公司的Kinect控制器也為傳統(tǒng)智慧帶來了挑戰(zhàn)。這款內(nèi)建MEMS加速度計的Kinect控制器可置于設(shè)備頭端,使用戶的手得以完全擺脫手勢感測硬體。微軟根據(jù)由GestureTek公司所授權(quán)而來光學辨識技術(shù),為Kinect開發(fā)了專有的3D辨識演算法。
Kinect控制器為特定游戲(如虛擬排球)界定嚴格的動作范圍,并進行分類。該技術(shù)以雷射將一組規(guī)則的紅外線點陣投射到玩家身上,而對所投射的影像進行分段,然后測量每個點的反射強度。強度較低的反射點被設(shè)定為來自于背景反射,而較強的反射點則被設(shè)定為從前景中的用戶身上反射而來。然后,Kinect再為用戶的動作進行最佳推測分析,以驅(qū)動游戲中的化身進行反應(yīng)與動作。Kionix公司的MEMS加速度計則有助于使攝影鏡頭能更精確地對準用戶。
根據(jù)業(yè)界分析師們表示,這種技術(shù)犧牲了一定的精確度,以利于用戶的行動性。“我認為微軟公司基于攝影機的辨識系統(tǒng)所具備的精確度仍不足以滿足眾多游戲玩家的要求,這可能導致他們?nèi)匀粚幙衫^續(xù)使用手持控制器,從而讓Sony的Move成為游戲玩家的更佳選擇。 ”iSuppli公司資深分析師Jeremie Bouchaud指出。
“微軟解決方案適合其所針對的用戶:例如想要快速進入和離開游戲、以及希望擁有方便且即時體驗的家庭。”IHS Screen Digest公司游戲負責人Piers Harding-Rolls表示。“另一方面,Sony的Move是一種混合解決方案,不但以感測器追蹤動作,也使用攝影機追蹤位置。在目前這個階段中,Sony的論點是為游戲玩家提供更精確的感測器技術(shù)。 ”
像Kinect控制器這類以攝影機為基礎(chǔ)的技術(shù),“并不是手勢辨識的終結(jié)者。它有一定的存在空間,但加速度計/陀螺儀組合也有自己的市場空間。”Gartner公司分析師Jim Tully認為。
“例如,Kinect攝影機鏡頭無法在多用戶場合中檢測一連串復雜的動作,特別是當某一位用戶被另一位用戶擋住,以及當用戶背對著攝影機鏡頭時的效果都不好……這些時候就需要多部攝影機,然而,這在大多數(shù)情況下又不見得可行。”
透過觀察不斷變化中的攝影影像,GestureTeck公司的技術(shù)已經(jīng)追蹤了數(shù)百萬部手機的3D動作。該公司并因此宣稱,這一光學手勢辨識技術(shù)最終將戰(zhàn)勝基于MEMS的設(shè)備。
“至今,光學手勢辨識技術(shù)的解析度和精確度仍無法達到像使用MEMS慣性感測器時的效果,但對于大多數(shù)游戲來說已經(jīng)足夠了。”GestureTek公司共同創(chuàng)辦人兼總裁Vincent John Vincent指出,“同時,隨著攝影機鏡頭解析度的不斷提升,我們深信光學手勢辨識將具有更精確的解析度,讓設(shè)備得以追蹤身體每部分的動作,最終還將超越MEMS技術(shù)。”
手勢辨識領(lǐng)域中的'凱迪拉克'
就像游戲玩家十分看重精確度一樣,游戲本身的重要性也不如游戲的開發(fā)或特效電影動畫一般。對于動畫達人來說,手勢辨識領(lǐng)域中的'凱迪拉克'就是Xsens Technologies公司以MEMS元件鑲嵌打造的緊身衣褲。這種套裝上的加速度計和陀螺儀可實現(xiàn)即時的動畫序列預(yù)覽。
Xsens公司利用美商亞德諾(ADI)公司的高精度三軸加速度計、陀螺儀和磁力計,開發(fā)出精細的動態(tài)追蹤。例如,有些專業(yè)設(shè)計者利用Xsens技術(shù)為電影'鋼鐵人2'(Iron Man 2)和PS3游戲'殺戮地??帶2'(KillZone 2)開發(fā)動畫效果。這種技術(shù)提供的動作擷取解決方案可應(yīng)用于任何場合,而無需復雜的基礎(chǔ)設(shè)施。Xsens公司預(yù)測,這種技術(shù)最終將能使消費應(yīng)用降低成本,實現(xiàn)類似Kinect的體驗,但提供較其更高的精確度,玩家人數(shù)多少也不受限制。
“微軟Kinect是一種優(yōu)質(zhì)的解決方案,因為它不需要在人體上安裝任何感測器,不過,這也使其速度較慢,有時在追蹤人類動作姿勢方面顯得比較遲緩。”Xsens公司CEO Casper Peeters表示,“我們的技術(shù)應(yīng)用場合方面則靈活得多,它在追蹤穿戴者的細致動作中可以達到更高的精確度。但基于動作的游戲控制器和電話介面才剛開始出現(xiàn)。Xsens公司期望朝另一方面發(fā)展,針對細致的人物動畫實現(xiàn)高階動態(tài)擷取,并為未來催生更多有趣的應(yīng)用。”
微軟也將目光瞄準了未來,計劃充分利用該公司分別于2009年和2010年收購3-DV和Canesta公司時所取得的3D追蹤技術(shù)。這些公司在時差測距(TOF)手勢辨識專利方面實際上已壟斷了市場,特別是對行動設(shè)備而言。
時差測距感測器所測量的是紅外線從物體反射回來到達某個特定CMOS感測器的時間,從而實現(xiàn)可在任何光照條件下任意距離的高精確度3D深度映射。時差測距深度映射技術(shù)還能??與微軟獲GestureTek授權(quán)開發(fā)的3D攝影機手勢辨識演算法完美地結(jié)合起來。
德國TriDiCam和其他幾家公司聲稱也擁有時差測距感測器技術(shù)。但至今只有Canesta公司證實了這個概念,可以使用一個CMOS影像感測器作出在行動設(shè)備上方僅數(shù)英吋處揮手的精確3D影像映射,即使在室外明亮的陽光下使用也沒問題。
同時,像Silicon Labs等公司則利用低成本的紅外線和環(huán)境光感測器,以辨識特殊應(yīng)用手勢,例如以手指在空中劃一條線來啟動顯示器或調(diào)整音量。
Surface的變化
微軟在CES上展示了下一代Surface多點觸控平臺。這種平臺不再使用第一代產(chǎn)品中的5架攝影機建置,實現(xiàn)了一種可垂直安裝的更輕薄設(shè)備。
這種Surface平臺讓用戶能直接操作顯示在螢?zāi)簧系奈矬w,并內(nèi)建演算法來解讀各種手勢,如選擇、拖拉、放下、單指縮放(pinch-to-zoom)和其它類似觸控螢?zāi)坏闹噶?OEM還可開發(fā)自建演算法)。該新版本“厚度僅4英吋,能以水平、垂直或任何角度進行安裝。”微軟公司Surface開發(fā)團隊總經(jīng)理Brad Carpenter指出。
Surface平臺的關(guān)鍵在于微軟與三星LCD部門共同開發(fā)的PixelSense技術(shù)。該技術(shù)針對交錯式棋盤圖案的可見光或紅外光,為其中的每個LCD畫素都加入一個光感測器。在背光中的可見光和紅外光發(fā)射器讓每個對應(yīng)畫素能偵測到從使用者雙手或其它物體反射的光線,再以60f/s的速度采樣感測器,即可同時追蹤多位用戶的動作,使用者數(shù)量僅受限于螢?zāi)豢捎玫谋砻娣e空間大小。內(nèi)建的FPGA支援定位追蹤,并能讀取在螢?zāi)槐砻嫔戏胖梦矬w上的特殊應(yīng)用標簽,再透過紅外線傳輸方式將資料傳送到配備攝影機的Windows 7智慧手機上。
在應(yīng)用程式方面,Surface平臺包括支援Windows 7的超微(AMD) Athlon X2 245e 2.9GHz雙核心處理器,以及一個與其搭配的AMD Radeon HD 6750繪圖處理器。
三星公司還將采用此技術(shù)推出型號為SUR40的顯示器,“這種40英吋的螢?zāi)粚⒂扇堑腖CD部門以7,600美元的價格銷售至全球市場。”微軟公司的Carpenter透露。
圖說:蘋果用戶們非常熟悉2D手勢控制,包括像單指縮放等指令都已經(jīng)被電腦和智慧手機領(lǐng)域的競爭對手們復制。
圖說:穿戴著Xsens公司MVN Motion Capture彈性纖維緊身衣的演員(中)──這件萊卡材質(zhì)的緊身衣鑲嵌著ADI公司的MEMS慣性感測器。他模擬美國驚奇漫畫(Marvel Comics)公司'鋼鐵人'漫畫插圖中的人物姿態(tài)(左),以作為派拉蒙電影(Paramount Picture)公司創(chuàng)作“鋼鐵人2”(右)電影動畫的基礎(chǔ)。
資料來源:Marvel、Xsens、Paramount
圖說:飛利浦公司的uWand技術(shù)針對與配備MEMS控制器相同的應(yīng)用,但不使用MEMS元件。相反地??,它整合了一個紅外線攝影機以偵測來自電視的紅外光,因此不用陀螺儀就能實現(xiàn)動作追蹤。
資料來源:飛利浦
(紅外線光束,紅外線感測器,游標+按鍵透過RF到接收器)
圖說:在OEM演算法的支援下,微軟Surface平臺可讀取'揮手'動作。重新設(shè)計過的螢?zāi)幻姘暹€可掛在墻上。
圖說:微軟的Xbox Kinect以PrimeSense參考設(shè)計為基礎(chǔ),使用兩個CMOS成像器(一個用于紅外光,一個用于可見光)偵測3D深度,使系統(tǒng)能夠輕松區(qū)別房間內(nèi)的游戲玩家和背景物體。