人工智能(AI)目前正在為社會的方方面面帶來革新。比如,通過結(jié)合數(shù)據(jù)挖掘和深度學習的優(yōu)勢,如今可以利用人工智能來分析各種來源的大量數(shù)據(jù),識別各種模式、提供交互式理解和進行智能預(yù)測。
這種創(chuàng)新發(fā)展的一個例子就是將人工智能應(yīng)用于由傳感器生成的數(shù)據(jù),尤其是通過智能手機和其他消費者設(shè)備所收集的數(shù)據(jù)。運動傳感器數(shù)據(jù)以及其他信息比如GPS地址,可提供大量不同的數(shù)據(jù)集。因此,問題在于:“如何使用人工智能才能充分發(fā)揮這些協(xié)同作用?”
運動數(shù)據(jù)分析
一個說明性的的真實應(yīng)用程序?qū)⒖梢酝ㄟ^分析使用數(shù)據(jù)來確定用戶在每個時間段的活動,無論是在坐姿、走路、跑步或者睡眠情況下。
在這種情況下,智能產(chǎn)品的好處不言而喻:
1.提高客戶生命周期價值
提高用戶參與度可以降低客戶流失率。
2.更具競爭力的產(chǎn)品定位
下一代智能產(chǎn)品滿足消費者日益增長的期待。
3.為終端用戶創(chuàng)造真正的價值
對室內(nèi)運動的準確檢測和分析可實現(xiàn)靈敏的導航功能、進行健康風險監(jiān)控,同時提高設(shè)備的效率。 對多種智能手機和可穿戴平臺實際使用情景的深度掌握,將大大有助于產(chǎn)品設(shè)計師了解用戶的重復習慣和行為,例如確定正確的電池尺寸或確定推送通知的正確時機。
智能手機制造商對于人工智能功能的興趣正濃,這也正突出了識別簡單日常活動,如步數(shù)的重要性,這必將發(fā)展為更為深入的分析,例如體育活動。對于像足球這樣的流行體育運動,產(chǎn)品設(shè)計師不會只著眼于運動員,而是會為更多的人提供便利,比如教練、球迷甚至是廣播公司和運動服裝設(shè)計公司等大型公司。這些公司將從深層次的數(shù)據(jù)分析中獲益,從而可以準確量化、提高和預(yù)測運動表現(xiàn)。
數(shù)據(jù)獲取和預(yù)處理
在識別這一商機之后,下一個合理的步驟就是思考如何有效收集這些巨大的數(shù)據(jù)集。
比如在活動跟蹤方面,原始數(shù)據(jù)通過軸向運動傳感器得以收集,例如智能手機、可穿戴設(shè)備和其他便攜式設(shè)備中的加速度計和陀螺儀。這些設(shè)備以完全隱蔽的方式獲取三個坐標軸(x、y、z)上的運動數(shù)據(jù),即以便于用戶應(yīng)用的方式連續(xù)跟蹤和評估活動。
訓練模型
對于人工智能的監(jiān)督式學習,需要用標記數(shù)據(jù)來訓練“模型”,以便分類引擎可以使用此模型對實際用戶行為進行分類。舉例來說,我們從正在進行跑步或是走路的測試用戶那里收集運動數(shù)據(jù),并把這些信息提供給模型來幫助其學習。
由于這基本上是一種一次性方法,簡單的應(yīng)用程序和照相系統(tǒng)就可以完成給用戶“貼標簽”的任務(wù)。我們的經(jīng)驗表明,隨著樣本數(shù)量的增加,在分類上的人為錯誤率隨之減少。因此,從有限數(shù)量的用戶那里獲取更多的樣本集比從大量用戶那里獲得較小的樣本集更有意義。
只獲取原始傳感器數(shù)據(jù)是不夠的。我們觀察到,要實現(xiàn)高度準確的分類,需要仔細確定一些特征,即系統(tǒng)需要被告知對于區(qū)分各個序列重要的特征或者活動。人工學習的過程具有反復性,在預(yù)處理階段,哪些特征最為重要還尚未明確。因此,設(shè)備必須要依據(jù)可能對分類準確性有影響的專業(yè)知識進行一些猜測。
為了進行活動識別,指示性特征可以包括“濾波信號”,例如身體加速(來自傳感器的原始加速度數(shù)據(jù))或“導出信號”,例如高速傅里葉變換(FFT)值或標準差計算。
舉例來說,加州大學歐文分校的機器學習數(shù)據(jù)庫(UCI)創(chuàng)建了一個定義了561個特征的數(shù)據(jù)集,這個數(shù)據(jù)集以30名志愿者的六項基本活動,即站立、坐姿、臥姿、行走、下臺階和上臺階為基礎(chǔ)。
模式識別和分類
收集了原始運動數(shù)據(jù)之后,我們需要應(yīng)用機器學習技術(shù)來將其分類并進行分析??晒┪覀兪褂玫臋C器學習技術(shù)從邏輯回歸到神經(jīng)網(wǎng)絡(luò)等不一而足。
支持向量機(SVMs)就是這樣一個應(yīng)用于人工智能的學習模型。身體活動,比如走路包括了由多種運動構(gòu)成的序列,由于支持向量機擅長于序列分類,因此它是進行活動分類的合理選擇。
支持向量機的使用、培訓、擴展和預(yù)測均十分簡單,所以可以輕松地并列設(shè)置多個樣本采集實驗,以用于處理復雜的現(xiàn)實生活數(shù)據(jù)集的非線性分類。支持向量機還可實現(xiàn)多種不同的尺寸和性能優(yōu)化。
確定一項技術(shù)后,我們必須為支持向量機選擇一個軟件圖書館。開源庫LibSVM是一個很好的選擇,它非常穩(wěn)定并且有詳細的記錄,支持多類分類,并提供所有主要開發(fā)者平臺從MATLAB到Android的拓展。
持續(xù)分類的挑戰(zhàn)
在實踐中,用戶在移動的同時,使用中的設(shè)備要進行實時分類來進行活動識別。為了將產(chǎn)品成本降到最低,我們需要在不影響結(jié)果也就是信息質(zhì)量的前提下,平衡傳輸、存儲和處理的成本。
假設(shè)我們可以負擔數(shù)據(jù)傳輸?shù)馁M用,所有數(shù)據(jù)都可以在云端上獲得存儲和處理。實際上,這會為用戶帶來巨大的數(shù)據(jù)費用,用戶的設(shè)備當然要連接互聯(lián)網(wǎng),無線網(wǎng)絡(luò)、藍牙或4G模塊的費用不可避免地將進一步提升設(shè)備成本。
更糟糕的是,在非城市地區(qū),3G網(wǎng)絡(luò)的訪問效果通常不理想,例如徒步旅行、騎自行車或游泳時。這種對云端的大量數(shù)據(jù)傳輸?shù)囊蕾嚂垢伦兟?,并且需要定期同步,從而大大抵消人工智能運動分析帶來的實際益處。與之相反,僅在設(shè)備的主處理器上處理這些操作會明顯導致耗電量的增加,并且減少其他應(yīng)用的執(zhí)行周期。同理,將所有數(shù)據(jù)都儲存在設(shè)備上會增加存儲成本。
化圓為方
為了解決這些彼此沖突的問題,我們可以遵循四個原則:
1.拆分——將特征處理從分類引擎的執(zhí)行中拆分。
2.減少——智能選擇準確的活動識別所需的特征,來減少存儲和處理的需求量。
3.使用——使用的傳感器須能夠以較低耗電量獲取數(shù)據(jù)、實施傳感器融合(將多個傳感器的數(shù)據(jù)結(jié)合在一起),并且能夠為持續(xù)執(zhí)行進行特征預(yù)處理。
4.保留——保留能夠確定用戶活動的系統(tǒng)支持性數(shù)據(jù)的模型。
通過將特征處理與分類引擎的執(zhí)行拆分,與加速度和陀螺儀傳感器連接的處理器可以小得多。這有效避免了將實時數(shù)據(jù)塊連續(xù)傳輸?shù)礁鼜姶蟮奶幚砥鞯男枨?。諸如用于將時間域信號變換為頻率域信號的高速傅里葉變換的特征處理將需要低功耗融核處理器,以執(zhí)行浮點運算。
此外,在現(xiàn)實世界中,單個傳感器存在物理限制,并且其輸出隨時間發(fā)生偏差,例如由于由焊接和溫度引起的偏移和非線性縮放。為了補償這種不規(guī)則性,需要傳感器融合,以及快速、內(nèi)聯(lián)和自動的校準。
圖1:活動分類的功能流程(來源Bosch Sensortec)
此外,所選擇的數(shù)據(jù)捕獲速率可以顯著影響所需的計算和傳輸量。通常來說,50Hz采樣率對于正常的人類活動就足夠了。但在對快速移動的活動或運動進行分析時,需要200 Hz的采樣率。同樣地,為了取得更快的響應(yīng)時間,可以安裝2 kHz單獨加速計來確定用戶目的。
為了迎接這些挑戰(zhàn),低功耗或者應(yīng)用特定傳感器集線器可以顯著降低分類引擎所需的CPU周期。比如Bosch Sensortec的BHI160和BNO055兩個產(chǎn)品就是這種傳感器集線器。相關(guān)軟件可直接以不同的傳感器數(shù)據(jù)速率直接生成融合后的傳感器輸出。
對待處理特征的初始選擇隨后會極大地影響訓練模型的大小、數(shù)據(jù)量以及訓練和執(zhí)行內(nèi)聯(lián)預(yù)測所需的計算能力。因此,對特定活動分類和區(qū)分所需的特征進行選擇是一項關(guān)鍵的決定,同時也很可能是重要的商業(yè)優(yōu)勢。
回顧我們上文提到的UCI機器學習數(shù)據(jù)庫,其擁有561個特征的完整數(shù)據(jù)集,使用默認的LibSVM內(nèi)核訓練的模型進行活動分類的測試準確度高達91.84%。然而,完成培訓和特征排名后,選擇最重要的19項功能足以達到85.38%的活動分類測試準確度。經(jīng)過對排名進行仔細檢查,我們發(fā)現(xiàn)最相關(guān)的特征是頻域變換以及滑動窗口加速度原始數(shù)據(jù)的平均值、最大值和最小值。有趣的是,這些特征都不能僅僅通過預(yù)處理實現(xiàn),傳感器融合對于確保數(shù)據(jù)的足夠可靠性十分必要,并因此對分類尤為實用。
結(jié)論
總而言之,科技發(fā)展現(xiàn)在已經(jīng)達到在便攜式設(shè)備上運行高級人工智能來分析運動傳感器的數(shù)據(jù)的程度。這些現(xiàn)代傳感器以低功耗運行,而傳感器融合和軟件分區(qū)則明顯提高了整個系統(tǒng)的效率和可行性,同時也大大簡化了應(yīng)用程序開發(fā)。
為了補充傳感器的基礎(chǔ)架構(gòu),我們利用開源庫和最佳實踐來優(yōu)化特征提取和分類。
為用戶提供真正的個性化體驗已成為現(xiàn)實,通過人工智能,系統(tǒng)可以利用由智能手機、可穿戴和其他便攜設(shè)備的傳感器所收集的數(shù)據(jù),為人們提供更多深度功能。未來幾年,一系列現(xiàn)在還難以想象的設(shè)備和解決方案將會得到更多發(fā)展。人工智能和傳感器為設(shè)計師和用戶打開了一個充滿了激動人心的機會的新世界。
圖4:人工智能和傳感器為設(shè)計師和用戶打開了一個充滿了激動人心的機會的新世界。