據(jù)稱(chēng),機(jī)器現(xiàn)在已經(jīng)可以識(shí)別很多人類(lèi)的情緒,包括憤怒、恐懼、厭惡以及悲傷等等。情緒識(shí)別技術(shù)已經(jīng)從實(shí)驗(yàn)室里面走了出來(lái),成長(zhǎng)為一個(gè)價(jià)值高達(dá)200億的行業(yè)。
到底能不能通過(guò)面部識(shí)別和動(dòng)作識(shí)別來(lái)找到恐怖分子呢?這個(gè)項(xiàng)目早在2003年就已經(jīng)由美國(guó)運(yùn)輸安全管理局(TSA)提出來(lái)了,從那時(shí)起,他們就開(kāi)始測(cè)試一個(gè)名為Spot的監(jiān)控系統(tǒng)來(lái)完成這個(gè)任務(wù)。
在開(kāi)發(fā)這個(gè)系統(tǒng)的過(guò)程中,他們咨詢(xún)了Paul Ekman教授。Paul Ekman教授是舊金山加利福尼亞大學(xué)的榮譽(yù)退休教授。他在幾十年前就開(kāi)發(fā)了一種可以識(shí)別人類(lèi)面部微情緒的方法,這種方法可以通過(guò)掃描人臉微表情來(lái)測(cè)定一個(gè)人是否撒謊。
但是,后來(lái)這個(gè)項(xiàng)目出現(xiàn)了一些問(wèn)題,因而在2007年的時(shí)候被叫停了。安全人員對(duì)乘客進(jìn)行臨檢也是隨機(jī)的,而且,逮捕的人大多與恐怖組織并無(wú)聯(lián)系。另外,據(jù)說(shuō)這個(gè)系統(tǒng)還被用來(lái)區(qū)分人種。
Ekman也在努力和Spot項(xiàng)目劃清界限,他認(rèn)為,Spot項(xiàng)目濫用了他的技術(shù)。但其他一些人認(rèn)為,項(xiàng)目失敗的原因是這項(xiàng)技術(shù)的原理已經(jīng)過(guò)時(shí)了。這項(xiàng)技術(shù)的原理是:情緒可以通過(guò)對(duì)面部物理特征的分析而得出。
最近幾年,科技公司已經(jīng)開(kāi)始基于Ekman的識(shí)別方法訓(xùn)練算法,這些算法都是用于分析和檢測(cè)面部情緒。一些開(kāi)發(fā)者聲稱(chēng),他們開(kāi)發(fā)的自動(dòng)情緒檢測(cè)系統(tǒng)不僅僅具有比人類(lèi)更厲害的情緒解讀能力,而且,它們還可以洞悉我們內(nèi)心的真實(shí)想法,從而提升用戶(hù)與設(shè)備之間的人機(jī)交互。
但是很多研究情緒的專(zhuān)家認(rèn)為這些算法并不會(huì)成功,而且,這個(gè)技術(shù)的可靠性也尚未得到證實(shí),使用它們可能會(huì)產(chǎn)生不好的后果。
人臉?lè)治黾夹g(shù)
情緒檢測(cè)技術(shù)主要包含兩個(gè)技術(shù)要點(diǎn):一個(gè)是計(jì)算機(jī)視覺(jué)技術(shù),用于精確識(shí)別面部情緒;另一個(gè)是機(jī)器學(xué)習(xí)算法,用于解讀面部情緒。
一般來(lái)說(shuō),第二個(gè)步驟會(huì)使用一種名為“監(jiān)督學(xué)習(xí)”的技術(shù),這種技術(shù)可以訓(xùn)練算法,使之能夠識(shí)別之前“見(jiàn)到”過(guò)的東西。其原理就是讓算法分析和處理成千上萬(wàn)張高興表情的圖片來(lái)訓(xùn)練算法,而經(jīng)過(guò)訓(xùn)練后的算法將能夠識(shí)別新的、高興表情的圖片。
一個(gè)名叫Rana el Kaliouby研究生是第一位使用這種技術(shù)進(jìn)行試驗(yàn)的人。在2001年的時(shí)候,他從埃及來(lái)到劍橋攻讀計(jì)算機(jī)科學(xué)博士學(xué)位。和其他人相比,她每天使用電腦的時(shí)間都會(huì)很長(zhǎng)。因此,她想到:如果計(jì)算機(jī)可以識(shí)別她的情緒,并且給與回應(yīng)的話(huà),是不是很有趣呢?畢竟,她遠(yuǎn)渡重洋,身邊沒(méi)有家人和朋友,很孤獨(dú)。
因而,Kaliouby攻讀博士研究生期間的課題就選擇了實(shí)現(xiàn)自己的這個(gè)想法,而且,最后也成功地開(kāi)發(fā)了一個(gè)設(shè)備。這個(gè)設(shè)備可以幫助患有阿斯波哥爾綜合征(兒童分裂樣精神?。┑膬和喿x,同時(shí)回應(yīng)這些兒童的情緒。
2006年時(shí),Kaliouby加入了麻省理工的情緒計(jì)算實(shí)驗(yàn)室。在此工作期間,她和實(shí)驗(yàn)室的主任Rosalind Picard一起工作,繼續(xù)改進(jìn)和提升自己的技術(shù)。后來(lái),在2009年時(shí),他們一起創(chuàng)辦了一家名為Affectiva的初創(chuàng)公司,這也是第一家研究情緒人工智能的公司。
起初,Affectiva公司直接出售自己的情緒檢測(cè)技術(shù),這項(xiàng)技術(shù)可以實(shí)時(shí)檢測(cè)人們對(duì)于廣告和產(chǎn)品的情緒反應(yīng)。他們的客戶(hù)包括Mars、Kellogg’s以及CBS等等。2013年,他們還與另外一家生物測(cè)量公司進(jìn)行了合作,同時(shí),隨著行業(yè)的進(jìn)步而持續(xù)增長(zhǎng)。
Amazon、Microsoft、IBM現(xiàn)在也在宣傳“情緒分析”技術(shù),這項(xiàng)技術(shù)在這些公司也是面部識(shí)別技術(shù)的一種。還有很多小一些的公司,比如Kairos和Eyeris公司,他們也已經(jīng)發(fā)展起來(lái)了,向Affectiva公司提供相似的服務(wù)。
除了用于市場(chǎng)調(diào)查,這項(xiàng)技術(shù)還被應(yīng)用于監(jiān)控、檢測(cè)司機(jī)精神狀態(tài)、測(cè)試游戲的用戶(hù)體驗(yàn),甚至還可以協(xié)助醫(yī)生評(píng)估病人的情況。
Kaliouby見(jiàn)證了情緒檢測(cè)技術(shù)的發(fā)展,情緒檢測(cè)技術(shù)從實(shí)驗(yàn)室中的一個(gè)科研項(xiàng)目,成長(zhǎng)成為一個(gè)規(guī)模高達(dá)200億美元的產(chǎn)業(yè)。而且,她相信情緒檢測(cè)技術(shù)還會(huì)繼續(xù)發(fā)展。她預(yù)測(cè),未來(lái)這項(xiàng)技術(shù)將會(huì)無(wú)處不在,集成進(jìn)入我們所有的設(shè)備之中,甚至能夠洞悉我們的內(nèi)心,解讀我們的潛意思,并且給與實(shí)時(shí)的回應(yīng)。
龐大的數(shù)據(jù)庫(kù)
和大部分機(jī)器學(xué)習(xí)技術(shù)應(yīng)用場(chǎng)景一樣,情緒識(shí)別也以來(lái)大量高質(zhì)量數(shù)據(jù)。
根據(jù)Affectiva網(wǎng)站上的說(shuō)法,Affectiva公司擁有世界上最大的情緒數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)中共有超過(guò)750萬(wàn)張臉,它們來(lái)自于87個(gè)不同的國(guó)家。主要的拍攝場(chǎng)景是觀(guān)看電視和日常通勤。
這些視頻由Affectiva公司的35名工作人員進(jìn)行標(biāo)記,通過(guò)判斷來(lái)標(biāo)定視頻中拍攝到的情緒。比如,如果看到有人眉毛低垂、嘴唇緊閉或者是眼球外凸,那就將其標(biāo)注為“憤怒”。其他情緒也是相似的處理方法。這些標(biāo)記好的數(shù)據(jù)將會(huì)被用于訓(xùn)練公司的算法。
很多情緒檢測(cè)公司都使用這種標(biāo)記方法,而這種方法已經(jīng)成為測(cè)量情緒的金科玉律。這種方法叫做“面部情緒動(dòng)作編碼系統(tǒng)”(Emfacs),由Paul Ekman和Wallace V Friesen在上世紀(jì)80年代提出。
而這種技術(shù)最早起源于上世紀(jì)60年代,當(dāng)時(shí),Ekman和兩位同事創(chuàng)建了一個(gè)假說(shuō)。假說(shuō)認(rèn)為,人類(lèi)一共有6種通用情緒,包括:憤怒、厭惡、恐懼、快樂(lè)、悲傷以及驚訝,而這些情緒都可以通過(guò)分析面部肌肉的運(yùn)動(dòng)來(lái)得出結(jié)論。
為了證明這個(gè)假說(shuō),他們?cè)O(shè)計(jì)了實(shí)驗(yàn),向不同文化背景的人們展示情緒照片,讓他們來(lái)識(shí)別圖中情緒。結(jié)果表明,雖然大家有很大的文化差異,但是大家對(duì)于情緒的識(shí)別基本都是一致的。例如,對(duì)于所有的人來(lái)說(shuō),低垂的眉毛、緊閉的嘴唇以及外凸的眼球都是表示“憤怒”。
在接下來(lái)的20年中,Ekman根據(jù)自己的發(fā)現(xiàn),開(kāi)發(fā)了用于識(shí)別面部情緒的方法。一個(gè)人的某種情緒會(huì)自動(dòng)激發(fā)面部肌肉的活動(dòng),從而顯示出情緒。盡管有的時(shí)候人們?cè)诒M力隱藏自己真實(shí)的情緒,但總是會(huì)流露出一些東西,而這些東西就可能被其他人所捕捉到。
在20世界后半葉,這個(gè)理論一直當(dāng)做情緒的經(jīng)典理論。Ekman將他的情緒檢測(cè)方法申請(qǐng)了專(zhuān)利,并向CIA、FBI以及TSA等機(jī)構(gòu)出售自己的技術(shù),用于幫助這些機(jī)構(gòu)進(jìn)行培訓(xùn)。這種理論后來(lái)也流行起來(lái),甚至還有人用這個(gè)點(diǎn)子,拍了一部名為L(zhǎng)ie to Me(別對(duì)我說(shuō)謊)的電視劇。
但是,很多研究情緒的自然科學(xué)家和神經(jīng)學(xué)家都開(kāi)始質(zhì)疑Ekman的經(jīng)典理論。
近幾年來(lái),來(lái)自于美國(guó)東北大學(xué)(Northeastern University)的Lisa Feldman Barrett教授對(duì)Ekman的經(jīng)典理論提出了有力而且持續(xù)的評(píng)論。
Barrett教授第一次接觸經(jīng)典情緒理論是在讀研期間,她需要找一個(gè)合適的方法來(lái)客觀(guān)地測(cè)量情緒,因而就找到了Ekman教授的經(jīng)典理論。當(dāng)她仔細(xì)閱讀相關(guān)文獻(xiàn)時(shí),她發(fā)現(xiàn)這個(gè)理論是有漏洞的。當(dāng)時(shí)的實(shí)驗(yàn)中,人們做的是將給定的情緒和圖片去進(jìn)行匹配,而這一定程度上相當(dāng)于無(wú)意地給了他們答案的提示。
她和她的一些同事們一起重新做了Ekman經(jīng)典理論的驗(yàn)證實(shí)驗(yàn),這次,他們不再提供標(biāo)簽,實(shí)驗(yàn)參與者可以自由地描述圖片中的情緒。最終,實(shí)驗(yàn)得到了和以前不太一樣的結(jié)果,面部表情和情緒的相關(guān)性大大降低。
從這以后,Barrett建立了自己的情緒理論,而且出版了一本書(shū)來(lái)詳細(xì)闡明,書(shū)的名字叫做《情緒是如何產(chǎn)生的:大腦的秘密》(How Emotions Are Made: the Secret Life of the Brain)她認(rèn)為,沒(méi)有什么所謂的“通用情緒”,情緒存在于大腦之中,由內(nèi)部刺激而激發(fā),而且情緒是由更小的基礎(chǔ)結(jié)構(gòu)所構(gòu)成的。
Barrett在書(shū)中寫(xiě)到:“情緒是身體的物理特性的體現(xiàn)。大腦會(huì)將自己和周?chē)母鞣N環(huán)境相聯(lián)系,包括文化、成長(zhǎng)歷程等等,從而產(chǎn)生出情緒。情緒是真實(shí)的,但是并不是一個(gè)具象的分子或者是神經(jīng)元。這種真實(shí)就是像是我們手里握著鈔票那樣,情緒是我們身體的產(chǎn)物。”
Barrett認(rèn)為將面部表情直接和情緒在各種文化環(huán)境中直接相關(guān)聯(lián),是不合適的。有的人在生氣的時(shí)候可能會(huì)滿(mǎn)臉怒容,另一個(gè)可能會(huì)禮貌的微笑,但背地里謀劃著怎么對(duì)付自己的敵人。因此,進(jìn)行情緒分析時(shí),需要把情緒看做是動(dòng)態(tài)的,而且涉及很多東西,包括:認(rèn)知過(guò)程、人際交互、行為傾向以及文化背景等。Barrett說(shuō)道:“情緒非常復(fù)雜,因此,分析情緒有很多需要做的事情?!?/p>
Kaliouby也同意表情是復(fù)雜的,這也是為什么她和她的團(tuán)隊(duì)一直在提升自己數(shù)據(jù)庫(kù)的豐富程度和復(fù)雜程度。而且,他們使用視頻來(lái)訓(xùn)練算法,而不再使用圖片。他們也在試驗(yàn)中抓取相關(guān)信息,比如說(shuō)聲音、步態(tài)以及面部的細(xì)微變化。她堅(jiān)信,更好的數(shù)據(jù)庫(kù)將會(huì)提升分析結(jié)果的準(zhǔn)確性。有些研究甚至聲稱(chēng),機(jī)器在識(shí)別工作上的表現(xiàn)已經(jīng)超過(guò)了人類(lèi)。
但是,Barrett認(rèn)為,光有數(shù)據(jù)還不行,重要的是怎么去標(biāo)記。Affectiva等公司的標(biāo)記數(shù)據(jù)訓(xùn)練出來(lái)的算法,只能識(shí)別Barrett教授提到的“典型情緒”。
紐約大學(xué)AI Now研究中心的聯(lián)合主任Meredith Whittake,基于Ekman的理論開(kāi)發(fā)了一個(gè)使用機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用。結(jié)果,最后發(fā)現(xiàn)這個(gè)應(yīng)用不僅不實(shí)用,而且可能會(huì)給社會(huì)造成一定的危害。
她說(shuō):“有的公司已經(jīng)開(kāi)始使用這些技術(shù)來(lái)評(píng)測(cè)應(yīng)聘者是不是合適,甚至有的學(xué)校也用這些技術(shù)來(lái)判斷學(xué)生的參與度和滿(mǎn)意度。對(duì)于應(yīng)聘者,這樣的信息會(huì)改變一個(gè)人的應(yīng)聘結(jié)果;對(duì)于學(xué)生,這樣的信息會(huì)改變他所接受到的教學(xué)方法和評(píng)價(jià)方式。如果這個(gè)結(jié)果不是非常準(zhǔn)確的話(huà),那麻煩就大了。”
Kaliouby表示,她也知道情緒檢測(cè)技術(shù)可能會(huì)被濫用,因此,在開(kāi)發(fā)過(guò)程中,她非常注意技術(shù)倫理問(wèn)題。
Kaliouby非常了解建立多元數(shù)據(jù)庫(kù)的重要性,她說(shuō):“我們必須要保證用于訓(xùn)練算法的數(shù)據(jù)是多元化的。我們的樣本包含白種人、亞洲人、深色人種,甚至還包括穆斯林女性?!?/p>
正是為了這個(gè)目的,Affectiva公司從87個(gè)國(guó)家收集數(shù)據(jù)。而在數(shù)據(jù)收集的過(guò)程中,工作人員發(fā)現(xiàn),有的國(guó)家居民表情明顯,有的則不然,在表達(dá)情緒的時(shí)候會(huì)有一些細(xì)微的差別。比如說(shuō),巴西人笑得時(shí)候嘴會(huì)咧得比較寬、比較長(zhǎng);而日本人的微笑并不表示開(kāi)心,只是表示禮貌。
Affectiva公司為這些細(xì)微差別專(zhuān)門(mén)建立了一個(gè)分析系統(tǒng),用于區(qū)分不同的種族和不同的文化。
但是,Whittaker對(duì)這樣的技術(shù)有些擔(dān)心。事實(shí)上,已經(jīng)有一些公司提供預(yù)測(cè)技術(shù),可以預(yù)測(cè)某個(gè)人多大程度上可能會(huì)是恐怖分子、戀童癖或者是預(yù)測(cè)一個(gè)人的性取向。
最近的一些研究表明,面部識(shí)別技術(shù)產(chǎn)生的偏見(jiàn)將更可能會(huì)損害少數(shù)民族的權(quán)利。去年11月公布的一項(xiàng)研究表明,相對(duì)白人,情緒檢測(cè)技術(shù)對(duì)于黑人并不友好。
當(dāng)這些問(wèn)題匯總到Kaliouby那里以后,她說(shuō),Affectiva公司的系統(tǒng)中的確有所謂的“種族鑒定”功能,但是現(xiàn)在并未啟用。而且,他們只會(huì)橫向?qū)Ρ茸R(shí)別同一地區(qū)的情緒。例如,巴西人和巴西人去對(duì)比,日本人和日本人去對(duì)比。
“那如果是一個(gè)在巴西的日本人怎么辦呢?系統(tǒng)會(huì)采用那個(gè)標(biāo)準(zhǔn)呢?“
“當(dāng)前,我們的技術(shù)還未成熟。”