《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 業(yè)界動態(tài) > 東芝開發(fā)高速對照大數(shù)據(jù)技術(shù) 比傳統(tǒng)處理技術(shù)快50倍

東芝開發(fā)高速對照大數(shù)據(jù)技術(shù) 比傳統(tǒng)處理技術(shù)快50倍

2016-06-14

  近日,東芝開發(fā)出了可高速對照大數(shù)據(jù)、大規(guī)模媒體數(shù)據(jù)注1的數(shù)據(jù)處理技術(shù)。此技術(shù)以高維矢量注2表現(xiàn)人物的面部、銷售數(shù)據(jù)等,通過預(yù)先將類似的矢量群索引化處理,可實現(xiàn)高速對照。利用此技術(shù)從1000萬張人物的面部圖像數(shù)據(jù)中提取指定人物的實驗注3中,僅8.31毫秒(1毫秒=1/1000秒)即可完成處理。比傳統(tǒng)的處理速度高出約50倍注4。

  近年來,大數(shù)據(jù)的分析、活用技術(shù)不斷用于機械學(xué)習(xí)或機器故障預(yù)測等領(lǐng)域,大幅提高了故障的預(yù)測精度,給人們的生活帶來諸多便利的同時,分析的數(shù)據(jù)量也比人們預(yù)想的更快實現(xiàn)了大容量化、大規(guī)?;?,尋求計算處理的高速化需求日益凸顯。

  東芝開發(fā)的高速對照技術(shù),結(jié)合了“矢量符號技術(shù)”(以盡量維持矢量間的距離的狀態(tài)進行壓縮)、“矢量索引技術(shù)”(不計算矢量間的距離而是預(yù)先索引化處理距離比較近的矢量群)、“管道搜索技術(shù)”(將粗略搜索和詳細搜索進行階段性組合)這3項技術(shù),從而實現(xiàn)了計算處理的高性能化、高速化。其中,“矢量索引技術(shù)”是東芝最先開發(fā)的技術(shù),擺脫了逐一對照咨詢數(shù)據(jù)的矢量,而是對照已經(jīng)過索引化處理的類似的矢量群,使得處理速度大幅提高。

  東芝以模式挖掘注5、媒體識別的強化注6、大數(shù)據(jù)分析注7三個領(lǐng)域為中心,將此技術(shù)向解決方案服務(wù)領(lǐng)域推廣應(yīng)用。例如,可通過在大范圍內(nèi)設(shè)置的監(jiān)控攝像頭的影像瞬時發(fā)現(xiàn)指定人物,可使用機場等的水域監(jiān)控高速對照國際通緝犯的人臉照片列表注8。

  今后,東芝還將把此技術(shù)應(yīng)用于深度學(xué)習(xí),擴大與提高人工智能等相關(guān)的應(yīng)用領(lǐng)域,為企業(yè)創(chuàng)造全新的價值。

  此外,東芝已將此技術(shù)與向外擴展型數(shù)據(jù)庫“GridDB?”組合,建立了可高速處理大數(shù)據(jù)、大規(guī)模媒體數(shù)據(jù)的世界首個適用高維矢量對照的數(shù)據(jù)庫,計劃將于2016年制作成產(chǎn)品。

  注1:例如,監(jiān)控影像、廣播節(jié)目檔案、客戶服務(wù)中心儲存的語音記錄、Web文本等大規(guī)模媒體數(shù)據(jù)。

  注2:并非二維(平面)或三維(空間)的矢量,而是擁有數(shù)百~數(shù)萬等維數(shù)的矢量。

  注3:使用拍攝的5800人的面部共1000萬張圖像,以98%或以上的面部識別精度為限制條件進行實施。

  注4:依據(jù)東芝獨立調(diào)查獲得的速度比較值。

  注5:模式挖掘(類似模式搜索)

  可對照監(jiān)控攝像頭等的影像的広域監(jiān)控(追蹤需要監(jiān)控的對象人員等)

  配置場所可以是車站、機場、高速道路等的閘口(驗票)、主題公園、娛樂場等的各監(jiān)控點、從車站到運動場(音樂會、體育)的移動路線監(jiān)控、ATM、接待窗口、售票機等。

  注6:媒體識別的強化

  國際通緝犯的檢查(在機場等場所的監(jiān)控強化等)

  注7:大數(shù)據(jù)分析

  對學(xué)習(xí)和預(yù)測自動進行數(shù)據(jù)分析云服務(wù)。只將銷售數(shù)據(jù)、機械信號數(shù)據(jù)等需要分析的數(shù)據(jù)上傳至服務(wù)器,無需另行配置分析管理等人員,可自動獲得分析結(jié)果。

  注8:將1千萬人的國際通緝犯的人臉照片列表和通過安全門的人物進行對照,使用其它公司的類似技術(shù)需要約20秒,使用本技術(shù)則僅需約0.68秒便可進行對照(依據(jù)東芝與系統(tǒng)整體處理時間相關(guān)的理論估計值)。

  ※GridDB是株式會社東芝的注冊商標(biāo)。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。