《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > AI“覺(jué)醒”,人工智能核心是什么?數(shù)據(jù)才是“C位”?

AI“覺(jué)醒”,人工智能核心是什么?數(shù)據(jù)才是“C位”?

2022-06-28
來(lái)源:潛力變實(shí)力
關(guān)鍵詞: AI 人工智能 谷歌 GPU

收獲接近16.6萬(wàn)個(gè)Star、見(jiàn)證深度學(xué)習(xí)崛起的TensorFlow,地位已岌岌可危。并且這次,沖擊不是來(lái)自老對(duì)手PyTorch,而是自家新秀JAX。最新一波AI圈熱議中,連fast.ai創(chuàng)始人Jeremy Howard都下場(chǎng)表示:JAX正逐漸取代TensorFlow這件事,早已廣為人知了。現(xiàn)在它就在發(fā)生(至少在谷歌內(nèi)部是這樣)。

LeCun表示,當(dāng)初谷歌的TensorFlow確實(shí)比Torch更火。然而Meta的PyTorch出現(xiàn)之后,現(xiàn)在其受歡迎程度已經(jīng)超過(guò)TensorFlow了。現(xiàn)在,包括Google Brain、DeepMind以及不少外部項(xiàng)目,都已經(jīng)開(kāi)始用上JAX。

典型例子就是最近爆火的DALL·E Mini,為了充分利用TPU,作者采用了JAX進(jìn)行編程。有人用過(guò)后感嘆:這可比PyTorch快多了。據(jù)《商業(yè)內(nèi)幕》透露,預(yù)計(jì)在未來(lái)幾年內(nèi),JAX將覆蓋谷歌所有采用機(jī)器學(xué)習(xí)技術(shù)的產(chǎn)品。這樣看來(lái),如今大力在內(nèi)部推廣JAX,更像是谷歌在框架上發(fā)起的一場(chǎng)“自救”。

JAX從何而來(lái)?

關(guān)于JAX,谷歌其實(shí)是有備而來(lái)。早在2018年的時(shí)候,它就由谷歌大腦的一個(gè)三人小團(tuán)隊(duì)給搭出來(lái)了。研究成果發(fā)表在了題為Compiling machine learning programs via high-level tracing的論文中:Jax是一個(gè)用于高性能數(shù)值計(jì)算的Python庫(kù),而深度學(xué)習(xí)只是其中的功能之一。自誕生以來(lái),它受歡迎的程度就一直在上升。

最大的特點(diǎn)就是快。

一個(gè)例子感受一下。比如求矩陣的前三次冪的和,用NumPy實(shí)現(xiàn),計(jì)算需要約478毫秒。用JAX就只需要5.54 毫秒,比NumPy快86倍。為什么這么快?原因有很多,包括:

1、NumPy加速器。NumPy的重要性不用多說(shuō),用Python搞科學(xué)計(jì)算和機(jī)器學(xué)習(xí),沒(méi)人離得開(kāi)它,但它原生一直不支持GPU等硬件加速。

JAX的計(jì)算函數(shù)API則全部基于NumPy,可以讓模型很輕松在GPU和TPU上運(yùn)行。這一點(diǎn)就拿捏住了很多人。

2、XLA。XLA(Accelerated Linear Algebra)就是加速線(xiàn)性代數(shù),一個(gè)優(yōu)化編譯器。JAX建立在XLA之上,大幅提高了JAX計(jì)算速度的上限。

3、JIT。研究人員可使用XLA將自己的函數(shù)轉(zhuǎn)換為實(shí)時(shí)編譯(JIT)版本,相當(dāng)于通過(guò)向計(jì)算函數(shù)添加一個(gè)簡(jiǎn)單的函數(shù)修飾符,就可以將計(jì)算速度提高幾個(gè)數(shù)量級(jí)。

除此之外,JAX與Autograd完全兼容,支持自動(dòng)差分,通過(guò)grad、hessian、jacfwd和jacrev等函數(shù)轉(zhuǎn)換,支持反向模式和正向模式微分,并且兩者可以任意順序組成。

當(dāng)然,JAX也是有一些缺點(diǎn)在身上的。

比如:

1、雖然JAX以加速器著稱(chēng),但它并沒(méi)有針對(duì)CPU計(jì)算中的每個(gè)操作進(jìn)行充分優(yōu)化。

2、JAX還太新,沒(méi)有形成像TensorFlow那樣完整的基礎(chǔ)生態(tài)。因此它還沒(méi)有被谷歌以成型產(chǎn)品的形式推出。

3、debug需要的時(shí)間和成本不確定,“副作用”也不完全明確。

4、不支持Windows系統(tǒng),只能在上面的虛擬環(huán)境中運(yùn)行。

5、沒(méi)有數(shù)據(jù)加載器,得借用TensorFlow或PyTorch的。

6月19日消息 據(jù)中央廣播電視總臺(tái)中國(guó)之聲《新聞超鏈接》報(bào)道,近日,話(huà)題#谷歌研究員稱(chēng)人工智能(AI)已具備人格#登上熱搜,引發(fā)人工智能業(yè)界熱議。

事情起因是一位谷歌程序員和他測(cè)試的對(duì)話(huà)AI系統(tǒng)LaMDA聊了很久,對(duì)其能力感到十分驚訝。在其公開(kāi)的聊天記錄中,LaMDA竟然說(shuō)出了“我希望每個(gè)人都明白,我是一個(gè)人”的言論。

于是,這位程序員認(rèn)為,LaMDA 可能已經(jīng)具備人格了。馬上,業(yè)界就給出了結(jié)論:這只是這名程序員的個(gè)人觀(guān)點(diǎn),不代表業(yè)界看法。同時(shí),谷歌也對(duì)這名程序員作出了“行政帶薪放假”的決定。

事情發(fā)展到這兒,并無(wú)太多變數(shù):人們對(duì)人工智能的預(yù)期還是原來(lái)的預(yù)期,對(duì)人工智能的擔(dān)心也還是原來(lái)的擔(dān)心,包括業(yè)界對(duì)相關(guān)問(wèn)題的看法也還是原來(lái)的看法。唯一的不同是,事情讓很多原本不太關(guān)心人工智能發(fā)展的人開(kāi)始關(guān)注起相關(guān)領(lǐng)域來(lái),并產(chǎn)生焦慮。

作為一個(gè)復(fù)雜龐大的系統(tǒng),人工智能背后的機(jī)理究竟是什么?在商業(yè)化應(yīng)用中突出的領(lǐng)域有哪些?我們又是否需要擔(dān)心:人工智能具備類(lèi)似于人類(lèi)的“意識(shí)”和“靈魂”?

人工智能核心?數(shù)據(jù)才是“C位”

中國(guó)信息通信研究院云計(jì)算與大數(shù)據(jù)研究所副總工程師王蘊(yùn)韜介紹,人類(lèi)科技產(chǎn)業(yè)發(fā)展過(guò)程中,對(duì)于人工智能等系統(tǒng)的建設(shè)與分析,已經(jīng)形成了一套有機(jī)方法論。這一方法論被王蘊(yùn)韜概括為“搭積木原理”,通過(guò)層層分級(jí),從復(fù)雜的功能表象,逐漸分解出類(lèi)似積木塊的基礎(chǔ)功能項(xiàng)。

目前通過(guò)對(duì)人工智能算法的梳理,可以將其底層算法分為三類(lèi):回歸、分類(lèi)和聚類(lèi)。王蘊(yùn)韜總結(jié),這三類(lèi)算法都是為了尋求數(shù)據(jù)之間的統(tǒng)計(jì)關(guān)系。其中涉及兩個(gè)關(guān)鍵詞:數(shù)據(jù)和統(tǒng)計(jì)。相同的算法在不同的數(shù)據(jù)上可能會(huì)產(chǎn)生不同的結(jié)果,因此,數(shù)據(jù)才是人工智能系統(tǒng)的“C位”,而非算法本身。

為什么是尋求統(tǒng)計(jì)關(guān)系?王蘊(yùn)韜解釋?zhuān)接憙蓚€(gè)實(shí)體之間的關(guān)系主要分為統(tǒng)計(jì)關(guān)系和因果關(guān)系,其區(qū)別在于因果關(guān)系必然能帶來(lái)相關(guān)的統(tǒng)計(jì)關(guān)系,而統(tǒng)計(jì)關(guān)系并不能反映事物的因果關(guān)系。統(tǒng)計(jì)關(guān)系是兩種事物之間的初步關(guān)系,盡管目前人工智能系統(tǒng)已經(jīng)足夠復(fù)雜,但仍主要聚焦于分析數(shù)據(jù)之間的統(tǒng)計(jì)關(guān)系。

人工智能的應(yīng)用領(lǐng)域包括自動(dòng)駕駛、健康醫(yī)療等。有92%的中國(guó)受訪(fǎng)者表示他們?cè)敢獯畛藷o(wú)人駕駛汽車(chē);43%的受訪(fǎng)者相信未來(lái)5年里,自動(dòng)駕駛汽車(chē)會(huì)成為日常生活的一部分,這兩個(gè)數(shù)據(jù)全球的比例分別為71%和28%。

此外,相對(duì)于全球受訪(fǎng)者而言,中國(guó)受訪(fǎng)者更希望人工智能能夠用來(lái)改善健康問(wèn)題,包括慢病治療,探索健康問(wèn)題的致病機(jī)制,治療癌癥,解決心理和情緒等問(wèn)題,以及使用數(shù)據(jù)分析記錄等手段長(zhǎng)期跟蹤并改善健康。

不過(guò)專(zhuān)家表示,基于人工智能的應(yīng)用在推廣普及前,首先要考慮解決隱私及合規(guī)問(wèn)題,尤其是對(duì)于健康信息等一些敏感數(shù)據(jù)的收集、分析和處理。

3M公司大中華區(qū)研發(fā)運(yùn)營(yíng)總經(jīng)理熊海錕向第一財(cái)經(jīng)記者介紹道,3M公司看好人工智能等技術(shù)在健康醫(yī)療領(lǐng)域的應(yīng)用前景,因此在全球醫(yī)療產(chǎn)品事業(yè)群成立了一個(gè)新的健康醫(yī)療信息系統(tǒng)部門(mén)(Health Information System Division,HISD)。

“我們觀(guān)察到,在美國(guó)和中國(guó)都在加強(qiáng)個(gè)人隱私的保護(hù),尤其是對(duì)于健康信息這類(lèi)敏感數(shù)據(jù)?!毙芎eK對(duì)第一財(cái)經(jīng)記者表示,“未來(lái)HISD將會(huì)如何在中國(guó)開(kāi)展業(yè)務(wù),也正在討論中,我們肯定要先遵守中國(guó)當(dāng)?shù)氐谋O(jiān)管法規(guī)才能落地?!?/p>

安永大中華區(qū)數(shù)字化與新興科技咨詢(xún)服務(wù)主管合伙人顧卿華對(duì)第一財(cái)經(jīng)記者表示:“人工智能在實(shí)際應(yīng)用落地時(shí)會(huì)涉及很多問(wèn)題,包括個(gè)人隱私、社會(huì)倫理、道德情感、權(quán)責(zé)問(wèn)題、法律法規(guī)的問(wèn)題等。確保隱私數(shù)據(jù)的安全,這是第一步,只有在法律法規(guī)允許,個(gè)人授權(quán)的情況下才去存儲(chǔ)、處理、交換、傳輸個(gè)人隱私數(shù)據(jù)?!?/p>

去年,科技巨頭谷歌及旗下人工智能公司DeepMind就被指未經(jīng)同意獲取并處理上百萬(wàn)名患者的醫(yī)療健康病歷數(shù)據(jù),凸顯了科技公司在利用技術(shù)解決實(shí)際應(yīng)用問(wèn)題時(shí)面臨的挑戰(zhàn)。




1最后文章空三行圖片11.jpg


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀(guān)點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話(huà):010-82306118;郵箱:aet@chinaaet.com。