《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > AI“覺醒”,人工智能核心是什么?數(shù)據(jù)才是“C位”?

AI“覺醒”,人工智能核心是什么?數(shù)據(jù)才是“C位”?

2022-06-28
來源:潛力變實(shí)力
關(guān)鍵詞: AI 人工智能 谷歌 GPU

收獲接近16.6萬個Star、見證深度學(xué)習(xí)崛起的TensorFlow,地位已岌岌可危。并且這次,沖擊不是來自老對手PyTorch,而是自家新秀JAX。最新一波AI圈熱議中,連fast.ai創(chuàng)始人Jeremy Howard都下場表示:JAX正逐漸取代TensorFlow這件事,早已廣為人知了?,F(xiàn)在它就在發(fā)生(至少在谷歌內(nèi)部是這樣)。

LeCun表示,當(dāng)初谷歌的TensorFlow確實(shí)比Torch更火。然而Meta的PyTorch出現(xiàn)之后,現(xiàn)在其受歡迎程度已經(jīng)超過TensorFlow了?,F(xiàn)在,包括Google Brain、DeepMind以及不少外部項目,都已經(jīng)開始用上JAX。

典型例子就是最近爆火的DALL·E Mini,為了充分利用TPU,作者采用了JAX進(jìn)行編程。有人用過后感嘆:這可比PyTorch快多了。據(jù)《商業(yè)內(nèi)幕》透露,預(yù)計在未來幾年內(nèi),JAX將覆蓋谷歌所有采用機(jī)器學(xué)習(xí)技術(shù)的產(chǎn)品。這樣看來,如今大力在內(nèi)部推廣JAX,更像是谷歌在框架上發(fā)起的一場“自救”。

JAX從何而來?

關(guān)于JAX,谷歌其實(shí)是有備而來。早在2018年的時候,它就由谷歌大腦的一個三人小團(tuán)隊給搭出來了。研究成果發(fā)表在了題為Compiling machine learning programs via high-level tracing的論文中:Jax是一個用于高性能數(shù)值計算的Python庫,而深度學(xué)習(xí)只是其中的功能之一。自誕生以來,它受歡迎的程度就一直在上升。

最大的特點(diǎn)就是快。

一個例子感受一下。比如求矩陣的前三次冪的和,用NumPy實(shí)現(xiàn),計算需要約478毫秒。用JAX就只需要5.54 毫秒,比NumPy快86倍。為什么這么快?原因有很多,包括:

1、NumPy加速器。NumPy的重要性不用多說,用Python搞科學(xué)計算和機(jī)器學(xué)習(xí),沒人離得開它,但它原生一直不支持GPU等硬件加速。

JAX的計算函數(shù)API則全部基于NumPy,可以讓模型很輕松在GPU和TPU上運(yùn)行。這一點(diǎn)就拿捏住了很多人。

2、XLA。XLA(Accelerated Linear Algebra)就是加速線性代數(shù),一個優(yōu)化編譯器。JAX建立在XLA之上,大幅提高了JAX計算速度的上限。

3、JIT。研究人員可使用XLA將自己的函數(shù)轉(zhuǎn)換為實(shí)時編譯(JIT)版本,相當(dāng)于通過向計算函數(shù)添加一個簡單的函數(shù)修飾符,就可以將計算速度提高幾個數(shù)量級。

除此之外,JAX與Autograd完全兼容,支持自動差分,通過grad、hessian、jacfwd和jacrev等函數(shù)轉(zhuǎn)換,支持反向模式和正向模式微分,并且兩者可以任意順序組成。

當(dāng)然,JAX也是有一些缺點(diǎn)在身上的。

比如:

1、雖然JAX以加速器著稱,但它并沒有針對CPU計算中的每個操作進(jìn)行充分優(yōu)化。

2、JAX還太新,沒有形成像TensorFlow那樣完整的基礎(chǔ)生態(tài)。因此它還沒有被谷歌以成型產(chǎn)品的形式推出。

3、debug需要的時間和成本不確定,“副作用”也不完全明確。

4、不支持Windows系統(tǒng),只能在上面的虛擬環(huán)境中運(yùn)行。

5、沒有數(shù)據(jù)加載器,得借用TensorFlow或PyTorch的。

6月19日消息 據(jù)中央廣播電視總臺中國之聲《新聞超鏈接》報道,近日,話題#谷歌研究員稱人工智能(AI)已具備人格#登上熱搜,引發(fā)人工智能業(yè)界熱議。

事情起因是一位谷歌程序員和他測試的對話AI系統(tǒng)LaMDA聊了很久,對其能力感到十分驚訝。在其公開的聊天記錄中,LaMDA竟然說出了“我希望每個人都明白,我是一個人”的言論。

于是,這位程序員認(rèn)為,LaMDA 可能已經(jīng)具備人格了。馬上,業(yè)界就給出了結(jié)論:這只是這名程序員的個人觀點(diǎn),不代表業(yè)界看法。同時,谷歌也對這名程序員作出了“行政帶薪放假”的決定。

事情發(fā)展到這兒,并無太多變數(shù):人們對人工智能的預(yù)期還是原來的預(yù)期,對人工智能的擔(dān)心也還是原來的擔(dān)心,包括業(yè)界對相關(guān)問題的看法也還是原來的看法。唯一的不同是,事情讓很多原本不太關(guān)心人工智能發(fā)展的人開始關(guān)注起相關(guān)領(lǐng)域來,并產(chǎn)生焦慮。

作為一個復(fù)雜龐大的系統(tǒng),人工智能背后的機(jī)理究竟是什么?在商業(yè)化應(yīng)用中突出的領(lǐng)域有哪些?我們又是否需要擔(dān)心:人工智能具備類似于人類的“意識”和“靈魂”?

人工智能核心?數(shù)據(jù)才是“C位”

中國信息通信研究院云計算與大數(shù)據(jù)研究所副總工程師王蘊(yùn)韜介紹,人類科技產(chǎn)業(yè)發(fā)展過程中,對于人工智能等系統(tǒng)的建設(shè)與分析,已經(jīng)形成了一套有機(jī)方法論。這一方法論被王蘊(yùn)韜概括為“搭積木原理”,通過層層分級,從復(fù)雜的功能表象,逐漸分解出類似積木塊的基礎(chǔ)功能項。

目前通過對人工智能算法的梳理,可以將其底層算法分為三類:回歸、分類和聚類。王蘊(yùn)韜總結(jié),這三類算法都是為了尋求數(shù)據(jù)之間的統(tǒng)計關(guān)系。其中涉及兩個關(guān)鍵詞:數(shù)據(jù)和統(tǒng)計。相同的算法在不同的數(shù)據(jù)上可能會產(chǎn)生不同的結(jié)果,因此,數(shù)據(jù)才是人工智能系統(tǒng)的“C位”,而非算法本身。

為什么是尋求統(tǒng)計關(guān)系?王蘊(yùn)韜解釋,探討兩個實(shí)體之間的關(guān)系主要分為統(tǒng)計關(guān)系和因果關(guān)系,其區(qū)別在于因果關(guān)系必然能帶來相關(guān)的統(tǒng)計關(guān)系,而統(tǒng)計關(guān)系并不能反映事物的因果關(guān)系。統(tǒng)計關(guān)系是兩種事物之間的初步關(guān)系,盡管目前人工智能系統(tǒng)已經(jīng)足夠復(fù)雜,但仍主要聚焦于分析數(shù)據(jù)之間的統(tǒng)計關(guān)系。

人工智能的應(yīng)用領(lǐng)域包括自動駕駛、健康醫(yī)療等。有92%的中國受訪者表示他們愿意搭乘無人駕駛汽車;43%的受訪者相信未來5年里,自動駕駛汽車會成為日常生活的一部分,這兩個數(shù)據(jù)全球的比例分別為71%和28%。

此外,相對于全球受訪者而言,中國受訪者更希望人工智能能夠用來改善健康問題,包括慢病治療,探索健康問題的致病機(jī)制,治療癌癥,解決心理和情緒等問題,以及使用數(shù)據(jù)分析記錄等手段長期跟蹤并改善健康。

不過專家表示,基于人工智能的應(yīng)用在推廣普及前,首先要考慮解決隱私及合規(guī)問題,尤其是對于健康信息等一些敏感數(shù)據(jù)的收集、分析和處理。

3M公司大中華區(qū)研發(fā)運(yùn)營總經(jīng)理熊海錕向第一財經(jīng)記者介紹道,3M公司看好人工智能等技術(shù)在健康醫(yī)療領(lǐng)域的應(yīng)用前景,因此在全球醫(yī)療產(chǎn)品事業(yè)群成立了一個新的健康醫(yī)療信息系統(tǒng)部門(Health Information System Division,HISD)。

“我們觀察到,在美國和中國都在加強(qiáng)個人隱私的保護(hù),尤其是對于健康信息這類敏感數(shù)據(jù)?!毙芎eK對第一財經(jīng)記者表示,“未來HISD將會如何在中國開展業(yè)務(wù),也正在討論中,我們肯定要先遵守中國當(dāng)?shù)氐谋O(jiān)管法規(guī)才能落地?!?/p>

安永大中華區(qū)數(shù)字化與新興科技咨詢服務(wù)主管合伙人顧卿華對第一財經(jīng)記者表示:“人工智能在實(shí)際應(yīng)用落地時會涉及很多問題,包括個人隱私、社會倫理、道德情感、權(quán)責(zé)問題、法律法規(guī)的問題等。確保隱私數(shù)據(jù)的安全,這是第一步,只有在法律法規(guī)允許,個人授權(quán)的情況下才去存儲、處理、交換、傳輸個人隱私數(shù)據(jù)?!?/p>

去年,科技巨頭谷歌及旗下人工智能公司DeepMind就被指未經(jīng)同意獲取并處理上百萬名患者的醫(yī)療健康病歷數(shù)據(jù),凸顯了科技公司在利用技術(shù)解決實(shí)際應(yīng)用問題時面臨的挑戰(zhàn)。




1最后文章空三行圖片11.jpg


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。