斯坦福團(tuán)隊(duì)發(fā)布《2024年人工智能指數(shù)報(bào)告》
2024-04-16
來(lái)源:學(xué)術(shù)頭條
剛剛,由李飛飛聯(lián)合領(lǐng)導(dǎo)的斯坦福大學(xué)以人為本人工智能研究所(Stanford HAI)發(fā)布了《2024 年人工智能指數(shù)報(bào)告》(Artificial Intelligence Index Report 2024)。
這份長(zhǎng)達(dá) 300 多頁(yè)的報(bào)告是 Stanford HAI 發(fā)布的第 7 份 AI Index 研究,追蹤了 2023 年全球人工智能的發(fā)展趨勢(shì)。
Stanford HAI 官方介紹道,“這是我們迄今為止最全面的報(bào)告,而且是在人工智能對(duì)社會(huì)的影響從未如此明顯的重要時(shí)刻發(fā)布的?!?/p>
Stanford HAI 研究項(xiàng)目主任 Vanessa Parli 表示,“我認(rèn)為最令人興奮的人工智能研究?jī)?yōu)勢(shì)是將這些大型語(yǔ)言模型與機(jī)器人或智能體(agent)相結(jié)合,這標(biāo)志著機(jī)器人在現(xiàn)實(shí)世界中更有效地工作邁出了重要一步?!?/p>
與往年不同,Stanford HAI 今年擴(kuò)大了研究范圍,更廣泛地涵蓋了人工智能的技術(shù)進(jìn)步、公眾對(duì)該技術(shù)的看法等基本趨勢(shì)。新報(bào)告揭示了 2023 年人工智能行業(yè)的 10 大主要趨勢(shì):
1.人工智能在某些任務(wù)上勝過(guò)人類,但并非在所有任務(wù)上。
人工智能已在多項(xiàng)基準(zhǔn)測(cè)試中超越人類,包括在圖像分類、視覺(jué)推理和英語(yǔ)理解方面。然而,它在競(jìng)賽級(jí)數(shù)學(xué)、視覺(jué)常識(shí)推理和規(guī)劃等更復(fù)雜的任務(wù)上依然落后于人類。
2.產(chǎn)業(yè)界繼續(xù)主導(dǎo)人工智能前沿研究。
2023 年,產(chǎn)業(yè)界產(chǎn)生了 51 個(gè)著名的機(jī)器學(xué)習(xí)模型,而學(xué)術(shù)界只貢獻(xiàn)了 15 個(gè)。2023 年,產(chǎn)學(xué)合作還產(chǎn)生了 21 個(gè)著名模型,創(chuàng)下新高。此外,108 個(gè)新發(fā)布的基礎(chǔ)模型來(lái)自工業(yè)界,28 個(gè)來(lái)自學(xué)術(shù)界。
3.前沿模型變得更加昂貴。
根據(jù) AI Index 的估算,最先進(jìn)的人工智能模型的訓(xùn)練成本已經(jīng)達(dá)到了前所未有的水平。例如,OpenAI 的 GPT-4 估計(jì)使用了價(jià)值 7800 萬(wàn)美元的計(jì)算資源進(jìn)行訓(xùn)練,而谷歌的 Gemini Ultra 的計(jì)算成本則高達(dá) 1.91 億美元。
相比之下,幾年前發(fā)布的一些最先進(jìn)的模型,即原始 transformer 模型(2017 年)和 RoBERTa Large(2019 年),訓(xùn)練成本分別約為 900 美元和 16 萬(wàn)美元。
4.美國(guó)成為頂級(jí)人工智能模型的主要來(lái)源國(guó)。
2023 年,61 個(gè)著名的人工智能模型源自美國(guó)的機(jī)構(gòu),超過(guò)歐盟的 21 個(gè)和中國(guó)的 15 個(gè)。
美國(guó)也仍然是人工智能投資的首選之地。2023 年,美國(guó)在人工智能領(lǐng)域的私人投資總額為 672 億美元,是中國(guó)的近 9 倍。
然而,中國(guó)依然是美國(guó)最大的競(jìng)爭(zhēng)對(duì)手,中國(guó)的機(jī)器人安裝量居世界首位;同樣,世界上大多數(shù)人工智能專利(61%)都來(lái)自中國(guó)。
6.生成式人工智能投資激增。
盡管去年人工智能私人投資整體下降,但對(duì)生成式人工智能的投資激增,比 2022 年(約 30 億美元)增長(zhǎng)了近八倍,達(dá)到 252 億美元。生成式人工智能領(lǐng)域的主要參與者,包括 OpenAI、Anthropic、Hugging Face 和 Inflection,都獲得了一輪可觀的融資。
7.數(shù)據(jù)顯示,人工智能讓打工人更有生產(chǎn)力,工作質(zhì)量更高。
2023 年,多項(xiàng)研究評(píng)估了人工智能對(duì)勞動(dòng)力的影響,表明人工智能可以讓打工人更快地完成任務(wù),并提高他們的產(chǎn)出質(zhì)量。這些研究還表明,人工智能有可能縮小低技能和高技能工人之間的技能差距。還有一些研究警告說(shuō),在沒(méi)有適當(dāng)監(jiān)督的情況下使用人工智能可能會(huì)起到負(fù)面作用。
8.得益于人工智能,科學(xué)進(jìn)步進(jìn)一步加速。
2022 年,人工智能開(kāi)始推動(dòng)科學(xué)發(fā)現(xiàn)。然而,2023 年,與科學(xué)相關(guān)的更重要的人工智能應(yīng)用啟動(dòng)——使算法排序更高效的 AlphaDev、促進(jìn)材料發(fā)現(xiàn)過(guò)程的 GNoME、可在一分鐘內(nèi)提供極其準(zhǔn)確的 10 天天氣預(yù)報(bào)的 GraphCast、成功對(duì) 7100 萬(wàn)種可能的錯(cuò)義突變中的約 89% 進(jìn)行分類的 AlphaMissence。
如今,人工智能現(xiàn)在可以完成人類難以完成的、但對(duì)解決一些最復(fù)雜的科學(xué)問(wèn)題至關(guān)重要的粗暴計(jì)算。在醫(yī)療方面,新的研究表明,醫(yī)生可以利用人工智能更好地診斷乳腺癌、解讀X射線和檢測(cè)致命的癌癥。
9.美國(guó)的人工智能法規(guī)數(shù)量急劇增加。
2023 年,全球立法程序中有 2175 次提及人工智能,幾乎是上一年的兩倍。美國(guó)人工智能相關(guān)法規(guī)的數(shù)量在過(guò)去一年大幅增加。2023 年,與人工智能相關(guān)的法規(guī)有 25 項(xiàng),而 2016 年只有 1 項(xiàng)。僅去年一年,人工智能相關(guān)法規(guī)的總數(shù)就增長(zhǎng)了 56.3%。其中一些法規(guī)包括生成式人工智能材料的版權(quán)指南和網(wǎng)絡(luò)安全風(fēng)險(xiǎn)管理框架。
10.人們對(duì)人工智能的潛在影響有了更深刻的認(rèn)識(shí),同時(shí)也更焦慮。
來(lái)自市場(chǎng)研究公司 Ipsos 的一項(xiàng)調(diào)查顯示,在過(guò)去一年中,認(rèn)為人工智能將在未來(lái) 3-5 年內(nèi)極大地影響他們生活的人,比例從 60%上升到 66%。此外,52% 的人對(duì)人工智能產(chǎn)品和服務(wù)表示焦慮,比 2022 年上升了 13 個(gè)百分點(diǎn)。
在美國(guó),來(lái)自皮尤研究中心(Pew)的數(shù)據(jù)顯示,52% 的美國(guó)人表示對(duì)人工智能的擔(dān)憂多于興奮,這一比例比 2022 年的 38% 有所上升。
附:來(lái)自AI Index 聯(lián)合主任 Ray Perrault 的一封信
十年前,世界上最好的人工智能系統(tǒng)也無(wú)法以人類的水平對(duì)圖像中的物體進(jìn)行分類。人工智能在語(yǔ)言理解方面舉步維艱,也無(wú)法解決數(shù)學(xué)問(wèn)題。如今,人工智能系統(tǒng)在標(biāo)準(zhǔn)基準(zhǔn)上的表現(xiàn)經(jīng)常超過(guò)人類。
2023 年,人工智能進(jìn)步加速。GPT-4、Gemini 和 Claude 3 等先進(jìn)模型展示出了令人印象深刻的多模態(tài)能力:它們可以生成數(shù)十種語(yǔ)言的流暢文本,處理音頻,甚至可以解釋備忘錄。隨著人工智能的進(jìn)步,它也越來(lái)越多地進(jìn)入我們的生活。公司競(jìng)相打造基于人工智能的產(chǎn)品,普通大眾也越來(lái)越多地使用人工智能。但是,當(dāng)前的人工智能技術(shù)仍然存在重大問(wèn)題。它無(wú)法可靠地處理事實(shí)、進(jìn)行復(fù)雜的推理或解釋其結(jié)論。
人工智能面臨兩個(gè)相互關(guān)聯(lián)的未來(lái)。第一個(gè),技術(shù)不斷改進(jìn),應(yīng)用日益廣泛,對(duì)生產(chǎn)力和就業(yè)產(chǎn)生重大影響。人工智能的用途有好有壞。第二個(gè),人工智能的應(yīng)用受到技術(shù)局限的制約。無(wú)論是哪一種,政府都越來(lái)越關(guān)注。政府正在積極參與,鼓勵(lì)人工智能的發(fā)展,比如資助大學(xué)研發(fā)和激勵(lì)私人投資。政府還致力于管理潛在的不利因素,如對(duì)就業(yè)的影響、隱私問(wèn)題、錯(cuò)誤信息和知識(shí)產(chǎn)權(quán)。
在技術(shù)方面,今年的 AI Index 報(bào)告稱,2023 年全球發(fā)布的新大型語(yǔ)言模型數(shù)量比上一年翻了一番。三分之二的模型是開(kāi)源的,但性能最高的模型來(lái)自擁有封閉系統(tǒng)的行業(yè)參與者。
Gemini Ultra 成為首個(gè)在大規(guī)模多任務(wù)語(yǔ)言理解(MMLU)基準(zhǔn)上達(dá)到人類水平的 LLM;自去年以來(lái),模型在該基準(zhǔn)上的性能表現(xiàn)提高了 15 個(gè)百分點(diǎn)。此外,GPT-4 在綜合語(yǔ)言模型整體評(píng)估(HELM)基準(zhǔn)上取得了令人印象深刻的 0.97 平均勝率分?jǐn)?shù)。
雖然全球?qū)θ斯ぶ悄艿乃饺送顿Y連續(xù)第二年減少,但對(duì)生成式人工智能的投資卻急劇上升。財(cái)富 500 強(qiáng)企業(yè)財(cái)報(bào)電話會(huì)議中提及人工智能的次數(shù)比以往任何時(shí)候都多,而且新的研究表明,人工智能明顯提高了打工人的生產(chǎn)率。在政策制定方面,全球在立法程序中提及人工智能的次數(shù)前所未有。美國(guó)監(jiān)管機(jī)構(gòu)在 2023 年通過(guò)的人工智能相關(guān)法規(guī)比以往任何時(shí)候都多。盡管如此,許多人仍對(duì)人工智能生成深度偽造等能力表示擔(dān)憂。公眾對(duì)人工智能有了更多的認(rèn)識(shí),研究表明,他們的反應(yīng)也是焦慮的。
Ray Perrault
AI Index 聯(lián)合主任