“未來(lái)十年,AIGC(人工智能自主生產(chǎn)內(nèi)容)將顛覆現(xiàn)有內(nèi)容生產(chǎn)模式。可以實(shí)現(xiàn)以十分之一的成本,以百倍千倍的生產(chǎn)速度,去生成AI原創(chuàng)內(nèi)容。”
不得不說(shuō)李彥宏對(duì)技術(shù)趨勢(shì)的判斷還是非常準(zhǔn)的,去年7月在百度世界大會(huì)上的發(fā)言一語(yǔ)成讖。
李彥宏為AIGC背書(shū)不到一個(gè)月,AI繪畫(huà)作品《太空歌劇院》戰(zhàn)勝諸多人類畫(huà)師,拿下美國(guó)科羅拉多州博覽會(huì)美術(shù)競(jìng)賽一等獎(jiǎng),此后很長(zhǎng)一段時(shí)間內(nèi),無(wú)論是嚴(yán)肅的學(xué)術(shù)會(huì)議,還是互聯(lián)網(wǎng)的角角落落,AI繪畫(huà)都是熱度極高的話題。
今年開(kāi)年,ChatGPT一夜爆紅,科技巨頭爭(zhēng)先入局。
百度類ChatGPT產(chǎn)品“文心一言”將在3月上線,消息發(fā)布當(dāng)日,百度股價(jià)盤(pán)中一度漲超15%;谷歌版ChatGPT—Bard 8日首秀翻車,谷歌股價(jià)重挫8.28美元,市值縮水超千億美元(合人民幣7202億元)。
ChatGPT帶動(dòng)的不光是AI技術(shù)的一大跨步,更是一眾科技巨頭們對(duì)未來(lái)產(chǎn)業(yè)的爭(zhēng)奪。
01
一年一個(gè)熱點(diǎn),今年輪到ChatGPT
都說(shuō)互聯(lián)網(wǎng)有記憶。
從2021年的Clubhouse,到2022年的AI繪畫(huà),再到當(dāng)前的ChatGPT,一年一個(gè)熱點(diǎn),大有“皇帝輪流坐,今年到我家”的勢(shì)頭。
2021年即時(shí)音頻社交軟件Clubhouse大熱時(shí),帶動(dòng)了“聲音概念股”大漲,這股熱潮由國(guó)外沖擊到國(guó)內(nèi),荔枝、映客等玩家狠狠的收獲了一輪紅利,當(dāng)時(shí)有關(guān)Clubhouse的創(chuàng)業(yè)風(fēng)口也甚囂塵上。
可是Clubhouse的熱度并未持續(xù)很長(zhǎng)時(shí)間,幾個(gè)月后就偃旗息鼓,逐漸淡出主流視野直至成為記憶塵埃。
根據(jù)Sensor Tower的數(shù)據(jù)顯示,Clubhouse在2021年2月爆紅當(dāng)月下載量為960萬(wàn)次。3月的下載量掉落到270萬(wàn),四月的下載量?jī)H有92萬(wàn),大約是2月的1/10,暴跌90%。
AI繪畫(huà)的熱度由《太空歌劇院》拿下美國(guó)科羅拉多州博覽會(huì)美術(shù)競(jìng)賽一等獎(jiǎng)的事件引爆,之后推特、Facebook等社交媒體又接力了一輪助推,引發(fā)了大量用戶圍觀。
在B站,《七里香》《孤勇者》《加州旅館》《波西米亞狂想曲》等熱門(mén)歌曲的MV都被UP主們用AI繪畫(huà)的作品作為素材重新創(chuàng)作了一次,天馬行空的想象與賽博朋克的迷幻相結(jié)合,制造了無(wú)數(shù)話題。
然而AI繪畫(huà)的熱度維持的時(shí)間也不長(zhǎng),當(dāng)用戶們的新鮮感過(guò)去之后,整個(gè)行業(yè)似乎又陷入了平靜。
如今,公眾關(guān)注的熱點(diǎn)來(lái)到了ChatGPT。
其實(shí),無(wú)論是Clubhouse還是AI繪畫(huà),或是ChatGPT,追溯它們成為熱點(diǎn)的過(guò)程可以發(fā)現(xiàn),最開(kāi)始都是在C端引爆,經(jīng)C端流量的引導(dǎo)持續(xù)發(fā)酵,然后發(fā)現(xiàn)技術(shù)/產(chǎn)品在某些行業(yè)或特定場(chǎng)景落地蘊(yùn)含巨大價(jià)值,接著就是巨頭們?nèi)雸?chǎng)競(jìng)逐。
像Clubhouse的第一批用戶包括美國(guó)影星艾希頓古查(Ashton Kutcher),加拿大饒舌天王德雷克、影星凱文·哈特(Kevin Hart)和脫口秀女王奧普拉等,吳彥祖、蘇打綠、林俊杰等港臺(tái)明星、羅永浩等科技圈名人也在Clubhouse開(kāi)有帳號(hào)。
馬斯克的入場(chǎng)更是給Clubhouse打了一針強(qiáng)心劑,名人效應(yīng)下,引發(fā)了大量用戶跟隨加入,帶來(lái)了用戶數(shù)火箭般的躥升。
AI繪畫(huà)則是由社交媒體完成擴(kuò)散,ChatGPT同樣是被大量C端用戶的口口相傳而推向頂峰的。
京東集團(tuán)副總裁何曉冬對(duì)ChatGPT的評(píng)價(jià)非常高,認(rèn)為ChatGPT是第一款真正意義上的人工智能原生產(chǎn)品,“就像第一款iPhone(蘋(píng)果公司手機(jī)產(chǎn)品),一出來(lái)就展現(xiàn)出高完整度,高體驗(yàn)性,高平臺(tái)性”。
與傳統(tǒng)的人機(jī)交互不同,ChatGPT最大的創(chuàng)新在于文本內(nèi)容的生成,通過(guò)交互式對(duì)話來(lái)逐步理清用戶的意圖,尤其是一些比較復(fù)雜的意圖,ChatGPT連續(xù)多輪人機(jī)交互,直至完全理解用戶意圖并給出相應(yīng)的回答。
也正是因?yàn)槿绱耍珻hatGPT推出僅兩個(gè)月,在2023年1月末的月活用戶就已突破了1億,成為史上用戶增長(zhǎng)速度最快的消費(fèi)級(jí)應(yīng)用程序。
之前最快破億的TikTok,達(dá)到這一成績(jī)時(shí)花了9個(gè)月。
風(fēng)口之下,巨頭們都坐不住了,Google、Meta分別推出各自的聊天機(jī)器人Bard和BlenderBot,中國(guó)企業(yè)百度、阿里、京東、科大訊飛等企業(yè)也紛紛發(fā)布了各自的ChatGPT產(chǎn)品計(jì)劃。
圍繞ChatGPT的大戰(zhàn)一觸即發(fā)。
02
對(duì)ChatGPT保持樂(lè)觀,但也不要太樂(lè)觀
比爾蓋茨曾經(jīng)說(shuō)過(guò):人們總是高估新技術(shù)出現(xiàn)的第一個(gè)五年,低估第二個(gè)五年。
像AI、自動(dòng)駕駛等新技術(shù)都經(jīng)歷過(guò)先被追捧,后被看低的過(guò)程,然而ChatGPT似乎正在打破比爾蓋茨的這個(gè)判斷。
從技術(shù)的進(jìn)化趨勢(shì),以及更長(zhǎng)的時(shí)間維度來(lái)看,ChatGPT的價(jià)值不應(yīng)被低估,主要因?yàn)橄啾冗^(guò)去的AI技術(shù),ChatGPT具有更強(qiáng)的自學(xué)習(xí)能力,可以基于大數(shù)據(jù)集自己生成內(nèi)容,這是一個(gè)非常巨大的跨越,只是從ChatGPT目前所暴露出的問(wèn)題來(lái)看,我們需要對(duì)當(dāng)前的狂熱保持謹(jǐn)慎樂(lè)觀。
大量的測(cè)試中,很多用戶已經(jīng)發(fā)現(xiàn)ChatGPT存在結(jié)果不穩(wěn)定、推理能力有限的缺點(diǎn),例如詢問(wèn)現(xiàn)在的美國(guó)總統(tǒng)是誰(shuí),會(huì)回答奧巴馬或特朗普,但又能回答出拜登是第46屆總統(tǒng),模型中有事實(shí)存在,但ChatGPT卻無(wú)法推理出正確答案。
致命一擊的是,Google 聊天機(jī)器人Bard 2月8日首秀時(shí)犯下事實(shí)性錯(cuò)誤,這種公開(kāi)場(chǎng)合的翻車,更加加深了公眾對(duì)ChatGPT技術(shù)的不信任感。
結(jié)果不穩(wěn)定,頻繁犯錯(cuò)直接導(dǎo)致ChatGPT無(wú)法落地對(duì)結(jié)果準(zhǔn)確性要求高的業(yè)務(wù),最終會(huì)逐漸邊緣化,成為輔助應(yīng)用協(xié)助人工審核,或者干脆作為一個(gè)娛樂(lè)性工具而存在。
以對(duì)人力需求很大的保險(xiǎn)業(yè)為例,截至2022年6月30日,全國(guó)保險(xiǎn)公司在保險(xiǎn)中介監(jiān)管信息系統(tǒng)執(zhí)業(yè)登記的銷售人員高達(dá)570.7萬(wàn)人。
專業(yè)的保險(xiǎn)配置需要結(jié)合客戶家庭收支、預(yù)算情況、保障需求、產(chǎn)品優(yōu)勢(shì)等層面來(lái)綜合考慮,這是目前AI技術(shù)無(wú)法達(dá)到的,也是保險(xiǎn)經(jīng)紀(jì)人/代理人的核心價(jià)值。
雖然ChatGPT目前在自然語(yǔ)言處理和學(xué)習(xí)效果上比其他框架有所提升,但其對(duì)專業(yè)問(wèn)題的理解和回答上與人類專家有較大差距,中國(guó)保險(xiǎn)學(xué)會(huì)特聘保險(xiǎn)科技專家彭勇就認(rèn)為,“ChatGPT短期內(nèi)還只能替代一些較簡(jiǎn)單的工作,隨著技術(shù)進(jìn)步,后期替代比例才會(huì)逐漸提高”。
除此之外,由于模型的二次訓(xùn)練成本過(guò)高,ChatGPT知識(shí)更新頻率無(wú)法與現(xiàn)實(shí)發(fā)展同步,目前ChatGPT訓(xùn)練的知識(shí)庫(kù)還只停留在2021年。
為了達(dá)到當(dāng)前的效果,OpenAI用了45TB的數(shù)據(jù)量、近萬(wàn)億個(gè)單詞(相當(dāng)于1351萬(wàn)本牛津詞典)來(lái)訓(xùn)練模型,而訓(xùn)練這樣一個(gè)包含1750億參數(shù)的語(yǔ)言大模型,至少需要上萬(wàn)個(gè) CPU/GPU 24小時(shí)不間斷輸入數(shù)據(jù),部分高質(zhì)量標(biāo)注數(shù)據(jù),還得依靠博士級(jí)別的專業(yè)人士來(lái)完成。
小冰CEO李笛曾用人工智能小冰舉例,如果小冰用ChatGPT這類方式運(yùn)行系統(tǒng),小冰每天承載的交互量就需要花近3億人民幣的對(duì)話成本。折合成一年,就是千億元的成本。
因而除了巨頭之外,對(duì)于創(chuàng)業(yè)公司尤其需要關(guān)注的一點(diǎn)是,在還沒(méi)有確定商業(yè)模式之前,企業(yè)前期不計(jì)成本進(jìn)行ChatGPT研發(fā),后期能否帶來(lái)希望中的回報(bào),是需要慎重考慮的問(wèn)題。
更具挑戰(zhàn)的是,有一篇來(lái)自12個(gè)國(guó)內(nèi)外研究機(jī)構(gòu)共同發(fā)表的關(guān)于智能計(jì)算的論文中指出,AI模型所需算力每100天就要翻一倍,這個(gè)速度遠(yuǎn)超摩爾定律(集成電路上可容納的晶體管數(shù)目,約每隔兩年便會(huì)增加一倍)。
如果對(duì)未來(lái)進(jìn)行估算,即AI模型所需算力五年內(nèi)將增加超過(guò)100萬(wàn)倍,如今摩爾定律都正在走向失效,如何滿足高速增長(zhǎng)算力的需求,沒(méi)人能夠回答這個(gè)問(wèn)題。
03
關(guān)乎未來(lái)的技術(shù)爭(zhēng)奪戰(zhàn)
回到ChatGPT的競(jìng)爭(zhēng),就其技術(shù)內(nèi)核而言,并沒(méi)有太多“秘密”。
Meta公司首席AI科學(xué)家Yann Lecun公開(kāi)表示,ChatGPT沒(méi)有令人印象深刻的技術(shù)創(chuàng)新,其最大的“創(chuàng)新”其實(shí)是將現(xiàn)有的技術(shù)與體驗(yàn)進(jìn)行了更好整合,帶給用戶以及開(kāi)發(fā)者非常棒的體驗(yàn)。
事實(shí)也是如此,ChatGPT的底層技術(shù)來(lái)自于Google提出的Transformer架構(gòu),同時(shí)還使用了大量在谷歌內(nèi)部使用(由 DeepMind 發(fā)明)的強(qiáng)化學(xué)習(xí)技術(shù),大量開(kāi)源的架構(gòu)、模型以及數(shù)十年來(lái)公開(kāi)的論文等,為ChatGPT的出現(xiàn)創(chuàng)造了良好的基礎(chǔ),“它不是真空出現(xiàn)的”。
這也是ChatGPT發(fā)布后,包括百度、阿里、華為、騰訊、網(wǎng)易、字節(jié)、科大訊飛等內(nèi)在的中國(guó)公司能夠幾乎前后腳發(fā)布自己的ChatGPT產(chǎn)品的原因所在,在一定程度上來(lái)說(shuō),這些中國(guó)公司因?yàn)槠錁I(yè)務(wù)生態(tài)和技術(shù)專長(zhǎng)的不同,在ChatGPT方面反而有自己的差異化優(yōu)勢(shì)。
比如百度,一直做著與GPT類似的事情,只是未將技術(shù)進(jìn)行包裝,做出像ChatGPT這樣的產(chǎn)品來(lái)“炫耀”。
早在2019年,百度就做出了產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)文心大模型ERNIE 1.0,這一技術(shù)創(chuàng)新與“同類”GPT-1、BERT的差距都只有幾個(gè)月。
在文心的發(fā)展過(guò)程中,2021年迭代的ERNIE 3.0大模型即擁有千億參數(shù);與超強(qiáng)算力方聯(lián)合的鵬城-百度·文心作為一款融合了自然語(yǔ)言理解和自然語(yǔ)言生成的大模型,其參數(shù)量達(dá)到了2600億,相對(duì)GPT-3和ChatGPT提升了50%。
百度發(fā)布“文心一言”時(shí),就公開(kāi)表示,百度在人工智能四層架構(gòu)中,有全棧布局。包括底層的芯片、深度學(xué)習(xí)框架、大模型以及最上層的搜索等應(yīng)用。文心一言,位于模型層。
同時(shí),在與ChatGPT深度關(guān)聯(lián)的NLP領(lǐng)域,百度也是行業(yè)內(nèi)公認(rèn)的第一。
阿里巴巴達(dá)摩院2020年初啟動(dòng)中文多模態(tài)預(yù)訓(xùn)練模型M6項(xiàng)目,其發(fā)展速度相當(dāng)驚人,同年6月推出3億參數(shù)的基礎(chǔ)模型,到了2021年1月時(shí),模型參數(shù)規(guī)模達(dá)到百億級(jí)別,成為世界上最大的中文多模態(tài)模型;2021年5月,具有萬(wàn)億參數(shù)規(guī)模的模型正式投入使用。
去年,阿里AliceMind模型更是在CLUE榜單的AI中文語(yǔ)言理解任務(wù)上得分首超人類,獲得了86.685高分。
IDC近期發(fā)布的《2022 H1中國(guó)AI云服務(wù)市場(chǎng)研究報(bào)告》顯示,阿里AI在ChatGPT相關(guān)的語(yǔ)音語(yǔ)義領(lǐng)域市場(chǎng)份額達(dá)到31.98%,其中阿里對(duì)話式AI、語(yǔ)言AI、語(yǔ)音AI市占均為第一。
至于華為,則有業(yè)界首個(gè)千億級(jí)生成和理解中文NLP大模型——鵬城盤(pán)古大模型。
針對(duì)大模型的產(chǎn)業(yè)化,華為發(fā)起了智能遙感開(kāi)源生態(tài)聯(lián)合體、多模態(tài)人工智能產(chǎn)業(yè)聯(lián)合體,智能流體力學(xué)產(chǎn)業(yè)聯(lián)合體等,以聯(lián)合體的模式把科研院所、產(chǎn)業(yè)廠商等結(jié)合起來(lái),更好地讓大模型產(chǎn)業(yè)形成正向的閉環(huán)回路。
ChatGPT的熱潮雖然是由美國(guó)公司帶頭掀起的,占主導(dǎo)地位的也是微軟、谷歌和Meta這幾個(gè)巨頭,但中國(guó)企業(yè)的跟進(jìn)速度并不慢,就目前所演化成的態(tài)勢(shì),ChatGPT并不是一項(xiàng)簡(jiǎn)單的由技術(shù)革新而帶來(lái)的商業(yè)機(jī)會(huì),而是關(guān)乎到自主掌控AI關(guān)鍵技術(shù)的中外競(jìng)爭(zhēng),更加直白一些,中國(guó)必須要有自己的ChatGPT。
百度官宣3月上線“文心一言”后,李彥宏就說(shuō)過(guò),無(wú)論是AIGC還是ChatGPT,都是AI發(fā)展到一定階段后新的機(jī)會(huì)?!?strong>怎么把這么酷的技術(shù),變成人人都需要的好產(chǎn)品,這一步其實(shí)才是最難的,最偉大的,也是最能產(chǎn)生影響力的?!?/strong>