近期,360創(chuàng)始人周鴻祎對(duì)互聯(lián)網(wǎng)圈進(jìn)行了評(píng)論:在ChatGPT領(lǐng)域,美國超過了我們,中國公司和科研人員需要加速追趕。
ChatGPT的興起引起了國內(nèi)外互聯(lián)網(wǎng)公司的關(guān)注。為了應(yīng)對(duì)ChatGPT的挑戰(zhàn),谷歌在2月8日緊急推出了人工智能聊天機(jī)器人Bard。國內(nèi)的百度宣布將于3月初推出“文心一言”,其他互聯(lián)網(wǎng)公司也紛紛效仿。
截至2月10日,已經(jīng)宣布擁有類似ChatGPT技術(shù)儲(chǔ)備、準(zhǔn)備發(fā)布和已經(jīng)發(fā)布類ChatGPT產(chǎn)品服務(wù)的國內(nèi)大廠包括:阿里巴巴、騰訊、華為、字節(jié)跳動(dòng)、京東、360、科大訊飛、快手、網(wǎng)易有道等,超過10家互聯(lián)網(wǎng)巨頭紛紛進(jìn)入了熱門的ChatGPT領(lǐng)域。
小型科技公司正在跟風(fēng)熱度,大型公司也并非輕松控制ChatGPT。比如谷歌Bard發(fā)布時(shí),演示視頻中犯了一個(gè)事實(shí)錯(cuò)誤,導(dǎo)致谷歌股價(jià)大跌,目前市值已經(jīng)下降了1700億美元。
1.扎堆入局ChatGPT競賽
在搜索和AI領(lǐng)域積累最深的百度,自然被市場寄予厚望。
百度,作為在搜索和AI領(lǐng)域積累最深的公司,在市場上擁有很高的期望。計(jì)劃在今年三月推出一款類似于ChatGPT的人工智能聊天機(jī)器人服務(wù),名為“文心一言”,英文名為ERNIE Bot。在內(nèi)測(cè)完成后,將向公眾開放。不同的是,該工具將初始版本內(nèi)嵌入搜索服務(wù)中,允許用戶通過對(duì)話式方式獲得搜索結(jié)果。
百度的CEO李彥宏在去年9月判斷人工智能的發(fā)展將有“技術(shù)層面和商業(yè)應(yīng)用層面的方向性改變”。盡管沒有首先推出ChatGPT,但百度具備了人工智能所需的算力、算法和數(shù)據(jù),在芯片、框架、模型和應(yīng)用四個(gè)技術(shù)方面都有布局,是國內(nèi)少數(shù)擁有全棧AI能力的公司。
相比百度的技術(shù)研發(fā)儲(chǔ)備,阿里和字節(jié)跳動(dòng)可能是另外兩個(gè)較早布局的玩家。
2月9日,阿里的達(dá)摩院版ChatGPT在內(nèi)測(cè)中預(yù)先曝光。該新產(chǎn)品具備多種功能,包括知識(shí)問答、人工智能繪畫、代碼生成、小說續(xù)寫、文案撰寫和寫詩作詞等。在人工問答的水平方面,達(dá)摩院版ChatGPT已經(jīng)實(shí)現(xiàn)了相對(duì)真實(shí)的回答,同時(shí)也能實(shí)現(xiàn)多輪問答。
實(shí)際上,在2022年5月,阿里公布了相應(yīng)的能力,在AIGC方面,隨著超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型M6的發(fā)布,生成的實(shí)景圖片已經(jīng)非常逼真。
阿里現(xiàn)已推出了M6芯片,支持十萬億的模型參數(shù)規(guī)模,平均單卡可承載200億參數(shù),同等參數(shù)規(guī)模能耗僅為前業(yè)界標(biāo)桿的1%,大大降低了大模型訓(xùn)練的門檻。
字節(jié)動(dòng)態(tài)正在研發(fā)ChatGPT,雖然全棧技術(shù)不是非常出色,但在商業(yè)應(yīng)用方面有很大的前瞻性。字節(jié)動(dòng)態(tài)從去年開始研發(fā)類ChatGPT項(xiàng)目,現(xiàn)在已經(jīng)在內(nèi)部上線了測(cè)試插件,由AI實(shí)驗(yàn)室主導(dǎo),還在探索當(dāng)中。此外,字節(jié)動(dòng)態(tài)的AML團(tuán)隊(duì)也開發(fā)了veGiantModel模型,類似于為ChatGPT提供支持的GPT-3.5系列模型。
字節(jié)動(dòng)態(tài)早就著手研究基于GPT2和GPT3的訓(xùn)練模型和產(chǎn)品,在NLP領(lǐng)域也有許多研究積累。目前,字節(jié)動(dòng)態(tài)在對(duì)話機(jī)器人、機(jī)器翻譯、機(jī)器寫作方面有多項(xiàng)研究,特別是內(nèi)容創(chuàng)作方面。在ChatGPT用于寫文章之前,字節(jié)動(dòng)態(tài)就研發(fā)了Xiaomingbot自動(dòng)寫稿平臺(tái),從2016年上線以來,已經(jīng)寫了60萬篇文章,覆蓋了17場體育賽事,支持6種語言。
近日,快手也宣布正在大力研究大型語言模型(LLM),并已經(jīng)啟動(dòng)了相關(guān)項(xiàng)目,涵蓋了LLM模型的訓(xùn)練、文字自動(dòng)創(chuàng)作和生成、對(duì)話系統(tǒng)的開發(fā)等領(lǐng)域。
另外,京東云的言犀也宣布將推出工業(yè)版的ChatGPT:ChatJD,其參數(shù)量預(yù)計(jì)為千億級(jí)別,主要應(yīng)用于零售和金融兩個(gè)領(lǐng)域。
2.國內(nèi)大廠為何沒能搶得先機(jī)?
近幾年,大量的大公司和研究機(jī)構(gòu)加入了人工智能領(lǐng)域,但真正有實(shí)力的玩家并不多。估測(cè)訓(xùn)練1750億參數(shù)的GPT-3語言模型需要上萬個(gè)CPU/GPU,持續(xù)輸入數(shù)據(jù)24小時(shí),而且一次運(yùn)算就需要450萬美元,能耗相當(dāng)于開車往返地球和月球。因此,主流的大型語言模型只能被大型科技公司和少數(shù)研究機(jī)構(gòu)掌握。
從參數(shù)數(shù)量上看,國內(nèi)百度的文心模型有2600億參數(shù),高于GPT-3的1700億參數(shù),但參數(shù)數(shù)量不能代表模型的效果。國內(nèi)公司如百度和字節(jié)跳動(dòng)擁有大量數(shù)據(jù)積累,但數(shù)據(jù)清洗、標(biāo)注、模型設(shè)計(jì)、訓(xùn)練和推理等需要時(shí)間積累,這可能是國內(nèi)模型效果不如國外的重要原因。
關(guān)鍵時(shí)間點(diǎn)是2020年年中,GPT3.0剛剛推出。據(jù)流傳的專家紀(jì)要,很多人認(rèn)為GPT3.0不僅代表了技術(shù),也是人工智能模型發(fā)展的新理念,因?yàn)殚_發(fā)商OpenAI對(duì)此具有獨(dú)到的見解,領(lǐng)先于國外的Google,國內(nèi)公司比OpenAI晚了兩年。
許多科技企業(yè)認(rèn)為,ChatGPT并不是一種革命性的技術(shù)。它是OpenAI對(duì)GPT-3模型進(jìn)行微調(diào)后開發(fā)出的對(duì)話機(jī)器人,并未實(shí)現(xiàn)底層模型的重大突破,只是通過理解、生成和交些相結(jié)合的方式,基于人類反饋進(jìn)行強(qiáng)化訓(xùn)練,從而帶給人們智能的體驗(yàn)感。
Meta首席人工智能科學(xué)家Yann LeCun也曾表達(dá)過對(duì)ChatGPT的看法,他認(rèn)為它并沒有什么特別的創(chuàng)新,許多研究實(shí)驗(yàn)室都在使用同樣的技術(shù)。
很多互聯(lián)網(wǎng)企業(yè)沒有意識(shí)到ChatGPT對(duì)現(xiàn)有搜索模式的顛覆,也沒有準(zhǔn)確預(yù)測(cè)到ChatGPT對(duì)腦力勞動(dòng)者產(chǎn)生替代的關(guān)系。他們認(rèn)為“聊天”只是一種淺層的應(yīng)用,僅僅是一個(gè)更強(qiáng)的聊天機(jī)器人,現(xiàn)階段并不能看到其商業(yè)的潛力。
同樣的觀點(diǎn)還包括字節(jié)的NPL算法工程師,他認(rèn)為ChatGPT是一個(gè)不確定性極高的項(xiàng)目,國內(nèi)尚未有成功的先例。如果決定全力以赴,很難獲得資源支持,更別說提高優(yōu)先級(jí)了。因?yàn)閲鴥?nèi)的技術(shù)能力有限,缺少人力、資金和基礎(chǔ)模型,對(duì)于互聯(lián)網(wǎng)大廠這種商業(yè)公司而言,有著較大的難度。
造成的結(jié)果表現(xiàn)在不僅認(rèn)知層面存在局限,在技術(shù)上也有所局限。ChatGPT 的信息截至 2021 年,這意味著它無法提供實(shí)時(shí)信息?,F(xiàn)在,百度正在努力解決信息實(shí)時(shí)性問題。與此同時(shí),ChatGPT 已經(jīng)在準(zhǔn)備推出基于 GPT-4 的新產(chǎn)品,國內(nèi)企業(yè)也有了新的目標(biāo)需要實(shí)現(xiàn)。
3.跟風(fēng)熱潮中,誰在硬蹭熱點(diǎn)?
前阿里云大模型負(fù)責(zé)人楊紅霞評(píng)論了目前互聯(lián)網(wǎng)公司熱衷于做ChatGPT的現(xiàn)狀。她表示:“僅有參數(shù)規(guī)模達(dá)到100B以上的大模型才有足夠的實(shí)力來提供高質(zhì)量的對(duì)話回答?!?/p>
根據(jù)這個(gè)標(biāo)準(zhǔn),百度的飛槳平臺(tái)和文心大模型、阿里的“通義”大模型以及華為的鵬城盤古大模型都有較高的實(shí)力。而360、網(wǎng)易有道以及學(xué)而思等企業(yè)目前技術(shù)研發(fā)水平和進(jìn)度較差,缺乏相應(yīng)的大模型和技術(shù)儲(chǔ)備。
此外,還有一些企業(yè)被認(rèn)為是跟隨潮流追風(fēng)口,比如漢王科技。根據(jù)半年報(bào),該公司相關(guān)的文本大數(shù)據(jù)業(yè)務(wù)營收僅占總營收的14%,同比還有下降趨勢(shì)。然而,該公司卻通過炒作ChatGPT概念實(shí)現(xiàn)了股價(jià)的暴漲。
近期,越來越多的企業(yè)都在積極使用ChatGPT技術(shù)來提升自身業(yè)務(wù)。然而,也有一些企業(yè)并沒有采取任何行動(dòng),但卻受益于ChatGPT熱潮。2月8日,微軟推出了集成了ChatGPT技術(shù)的新版必應(yīng),其回答內(nèi)容中不少答案來自知乎,該天下午知乎的股價(jià)一度漲幅超過56%。由于ChatGPT可能對(duì)社區(qū)問答造成深遠(yuǎn)影響,知乎方面一直對(duì)ChatGPT相關(guān)事宜保持沉默。但市場對(duì)其仍然熱愛,帶動(dòng)了股價(jià)的增長。
有業(yè)內(nèi)人士表示,許多中小型企業(yè)缺乏技術(shù)實(shí)力,但也可以利用開源的Transformer大模型,在一定程度上實(shí)現(xiàn)ChatGPT的功能。
然而,達(dá)摩院專家表示,目前大規(guī)模預(yù)訓(xùn)練的基于Transformer的模型雖然能很好地解決感知智能相關(guān)任務(wù),但由于缺乏精心設(shè)計(jì)的純Transformer模型,基本無法實(shí)現(xiàn)認(rèn)知智能。
正如字節(jié)跳動(dòng)的情況,火山引擎的售前支持人員也表示,該平臺(tái)尚未推出類似產(chǎn)品,但可以通過機(jī)器學(xué)習(xí)平臺(tái)與自家產(chǎn)品結(jié)合,經(jīng)過二次開發(fā),能夠?qū)崿F(xiàn)類ChatGPT的效果。
4.尾聲
AIGC尤其是目前的ChatGPT確實(shí)是非常重要的新方向,不像之前談元宇宙很多人不認(rèn)可、談28nm落地很多人搖頭、談國產(chǎn)操作系統(tǒng)大家尷尬一笑,經(jīng)過這段時(shí)間發(fā)酵,和AI相關(guān)的上下游企業(yè)都是非常緊張而且重視的態(tài)度。
AI產(chǎn)業(yè)的成熟,是大家目前極少數(shù)能看清的,可以提升整個(gè)社會(huì)生產(chǎn)效率的可落地工具,也就是很多年不再提升的全要素生產(chǎn)率,能再上一個(gè)臺(tái)階的最大希望(很多人原本期待L4自動(dòng)駕駛會(huì)先落地),經(jīng)濟(jì)增長越慢大家才越內(nèi)卷,AI有可能會(huì)讓經(jīng)濟(jì)增速上一個(gè)臺(tái)階。這個(gè)方向是幾乎不可能被放棄的,對(duì)于互聯(lián)網(wǎng)頭部企業(yè)而言,如果這一次的機(jī)遇無法把握住,那么像新巨頭字節(jié)之前用算法(當(dāng)時(shí)的最新工具)顛覆老巨頭百度這種事情也會(huì)有很大概率再次上演,這也是各家非常緊張的真實(shí)原因。
但是實(shí)際來看,也能理解這里算法、算力、數(shù)據(jù)三個(gè)方面的要求都是極高的,所以嚴(yán)格意義上只有巨頭能做。從事實(shí)出發(fā),我們不能發(fā)現(xiàn),現(xiàn)在連足夠算力的先進(jìn)制程AI芯片都不夠,目前大家能想到的妥協(xié)方案是用CPU來頂。所以小公司撐不起全譜系A(chǔ)I研發(fā),大概率仍舊是接入端口部署應(yīng)用,包括最后國內(nèi)能活下來的AI平臺(tái),可能也就是兩至三家;
如果類比AI產(chǎn)業(yè)對(duì)于,就如8年前伊始的新能源汽車,有兩三年的技術(shù)代差,但是核心技術(shù)沒有實(shí)質(zhì)性壟斷、沒有專利權(quán)鐵桶、沒有制造業(yè)上的硬門檻,目前對(duì)于國內(nèi)最尷尬的是算力芯片的困局,但是在其他領(lǐng)域(數(shù)據(jù)源、人工標(biāo)注、中文語境)是有比較優(yōu)勢(shì)的,有點(diǎn)像當(dāng)年新能源車?yán)镂覀冇校▏鴥?nèi)市場、人工、電池、補(bǔ)貼)這些優(yōu)勢(shì)一樣。希望是靠著補(bǔ)貼、市場容量、制造業(yè)優(yōu)勢(shì)(這次是數(shù)據(jù)源優(yōu)勢(shì)),能彎道超車,起碼不落后。
包括騰訊、阿里、字節(jié)、小紅書、菜鳥等互聯(lián)網(wǎng)公司,已經(jīng)在NPL算法工程師等相關(guān)招聘崗位中,加入了從業(yè)者需了解熟悉GPT-3等相關(guān)模型的要求。而招聘的月薪多在4萬元左右,最高可達(dá)10萬元。
2023年,ChatGPT點(diǎn)燃的這把火,可以淬煉出真金的企業(yè)和人才,也可以蒸發(fā)掉虛妄的概念。最后想說的是,ChatGPT是開胃菜,GPT4.0才是大餐。