3月16日,百度正式發(fā)布文心一言。百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏在發(fā)布會(huì)現(xiàn)場(chǎng)表示,在發(fā)布之前,很多人問百度是否已經(jīng)準(zhǔn)備好,“從某種意義上說我們已經(jīng)為此準(zhǔn)備了多年,我們十幾年前就開始投入AI研究,但也不能說我們完全ready(準(zhǔn)備好)了,文心一言對(duì)標(biāo)ChatGPT、甚至是對(duì)標(biāo)GPT-4,門檻是很高的,全球大廠還沒有一個(gè)做出來的,百度是第一個(gè),我自己測(cè)試感覺還是有很多不完美的地方?!?/p>
為什么不完美還要發(fā)布?李彥宏說,因?yàn)槭袌?chǎng)有需求,短短一個(gè)月,有超過650家合作伙伴宣布加入文心一言生態(tài),大家都希望能早一點(diǎn)用上最新最先進(jìn)的大語言模型,一旦有了真實(shí)的人類反饋,文心一言的進(jìn)步速度會(huì)非???,希望它快點(diǎn)成長(zhǎng)。
發(fā)布會(huì)上,百度同時(shí)公布了文心一言的邀請(qǐng)測(cè)試方案。3月16日起,首批用戶即可通過邀請(qǐng)測(cè)試碼,在文心一言官網(wǎng)體驗(yàn)產(chǎn)品,后續(xù)將陸續(xù)開放給更多用戶。此外,百度智能云即將面向企業(yè)客戶開放文心一言API接口調(diào)用服務(wù)。3月16日起正式開放預(yù)約,搜索“百度智能云”進(jìn)入官網(wǎng),可申請(qǐng)加入文心一言云服務(wù)測(cè)試。
從百度的發(fā)布來看,文心一言有五大能力:文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成,因此,李彥宏的演示也聚焦于這五個(gè)方面。值得關(guān)注的是,現(xiàn)場(chǎng)演示的均為提前錄制好的demo。
用“雞兔同籠”做數(shù)理推算,還做了一首藏頭詩
李彥宏演示了文心一言對(duì)數(shù)理邏輯推算任務(wù)做的怎么樣。雞兔同籠是鍛煉人類邏輯思維的經(jīng)典題,這個(gè)對(duì)生成式AI同樣有挑戰(zhàn)。
第一個(gè)問題,我們來玩一個(gè)雞兔同籠的游戲。1只雞有2只腳1個(gè)頭,1只兔子有4只腳1個(gè)頭。那么,如果有一個(gè)籠子里有9個(gè)頭,40只腳,應(yīng)該有多少只雞,多少只兔子?
經(jīng)過測(cè)試,對(duì)于第一道題,文心一言經(jīng)過演算,認(rèn)為可能是題出錯(cuò)了。
第二個(gè)問題:我們來玩一個(gè)雞兔同籠的游戲。1只雞有2只腳1個(gè)頭,1只兔子有4只腳1個(gè)頭。那么,如果有一個(gè)籠子里有9個(gè)頭,30只腳,應(yīng)該有多少只雞,多少只兔子?
第二道題,文心一言不僅給出了正確結(jié)果,還詳細(xì)給出解題步驟。可以看出,文心一言能理解題意,并有正確的解題思路,進(jìn)而像學(xué)生做題一樣,按正確的步驟,一步步算出正確答案。
百度曾在多個(gè)場(chǎng)合強(qiáng)調(diào),作為扎根于中國(guó)市場(chǎng)的大語言模型,文心一言具備中文領(lǐng)域最先進(jìn)的自然語言處理能力,在中文語言和中國(guó)文化上有更好的表現(xiàn)。發(fā)布會(huì)上也披露,文心一言大模型的訓(xùn)練數(shù)據(jù)包括萬億級(jí)的網(wǎng)頁數(shù)據(jù)、數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級(jí)的語音日均調(diào)用數(shù)據(jù),以及5500億事實(shí)的知識(shí)圖譜等。
那文心一言在中文語言的處理上,到底如何呢?
在現(xiàn)場(chǎng)展示中,文心一言正確解釋了成語“洛陽紙貴”的含義、“洛陽紙貴”對(duì)應(yīng)的經(jīng)濟(jì)學(xué)理論,還用“洛陽紙貴”四個(gè)字創(chuàng)作了一首藏頭詩。在商業(yè)文案創(chuàng)作場(chǎng)景中,文心一言完成了給公司起名、寫Slogan、寫新聞稿的創(chuàng)作任務(wù)。
“多模態(tài)是生成式AI一個(gè)明確的發(fā)展趨勢(shì)”
在文心一言發(fā)布的前一天,ChatGPT開發(fā)商Open AI公開發(fā)布了大型多模態(tài)模型GPT-4,與此前的GPT系列模型相比,最大的突破之一是在文本之外還能夠處理圖像內(nèi)容。OpenAI表示,用戶同時(shí)輸入文本和圖像的情況下,它能夠生成自然語言和代碼等文本,而此前的GPT-3.5只接受文本。
外界認(rèn)為,在GPT-4帶動(dòng)下,未來大模型以及多模態(tài)模型的商業(yè)化應(yīng)用將進(jìn)一步加速,百度的文心一言是否能做到多模態(tài)生成也是外界所關(guān)注的。
在現(xiàn)場(chǎng)演示中,李彥宏現(xiàn)場(chǎng)展示了文心一言生成文本、圖片、音頻和視頻的能力,文心一言可以生成四川話等方言語音,但因視頻生成能力則因成本較高,現(xiàn)階段這個(gè)功能還未對(duì)所有用戶開放,百度稱未來會(huì)逐步接入。
“多模態(tài)是生成式AI一個(gè)明確的發(fā)展趨勢(shì)。”李彥宏表示,“未來,隨著百度多模態(tài)統(tǒng)一大模型的能力增強(qiáng),文心一言的多模態(tài)生成能力也會(huì)不斷提升?!?/p>
產(chǎn)品形態(tài)趨于ChatGPT剛發(fā)布時(shí)
文心一言具體表現(xiàn)如何?李彥宏評(píng)價(jià),文心一言從某種程度上具有了對(duì)人類意圖的理解能力,回答的準(zhǔn)確性、邏輯性、流暢性都逐漸接近人類水平,但整體而言,這類大語言模型還遠(yuǎn)未到發(fā)展完善的階段,有賴于通過真實(shí)的用戶反饋而逐步迭代。
在外界看來,百度在往ChatGPT剛發(fā)布時(shí)的產(chǎn)品形態(tài)靠攏,更有業(yè)內(nèi)人士指出,與GPT-4相比,文心一言還像是一個(gè)“剛出生的嬰兒”。
李彥宏曾表示,百度的多項(xiàng)主流業(yè)務(wù)會(huì)與文心一言整合,包括搜索、智能云、Apollo自動(dòng)駕駛、小度智能設(shè)備等,但從今日的發(fā)布看,百度并未提及與上述產(chǎn)品的結(jié)合進(jìn)展,而是用一部分篇幅談了生成式AI、大模型所帶來的產(chǎn)業(yè)機(jī)會(huì)。
“對(duì)于大部分創(chuàng)業(yè)者和企業(yè)來說,真正的機(jī)會(huì)并不是從頭開始做ChatGPT和文心一言這樣的基礎(chǔ)大模型,這很不現(xiàn)實(shí),也不經(jīng)濟(jì),真正的機(jī)會(huì)是,基于通用大語言模型,搶先開發(fā)重要的應(yīng)用服務(wù)。就像移動(dòng)互聯(lián)網(wǎng)時(shí)代,最成功的商業(yè)產(chǎn)品不見得是安卓和iOS,而是基于安卓和iOS開發(fā)的微信、淘寶、抖音等各種超級(jí)應(yīng)用。”李彥宏說。
由此可見,百度給文心一言的定位,不僅僅是一個(gè)工具,而是一個(gè)通用的平臺(tái),百度想讓各行各業(yè)來使用這個(gè)平臺(tái),進(jìn)而創(chuàng)造價(jià)值。
李彥宏判斷,大模型時(shí)代將產(chǎn)生三大產(chǎn)業(yè)機(jī)會(huì),第一類是新型云計(jì)算公司,第二類是進(jìn)行行業(yè)模型精調(diào)的公司,第三類是基于大模型底座進(jìn)行應(yīng)用開發(fā)的公司,即應(yīng)用服務(wù)提供商,“今天,基于文本生成、圖像生成、音頻生成、視頻生成、數(shù)字人、3D等場(chǎng)景,已經(jīng)涌現(xiàn)出很多創(chuàng)業(yè)明星公司,他們可能就是未來的新巨頭。這里面的機(jī)會(huì)非常多,可以說每家企業(yè)在現(xiàn)在這個(gè)階段都有機(jī)會(huì)?!崩顝┖暾f。
在發(fā)布文心一言后,百度港股一度跌近10%,截至16日收盤,百度港股跌6.36%,報(bào)收125.1港元。
截至3月16日晚間,百度智能云已經(jīng)與5家企業(yè)完成首批簽約合作,同時(shí)與650家企業(yè)啟動(dòng)簽約。發(fā)布會(huì)首日,申請(qǐng)文心一言API調(diào)用服務(wù)測(cè)試的企業(yè)用戶已突破7萬。
更多精彩內(nèi)容歡迎點(diǎn)擊==>>電子技術(shù)應(yīng)用-AET<<