ChatGPT現(xiàn)在有多火?
2022年11月30日,ChatGPT橫空出世,在全球范圍內(nèi)形成了熱烈的討論。根據(jù) Similarweb 的數(shù)據(jù),今年1 月,平均每天約有 1300 萬獨(dú)立訪客使用 ChatGPT,是去年 12 月份的兩倍多,累計(jì)用戶超1億,創(chuàng)下了互聯(lián)網(wǎng)最快破億應(yīng)用的記錄,超過了之前TikTok 9個(gè)月破億的速度。
除了廣大用戶千奇百怪的問題,引發(fā)了社交媒體的大量傳播,ChatGPT在各領(lǐng)域的秀肌肉,也進(jìn)一步強(qiáng)化了其知名度。美國賓夕法尼亞大學(xué)發(fā)現(xiàn),ChatGPT能夠通過該校工商管理碩士MBA課程的期末考試。《自然》雜志1月24日宣布,將人工智能工具列為作者的論文,不能在雜志上發(fā)表?!蹲匀弧贩Q,作者身份意味著對作品負(fù)有責(zé)任,而人工智能工具無法承擔(dān)這樣的責(zé)任。據(jù)傳,ChatGPT還成功通過了谷歌的編程面試,拿到了年薪18.3萬美元的L3工程師offer。
ChatGPT背后的核心技術(shù)?
ChatGPT是生成式AI的一種形式,Gartner將其作為《2022年度重要戰(zhàn)略技術(shù)趨勢》的第一位。Gartner預(yù)測,到2025年,生成式AI將占到所有生成數(shù)據(jù)的10%,但目前這個(gè)比例還不足1%。
ChatGPT背后的支撐是人工智能大模型,這個(gè)技術(shù)點(diǎn),我們在去年的騰訊研究院《2022十大數(shù)字科技前沿應(yīng)用趨勢》報(bào)告中做過詳細(xì)的闡述:當(dāng)前的人工智能大多是針對特定的場景應(yīng)用進(jìn)行訓(xùn)練, 生成的模型難以遷移到其他應(yīng)用, 屬于“ 小模型”的范疇。整個(gè)過程不僅需要大量的手工調(diào)參, 還需要給機(jī)器喂養(yǎng)海量的標(biāo)注數(shù)據(jù),這拉低了人工智能的研發(fā)效率, 且成本較高。大模型通常是在無標(biāo)注的大數(shù)據(jù)集上, 采用自監(jiān)督學(xué)習(xí)的方法進(jìn)行訓(xùn)練。之后,在其他場景的應(yīng)用中,開發(fā)者只需要對模型進(jìn)行微調(diào), 或采用少量數(shù)據(jù)進(jìn)行二次訓(xùn)練, 就可以滿足新應(yīng)用場景的需要。這意味著,對大模型的改進(jìn)可以讓所有的下游小模型受益, 大幅提升人工智能的適用場景和研發(fā)效率, 因此大模型成為業(yè)界重點(diǎn)投入的方向,Open AI、谷歌、臉書、微軟, 國內(nèi)的百度、阿里、騰訊、華為和智源研究院等紛紛推出超大模型。特別是OpenAI GPT 3 大模型在翻譯、問答、內(nèi)容生成等領(lǐng)域的不俗表現(xiàn), 讓業(yè)界看到了達(dá)成通用人工智能的希望。當(dāng)前ChatGPT的版本為GPT 3.5,是在GPT3之上的調(diào)優(yōu),能力進(jìn)一步增強(qiáng)。
ChatGPT使用的核心技術(shù)之一是Transformer。這從其全稱上也能看得出來,Chat Generative Pre-trained Transformer。Transformer技術(shù)是近幾年人工智能技術(shù)最大的亮點(diǎn)之一,他是Google于2017年提出的一種采用注意力機(jī)制的深度學(xué)習(xí)模型,可以按輸入數(shù)據(jù)各部分重要性的不同,而分配不同的權(quán)重。Transformer的精度和性能上都要優(yōu)于之前流行的CNN(卷積神經(jīng)網(wǎng)絡(luò))、RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))等模型,大幅提升了模型訓(xùn)練的效果,讓人工智能得以在更大模型、更多數(shù)據(jù)、更強(qiáng)算力的基礎(chǔ)上進(jìn)一步增強(qiáng)能力。此外,他還具有很強(qiáng)的跨模態(tài)能力,不僅在NLP(自然語言理解)領(lǐng)域表現(xiàn)優(yōu)異,在語音、圖像方面也顯示出了優(yōu)異的性能。
ChatGPT為什么能成功?
ChatGPT是非常成功的一次從技術(shù)研發(fā)到工程化、再到點(diǎn)燃大眾熱情的經(jīng)典案例。
技術(shù)創(chuàng)新
Open AI持續(xù)的研究中,不斷探索引入新的技術(shù)路線。這次引入的強(qiáng)化學(xué)習(xí)方法,很好地提升了模型的效果。在研究中,Open AI在模型訓(xùn)練中,引入了人類專家。專家一方面幫助ChatGPT撰寫更符合人類習(xí)慣的回答,另一方面,也對生成的結(jié)果進(jìn)行排名,通過這樣的獎(jiǎng)勵(lì)機(jī)制,實(shí)現(xiàn)模型的微調(diào)優(yōu)化。
組織文化
Open AI自成立之初,就致力于打造通用AI的能力,并堅(jiān)定的持續(xù)投入,這是ChatGPT成功的一大關(guān)鍵因素。在這樣的愿景下,吸引了一大批高水平的人才,在沒有任何商業(yè)KPI的情況下心無旁騖地開展研發(fā)工作,最終取得了重大的突破。
反饋機(jī)制
通過用戶的使用,Open AI可以獲得用戶對于模型優(yōu)劣和使用體驗(yàn)的反饋,從而形成了模型使用到體驗(yàn)反饋的閉環(huán),從而進(jìn)一步優(yōu)化模型。此外,Open AI還組織專門的反饋競賽,鼓勵(lì)用戶針對回答中的風(fēng)險(xiǎn)危害、新穎的回答建議等方面給予反饋,參賽者有機(jī)會(huì)贏取500 美元的 API 積分,并可兌換相應(yīng)獎(jiǎng)品。
項(xiàng)目策劃
一個(gè)影響力出圈的技術(shù),與其項(xiàng)目策劃密不可分。ChatGPT的問答和多輪對話形式,很好地激發(fā)了大眾的熱情和創(chuàng)造力,大家基于各自感興趣的話題自由發(fā)揮,或幽默搞笑、或嚴(yán)肅認(rèn)真,在朋友圈和媒體上屢屢刷屏。包括之前GPT3的推出,他寫新聞、作詩、翻譯、編代碼等能力,也是在社會(huì)上產(chǎn)生了熱議和討論。這種很好地與公眾互動(dòng)的項(xiàng)目設(shè)計(jì)策略,也很值得我們學(xué)習(xí)。包括之前AlphaGo的圍棋大戰(zhàn)、Deepmind破解蛋白質(zhì)折疊結(jié)構(gòu)難題,都是很好的議題任務(wù)設(shè)置。
ChatGPT是否開源?
尚未開源,目前是以API(應(yīng)用程序編程接口)調(diào)用的方式服務(wù),目前也暫無開源計(jì)劃。
Open AI不Open,是業(yè)界很多人詬病的地方。開源是多年來軟件和互聯(lián)網(wǎng)產(chǎn)業(yè)之所以蓬勃發(fā)展的核心動(dòng)力之一。開源的方式可以調(diào)動(dòng)全球開發(fā)者的積極性,每個(gè)人都可以下載源代碼使用,并進(jìn)行優(yōu)化和在社區(qū)分享。這種用全社會(huì)的力量來創(chuàng)新的機(jī)制,大幅加速了技術(shù)科研攻關(guān)、產(chǎn)業(yè)應(yīng)用的進(jìn)程。
關(guān)于ChatGPT為何不開源,業(yè)界也有一些專家表示認(rèn)可,因?yàn)槿斯ぶ悄芗夹g(shù)至今為止還是一個(gè)黑盒,關(guān)于其內(nèi)部的機(jī)制尚未可知,如果代碼開源,很難避免該技術(shù)用于一些不利于社會(huì)和人類的方面。此外,自從Open AI放棄了非盈利組織的定位,接受微軟等投資后,從商業(yè)化的角度考慮,也會(huì)采取整體模型閉源,開放應(yīng)用接口的方式來推廣,同時(shí)也會(huì)開源少部分模型,豐富開發(fā)者生態(tài)。
ChatGPT免費(fèi)嗎?
未來能賺錢嗎?
當(dāng)前,普通用戶使用ChatGPT 是免費(fèi)的。
據(jù)《財(cái)富》,2022年,OpenAI公司的收入預(yù)計(jì)不足3000萬美元,凈虧損5.45億美元。而隨著ChatGPT的火爆,可能進(jìn)一步增加其虧損,因?yàn)橛脩裘恳淮握{(diào)用,就會(huì)讓Open AI付出更多的計(jì)算資源和帶寬成本。
當(dāng)然,Open AI也開始了商業(yè)化的嘗試,2023 年 2 月,OpenAI 宣布推出付費(fèi)試點(diǎn)訂閱計(jì)劃ChatGPT Plus,定價(jià)每月20美元。付費(fèi)版功能包括高峰時(shí)段免排隊(duì)、快速響應(yīng)以及優(yōu)先獲得新功能和改進(jìn)等。
Open AI預(yù)測,隨著ChatGPT成為吸引客戶的重要工具,其收入將會(huì)快速增長,預(yù)計(jì)2023年收入2億美元,2024年收入預(yù)計(jì)超過10億美元。
此外,據(jù)報(bào)道,微軟正在洽談向 OpenAI 投資約 100 億美元,也讓其估值達(dá)到了290 億美元。而此前,2019年微軟曾向 OpenAI投資 10 億美元,為其提供了大量的資金支持和Azure云算力支持。
ChatGPT會(huì)替代搜索引擎嗎?
短期來說,不會(huì)。長期來看,有可能通過融合,形成新型的搜索引擎。
目前的ChatGPT給出的答案參差不齊,既可以給出很多問題的簡要答案,甚至能寫一篇符合初級(jí)規(guī)劃師水平的產(chǎn)業(yè)規(guī)劃報(bào)告,但ChatGPT也不可避免地經(jīng)常出現(xiàn)“一本正經(jīng)的胡說八道”的情況,這使得其置信度還需進(jìn)一步提升。而且ChatGPT目前的知識(shí)庫主要還是2021年9月之前的數(shù)據(jù),缺乏新數(shù)據(jù),這也大大限制了其提供新信息的能力。而同時(shí),Open AI還推出了WebGPT,它可以在網(wǎng)絡(luò)上查找信息并提供信息來源,這將很大程度上補(bǔ)充ChatGPT的實(shí)時(shí)信息源,從而進(jìn)一步優(yōu)化答案。
在搜索引擎的邏輯下,選擇權(quán)在用戶,搜索引擎一般會(huì)給出眾多相關(guān)結(jié)果,根據(jù)用戶的點(diǎn)擊反饋來持續(xù)優(yōu)化搜索結(jié)果。近年來,搜索引擎也一直在做結(jié)果唯一化的嘗試,比如直接在搜索框中提供唯一的答案選擇,但目前可提供唯一結(jié)果的比較有限,且無法開展多輪對話。
ChatGPT的推出,給搜索引擎廠商帶來了很大的震動(dòng),也啟發(fā)了其打造搜索新體驗(yàn)的方向。谷歌兩位創(chuàng)始人多次召開討論會(huì),以應(yīng)對 ChatGPT 可能帶來的顛覆搜索引擎業(yè)務(wù)的潛力。谷歌CEO Pichai表示,將在近期推出類似ChatGPT的基于人工智能的大型語言模型,一款由 LaMDA 提供支持的對話AI服務(wù) Bard,讓用戶以“搜索伴侶”的形式使用。微軟已經(jīng)在 Bing搜索引擎中添加了 ChatGPT 功能,并開展了小流量測試。百度也計(jì)劃在3月推出新功能,在搜索引擎中加入類似ChatGPT的對話式機(jī)器人“文心一言”。
我們也可以看看ChatGPT自己的回答:
還有哪些類似ChatGPT的
模型和應(yīng)用?
ChatGPT是典型的AIGC大模型,目前國內(nèi)外在文本、代碼、圖像、視頻、3D等領(lǐng)域都涌現(xiàn)出相應(yīng)的生成模型。
當(dāng)前,ChatGPT一個(gè)有力的競爭者是Claude,他是Anthropic近期推出的生成式Al模型。Anthropic由幾位前 OpenAl的研究員在2021年創(chuàng)立,包括OpenAl前研究副總裁Dario Amodei、GPT-3論文一作Tom Brown等人。據(jù)《金融時(shí)報(bào)》報(bào)道,2022 年底,Google向這家初創(chuàng)公司投資了約 3 億美元。相比ChatGPT,Anthropic 在其網(wǎng)站上更強(qiáng)調(diào)其構(gòu)建“可靠、可解釋和可操縱的人工智能系統(tǒng)”的工作。
騰訊的混元大模型,集CV(計(jì)算機(jī)視覺)、NLP(自然語言理解)、多模態(tài)理解能力于一體,先后在MSR-VTT,MSVD等五大權(quán)威數(shù)據(jù)集榜單中登頂,實(shí)現(xiàn)跨模態(tài)領(lǐng)域的大滿貫。2022年5月,騰訊“混元”AI大模型在CLUE(中文語言理解評(píng)測集合)總排行榜、閱讀理解、大規(guī)模知識(shí)圖譜三個(gè)榜單同時(shí)登頂,一舉打破三項(xiàng)紀(jì)錄。12月,混元推出國內(nèi)首個(gè)低成本、可落地的NLP萬億大模型,并再次登頂自然語言理解任務(wù)榜單CLUE?;煸们|模型熱啟動(dòng),最快僅用256卡在一天內(nèi)即可完成萬億參數(shù)大模型HunYuan-NLP 1T的訓(xùn)練,整體訓(xùn)練成本僅為直接冷啟動(dòng)訓(xùn)練萬億模型的1/8。
圖片來源:紅杉資本《Generative AI: A Creative New World》
ChatGPT等大模型
會(huì)讓我們實(shí)現(xiàn)通用人工智能嗎?
自從包含1750億參數(shù)的GPT3從2020年6月推出以來,業(yè)界對于達(dá)成通用人工智能的探討又進(jìn)一步熱了起來。正如微軟CEO納德拉近日在接受華爾街日報(bào)訪談時(shí)表示,GPT 的發(fā)展不是線性的,而是指數(shù)級(jí)變化的,所以相比較GPT3,當(dāng)前的GPT3.5已經(jīng)展現(xiàn)出更強(qiáng)的能力。業(yè)界普遍預(yù)測,GPT4將在今年推出,并具備更強(qiáng)大的通用能力。
但同時(shí),我們也需要有清晰的辨識(shí),AI并非萬能。即無論AI如何強(qiáng)大,其解決的問題,也只是人類面臨所有問題的很小一部分。因?yàn)楝F(xiàn)實(shí)世界中有海量的問題并不是數(shù)學(xué)問題,也就不可能通過計(jì)算來求解。目前人工智能已經(jīng)找到解決方案的問題,也只是可計(jì)算問題的一小部分。
ChatGPT可能產(chǎn)生哪些
社會(huì)或倫理問題?
ChatGPT也面臨人工智能長期以來面臨的問題,如歧視等倫理問題,被濫用于詐騙、欺詐、政治造謠、偽造身份等安全問題,以及知識(shí)產(chǎn)權(quán)問題。最近,OpenAI表示,正考慮在ChatGPT中添加模型水印,即監(jiān)測模型可以識(shí)別的特殊標(biāo)記,以降低模型濫用的問題。
此外,針對大眾普遍擔(dān)心的失業(yè)問題,ChatGPT 在 LinkedIn 上分享了一篇帖子寫道:“AI 不會(huì)取代你。一個(gè)使用 AI 的人將取代你”。
ChatGPT的未來將帶來哪些
變革和新機(jī)會(huì)?
ChatGPT自己的回答,已展現(xiàn)出其發(fā)展的一種典型路徑,即作為人類的陪伴機(jī)器人。
但更重要的,ChatGPT會(huì)成為未來人機(jī)交互的一個(gè)新入口,很可能改變現(xiàn)有APP的交互方式,以更為自然的對話方式,讓用戶來使用軟件和調(diào)用技能。例如,未來在文檔編輯軟件中,人們可以通過描述需求,讓軟件直接生成文字內(nèi)容,或者生成一個(gè)圖形,甚至直接進(jìn)行修圖等工作。在編程方面,ChatGPT這種即時(shí)編程的方式,將改變傳統(tǒng)的工作方式和應(yīng)用交互規(guī)則,推動(dòng)產(chǎn)業(yè)進(jìn)入軟件3.0的新階段。
除此之外,ChatGPT未來還可以有多樣化的應(yīng)用前景:
一是現(xiàn)在火熱的數(shù)字人,好看的皮囊下,則需要類似ChatGPT這樣的模型提供對話能力,才能讓數(shù)字人具備有趣的靈魂,更好地陪伴和服務(wù)人。同時(shí),該能力也可以嵌入到機(jī)器人身體內(nèi),讓未來的人形機(jī)器人更聰明,更像人。
二是大量的開發(fā)者可以利用ChatGPT這樣的底層平臺(tái),在大模型基礎(chǔ)上根據(jù)不同行業(yè)和場景進(jìn)行模型調(diào)優(yōu),從而創(chuàng)造出各類滿足用戶需求的豐富應(yīng)用,從而形成對話式AI的生態(tài)。例如國外火爆的Jasper,通過在GPT3模型上的微調(diào),可以幫助用戶撰寫營銷文案,甚至有人在上面完成了一部 12 萬字的小說,IBM、Airbnb、Autodesk等大企業(yè)都是其企業(yè)用戶。普通用戶可以免費(fèi)試用1萬個(gè)單詞的版本,之后可以29美元訂購2萬個(gè)單詞,或用59美元訂購生成5萬個(gè)單詞的權(quán)限。
三是在教育、醫(yī)療、廣告營銷、電子商務(wù)、市場和戰(zhàn)略咨詢、企業(yè)服務(wù)、編寫代碼等專業(yè)服務(wù)領(lǐng)域,成為更為專業(yè)的人類助手,不僅可以生成內(nèi)容,還可以調(diào)用各種專業(yè)能力,甚至替代部分初級(jí)的專業(yè)工作。企業(yè)服務(wù)方面,2月8日,微軟推出了由 ChatGPT 提供技術(shù)支持的高級(jí) Teams 產(chǎn)品, ChatGPT 可以自動(dòng)幫助參會(huì)者生成會(huì)議記錄,即使沒有參加會(huì)議,智能回顧功能也能幫助用戶生成會(huì)議記錄和要點(diǎn)。如果有被同事在會(huì)議中提到,ChatGPT還可以給用戶提供個(gè)性化的時(shí)間線標(biāo)記,以快速查看分享和討論的內(nèi)容,該服務(wù)將在 6 月份每月收費(fèi) 7 美元,然后在 7 月份增加到 10 美元。代碼編寫方面,近期特斯拉前任AI總監(jiān)Andrej Karpathy透露,現(xiàn)在他80%的代碼都是由AI生成的(GitHub Copilot),而且有80%的準(zhǔn)確率。
四是與其他模態(tài)AI工具的組合式創(chuàng)新,ChatGPT同文生圖、文字生成視頻、甚至未來直接生成3D模型的工具集成,可以帶來UGC內(nèi)容的極大豐富,成為內(nèi)容工業(yè)化的核心引擎。
未來,ChatGPT與更多的AI、云計(jì)算等信息技術(shù)的集成創(chuàng)新,將創(chuàng)造改變生產(chǎn)力曲線的工具,成為經(jīng)濟(jì)發(fā)展新動(dòng)力。