《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > 【ChatGPT專題】對(duì)話全球前2%頂尖科學(xué)家:深度解構(gòu)“殺手級(jí)應(yīng)用”ChatGPT

【ChatGPT專題】對(duì)話全球前2%頂尖科學(xué)家:深度解構(gòu)“殺手級(jí)應(yīng)用”ChatGPT

2023-02-16
來(lái)源:中國(guó)聯(lián)通
關(guān)鍵詞: ChatGPT

  這個(gè)冬天,ChatGPT火爆全球。作為AIGC的重要落地應(yīng)用,ChatGPT到底是什么?帶來(lái)什么影響?中國(guó)版ChatGPT如何發(fā)展?通信產(chǎn)業(yè)如何著力?對(duì)此,《通信產(chǎn)業(yè)報(bào)》全媒體專訪聯(lián)通數(shù)科首席AI科學(xué)家廉士國(guó)博士(專家介紹請(qǐng)戳:喜報(bào)),作為2022年度“全球前2%頂尖科學(xué)家榜單”入選者,他如何看待ChatGPT概念、影響和未來(lái)發(fā)展呢,一起來(lái)看:

  ChatGPT是什么?

  廉士國(guó):ChatGPT是一個(gè)面向?qū)υ拡?chǎng)景的大語(yǔ)言模型,是在2020年發(fā)布的語(yǔ)言生成模型GPT-3版本基礎(chǔ)上的改進(jìn)版,又稱為GPT-3.5版。它能通過(guò)與人類做文字對(duì)話的方式,針對(duì)人類輸入的提示文字,提供相應(yīng)的文字回答,且回答的內(nèi)容“形式上合理”。

  因?yàn)椴捎昧俗员O(jiān)督學(xué)習(xí)技術(shù),而無(wú)需人工做數(shù)據(jù)標(biāo)注,就可以用網(wǎng)絡(luò)上大量公開文本數(shù)據(jù)來(lái)做模型訓(xùn)練,以形成沉淀了大量知識(shí)的模型。依賴于訓(xùn)練庫(kù)中的文本數(shù)據(jù)涉及的領(lǐng)域,原則上只要是自然語(yǔ)言能夠表述出的領(lǐng)域都可用來(lái)訓(xùn)練并能具備該領(lǐng)域的智能問(wèn)答功能,例如歷史、地理、數(shù)學(xué)、詩(shī)歌、編程等。目前大家在線體驗(yàn)的ChatGPT服務(wù),是基于ChatGPT模型包裝成的問(wèn)答SaaS服務(wù)。

  ChatGPT有什么影響?

  廉士國(guó):ChatGPT給人們帶來(lái)新穎的體驗(yàn),主要體現(xiàn)在其支持自然問(wèn)答交互方式、能創(chuàng)作性組織文字內(nèi)容、可記憶強(qiáng)大知識(shí)庫(kù)、具備“多才多藝”能力等方面,在交互方式和能力上更“像”人。因?yàn)槭腔谧匀徽Z(yǔ)言數(shù)據(jù)訓(xùn)練的,其在自然語(yǔ)言或文字相關(guān)的功能上更成熟,例如百科知識(shí)查詢、問(wèn)題探討或觀點(diǎn)獲取、文字創(chuàng)作等。

  首先,會(huì)對(duì)搜索體驗(yàn)帶來(lái)提升,包括更自然地輸入內(nèi)容、更豐富的輸出結(jié)果呈現(xiàn)、更準(zhǔn)確的內(nèi)容組織梳理等,可在自然對(duì)話中完成更精準(zhǔn)的搜索,或者說(shuō)讓搜索從關(guān)鍵詞匹配逐漸過(guò)渡到語(yǔ)義匹配。其次,為文字創(chuàng)作提供便捷的輔助工具,例如寫論文、編程序、回復(fù)郵件等,先為人工生成草稿以提升效率。另外,會(huì)提升對(duì)話閑聊的水平,包括對(duì)長(zhǎng)句的理解能力、多輪對(duì)話能力、針對(duì)問(wèn)題的內(nèi)容組織能力等的提升,將革新智能音箱的體驗(yàn)。總之,基于ChatGPT基礎(chǔ)模型,可以對(duì)例如搜索引擎類的信息查詢工具做升級(jí)改造,可以制作文字創(chuàng)作工具作為人類的助手來(lái)提升工作效率,可以為人類提供專家級(jí)咨詢參考和輔導(dǎo)等。

  ChatGPT會(huì)如何影響AI產(chǎn)業(yè)格局和發(fā)展走勢(shì)?

  廉士國(guó):ChatGPT目前在免費(fèi)試用階段,上線僅兩個(gè)月已突破1億用戶數(shù)。據(jù)說(shuō)后續(xù)會(huì)推出按月收費(fèi)的商用版本,同時(shí)微軟已正式推出基于ChatGPT的Bing搜索產(chǎn)品并正將其嵌入Office和Azure等產(chǎn)品中。

  目前看,ChatGPT在B端產(chǎn)品中的定位相對(duì)明確,可作為輔助工具來(lái)改進(jìn)已有產(chǎn)品或?yàn)槿斯ぬ峁┲止δ?。例如,雖然大模型里沉淀了大量知識(shí),但它很難完全替代搜索引擎,因?yàn)槠洳荒芴峁┰純?nèi)容鏈接、不能做即時(shí)信息查詢等,可作為使能工具來(lái)升級(jí)搜索引擎產(chǎn)品;它可為銷售人員提供回復(fù)郵件自動(dòng)生成工具,以降低人工工作量并提升效率等。

  而作為C端產(chǎn)品,相對(duì)還不夠明確,類似寫論文、編程序、咨詢顧問(wèn)等的個(gè)人助手,是否存在合規(guī)性風(fēng)險(xiǎn)、商業(yè)模式問(wèn)題等,有待探索,但同時(shí)也有較大可想像空間。但對(duì)算力基礎(chǔ)設(shè)施的帶動(dòng)作用是明確的,無(wú)論是ChatGPT的研發(fā)(訓(xùn)練)和基于ChatGPT的應(yīng)用(推理)都需要大量智能計(jì)算資源和數(shù)據(jù)存儲(chǔ)及傳輸資源,因此具備智能算力中心的云計(jì)算企業(yè)將是受益者。從技術(shù)分層角度看,從底往上:智能算力平臺(tái)、ChatGPT基礎(chǔ)大模型、基于ChatGPT基礎(chǔ)模型的AI應(yīng)用或插件、行業(yè)應(yīng)用系統(tǒng)。

  可以預(yù)見:以智能算力平臺(tái)為基礎(chǔ),會(huì)有少量公司做類似ChatGPT基礎(chǔ)大模型,其他大量公司和開發(fā)者會(huì)基于ChatGPT基礎(chǔ)模型做AI應(yīng)用或插件,包括To B和To C類的,這些AI應(yīng)用或插件可被集成到行業(yè)應(yīng)用系統(tǒng)中。這種分層模式跟非大模型時(shí)代相似,只是現(xiàn)在大模型可能開始不再免費(fèi)了,這是否說(shuō)明會(huì)出現(xiàn)以ChatGPT基礎(chǔ)大模型擁有者為中心的“寡頭”?對(duì)標(biāo)OpenAI的ChatGPT,谷歌剛剛發(fā)布了以其LaMDA大模型為基礎(chǔ)的Bard對(duì)話服務(wù)。是否要出現(xiàn)類似iOS和Android兩強(qiáng)對(duì)立的局面?

  我們認(rèn)為,目前階段的基礎(chǔ)大模型性能上還需完善,其門檻也沒有高到只能出現(xiàn)兩個(gè)“寡頭”,更多玩家的局面將會(huì)出現(xiàn)。試用階段的用戶熱度是否會(huì)延續(xù),有賴于后續(xù)“爆款”AI應(yīng)用的出現(xiàn),但其對(duì)已有行業(yè)應(yīng)用系統(tǒng)的升級(jí)輔助作用會(huì)持續(xù)體現(xiàn)出價(jià)值。

  ChatGPT發(fā)展存在哪些挑戰(zhàn)?它會(huì)對(duì)AI倫理、數(shù)字治理有什么影響?

  廉士國(guó):ChatGPT基礎(chǔ)模型是基于文字間上下文關(guān)聯(lián)關(guān)系做自監(jiān)督訓(xùn)練的,以數(shù)據(jù)驅(qū)動(dòng)為主、外加少量人工介入,其功能依賴于訓(xùn)練數(shù)據(jù)的數(shù)量和質(zhì)量。從近期的大眾試用反映來(lái)看,如果通過(guò)百科知識(shí)問(wèn)答、寫詩(shī)、做數(shù)學(xué)題和查詢天氣等測(cè)試來(lái)分別評(píng)估當(dāng)前基礎(chǔ)模型的記憶、創(chuàng)作、推理、查詢能力,其相對(duì)從強(qiáng)到弱的排序是:記憶能力、創(chuàng)作能力、推理能力、查詢能力。其推理能力相對(duì)較弱,這印證了國(guó)外部分專家的評(píng)價(jià):當(dāng)前版本模型對(duì)自然語(yǔ)言文本規(guī)則和模式知識(shí)學(xué)得較好,但對(duì)抽象知識(shí)和邏輯推理還沒有學(xué)到位。其信息查詢能力依賴于其訓(xùn)練數(shù)據(jù)的截止搜集時(shí)間,例如問(wèn)“北京明天的天氣是?”其回答“北京明天25度,天氣晴朗”,因?yàn)槠溆?xùn)練數(shù)據(jù)截止到2021年春夏之交,僅能查詢2021年之前的信息。即使其創(chuàng)作能力較強(qiáng),寫出的詩(shī)、論文和問(wèn)題建議在形式結(jié)構(gòu)上看很合理,但細(xì)究其內(nèi)部邏輯仍有不合理的拼湊感。

  盡管ChatGPT本身還存在一些技術(shù)挑戰(zhàn),但大家已經(jīng)看到了其威力,甚至已對(duì)現(xiàn)行制度帶來(lái)了不利影響,例如有國(guó)外學(xué)生用它來(lái)代寫課題論文并獲得了高分,這給其他同學(xué)帶來(lái)了不公平。的確,ChatGPT的出現(xiàn)超出了大家的預(yù)期,但我們的數(shù)字治理還沒有跟上。像這樣具備文字創(chuàng)作等能力的超級(jí)助手,人人都可以平等獲得嗎?其創(chuàng)作的內(nèi)容存在版權(quán)問(wèn)題嗎、是否可以自由使用而不受限?其創(chuàng)作的內(nèi)容如果存在編造事實(shí)、民族歧視、侵犯隱私等問(wèn)題應(yīng)由誰(shuí)來(lái)?yè)?dān)責(zé)?等等問(wèn)題是需要大家共同來(lái)面對(duì)的。而人工智能領(lǐng)域的專家們已經(jīng)開始考慮用技術(shù)手段來(lái)鑒別AI生成的內(nèi)容了,例如通過(guò)人工規(guī)則來(lái)判斷內(nèi)容合法性、通過(guò)文本內(nèi)容統(tǒng)計(jì)分析及添加文本水印等方法來(lái)鑒權(quán)等。我們相信,除了技術(shù)手段之外,相關(guān)的數(shù)字治理制度也將啟動(dòng)建立。

  中國(guó)版ChatGPT如何發(fā)展?

  廉士國(guó):類似ChatGPT的大模型可通過(guò)基于自然語(yǔ)言的自監(jiān)督學(xué)習(xí)技術(shù)實(shí)現(xiàn)對(duì)知識(shí)的沉淀,可作為公共的基礎(chǔ)模型,支撐多種上層應(yīng)用。因此,構(gòu)建中文版的ChatGPT形成具備中文知識(shí)的公共基礎(chǔ)模型,也尤為重要。

  研發(fā)類似ChatGPT的大模型,其基礎(chǔ)主要包括智能算力、大量數(shù)據(jù)、自監(jiān)督學(xué)習(xí)算法等。對(duì)于這些基礎(chǔ),國(guó)內(nèi)相關(guān)企業(yè)和機(jī)構(gòu)是擁有的或可以聯(lián)合構(gòu)建。之前,已有國(guó)內(nèi)企業(yè)和機(jī)構(gòu)發(fā)布了大模型,包括語(yǔ)言大模型、基于語(yǔ)言大模型的多模態(tài)模型等,只是其語(yǔ)言大模型還沒達(dá)到ChatGPT的能力。剛剛已有幾家國(guó)內(nèi)企業(yè)宣布在ChatGPT上做布局,相信國(guó)內(nèi)很快會(huì)出現(xiàn)類似ChatGPT的語(yǔ)言大模型,并且對(duì)中文效果更好。

  另外,國(guó)內(nèi)的應(yīng)用場(chǎng)景豐富、開發(fā)者眾多,以ChatGPT類大模型為基礎(chǔ),面向垂直應(yīng)用場(chǎng)景的再開發(fā),可能出現(xiàn)“爆款”智能應(yīng)用。而且,考慮到國(guó)內(nèi)千行百業(yè)數(shù)字化轉(zhuǎn)型的趨勢(shì),會(huì)產(chǎn)生豐富的行業(yè)場(chǎng)景數(shù)據(jù),可能推進(jìn)行業(yè)大模型的快速發(fā)展,包括語(yǔ)言類、多模類等,不限于對(duì)話場(chǎng)景,可在基礎(chǔ)模型上做微調(diào)或重訓(xùn)練。

  最后,ChatGPT的研發(fā)模式和歷程值得我們借鑒。一方面,ChatGPT的研發(fā)要以巨大的算力和數(shù)據(jù)以及最前沿算法為基礎(chǔ),OpenAI公司能聚齊這些資源并具備產(chǎn)學(xué)研用融合特點(diǎn),這種以公司牽頭的產(chǎn)學(xué)研用融合研發(fā)體系值得借鑒。另一方面,雖然ChatGPT僅僅是OpenAI追求的AGI(通用人工智能)的初級(jí)階段,但我們已看到了其創(chuàng)新帶來(lái)的巨大影響力,這得益于OpenAI創(chuàng)始人和投資者的遠(yuǎn)見和堅(jiān)持。大家可能還記得,OpenAI和DeepMind的投入-產(chǎn)出問(wèn)題(虧損情況),曾是大家熱議的話題,也反應(yīng)在國(guó)內(nèi)AI領(lǐng)域投資的波動(dòng)上。從ChatGPT基礎(chǔ)模型的研發(fā)歷程來(lái)看,大模型研發(fā)是中長(zhǎng)期積累的產(chǎn)物,如果僅追求短期回報(bào)可能反而會(huì)錯(cuò)過(guò)機(jī)會(huì)。這也給了國(guó)內(nèi)投資者和創(chuàng)始人以啟示,大的創(chuàng)新是需要中長(zhǎng)期的堅(jiān)持的,尤其人工智能領(lǐng)域還有很多未知待解決,就更需要堅(jiān)定客觀正確的方向不動(dòng)搖。

  ChatGPT對(duì)信息通信業(yè)有什么影響與互動(dòng)?如何利用?

  廉士國(guó):ChatGPT實(shí)現(xiàn)了人與機(jī)器之間以文本方式“communication”的功能,接近甚至超越了人與人之間以文本方式聊天的體驗(yàn),這與信息通信業(yè)要支撐的豐富人們的溝通與交流相似。

  首先,ChatGPT大模型可作為工具用來(lái)改進(jìn)信息通信服務(wù)能力,例如其在自然語(yǔ)言上的強(qiáng)大能力可用于提升智能客服、智慧運(yùn)營(yíng)、欺詐監(jiān)測(cè)等運(yùn)營(yíng)服務(wù)功能,通信網(wǎng)絡(luò)的巨量數(shù)據(jù)量可用來(lái)訓(xùn)練通信網(wǎng)絡(luò)大模型賦能網(wǎng)絡(luò)自主運(yùn)行。其次,ChatGPT在自然語(yǔ)言上的成功,啟示了在語(yǔ)音、視覺等多模態(tài)數(shù)據(jù)上的擴(kuò)展空間,這將為運(yùn)營(yíng)商在政企業(yè)務(wù)上為千行百業(yè)數(shù)字化轉(zhuǎn)型賦能提供重要工具。而且,ChatGPT等大模型的運(yùn)行和服務(wù)離不開算力和網(wǎng)絡(luò)支撐,運(yùn)營(yíng)商作為新型信息基礎(chǔ)設(shè)施服務(wù)運(yùn)營(yíng)者,可以加強(qiáng)算網(wǎng)融合的智能算力中心建設(shè),來(lái)承載ChatGPT等大模型訓(xùn)練和推理服務(wù),真正讓大模型服務(wù)遍及無(wú)處不在的用戶。

  可以預(yù)見,ChatGPT的流行會(huì)讓人機(jī)自然對(duì)話的交互方式越來(lái)越普及,并很可能從文本對(duì)話模式擴(kuò)展到語(yǔ)音對(duì)話模式,以及與數(shù)字人面對(duì)面交流模式,進(jìn)而將大大提升信息通信流量和用戶黏度,這也將推動(dòng)信息通信業(yè)考慮從人與人之間的溝通交流擴(kuò)展到人機(jī)之間的溝通交流。雖然傳統(tǒng)搜索引擎已經(jīng)不再是搜尋或咨詢信息的普遍方式了,部分代之以基于知識(shí)沉淀的大模型構(gòu)建的文本/語(yǔ)音/數(shù)字人對(duì)話機(jī)器人,但這對(duì)信息通信的依賴程度有過(guò)之而無(wú)不及,因而通信行業(yè)更應(yīng)該擁抱大模型。

敬請(qǐng)關(guān)注電子技術(shù)應(yīng)用2023年2月22日==>>商業(yè)航天研討會(huì)<<

微信圖片_20230210170337.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。