《電子技術(shù)應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 【ChatGPT專題】ChatGPT國內(nèi)“遍地開花”:堵點在哪,隱患何在

【ChatGPT專題】ChatGPT國內(nèi)“遍地開花”:堵點在哪,隱患何在

2023-02-17
作者: 查睿 吳丹璐
來源: 懂經(jīng)
關(guān)鍵詞: ChatGPT 人工智能

  前言導讀

  “ChatGPT會不會搶走我的飯碗?”時下最熱門的話題,無疑是這個AI聊天機器人。人工智能上一次這么火,或許還是谷歌Alpha Go打敗柯潔的時候。

  有業(yè)內(nèi)人士認為,ChatGPT這一現(xiàn)象級的產(chǎn)品將開啟人工智能產(chǎn)業(yè)的2.0時代,引領(lǐng)新的產(chǎn)業(yè)趨勢。雖然目前市場反應火熱,但從產(chǎn)業(yè)角度來看,ChatGPT的商業(yè)化路徑和安全防護還處于探索初期。

  先別擔心“AI與人是敵是友”的哲學命題,ChatGPT到底能火多久,或許它自己也沒有答案。

  01

  巨頭入場,個人“淘金”

  幾乎同一時刻,谷歌和百度宣布同一件事:要做自己的ChatGPT。

  日前,谷歌CEO桑達爾·皮查伊宣布,公司正在推出一項名為Bard的對話式AI服務,以測試用戶的反饋,隨后將在未來幾周內(nèi)公開發(fā)布。百度也宣布推出國產(chǎn)版“ChatGPT”文心一言,一位接近百度相關(guān)人士向懂經(jīng)哥透露,文心一言落地之后,首站將直接接入百度搜索,“一些相關(guān)功能已陸續(xù)在百度搜索內(nèi)上線或內(nèi)測,包括多答案回復、智能生成等?!?/p>

  ChatGPT主創(chuàng)團隊OpenAI背后的微軟更是乘勝追擊,將GPT—3.5升級版整合進必應搜索、Edge瀏覽器和Office辦公套件中,宣稱比ChatGPT的功能更強大。

  除了搜索巨頭之外,國內(nèi)不少互聯(lián)網(wǎng)企業(yè)也開始涉足以ChatGPT為代表的AIGC(人工智能自動生成內(nèi)容)技術(shù)的垂直領(lǐng)域產(chǎn)品。

  據(jù)悉,阿里巴巴達摩院正在研發(fā)類ChatGPT的對話機器人,目前處于內(nèi)測階段,可能將AI大模型技術(shù)與釘釘深度結(jié)合。360公司在答投資者問時表示,類似的AIGC技術(shù)目前作為內(nèi)部生產(chǎn)力工具使用,計劃盡快推出相關(guān)demo版產(chǎn)品。網(wǎng)易有道AI技術(shù)團隊已聚焦AIGC在教育場景的落地研發(fā),正在AI口語老師、中文作文批改等細分學習場景中嘗試探索。

  懂經(jīng)哥發(fā)現(xiàn),已有“高階玩家”將原生ChatGPT“嫁接”到國內(nèi)互聯(lián)網(wǎng)平臺。一名釘釘資深用戶在公司的運維群創(chuàng)建故障報警應用時,嘗試在“自定義機器人”插件中接入ChatGPT,完成配置后即可自動寫開年規(guī)劃、英文郵件和爬蟲代碼等。

  ChatGPT尚未面向中國市場開放,但國內(nèi)已聚集了一批個人“淘金者”,在公眾號、小程序上搭建ChatGPT的鏡像產(chǎn)品,國內(nèi)用戶在小程序上提問,鏡像連接ChatGPT服務器,再將答案轉(zhuǎn)述給用戶。懂經(jīng)哥親測后發(fā)現(xiàn),該類產(chǎn)品通常可免費試用10次對話,隨后需要充值或開通會員方能繼續(xù),收費標準從10元至300元不等。有媒體推測,有人兩個月以此牟利達數(shù)萬元。

  在國研新經(jīng)濟研究院創(chuàng)始院長朱克力看來,ChatGPT在國內(nèi)的突然爆火,主要是技術(shù)突破和資本參與的雙重結(jié)果,“算法、算力和數(shù)據(jù)是AIGC的‘三駕馬車’,隨著國內(nèi)三方面的技術(shù)沉淀,AIGC已經(jīng)實現(xiàn)了不少落地應用,因此ChatGPT自上線以來在技術(shù)圈層保持活躍的討論度,春節(jié)后資本市場關(guān)注到這一現(xiàn)象后,才實現(xiàn)了面向大眾的‘破圈’?!?/p>

  02

  一場“燒錢”的試驗

  多家科技巨頭紛紛入局,打造自己的“ChatGPT”,這意味著產(chǎn)業(yè)發(fā)展的趨勢正在快速調(diào)整。復旦大學管理學院信息管理與商業(yè)智能系系主任、教授張誠表示,ChatGPT背后技術(shù)并沒有壟斷性,各家都可以做。從技術(shù)創(chuàng)新角度來看,OpenAI推出的ChatGPT屬于集成或漸進性創(chuàng)新,在模型、數(shù)據(jù)和算力上實現(xiàn)了進步,但仍非原始創(chuàng)新。

  實際上,人工智能發(fā)展多年,聊天機器人早已滲透在我們的日常生活中,蘋果的Siri、微軟的小冰、百度的小度等等都屬于聊天機器人范疇。包括去年曾爆火網(wǎng)絡的AI繪畫、AI換臉,和ChatGPT也屬于同一類型應用。

  相似產(chǎn)品不少,ChatGPT的優(yōu)勢在哪?歸結(jié)下來就是“擬人化”和“反應快”兩點。業(yè)內(nèi)人士介紹,這對應了ChatGPT兩方面的特殊性。

  第一,ChatGPT使用了更為通用的NLP(自然語言處理)模型,訓練過的話題包羅萬象,涵蓋人類社會信息的各方各面,而以往智能化應答程度能達到如此高水平的應用大多只聚焦在有限垂直領(lǐng)域;第二,ChatGPT依靠巨大的算力,實現(xiàn)了全內(nèi)容和實時性的平衡。一般來說,以往大部分聊天機器人使用的是輕量化的語言模型,這樣可以保證反應的即時性,完成快速的“你問我答”,但內(nèi)容的質(zhì)量也相應有所下降,而ChatGPT的推理時間可能延長至幾十秒甚至幾分鐘,大型語言模型讓輸出內(nèi)容的質(zhì)量得到了極大的提升。

  這兩點都對聊天機器人的算法模型和訓練數(shù)據(jù)樣本提出了極高的要求。ChatGPT使用的GPT—3.5語言預測模型是此前模型GPT—3的迭代版本。根據(jù)公開信息,GPT—3模型包含的參數(shù)量達1750億,訓練所用的數(shù)據(jù)量達45TB。

  45TB數(shù)據(jù)量是什么概念?一位從業(yè)者向懂經(jīng)哥解釋,1MB相當于一本紅樓夢的數(shù)據(jù)量,1TB為100多萬本紅樓夢的數(shù)據(jù)量,所以ChatGPT相當于至少看過了4500萬本紅樓夢的內(nèi)容。

  正是因為有強大的數(shù)據(jù)和算力支持,ChatGPT才具備了“以假亂真”的對話能力,實現(xiàn)了超越以往的信息總結(jié)能力。再加上其互動感十足的交互設(shè)計,引起了用戶極大的興趣,最終引爆了消費市場。

  大數(shù)據(jù)、大算力并不是一條好走的路,OpenAI至今仍處在劇烈燒錢的狀態(tài)。ChatGPT每回復一次大概要消耗1美分, 2022年OpenAI的整年虧損已經(jīng)高達5.45億美元。國內(nèi)文本智能處理企業(yè)達觀數(shù)據(jù)CEO陳運文表示,看到ChatGPT的橫空出世,他與身邊的從業(yè)者都十分驚訝,因為OpenAI的技術(shù)方向此前并不被業(yè)界看好。成本高昂,產(chǎn)出的文本質(zhì)量也不一定很高,導致包括谷歌在內(nèi)的大部分公司都沒有將這一技術(shù)方向作為首選。

  “但從目前的結(jié)果來看,ChatGPT讓大家看到,大規(guī)模語言模型確實可以勝任復雜的人類工作,接下來的兩三年內(nèi),沿著ChatGPT這條技術(shù)方向會有越來越多的產(chǎn)品出現(xiàn)?!标愡\文說,這款產(chǎn)品可能讓AI產(chǎn)業(yè)發(fā)展大大提速,NLP技術(shù)原本需要十幾年才能實現(xiàn)的目標已變得近在咫尺。

  03

  商業(yè)盈利仍待驗證

  AIGC作為一種賦能千行百業(yè)的技術(shù),一旦突破必將改變現(xiàn)有的商業(yè)生態(tài)。上海人工智能研究院總工程師王資凱向懂經(jīng)哥舉例,國外語法糾正知名應用Grammarly在輔助寫作領(lǐng)域一家獨大,估值最高曾達到130億美元,但由于ChatGPT的出現(xiàn),許多初創(chuàng)公司都可以利用其提供的基礎(chǔ)設(shè)施搭建自己的輔助寫作平臺,Grammarly技術(shù)的獨特性和產(chǎn)品的壟斷性立刻被打破。

  包括前文所提到的,將ChatGPT嵌入到搜索引擎當中,也將改變搜索引擎的服務模式。王資凱預計,有了大語言模型支持后,搜索網(wǎng)頁的內(nèi)容呈現(xiàn)方式將不同,用戶會更直接地接收到信息,用戶使用習慣和搜索引擎的盈利模式都可能發(fā)生變化。

  ChatGPT已經(jīng)開始落地化嘗試,但總體來看,其商業(yè)化進程還處于初期階段。陳運文認為,由于業(yè)界對ChatGPT的看好,此技術(shù)方向目前處于“不差錢”的階段,大家都希望先把產(chǎn)品做出來占領(lǐng)市場,但可持續(xù)的盈利模式仍在探索當中,即使是開發(fā)者OpenAI也不例外。

  具體來看,根據(jù)應用場景的不同,ChatGPT的落地難度也不盡相同。張誠認為,如果將ChatGPT應用到信息總結(jié)、文法糾正、創(chuàng)意寫作方面,落地速度將非常快,OpenAI提供的基礎(chǔ)設(shè)施可以直接使用。但如果應用在對正確率要求較高的場景,比如醫(yī)療問診、商業(yè)咨詢等方面,還需要進一步改善算法在內(nèi)容正確與表達流暢間的平衡。

  “ChatGPT商業(yè)運用的主要挑戰(zhàn)還是其內(nèi)容的真實有效性?!睆堈\說,即使一項AIGC技術(shù)的正確率能達到95%,但對于某些嚴肅應用場景,1%的差錯可能都會導致巨大的決策失誤,企業(yè)可能需要花費比使用AIGC技術(shù)更高的成本去做校對。在這些場景中,目前能使用的AIGC技術(shù)仍是“命題發(fā)揮”,即在有限的、經(jīng)過驗證的知識文本中自動生成內(nèi)容。

  微信截圖_20230217150150.png

  雖然國內(nèi)多家機構(gòu)宣稱推出類ChatGPT產(chǎn)品,但國產(chǎn)版“平替”與ChatGPT的差距依然肉眼可見。

  以360公司為例,由于訓練數(shù)據(jù)源及應用方向的原因,在中文環(huán)境下的實際效果強于GPT—2,與當前流行的ChatGPT—3有著代際差距。與國外同行相比,國內(nèi)在中文語料數(shù)據(jù)資源端有豐富的多模態(tài)大數(shù)據(jù)積累,但在預訓練大模型和多模態(tài)數(shù)據(jù)清洗融合技術(shù)領(lǐng)域存在較大差距。不少互聯(lián)網(wǎng)企業(yè)或許與360公司有著類似的選擇——用充足的資金儲備用于購買大規(guī)模算力,深入自行研發(fā)的同時尋找強有力的合作伙伴,以此來降低技術(shù)壁壘。

  “雖然我國在AI領(lǐng)域已有所成就,但主要集中在應用端,技術(shù)端仍由美國互聯(lián)網(wǎng)巨頭引領(lǐng),目前仍有兩三年的差距?!敝炜肆Ρ硎?,AIGC屬于“養(yǎng)成類”產(chǎn)品,除了技術(shù)外,“喂養(yǎng)”的內(nèi)容也非常關(guān)鍵,我國應用市場廣大、數(shù)據(jù)內(nèi)容豐富,可趁此機會“彎道超車”趕超,“在法律合規(guī)的前提下,如何把握好開放、發(fā)展與安全的平衡,釋放國內(nèi)的數(shù)據(jù)內(nèi)容的潛在價值,值得各方聯(lián)合探索?!?/p>

  04

  既是野獸,也是獵手

  “如同其他人工智能模型一樣,ChatGPT是把雙刃劍,既可以是提升效率的工具,甚至編寫代碼。同時也可能被繞過安全機制,用于實施有害的活動。”奇安信虎符智庫研究員李建平告訴懂經(jīng)哥,對網(wǎng)絡安全行業(yè)來說,以ChatGPT為代表的人工智能工具,既可以用來編寫網(wǎng)絡釣魚、生成惡意軟件、開展網(wǎng)絡攻擊,也能成為網(wǎng)絡防御者的有力工具。

  奇安信人工智能研究院負責人介紹,美國在暗網(wǎng)中發(fā)現(xiàn)了1500多條惡意軟件和驗證代碼中有ChatGPT的身影,甚至還利用惡意代碼對ChatGPT進行“培訓”,以生成可逃避病毒檢測的惡意代碼不同變體,研究人員已經(jīng)確定ChatGPT可以有效生成信息竊取器、遠程訪問木馬和加密貨幣竊取器等。

  此外,ChatGPT還降低了網(wǎng)絡犯罪的門檻,即便是沒有技術(shù)的“小白”,也能成為攻擊者。境外已有網(wǎng)絡釣魚即服務(即服務是一種軟件許可模式)和勒索軟件即服務開始向攻擊者提供收費工具包,使其可以輕松實施攻擊,特別是ChatGPT面向公眾免費開放,網(wǎng)絡攻擊的成本進一步降低。

  目前,國內(nèi)已經(jīng)有多家人工智能研究院成立了ChatGPT項目專班,開展該技術(shù)在網(wǎng)絡安全領(lǐng)域的場景研究和應用,未來將廣泛應用于安全產(chǎn)品開發(fā)、威脅檢測、漏洞挖掘、安全運營及自動化、攻防對抗、反病毒、威脅情報分析和運營、涉網(wǎng)犯罪分析等領(lǐng)域。

  “我們看到ChatGPT相繼被Stack Overflow編程問答社區(qū)、行業(yè)協(xié)會和高?!鈿ⅰ糠衷蚓褪撬匀粫梢恍┨摷馘e誤內(nèi)容,并且難以辨別。”李建平說。遺憾的是,迄今為止ChatGPT自動生成的內(nèi)容依然真假難辨,OpenAI已經(jīng)發(fā)布相關(guān)AI內(nèi)容檢測器,但是識別置信度正確率僅為26%,甚至還會將人類創(chuàng)作文本誤識別為AI創(chuàng)作,“其象征意義比實際意義更大?!?/p>

  網(wǎng)絡上有句戲言:“只有魔法才能打敗魔法”,同理,只有AI才能打敗AI,規(guī)避ChatGPT安全隱患的最好辦法,或許正是它自己。

  “ChatGPT可以在網(wǎng)絡釣魚檢測、漏洞發(fā)現(xiàn)和事件分析與響應三方面提高安全防護力?!崩罱ㄆ奖硎?,ChatGPT能幫助組織識別和標記釣魚郵件,在接收郵件前進行標記,從而降低網(wǎng)絡釣魚成功的機會,同時訓練網(wǎng)絡釣魚檢測系統(tǒng),增強識別相關(guān)的模式和語言,以便提高網(wǎng)絡釣魚檢測系統(tǒng)的效率。另外,隨著ChatGPT人工智能模型的演進,有可能實現(xiàn)漏洞檢測和修復的自動化。更有甚者,ChatGPT還可以在檢測和響應網(wǎng)絡攻擊,更快地從數(shù)據(jù)中創(chuàng)建有關(guān)安全事件的報告,輔助IT團隊做出安全決策。

  “來自人工智能的威脅并不是新問題,只是ChatGPT展示了一些看起來很可怕的應用。”奇安信人工智能研究院負責人表示,關(guān)鍵要及時意識到ChatGPT的潛在風險并及時采取適當?shù)拇胧﹣響獙?。展望未來,ChatGPT也可能是一個信號,表明距離網(wǎng)絡防御決策的更高自動化不再遙遠。


敬請關(guān)注電子技術(shù)應用2023年2月22日==>>商業(yè)航天研討會<<


微信圖片_20230210170337.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。