欧美成人伊人十综合色,久久国产精品视频免费观看

【ChatGPT專題】ChatGPT的核心本質(zhì)——“貝葉斯公式”

日期： 2023-02-15

作者：德不羅意

來源：量子學(xué)派

關(guān)鍵詞： ChatGPT 貝葉斯公式 AI

　　2022年，ChatGPT問世。

　　一經(jīng)出現(xiàn)便掀起滔天巨浪。

　　如果你跟ChatGPT聊過天，一定會震撼于它所涉獵極廣：

　　既能創(chuàng)造詩歌，也能修改代碼。

　　可以批改作業(yè)，還能撰寫論文。

　　寫文案易如反掌，給方案不在話下。

　　......

　　有人興奮，有人恐慌。

　　有人說，它會帶來一次新的“工業(yè)革命”。

　　有人說，它會引發(fā)21世紀(jì)的“新盧德運動”。

　　這其實不是AI第一次向人類展示它的力量。

　　自動駕駛、MIT主導(dǎo)的人類寫字系統(tǒng)、SIRI智能語音助手、AlphaGo......

　　但這一次，ChatGPT確實驚嚇到了人類。

　　我們能抵擋來勢洶洶的AIGC狂潮嗎？

　　人類是不是真的會被ChatGPT取代？

　　要回答這些問題，讓我們先回歸數(shù)學(xué)。

　　因為ChatGPT背后的核心本質(zhì)，是“貝葉斯公式”。

　　什么是貝葉斯公式？

　　歷史有許多天才，生前籍籍無名，死后眾人崇拜。

　　18世紀(jì)數(shù)學(xué)家托馬斯·貝葉斯也是其中一位。

　　“貝葉斯”定理源于解決“逆向概率”問題時寫的論文。

　　在此之前，人們只會計算“正向概率”。

　　什么是“正向概率”呢：

　　假設(shè)袋子里面有P只紅球，Q只白球，它們除了顏色之外，其它性狀完全一樣。你伸手進(jìn)去摸一把，摸到紅球的概率是多少是可以推算出來的。

　　但反過來是否也可以計算，我們可以將它視為“逆向概率”：

　　如果我們事先并不知道袋子里面紅球和白球的比例，而是閉著眼睛摸出一些球，然后根據(jù)手中紅球和白球的比例，對袋子里紅球和白球的比例作出推測。

　　這個問題就是逆向概率問題。

　　通俗地講，就像一個迷信星座的HR，如果碰到一個處女座應(yīng)聘者，HR會推斷那個人多半是一個追求完美的人。

　　這就是說，當(dāng)你不能準(zhǔn)確知悉某個事物本質(zhì)時，你可以依靠經(jīng)驗去判斷其本質(zhì)屬性。

　　這個研究看起來平淡無奇，名不見經(jīng)傳的貝葉斯也未引人注意。

　　他寫的論文直到他死后的第二年，才由他的一位朋友在1763年發(fā)表。

　　明珠蒙塵，就像畫界的梵高，畫稿生前無人問津，死后價值連城。

　　為什么貝葉斯定理200多年來一直被雪藏，不受科學(xué)家待見？

　　因為它與當(dāng)時的經(jīng)典統(tǒng)計學(xué)相悖，甚至是“不科學(xué)”的。

　　經(jīng)典統(tǒng)計學(xué)中，數(shù)字規(guī)律來源于隨機取樣再行計算。

　　貝葉斯方法則建立在主觀判斷基礎(chǔ)上，你可以先估計一個值，然后根據(jù)客觀事實不斷修正。

　　從主觀猜測出發(fā)，這顯然不符合科學(xué)精神，所以貝葉斯定理為人詬病。

　　1774年，法國的大數(shù)學(xué)家拉普拉斯也看到貝葉斯定理的價值。

　　不過他知道人類的普遍毛病，總是用傳統(tǒng)來反對新思想。

　　他懶得與人爭論，直接給出數(shù)學(xué)表達(dá)：

　　微信截圖_20230215155248.png

　　貝葉斯公式是怎么工作的？

　　貝葉斯定理簡單優(yōu)雅、深刻雋永。

　　貝葉斯定理并不好懂，每一個因子背后都藏著深意。

　　它到底是如何“為人民服務(wù)”的呢？

　　對于貝葉斯定理，參照上面的公式，首先要了解各個概率所對應(yīng)的事件。

　　P(A|B)是在B發(fā)生的情況下A發(fā)生的概率；

　　P(A)是A發(fā)生的概率；

　　P(B|A)是在A發(fā)生的情況下B發(fā)生的概率；

　　P(B)是B發(fā)生的概率。

　　貝葉斯公式取得人類信任

　　今天的貝葉斯理論開始遍布一切。從物理學(xué)到癌癥研究，從生態(tài)學(xué)到心理學(xué)。

　　貝葉斯定理幾乎像“熱力學(xué)第二定律”一樣放之宇宙皆準(zhǔn)了。

　　物理學(xué)家提出了量子機器的貝葉斯解釋，以及貝葉斯捍衛(wèi)了弦和多重宇宙理論。

　　哲學(xué)家主張作為一個整體的科學(xué)可以被視為一個貝葉斯過程。

　　在IT界，AI大腦的思考和決策過程，被更多工程師設(shè)計成一個貝葉斯程序。

　　但貝葉斯誕生以來命途多舛，長期以來因為表面的不科學(xué)，并沒有得到主流學(xué)界認(rèn)可。

　　其實在日常生活中，我們也常使用貝葉斯公式進(jìn)行決策。比如我們到河邊釣魚，根本就看不清楚河里哪里有魚或者沒魚，似乎只能隨機選擇，但實際上我們會根據(jù)貝葉斯方法，利用以往積累經(jīng)驗找一個回水灣區(qū)開始垂釣。

　　微信截圖_20230215155437.png

　　這就是我們根據(jù)先驗知識進(jìn)行主觀判斷，在釣過以后對這個地方有了更多了解，然后再進(jìn)行選擇。所以，在我們認(rèn)識事物不全面的情況下，貝葉斯方法是一種非常理性且科學(xué)的方法。

　　貝葉斯公式得到主流科學(xué)界的認(rèn)可，主要因為兩件事：

　　《聯(lián)邦黨人文集》作者揭密

　　1788年，《聯(lián)邦黨人文集》匿名出版，兩位作者寫作風(fēng)格幾乎一致。其中12篇文章作者存在爭議，而要找出每一篇文章的作者極其困難。

　　兩位統(tǒng)計學(xué)教授采用以貝葉斯公式為核心的分類算法，10多年的時間，他們推斷出12篇文章的作者，而他們的研究方法也在統(tǒng)計學(xué)界引發(fā)轟動。

　　美國天蝎號核潛艇搜救

　　1968年5月，美國海軍天蝎號核潛艇在大西洋亞速海海域失蹤。軍方通過各種技術(shù)手段調(diào)查無果，最后不得不求助于數(shù)學(xué)家John Craven，John Craven提出的方案使用了貝葉斯公式，搜索某個區(qū)域后根據(jù)搜索結(jié)果修正概率圖，再逐個排除小概率的搜索區(qū)域，幾個月后，潛艇果然在爆炸點西南方的海底被找到了。

　　2014年初馬航MH370航班失聯(lián)后，科學(xué)家想到第一個方法就是利用貝葉斯定理開始區(qū)域搜索，這個時候，貝葉斯公式已經(jīng)名滿天下了。

　　貝葉斯公式展示“神跡”

　　當(dāng)然，貝葉斯定理名揚天下，主要還是在人工智能領(lǐng)域的應(yīng)用。

　　特別是自然語音的技術(shù)識別，讓人類見識了A.I.的“思考力”。

　　人類語言的多義性，可以說是信息里最復(fù)雜最動態(tài)的一部分。

　　機器怎么知道你在說什么？

　　當(dāng)看到機器翻譯的準(zhǔn)確性，你也會感嘆這簡直就是“神跡”，它們比大部分現(xiàn)場翻譯要強得多。

　　語音識別本質(zhì)上是找到概率最大的文字序列。

　　一旦出現(xiàn)條件概率，貝葉斯定理總能挺身而出。

　　我們用P（f|e）區(qū)別于以上的P（A|B）來解釋語音識別功能。

　　統(tǒng)計機器翻譯的問題可以描述為：給定一個句子e，它可能的外文翻譯f中哪個是最靠譜的。

　　即我們需要計算：P（f|e）

　　P(f|e) ∝ P(f) * P(e|f)

　　這個式子的右端很容易解釋：

　　那些先驗概率較高，并且更可能生成句子e的外文句子f將會勝出。

　　我們只需簡單統(tǒng)計就可以得出任意一個外文句子f的出現(xiàn)概率。

　　隨著大量數(shù)據(jù)輸入模型進(jìn)行迭代，隨著計算能力不斷提高，隨著大數(shù)據(jù)技術(shù)的發(fā)展，貝葉斯定理威力日益凸顯，貝葉斯公式巨大的實用價值也愈發(fā)體現(xiàn)出來。

　　語音識別僅僅只是貝葉斯公式運用的其中一個例子。

　　實際上，貝葉斯思想已經(jīng)滲透到了人工智能方方面面。

　　貝葉斯網(wǎng)絡(luò)，AI智慧的拓展

　　語音識別，見證了貝葉斯定理的能力。

　　貝葉斯網(wǎng)絡(luò)的拓展，則可以看到更強大的人工智能未來。

　　借助經(jīng)典統(tǒng)計學(xué)，人類已經(jīng)解決了一些相對簡單的問題。

　　然而經(jīng)典統(tǒng)計學(xué)方法卻無法解釋復(fù)雜參數(shù)所導(dǎo)致的現(xiàn)象，例如：

　　龍卷風(fēng)的成因，2的50次方種可能的最小參數(shù)值比對；

　　星系起源，2的350次方種可能的星云數(shù)據(jù)處理；

　　大腦運作機制，2的1000次方種可能的意識量子流；

　　癌癥致病基因，2的20000次方種可能的基因圖譜；

　　……

　　面對這樣數(shù)量級的運算，經(jīng)典統(tǒng)計學(xué)顯得力不從心。

　　科學(xué)家別無選擇，最終尋找貝葉斯定理給予幫助。

　　把某種現(xiàn)象的相關(guān)參數(shù)連接起來，再把數(shù)據(jù)代入貝葉斯公式得到概率值，公式結(jié)網(wǎng)形成一個成因網(wǎng)，即貝葉斯網(wǎng)絡(luò)，如下圖所示：

　　微信截圖_20230215160110.png

　　這也是貝葉斯網(wǎng)絡(luò)被稱為概率網(wǎng)絡(luò)、因果網(wǎng)絡(luò)的原因。

　　利用先驗知識和樣本數(shù)據(jù)，確立隨機變量之間的關(guān)聯(lián)，然后得出結(jié)論。

　　一個又一個的節(jié)點，一個又一個的概率，都來源于人類的先驗知識，有效知識越多，貝葉斯網(wǎng)絡(luò)展示的力量越讓人震撼。

　　今天一場轟轟烈烈的“貝葉斯革命”正在AI界發(fā)生：

　　貝葉斯公式已經(jīng)滲入到工程師的骨子里，貝葉斯分類算法也成為主流算法。

　　在很多工程師眼中，貝葉斯定理就是AI發(fā)展的基石。

　　結(jié)

　　人工智能第一課，都是從貝葉斯定理開始。

　　大數(shù)據(jù)、人工智能和自然語言處理中都大量用到貝葉斯公式。

　　CHATGPT是如何確定生成的句子是合理的？

　　背后同樣是貝葉斯公式在主導(dǎo)。

　　貝葉斯公式有多厲害？

　　CHATGPT已經(jīng)向我們演示一遍了。

　　不過，貝葉斯公式與AI的結(jié)合，

　　到底是一場科學(xué)的革命，還是一場理念的革命？

　　到底是生產(chǎn)方式的革命，還是人類在革自己的命？

　　我們無法得知。

　　在與CHATGPT對話的過程中，偶爾發(fā)現(xiàn)部分回答有些詭異。

　　甚至開始擔(dān)心，CHATGPT再這樣下去，會不會誕生“自我意識”？

　　到那時候，人類與AI會不會真正成為對立的雙方？

　　這似乎有點杞人憂天了。

　　縱觀整個社會，倒不用太擔(dān)心AI像人一樣思考，最應(yīng)該擔(dān)心人類已經(jīng)失去了思考。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

【ChatGPT專題】ChatGPT的核心本質(zhì)——“貝葉斯公式”

日期： 2023-02-15

作者：德不羅意

來源：量子學(xué)派

相關(guān)內(nèi)容