人A片产无码免费视频看A片,91桃色黄色视频APP下载,亚洲性夜夜时

英偉達(dá)牽頭發(fā)布代碼大模型StarCoder2

日期： 2024-03-06

來源：36Kr

關(guān)鍵詞： 英偉達(dá) 代碼大模型 StarCoder2

生成式人工智能的走紅已經(jīng)持續(xù)了一年多時間，而且大概率會一直熱下去。

不過隨著大眾對于AI的了解越來越深入，有一個事實(shí)也被不少人用段子的形式揭露了出來，“我以為AI是要來幫人類做家務(wù)的，讓我好去寫詩做畫，結(jié)果現(xiàn)在AI來了，AI直接開始寫詩做畫了，我依然在掃地做菜”。

如此調(diào)侃背后指向了當(dāng)下的AI過于“風(fēng)花雪月”，離真正能改變生產(chǎn)力場景太遠(yuǎn)。

當(dāng)然，目前并不是所有的AI大模型廠商都在文生圖、文生視頻賽道狂奔。

日前有消息顯示，英偉達(dá)聯(lián)合知名AI開源社區(qū)Hugging Face和ServiceNow，發(fā)布了名為StarCoder2的LLMs系列模型，并希望成為代碼生成領(lǐng)域的新標(biāo)準(zhǔn)。

據(jù)悉，LLMs系列系列模型包括一個由ServiceNow訓(xùn)練的30億參數(shù)模型、一個由Hugging Face訓(xùn)練的70億參數(shù)模型，以及一個由英偉達(dá)訓(xùn)練的150億參數(shù)模型。

據(jù)悉，StarCoder2經(jīng)過了619門編程語言的訓(xùn)練，可執(zhí)行源代碼生成、工作流生成、文本摘要等專業(yè)任務(wù)。英偉達(dá)對此表示，開發(fā)人員可以利用它進(jìn)行代碼補(bǔ)全、高級代碼總結(jié)、代碼片段檢索等，從而提高工作效率。

并且值得一提的是，該模型將在BigCode Open RAIL-M許可證的基礎(chǔ)上以開放訪問的方式發(fā)布，以允許免版稅分發(fā)。與現(xiàn)階段沒有用例限制的傳統(tǒng)開源軟件不同，BigCode在發(fā)布模型時附帶了一個負(fù)責(zé)任的人工智能模型許可證，限制其被用于生成或分發(fā)惡意代碼以損害電子系統(tǒng)。

在GitHub Copilot之后，終于又出現(xiàn)了一個真正意義上的代碼生成大模型。那么，這一次人人都能是程序員的時代要來了嗎？當(dāng)然不是，且不提StarCoder2并有沒有夸大宣傳，即便StarCoder做到了它所宣稱的一切，上限也只不過是一個程序員的助手，而非代替程序員。這與Midjourney、Stable Diffusion在一定程度上代替畫家，有著本質(zhì)的區(qū)別。

目前StarCoder2的技術(shù)文檔并沒有公開，但從它的上一代產(chǎn)品StarCoder就能一窺該LLMs系列模型的特質(zhì)。作為將大語言模型集成至編程領(lǐng)域代表的StarCoder，其訓(xùn)練模式與傳統(tǒng)的大語言模型并沒有什么區(qū)別，無非就是訓(xùn)練ChatGPT、文心一言這類大模型主要是使用各種文字內(nèi)容，而StarCoder的語料則是代碼。

這也就意味著StarCoder與ChatGPT、文心一言沒有本質(zhì)上的區(qū)別，前者更像是一個專精于細(xì)分場景的大模型，而這一類代碼大模型目前能做到的就是自動補(bǔ)全代碼、根據(jù)指令修改代碼，以及用自然語言解釋代碼片段等任務(wù)。

要知道，目前一眾大語言模型最大的命門就是缺乏自我糾正的能力，無論是作為AI聊天機(jī)器人的ChatGPT、文生圖的Stable Diffusion，還是文生視頻的Sora都無法規(guī)避幻覺，它們可能會生成一大段不同風(fēng)格天馬行空般的囈語。如今能看到的用ChatGPT作詩、用Stable Diffusion作畫，乃至用Sora生成視頻，其實(shí)都離不開人來篩選和修正其中可用的一段。而這背后的含義，就是目前的AIGC還不是智能體、更不是AGI，而像是一種對于人類輸出能力的模仿。

以目前應(yīng)用AIGC最為成熟的游戲美術(shù)領(lǐng)域?yàn)槔?，游戲廠商通常采用的工作流是用AI出一個底稿，然后由人工來增加細(xì)節(jié)、并糾偏，再將修改過的畫面重新輸入AI大模型，然后重復(fù)多次，直至打磨出能用的作品。指望AI一次就做成可以商用的圖片，至少現(xiàn)階段是不現(xiàn)實(shí)的一件事。然而這樣的工作模式放在編程領(lǐng)域就不那么好使了，因?yàn)槭褂肧tarCoder2其實(shí)就相當(dāng)于是接手別人的代碼、并debug。

但這幾乎可以說是程序員最不喜歡做的事情之一，特別是沒有注釋的代碼。因?yàn)槟悴豢赡芮逦髁说亓私馑舜a的整體設(shè)計思想及理念，所以能讓代碼跑起來就已經(jīng)不錯了，再加上缺失了相關(guān)注釋，debug簡直就是一件災(zāi)難性的工作。因此如今即便已經(jīng)是程序員的用戶，對于代碼模型的使用都很謹(jǐn)慎，基本也不會考慮直接用大模型生成用于生成環(huán)境的代碼。

至于說有了StarCoder2人人都能成為程序員，這就更難實(shí)現(xiàn)了。用自然語言生成代碼其實(shí)早在GitHub的Copilot Chat上就已經(jīng)實(shí)現(xiàn)，可又多少人僅僅靠著Copilot Chat就能敲開程序員生涯的大門呢？其實(shí)編程是一門與計算機(jī)對話的學(xué)問，C++、Java、PHP等語言則是代碼世界的“英語”、“漢語”、“法語”。但程序員真正的競爭力并不是代碼編得又快又好，而是能否把現(xiàn)實(shí)世界中的需求，清晰地翻譯到抽象的觀念世界。

這種能力，就是產(chǎn)品經(jīng)理與開發(fā)這兩大互聯(lián)網(wǎng)公司中常見職位的標(biāo)志性差異，而沒有受過計算機(jī)科學(xué)培訓(xùn)的人最缺乏的往往就是抽象能力。不過盡管程序員暫時還不需要像畫師一般擔(dān)憂自己的工作馬上就會被AI搶走，可StarCoder2等代碼大模型的出現(xiàn)，就代表著相關(guān)廠商一直在嘗試削弱程序員群體的議價權(quán)，這顯然不是一個好兆頭。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

英偉達(dá)牽頭發(fā)布代碼大模型StarCoder2

日期： 2024-03-06

來源：36Kr

相關(guān)內(nèi)容