《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動(dòng)態(tài) > 智源人工智能研究院推出大模型全家桶

智源人工智能研究院推出大模型全家桶

2024-06-18
來源:澎湃新聞

6月14日,2024北京智源大會(huì)在中關(guān)村展示中心開幕,北京智源人工智能研究院(簡(jiǎn)稱智源研究院)推出大模型“全家桶”。

0.png

智源研究院院長(zhǎng)王仲遠(yuǎn)表示,現(xiàn)階段語言大模型的發(fā)展已經(jīng)具備了通用人工智能非常核心的理解和推理能力,并且形成了一條以語言大模型為核心對(duì)齊和映射其他模態(tài)的技術(shù)路線,從而讓模型具備了初步的多模態(tài)理解和生成能力。但這并不是讓人工智能感知、理解物理世界的終極技術(shù)路線,而是應(yīng)該采取統(tǒng)一模型的范式,實(shí)現(xiàn)多模態(tài)的輸入和輸出,讓模型具備原生的多模態(tài)擴(kuò)展能力,向世界模型演進(jìn)。未來,大模型將以數(shù)字智能體的形態(tài)與智能硬件融合,以具身智能的形態(tài)從數(shù)字世界進(jìn)入物理世界,同時(shí),大模型這一技術(shù)手段可為科學(xué)研究提供新的知識(shí)表達(dá)范式,加速人類對(duì)微觀物理世界規(guī)律的探索與研究突破,不斷趨近通用人工智能的終極目標(biāo)。

智源研究院此次推出的大模型“全家桶”,包括智源多模態(tài)大模型、具身智能大模型、生物計(jì)算大模型等。

針對(duì)大模型訓(xùn)練算力消耗高的問題,智源研究院和中國電信人工智能研究院(TeleAI)基于模型生長(zhǎng)和損失預(yù)測(cè)等關(guān)鍵技術(shù),聯(lián)合研發(fā)并推出全球首個(gè)低碳單體稠密萬億語言模型Tele-FLM-1T。該模型與百億級(jí)的52B版本、千億級(jí)的102B版本共同構(gòu)成Tele-FLM系列模型。Tele-FLM系列模型僅以業(yè)界普通訓(xùn)練方案9%的算力資源,基于112臺(tái)A800服務(wù)器,用4個(gè)月完成3個(gè)模型總計(jì)2.3T tokens的訓(xùn)練,訓(xùn)練出萬億稠密模型Tele-FLM-1T。

針對(duì)大模型幻覺等問題,智源研究院自主研發(fā)了通用語義向量模型BGE(BAAI General Embedding)系列,基于檢索增強(qiáng)RAG技術(shù),實(shí)現(xiàn)數(shù)據(jù)之間精準(zhǔn)的語義匹配,支持大模型調(diào)用外部知識(shí)的調(diào)用。

行業(yè)現(xiàn)有的多模態(tài)大模型多為對(duì)于不同任務(wù)而訓(xùn)練的專用模型,例如Stable Diffusion之于文生圖,Sora之于文生視頻,GPT-4V之于圖生文。每類模型都有對(duì)應(yīng)的架構(gòu)和方法,例如對(duì)于視頻生成,行業(yè)普遍參照Sora選擇了DiT架構(gòu)。但是現(xiàn)有模型的能力多為單一分散的能力組合,而不是原生的統(tǒng)一能力,例如目前Sora還做不到圖像和視頻的理解。為了實(shí)現(xiàn)多模態(tài)、統(tǒng)一、端到端的下一代大模型,智源研究院推出Emu3原生多模態(tài)世界模型,采用智源自研多模態(tài)自回歸技術(shù)路徑,在圖像、視頻、文字上聯(lián)合訓(xùn)練,使模型具備原生多模態(tài)能力,實(shí)現(xiàn)圖像、視頻、文字的統(tǒng)一輸入和輸出。

在具身大模型方面,對(duì)于具身智能通用抓取能力,智源針對(duì)跨任意形狀和材質(zhì)的泛化難題,突破95%的真機(jī)實(shí)驗(yàn)成功率,實(shí)現(xiàn)商業(yè)級(jí)動(dòng)作執(zhí)行水平。借助這項(xiàng)技術(shù),即使在復(fù)雜光線透射、反射的情況下,機(jī)器人依然能準(zhǔn)確感知透明、高反光物體的形狀和姿態(tài),并預(yù)測(cè)出高成功率的抓取位姿。

在分級(jí)具身大模型系統(tǒng)方面,智源研發(fā)了能夠從失敗中重思考、再嘗試的鉸接物體操作大模型系統(tǒng)SAGE。該系統(tǒng)結(jié)合三維視覺小模型對(duì)空間幾何的精確感知能力和通用圖文大模型的通用物體操作知識(shí),使大模型驅(qū)動(dòng)的機(jī)器人能夠在任務(wù)執(zhí)行失敗時(shí)重新思考并再次嘗試新的交互方式,實(shí)現(xiàn)傳統(tǒng)機(jī)器人技術(shù)無法企及的智能性和魯棒性。此外,智源研究院探索了生成式人工智能在分子生物學(xué)中的應(yīng)用,推出全原子生物分子模型OpenComplex 2,以及實(shí)時(shí)孿生心臟計(jì)算模型。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。