3 月 5 日消息,武漢人工智能研究院聯(lián)合中國科學(xué)院自動化研究所自主研發(fā)的“紫東太初”大模型已迭代到 2.0 版本,根據(jù)官方最新消息,“紫東太初 3.0”將于今年上半年發(fā)布。
據(jù)湖北日報報道,武漢人工智能研究院院長王金橋介紹:“上半年,我們將發(fā)布‘紫東太初’3.0,進一步提升大模型對千行百業(yè)的賦能能力。借力相關(guān)研究,院方與東風(fēng)汽車、光庭信息在智能駕駛領(lǐng)域的合作已全面展開?!?/p>
據(jù)IT之家此前報道,紫東太初第一代 AI 大模型于 2021 年發(fā)布,由中國科學(xué)院自動化研究所和華為聯(lián)合開發(fā),號稱是“全球首個千億參數(shù)多模態(tài)大模型”。
區(qū)別于當(dāng)前以文本為主的大部分語言大模型,“紫東太初”大模型在研發(fā)之初即以多模態(tài)技術(shù)為核心,利用圖-音-文等更多類型數(shù)據(jù)進行跨模態(tài)的統(tǒng)一表征和學(xué)習(xí),實現(xiàn)了圖像、文本、語音三模態(tài)數(shù)據(jù)間的“統(tǒng)一表示”與“相互生成”。
紫東太初 2.0 于 2023 年 6 月發(fā)布,基于華為全棧國產(chǎn)化軟硬件平臺昇騰 AI 與昇思 MindSpore,相比第一代著力提升了決策與判斷能力,在文本、圖片、音頻的基礎(chǔ)上,“紫東太初”2.0 可融入 3D、視頻、傳感信號等更多模態(tài)數(shù)據(jù),并優(yōu)化語音、視頻和文本的融合認(rèn)知以及常識計算等功能。
報道稱,升級到 3.0 版本,大模型將在各項性能優(yōu)化的基礎(chǔ)上,具備自主選擇、使用工具的能力,滿足更深層次的邏輯交互需要。
針對智能駕駛,“紫東太初”將大幅縮短、優(yōu)化其訓(xùn)練過程。通過大語言模型和多模態(tài)能力,大模型可以替代海量的人工,完成汽車、信號燈、路標(biāo)等數(shù)據(jù)的自動標(biāo)注,大幅提升智能汽車感知世界的效率。
同時,“紫東太初”接入汽車后,能夠更深層次地學(xué)習(xí)、理解駕駛目標(biāo)和意圖,快速將環(huán)境信息翻譯成設(shè)備能讀懂的語言,并預(yù)測未來幾秒內(nèi)的情況,提前向汽車下達合適指令。