6月18日,2025 MWC上海期間,中興通訊聯(lián)合中國移動(浙江)創(chuàng)新研究院發(fā)布了面向垂直行業(yè)應(yīng)用場景的全新人工智能大模型——星云視頻多模態(tài)大模型NebulaVideo。中興通訊副總裁陸平、中國移動(浙江)創(chuàng)新研究院研發(fā)副總監(jiān)陳建忠出席發(fā)布儀式。
中興通訊、中國移動通信集團(tuán)浙江有限公司在2023年12月成立聯(lián)合信創(chuàng)實驗室,充分發(fā)揮各自技術(shù)與資源優(yōu)勢,持續(xù)深化合作,推動人工智能技術(shù)創(chuàng)新,深度賦能產(chǎn)業(yè)應(yīng)用。此次雙方聯(lián)合發(fā)布的NebulaVideo大模型聚焦多模態(tài)認(rèn)知,以領(lǐng)先的視頻理解技術(shù),驅(qū)動交通、工業(yè)、電力、政務(wù)等領(lǐng)域的智能應(yīng)用落地。通過公開數(shù)據(jù)集測試表明,NebulaVideo的視頻理解及時空定位綜合能力達(dá)到業(yè)界頂尖水平,在事件因果關(guān)系推理、取證、溯源等行業(yè)共性場景需求下更實用、更好用,為AI賦能千行百業(yè)提供更多可能。
中興通訊產(chǎn)業(yè)數(shù)字化方案總監(jiān)李深在發(fā)布會上進(jìn)行了《強(qiáng)化理解動態(tài)世界,深度賦能產(chǎn)業(yè)應(yīng)用》的主題演講,詳細(xì)介紹了NebulaVideo模型的能力與應(yīng)用前景。
萬物互聯(lián)時代,視頻數(shù)據(jù)高速增長,人工智能逐漸成為高效處理分析視頻數(shù)據(jù)的必選方案,然而傳統(tǒng)AI視覺模型對視頻多模態(tài)數(shù)據(jù)處理能力有限,無法真正理解視頻的內(nèi)涵,難以覆蓋復(fù)雜行業(yè)場景的需求。NebulaVideo面向行業(yè)真實需求,對通用多模態(tài)大模型的技術(shù)架構(gòu)進(jìn)行了針對性創(chuàng)新改進(jìn),實現(xiàn)了時空統(tǒng)一建模,具備長達(dá)1小時的超長視頻快速推理、15分鐘長視頻的深度思考能力。模型支持事件識別、動作定位、目標(biāo)追蹤等視頻理解常見任務(wù),新垂類應(yīng)用場景下只需少量樣本微調(diào)即可滿足商用落地要求,極大地增加了大模型的落地實用性。
在落地形態(tài)方面,NebulaVideo模型與中國移動(浙江)創(chuàng)新研究院九天智算一體機(jī)產(chǎn)品進(jìn)行了適配,通過軟硬一體化交付實現(xiàn)行業(yè)視頻理解MaaS服務(wù)開箱即用。
中興通訊作為科技領(lǐng)軍企業(yè),積極響應(yīng)國家“人工智能+”戰(zhàn)略,攜手合作伙伴致力于推動數(shù)智化技術(shù)的持續(xù)創(chuàng)新以及與行業(yè)場景的深度融合,以AI技術(shù)賦能實體經(jīng)濟(jì),共贏數(shù)智未來。