2月8日,在中國移動的助力下,中國石油高效完成DeepSeek V3/R1全棧國產(chǎn)化的訓推適配和私有化部署。此次部署,基于DeepSeek的關鍵技術點,開展了系列基礎模型算法創(chuàng)新,實現(xiàn)了從底層芯片到框架、模型的全棧自主可控,為推動人工智能技術在能源化工領域的深度應用與國產(chǎn)AI技術生態(tài)的規(guī)?;涞刈⑷肓藦姶髣恿?。
一直以來,中國移動與中國石油兩大央企積極響應國家人工智能戰(zhàn)略,努力推動 “人工智能 +” 在能源化工行業(yè)落地生根。此前,中國移動攜手中國石油發(fā)布能源化工領域首個行業(yè)大模型——700億參數(shù)昆侖大模型,助力中國石油打造“五個一”:建設一個央企領先的算力中心,一個集中統(tǒng)一AI中臺,一套高質量行業(yè)數(shù)據(jù)集,一套國內(nèi)領先的行業(yè)大模型、一系列創(chuàng)新應用。
面對中國石油多模態(tài)、超百億參數(shù)的大模型訓練任務需求,移動云憑借強大的算力網(wǎng)絡能力,實現(xiàn)了資源的快速響應、彈性擴展及高質量供給。通過為中國石油構建“算力泛在、算網(wǎng)共生、智能敏捷、安全可靠、綠色低碳”的一體化算力體系,移動云已提供超過1000P的穩(wěn)定算力資源,為大模型的建設和運行提供了堅實的算力保障。
為了使DeepSeek系列模型在昆侖大模型原有的框架下,獲得更好的適配效果和執(zhí)行性能,中國移動第一時間開展相關的分析、適配與創(chuàng)新工作。中國移動通過配置化開發(fā),在DeepSeek V3模型基礎上快速實現(xiàn)了自定義模型參數(shù)和規(guī)模的針對性優(yōu)化。團隊在不實際啟動集群訓練任務的情況下,僅通過單卡即模擬出集群中所有卡的內(nèi)存占用情況,從而制定整體的集群分布式訓練策略。
中國移動復現(xiàn)并優(yōu)化了DeepSeek MTP多Tokens預測功能,通過DeepSeek-V3/R1主模型和MTP Module的分布式調(diào)度,實現(xiàn)一次解碼生成多個Token,并通過使整圖編譯功能,組合計算圖的通用算子,實現(xiàn)自動融合加速,提升DeepSeek-V3/R1端到端的推理性能。
此次DeepSeek大模型的成功部署,為中國政企客戶實現(xiàn)DeepSeek V3/R1全棧國產(chǎn)化的訓推適配和部署提供了重要參考。它也為中國石油昆侖大模型優(yōu)化應用效果、縮短研發(fā)周期、構建健康生態(tài)提供了新引擎,推動“數(shù)智中國石油”建設步入快車道。
在應用層面,昆侖大模型的問答應用“行業(yè)大家”目前已新增DeepSeek深度推理能力。用戶在使用該應用時,除了可以得到昆侖大模型生成的能源化工領域專業(yè)問答結果,還能選擇“深度思考”模式,體驗知識推理、場景理解等AI服務。
在模型層面,昆侖大模型的AI中臺模型廣場目前已上線DeepSeek-V3與DeepSeek-R1模型版本,并實現(xiàn)全尺寸適配,用戶可基于AI中臺調(diào)用DeepSeek模型API服務,并使用AI中臺組件及工具構建智能體,以滿足不同場景的需求。
未來,中國移動與中國石油將繼續(xù)攜手共進,在油氣勘探開發(fā)、煉油化工、油氣銷售、工程建設等核心業(yè)務領域深入挖掘AI潛力,以新質生產(chǎn)力為中國式現(xiàn)代化建設貢獻力量。