加速 AI 算法,實(shí)現(xiàn)多場(chǎng)景應(yīng)用
全國(guó)產(chǎn) AI 計(jì)算平臺(tái)解決方案搭載飛騰高性能處理器和比特大陸最新深度學(xué)習(xí)加速卡,基于寶德 AI 服務(wù)器進(jìn)行架構(gòu),計(jì)算性能業(yè)界領(lǐng)先,特別適用于超大運(yùn)算規(guī)模的深度神經(jīng)網(wǎng)絡(luò)的推理運(yùn)算,可實(shí)現(xiàn)對(duì)諸如視頻結(jié)構(gòu)化、人臉識(shí)別、物品識(shí)別、視頻內(nèi)容增強(qiáng)等典型的 AI 運(yùn)算進(jìn)行加速。例如,接收采集前端傳送的視頻流與圖片流等信息,利用人工智能算法進(jìn)行智能分析,進(jìn)而將分析結(jié)果傳遞給下一環(huán)節(jié)的應(yīng)用平臺(tái)進(jìn)行處理,以實(shí)現(xiàn)基于 AI 的場(chǎng)景業(yè)務(wù)應(yīng)用。
典型方案組網(wǎng)示意圖
全國(guó)產(chǎn) AI 計(jì)算平臺(tái)解決方案適合用在基于深度學(xué)習(xí)技術(shù)實(shí)現(xiàn)的各種 AI+行業(yè)場(chǎng)景的 AI 加速推理,包括互聯(lián)網(wǎng)、智慧警務(wù)、智慧交通、智慧城市、智慧社區(qū)、智慧零售、工業(yè)智能、智慧醫(yī)療等 AI+落地場(chǎng)景。
多樣化應(yīng)用場(chǎng)景
四大優(yōu)勢(shì)賦能千行萬(wàn)業(yè)
飛騰聯(lián)合寶德和比特大陸推出的全國(guó)產(chǎn) AI 計(jì)算平臺(tái)解決方案,具有自主安全、性能領(lǐng)先、工具鏈完善、業(yè)務(wù)全流程加速四大鮮明優(yōu)勢(shì),為各行各業(yè)搭上 AI 快車充分賦能。
自主安全
飛騰 CPU 處理器和比特大陸算豐 TPU 處理器都是自主研發(fā)的芯片,具備完整的自主知識(shí)產(chǎn)權(quán)和后續(xù)迭代開發(fā)能力,可以對(duì)各類項(xiàng)目提供長(zhǎng)期安全可靠的最底層硬件資源支撐。
性能領(lǐng)先
該解決方案搭載的飛騰 FT-2000+/64 處理器是飛騰面向高性能服務(wù)器領(lǐng)域的產(chǎn)品,實(shí)測(cè)性能達(dá)到了國(guó)際主流服務(wù)器 CPU 同等水平,填補(bǔ)了國(guó)產(chǎn)高端通用 CPU 領(lǐng)域的空白,是中國(guó)首款自主設(shè)計(jì)的 64 核通用 CPU,也是國(guó)際上首款兼容 ARMv8 指令集的 64 核通用 CPU。
比特大陸 SC5+ 人工智能加速卡是基于 BM1684 芯片的第三代量產(chǎn)產(chǎn)品,成熟度穩(wěn)定度更高。該加速卡同時(shí)支持 FP32 和 INT8 等多種精度計(jì)算,SC5+ 三芯片卡可提供強(qiáng)勁的近 100 路視頻硬解碼能力,內(nèi)存容量可達(dá) 36GB/48GB,單卡配置 96MB 高速緩存 SRAM,小尺寸模型計(jì)算可大幅提速,多項(xiàng)指標(biāo)在國(guó)內(nèi)同類產(chǎn)品中居首,在同等運(yùn)算數(shù)精度下的計(jì)算性能超越國(guó)際同類主流產(chǎn)品。
搭載飛騰 FT-2000+/64、比特大陸 SC5+ 人工智能加速卡的寶德高性能 AI 服務(wù)器,具備業(yè)界領(lǐng)先的高算力密度、高能效比、低功耗等突出特點(diǎn)。
工具鏈完善
比特大陸工具鏈經(jīng)歷了多年的技術(shù)打磨與沉淀,具備業(yè)內(nèi)領(lǐng)先的完善與成熟度,對(duì)開發(fā)人員友好易用,可實(shí)現(xiàn)快速上手,能很大程度上節(jié)省算法遷移工作量和成本。工具鏈支持包括 Caffe、TensorFlow、Pytorch、Mxnet、Darknet、PaddlePaddle 在內(nèi)的業(yè)內(nèi)主流深度學(xué)習(xí)框架,涵蓋了神經(jīng)網(wǎng)絡(luò)推理階段所需的模型優(yōu)化、高效運(yùn)行時(shí)支持等能力,為深度學(xué)習(xí)應(yīng)用開發(fā)和部署提供易用、高效的全棧式解決方案。
業(yè)務(wù)全流程加速
SC5+ 加速卡具備視頻解碼、圖像解碼、視頻編碼、圖像編碼、視頻前后處理、AI 推理運(yùn)算加速、數(shù)據(jù)加密安全引擎等多個(gè)計(jì)算加速單元,可以對(duì) CV 視覺業(yè)務(wù)的全流程數(shù)據(jù)加工、計(jì)算、壓縮/解壓縮、加解密等進(jìn)行逐個(gè)環(huán)節(jié)的運(yùn)算加速增強(qiáng),減少甚至擺脫對(duì)主機(jī)計(jì)算資源的占用,減少數(shù)據(jù)搬運(yùn)次數(shù),提高業(yè)務(wù)效率,增強(qiáng)整體 AI 計(jì)算服務(wù)器的可靠性和魯棒性。
該解決方案相關(guān)產(chǎn)品
寶德:BD-21083F2 高性能機(jī)架式服務(wù)器
寶德 BD-21083F2 機(jī)架式服務(wù)器是基于國(guó)產(chǎn)飛騰處理器 FT-2000+/64 設(shè)計(jì)開發(fā),同時(shí)搭載多張比特大陸 SC5+ 加速卡,整體采用國(guó)產(chǎn)自主固件和國(guó)產(chǎn)自主 Linux 操作系統(tǒng),成為整體方案高性能、高穩(wěn)定、高可靠的平臺(tái)保證。
寶德BD-21083F2服務(wù)器
該服務(wù)器可支持 10 個(gè)熱插拔 2.5 英寸或 3.5 英寸 SATA/SAS/SSD 硬盤三種存儲(chǔ)方案。整機(jī)結(jié)構(gòu)采用模塊化設(shè)計(jì)方案,主機(jī)處理器模塊、系統(tǒng)電源模塊、系統(tǒng)風(fēng)扇可快速免工具拆裝,具有結(jié)構(gòu)緊湊可靠、便于擴(kuò)展、便于維護(hù)等優(yōu)點(diǎn)。面向黨政和國(guó)家重點(diǎn)行業(yè)信息系統(tǒng)和業(yè)務(wù)系統(tǒng)應(yīng)用需求,具有高吞吐率、單線程能力強(qiáng)、整數(shù)計(jì)算性能高、訪問(wèn)和 IO 通道帶寬高等特點(diǎn),能滿足相關(guān)應(yīng)用需求,可以用于各種人臉識(shí)別、視頻結(jié)構(gòu)化、視頻轉(zhuǎn)碼處理、安防監(jiān)控、機(jī)器視覺、高性能計(jì)算環(huán)境,實(shí)現(xiàn)對(duì)多種 CNN/RNN /DNN 等神經(jīng)網(wǎng)絡(luò)模型的高性能推理運(yùn)算。
比特大陸:算豐 SC5+ 加速卡
在該方案中搭載比特大陸(BITMAIN)推出的最新一代深度學(xué)習(xí)加速卡 SC5+,來(lái)實(shí)現(xiàn)對(duì)多種 CNN/RNN /DNN 等神經(jīng)網(wǎng)絡(luò)模型的計(jì)算加速。
比特大陸SC5+加速卡外觀
比特大陸 SC5+ 加速卡內(nèi)置 3 顆 BM1684 TPU 處理器,為標(biāo)準(zhǔn) PCIe 3.0 接口,采用無(wú)風(fēng)扇設(shè)計(jì),可提供高達(dá) 105.6T INT8 算力,以及 6.6T FP32 算力,可支持高精度計(jì)算。其中,BM1684 TPU 處理器采用特別優(yōu)化過(guò)的脈動(dòng)陣列架構(gòu),在進(jìn)行深度學(xué)習(xí)推理時(shí),具有業(yè)界領(lǐng)先的利用率。SC5+ 加速卡可以用于各種人臉識(shí)別、視頻結(jié)構(gòu)化、安防監(jiān)控、人工智能、機(jī)器視覺、高性能計(jì)算環(huán)境,用戶可以通過(guò) BITMAIN 同步提供的工具鏈軟件,實(shí)現(xiàn)對(duì)多種 CNN/RNN /DNN 等神經(jīng)網(wǎng)絡(luò)模型的計(jì)算加速。
比特大陸SC5+加速卡配置