技術(shù)擴(kuò)散能力在國(guó)家技術(shù)力量中非常重要,特別是在AI的背景下。有研究顯示,與美國(guó)分散且更利于擴(kuò)散的生態(tài)系統(tǒng)相比,中國(guó)的擴(kuò)散能力遠(yuǎn)遠(yuǎn)落后于創(chuàng)新能力——比后者排名低近30位。目前,中國(guó)正在計(jì)劃提高擴(kuò)散能力,重要方式是對(duì)AI教育進(jìn)行大規(guī)模投資,以培養(yǎng)中端、以工業(yè)為重點(diǎn)的AI勞動(dòng)力。
美國(guó)最近在大型語(yǔ)言模型(LLM)和擴(kuò)散模型方面取得了源源不斷的突破。這些成功推動(dòng)了美國(guó)風(fēng)險(xiǎn)投資對(duì)專注于科技和服務(wù)行業(yè)的生成式AI初創(chuàng)公司的激增,如HarveyAI、Jasper和Runway。美國(guó)的這種樂觀情緒與中國(guó)相對(duì)較慢的AI創(chuàng)業(yè)公司形成了鮮明對(duì)比。例如,有分析稱備受關(guān)注的阿里巴巴支持的初創(chuàng)公司零一萬物(01.AI)的語(yǔ)言模型在很大程度上是基于Meta的開源LLaMA基金會(huì)模型。
然而,中國(guó)在生成式AI領(lǐng)域的遲緩,可以解釋為政府將工業(yè)應(yīng)用置于服務(wù)業(yè)和傳統(tǒng)知識(shí)工作應(yīng)用之上的戰(zhàn)略優(yōu)先地位。特別是,政府希望通過工業(yè)部門的AI投資來對(duì)抗工業(yè)生產(chǎn)力增長(zhǎng)的下降,以期擺脫中等收入陷阱。
為此,政府已要求教育部在國(guó)內(nèi)的工業(yè)部門推廣尖端的機(jī)器學(xué)習(xí)技術(shù)。因此,中國(guó)各大學(xué)開設(shè)了2300多個(gè)AI本科生項(xiàng)目,其中大多數(shù)是專注于工業(yè)應(yīng)用的應(yīng)用AI項(xiàng)目。教育部的AI高等教育包括兩個(gè)目標(biāo):旨在降低傳統(tǒng)工業(yè)企業(yè)采用AI的障礙;龐大的中端AI勞動(dòng)力將如何在經(jīng)濟(jì)中擴(kuò)散AI。
AI在工業(yè)企業(yè)中的商業(yè)模式
教育部對(duì)應(yīng)用AI高等教育項(xiàng)目的空前投資在于政府認(rèn)識(shí)到大多數(shù)專注于工業(yè)的AI公司面臨的一個(gè)根本問題:構(gòu)建特定行業(yè)的AI解決方案需要耗費(fèi)大量時(shí)間和資金,通常無法通過橫向商業(yè)模式實(shí)現(xiàn)。這個(gè)問題很普遍,因?yàn)槌嘶厥盏壤袠I(yè)(AMP Robotics等成功的西方初創(chuàng)公司已經(jīng)出現(xiàn))之外,大多數(shù)工業(yè)部門都有特定于公司的數(shù)據(jù)基礎(chǔ)設(shè)施。制造公司通常在稱為制造執(zhí)行系統(tǒng)(MES)和監(jiān)控與數(shù)據(jù)采集(SCADA)的軟件系統(tǒng)上運(yùn)行。這些系統(tǒng)往往結(jié)合了內(nèi)部工具和SAP或西門子等傳統(tǒng)供應(yīng)商構(gòu)建的軟件服務(wù)的混亂組合。
因此,為了構(gòu)建一個(gè)可以實(shí)際部署的AI模型,這些不同的系統(tǒng)必須首先通過跨系統(tǒng)的數(shù)據(jù)通道進(jìn)行統(tǒng)一。這項(xiàng)工作的大部分都是定制的,涉及在傳統(tǒng)的、斷開連接的系統(tǒng)之間構(gòu)建強(qiáng)大的數(shù)據(jù)通道的繁瑣過程,這些系統(tǒng)通常來自具有不同數(shù)據(jù)模式的不同提供商。只有完成了這項(xiàng)艱巨的工作,計(jì)算機(jī)視覺模型才能開始訓(xùn)練和部署。即使在這些復(fù)雜的數(shù)據(jù)通道建成后,對(duì)AI系統(tǒng)進(jìn)行工業(yè)流程培訓(xùn)也會(huì)帶來自身的挑戰(zhàn):
鑒于工業(yè)企業(yè)使用的產(chǎn)品和流程眾多,每個(gè)模型都必須在公司或產(chǎn)品線的特定系統(tǒng)上進(jìn)行培訓(xùn)。換言之,大規(guī)模、全行業(yè)的多樣性限制了工業(yè)AI解決方案的可擴(kuò)展性。
此外,每當(dāng)一家公司改變流程或轉(zhuǎn)向新產(chǎn)品時(shí),該公司不僅必須建立新的制造流程,還必須重新培訓(xùn)其計(jì)算機(jī)視覺模型——如果這是一個(gè)沒有大量現(xiàn)有培訓(xùn)數(shù)據(jù)的新產(chǎn)品或流程,這通常是一項(xiàng)艱巨的任務(wù)。因此,如果沒有一個(gè)穩(wěn)健的數(shù)據(jù)集來調(diào)整新過程的機(jī)器學(xué)習(xí)算法,制造商往往被迫手動(dòng)測(cè)試和生成體能訓(xùn)練數(shù)據(jù),直到模型變得足夠可靠。
在工業(yè)AI領(lǐng)域,由于需要不斷更新、客戶規(guī)模有限以及高昂的前期成本,軟件即服務(wù)(SaaS)公司利潤(rùn)豐厚的經(jīng)濟(jì)效益不再適用。李開復(fù)的AI產(chǎn)業(yè)初創(chuàng)公司創(chuàng)新奇智(AInnovation),為中鋼國(guó)際和建筑巨頭中鐵四號(hào)等工業(yè)企業(yè)開發(fā)AI系統(tǒng)。隨著創(chuàng)新奇智擴(kuò)大其客戶群,它被迫增加軟件支出,部署更多專有的低利潤(rùn)硬件,導(dǎo)致毛利率從2018年的62.9%暴跌至2020年的29.1%。
由于工業(yè)部門的AI不能通過一刀切的橫向解決方案來采用,該行業(yè)需要一大批新的中級(jí)AI人才——比一般的數(shù)據(jù)分析師更熟練,但比ML工程師和研究人員成本更低。中國(guó)的AI教育戰(zhàn)略旨在填補(bǔ)這一應(yīng)用AI人才的利基市場(chǎng),以便每家工業(yè)公司都可以聘請(qǐng)內(nèi)部團(tuán)隊(duì)來構(gòu)建自己的機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施。
這項(xiàng)投資的成果已經(jīng)開始顯現(xiàn)。例如,CATL等公司正在電池制造質(zhì)量控制過程中大規(guī)模部署計(jì)算機(jī)視覺。當(dāng)然,考慮到電池的同質(zhì)化和商品化性質(zhì),政府戰(zhàn)略能否將其AI努力擴(kuò)大到這一相對(duì)較低的成果之外,還有待觀察。
AI的教育擴(kuò)散
除了促進(jìn)現(xiàn)有AI技術(shù)與工業(yè)部門的融合外,AI高等教育政策還尋求建立所需的受過中等教育的勞動(dòng)力隊(duì)伍,以將新興的AI突破傳播到全國(guó)其他地區(qū)。隨著許多新的應(yīng)用AI項(xiàng)目位于農(nóng)村和工業(yè)地區(qū),新一波AI項(xiàng)目旨在將AI的好處傳播到全國(guó)各地,而不是將其限制在北京和深圳等以服務(wù)為重點(diǎn)的沿??萍贾行摹?/p>
同時(shí),通過關(guān)注這一中級(jí)AI人才,中國(guó)將以成本效益培訓(xùn)那些愿意建設(shè)其工業(yè)企業(yè)所需數(shù)據(jù)基礎(chǔ)設(shè)施的工人,同時(shí)也了解前沿的相關(guān)突破。這一點(diǎn)可以通過創(chuàng)建應(yīng)用AI程序來實(shí)現(xiàn),這些程序省略了復(fù)雜的AI概念的教學(xué),而是專注于數(shù)據(jù)模型和最基本的機(jī)器學(xué)習(xí)概念——事實(shí)證明,這種方法具有很強(qiáng)的可擴(kuò)展性。
這種方法不同于美國(guó)大學(xué)的AI教育。美國(guó)本科生AI課程很少讓學(xué)生參與并學(xué)習(xí)構(gòu)建數(shù)據(jù)通道和清理數(shù)據(jù)集的混亂但關(guān)鍵的技能,而是專注于深度學(xué)習(xí)和transformer等更具理論性的主題。教授這些主題可能會(huì)帶來更前沿的研究突破,但在培養(yǎng)一支能夠?qū)⑦@些突破擴(kuò)散到整個(gè)經(jīng)濟(jì)中的傳統(tǒng)行業(yè)的勞動(dòng)力方面并不那么有效。
相比之下,長(zhǎng)春吉林大學(xué)的一名畢業(yè)生——教育部在那里啟動(dòng)了一個(gè)新的應(yīng)用AI項(xiàng)目——將精通為建筑和制造公司構(gòu)建有效的數(shù)據(jù)通道,同時(shí)也熟悉卷積神經(jīng)網(wǎng)絡(luò)(CNN)等基本的機(jī)器學(xué)習(xí)概念。由于這些學(xué)生主要學(xué)習(xí)如何構(gòu)建AI系統(tǒng)的基礎(chǔ)設(shè)施,大學(xué)并不依賴罕見的頂級(jí)AI教授,這使得應(yīng)用AI項(xiàng)目更容易擴(kuò)大規(guī)模。
中國(guó)有大量具備ML基礎(chǔ)知識(shí)的畢業(yè)生,不一定需要在AI突破方面領(lǐng)先。隨著清華等大學(xué)或者像OpenAI這樣的西方實(shí)驗(yàn)室涌現(xiàn)出新技術(shù),國(guó)內(nèi)訓(xùn)練有素的勞動(dòng)力可以在整個(gè)經(jīng)濟(jì)中快速學(xué)習(xí)和利用這些新興技術(shù)。例如,盡管工作人員可能主要花時(shí)間構(gòu)建數(shù)據(jù)整理流程和通道,但他們?nèi)匀粫?huì)對(duì)ML技術(shù)感到足夠舒適,從而學(xué)習(xí)如何使用CLIP或其他圖像處理突破,即使他們最初只熟悉CNN等基本技術(shù)。這種領(lǐng)域?qū)I(yè)化、AI快速追隨者的隊(duì)伍在ML領(lǐng)域尤其有效,在ML領(lǐng)域,知識(shí)可以通過開源論文輕松獲取。
需要指出的是,對(duì)AI工業(yè)應(yīng)用的關(guān)注與國(guó)家的發(fā)展愿景一致,即中國(guó)要實(shí)現(xiàn)類似德國(guó)的高端制造業(yè)模式,而不是更以服務(wù)業(yè)為導(dǎo)向的美國(guó)經(jīng)濟(jì)模式。事實(shí)上,今年兩會(huì)提出的最新AI提案——包括備受關(guān)注的AI+倡議——就是旨在將“AI技術(shù)的進(jìn)步轉(zhuǎn)化為實(shí)體經(jīng)濟(jì)中的有形生產(chǎn)力”。