一、芯片行業(yè)的演進路線
芯片行業(yè)的整體發(fā)展始自上世紀60年代,一開始是指數(shù)型發(fā)展,所以有了每18個月集成度翻一番的摩爾定律,可以說當時的發(fā)展是非常快的。摩爾定律背后的邏輯是說,隨著工藝制程的進化,同一款芯片的制造成本會更低,單位面積晶體管數(shù)量提升導(dǎo)致相同的芯片所需要的面積縮??;而如果工藝制程發(fā)展速度過慢,則意味著芯片制作成本居高不下,導(dǎo)致利潤無法擴大。但是,如果孤注一擲把所有的資本都用來發(fā)展新制程,則風(fēng)險太大,一旦研發(fā)失敗公司就完蛋了。
摩爾發(fā)現(xiàn)當時市場上成功的半導(dǎo)體廠商的制程進化速度大約是每年半導(dǎo)體芯片上集成的晶體管數(shù)量翻倍,于是寫了著名的論文告訴大家這個發(fā)展速度是成本與風(fēng)險之間一個良好的折中,半導(dǎo)體業(yè)以后發(fā)展可以按照這個速度來。
可以說,摩爾定律背后的終極推動力其實是經(jīng)濟因素,它給市場帶來的積極影響是,隨著半導(dǎo)體工藝制程的進化,芯片的性能以指數(shù)級增長,從而帶動了電子產(chǎn)品性能大躍進式發(fā)展,電子市場一片生機勃勃。在摩爾定律提出的前三十年,新工藝制程的研發(fā)并不困難,但隨著晶體管越來越小,越來越接近宏觀物理和量子物理的邊界,高級工藝制程的研發(fā)越來越困難,研發(fā)成本也越來越高。如果工藝制程繼續(xù)按照摩爾定律所說的以指數(shù)級的速度縮小特征尺寸,會遇到兩個阻礙,一個是經(jīng)濟學(xué)阻礙,另一個是物理學(xué)阻礙。
經(jīng)濟學(xué)阻礙是,隨著特征尺寸的縮小,芯片的成本上升很快。這個成本包括NRE成本(Non-Recurring Engineering,指芯片設(shè)計和掩膜制作成本,對于一塊芯片而言這些成本是一次性的)和制造成本(即每塊芯片制造的成本)。有人計算過,以現(xiàn)在的最新工藝,一塊芯片的NRE要到1000萬美元以上。如此高昂的NRE意味著需要非常非常高的芯片生產(chǎn)量才能去攤薄這個成本。換句話說,如果芯片的產(chǎn)量不到,那么你就沒有能力去使用最新的工藝,只能沿用較舊的工藝。這就部分打破了摩爾定律 “投資發(fā)展制程-芯片生產(chǎn)成本降低-用部分利潤繼續(xù)投資發(fā)展制程”的邏輯。
而物理學(xué)的障礙主要來源于量子效應(yīng)和光刻精度。晶體管太小就會碰到各種各樣的問題,比如當特征尺寸縮小到10nm的時候,柵氧化層的厚度僅僅只有十個原子那么厚,這時便會產(chǎn)生諸多量子效應(yīng),導(dǎo)致晶體管的特性難以控制。
筆者認為,現(xiàn)在芯片行業(yè)的發(fā)展已經(jīng)到了瓶頸期,接下來的發(fā)展策略有三種,分別是More Moore, More than Moore和Beyond Moore。第一種More Moore,意思是繼續(xù)按照摩爾定律的老路走下去,繼續(xù)縮小晶體管尺寸;第二種More than Moore,意思是首先芯片系統(tǒng)性能的提升不再單純地靠晶體管的縮小,而是更多地靠電路設(shè)計以及系統(tǒng)算法優(yōu)化。其次集成度的提高不一定要靠把更多模塊放到同一塊芯片上,而是可以靠封裝技術(shù)來實現(xiàn),例如Intel的EMIB,TSMC的InFO等等(蘋果的處理器就用了InFO技術(shù));第三種Beyond Moore,意思是干脆不用CMOS器件而是去研發(fā)一些新的器件,不過這個目前看起來還比較遙遠。未來估計是會More Moore結(jié)合More than Moore,隨著時間推移More than Moore比重越來越大。
其實筆者對未來還是蠻悲觀的,這個瓶頸期如果沒有新器件誕生的話,應(yīng)該會持續(xù)5年10年甚至更長一段時間。就像鋼鐵行業(yè),它早已進入平緩期,也沒什么特別新的技術(shù),如果這個行業(yè)想要有比較大的發(fā)展,那除非是發(fā)現(xiàn)新的材料可以替代鋼。半導(dǎo)體行業(yè)也一樣,什么時候出來新器件結(jié)束這個瓶頸期筆者也不知道,有的時候科學(xué)上的事情就是很偶然,可能突然就發(fā)現(xiàn)某種材料可以用了,但如果你找不到新材料,就是沒辦法有很大突破。
二、NV/Google/Intel/AMD在AI芯片的不同戰(zhàn)略
其實人工智能計算還是分很多領(lǐng)域,芯片應(yīng)用大概有兩個極端:一個是用于云端服務(wù)器的高功耗高計算能力的芯片,走的是高性能超級計算機(HPC)的路子;另一個是用于終端(比如手機)的人工智能芯片,這個就特別注重低功耗,對計算能力的要求不是特別高。
在云端服務(wù)器這個領(lǐng)域,因為要處理海量的數(shù)據(jù),Nvidia的GPU已經(jīng)成為服務(wù)器不可或缺的一部分,但Nvidia自己目前還沒有打算大規(guī)模自己做服務(wù)器,因此在人工智能的云端市場,Nvidia提供的是硬件而非平臺。而在終端這個領(lǐng)域,Nvidia基于GPU的人工智能平臺一方面功耗太大,另一方面過高的計算能力反而導(dǎo)致成本過高,因此無法與定制芯片抗衡。其實,Nvidia的人工智能平臺最具優(yōu)勢的應(yīng)用場景是上面兩種情況的中間,即數(shù)據(jù)量中等、對計算能力要求還比較高、對功耗有一定要求但是并不苛刻的地方,比如ADAS市場。Nvidia人工智能平臺無論計算能力(10-100TOPS)還是功耗(10-100W)都能完美地符合要求,因此它主打自動駕駛市場并不奇怪,它在2017年1月份舉辦的CES上也主要發(fā)布了自動駕駛相關(guān)的產(chǎn)品。
Intel的話,從三個方面來說吧。第一,在云端市場,它是最大的玩家,并且正在積極準備與Nvidia抗衡,因為Intel在HPC方面的業(yè)務(wù)本來就是駕輕就熟,而Nvidia進入HPC還沒有幾年,只能算這個市場的new player。大概是在2013年的時候,人們才發(fā)現(xiàn)原來GPU可以用于深度學(xué)習(xí),之前根本不知道這個事情。說回Intel,它在收購Altera之后推出了基于FPGA的專用深度學(xué)習(xí)加速卡,可以在云端使用。另外Intel收購Nervana后正在積極推廣結(jié)合其技術(shù)為AI優(yōu)化的Knight Mill至強處理器,目標也是在云端。第二,在車載端,Intel與Mobileye和BMW結(jié)成了自動駕駛聯(lián)盟,Mobileye提供傳感器芯片和算法,Intel提供云端計算平臺,BMW提供汽車。第三,在移動端,Intel收購了Movidius,但是尚未看到大的動作。所以筆者預(yù)期,移動端的人工智能芯片,如果有的話還是高通之類的廠商會比較有優(yōu)勢。
再說Google,它推出來的芯片TPU主要是自用的。這個有點像IBM,IBM最早出的Power PC系列芯片也是為了給自己的server用。所以Google也是類似的思路,它的芯片就沒有打算給別人用,換句話說它沒有真的打算進入芯片這個市場,和別人競爭。
最后說AMD,它在GPU和CPU的技術(shù)都處于追趕者的位置,在AI方面比較低調(diào),在CES上公布新產(chǎn)品的時候也都沒有主動去提人工智能的事情。最近的新聞大概是和阿里巴巴合作云端服務(wù)作為試水。AMD的總體思路還是求穩(wěn),不刻意去跟Nvidia爭誰先誰后,它就等你們把這些東西先做出來再說,自己就很踏實地把顯卡技術(shù)做好。其實GPU天生就符合深度學(xué)習(xí)的要求,只要AMD把自己芯片的運算能力做上去,它很快就可以殺入人工智能這個領(lǐng)域中來。
三、Nvidia面臨的機遇和挑戰(zhàn)
2016年是人工智能爆發(fā)的一年,借著這股東風(fēng),Nvidia的股價在去年飛升三倍有余,令人驚嘆。目前看來,Nvidia的技術(shù)成長空間還有很多,因為Nvidia正在轉(zhuǎn)型成為平臺公司而不是硬件公司,GPU會是它的核心但是不是全部,它要做的是圍繞GPU的一個平臺、一個生態(tài)。與GPU配套的各種設(shè)施,例如開發(fā)平臺、開發(fā)者社區(qū)和包絡(luò)編程語言在內(nèi)的開發(fā)工具也非常重要。舉例來說,在筆記本PC市場,其實ARM的處理器性能完全可以和Intel相抗衡,但是為什么基本沒有筆記本電腦用ARM的處理器?就是因為ARM在筆記本PC上沒有任何生態(tài)。一旦平臺和生態(tài)做起來,即使它的技術(shù)發(fā)展不像原來那么生猛,筆者相信Nvidia的商業(yè)價值仍然可以得到保證。假如明天AMD做出來一個和Nvidia性能一模一樣的GPU,它一時半會兒也還是無法取代Nvidia,因為Nvidia有自己的CUDA、CUDNN等配套的開發(fā)工具。
而Nvidia可能會面臨的最大風(fēng)險在于,它現(xiàn)在的股價完全由人工智能來支撐,但人工智能的應(yīng)用會不會像投資者想象中發(fā)展的那么快是存疑的。其實非常明顯現(xiàn)在人工智能的應(yīng)用有很大的泡沫,大家預(yù)期它在一兩年之內(nèi)會起來。但是如果它在一兩年之內(nèi)沒有起來或者說某些應(yīng)用沒有能真的落地,那時候投資者可能會有些反沖?,F(xiàn)在是一個overshoot,發(fā)現(xiàn)沒有達到預(yù)期之后就會有一個undershoot,幾次震蕩之后慢慢回到理性估值。
四、FPGA的玩家和留給創(chuàng)業(yè)公司的機會
FPGA全稱“可編輯門陣列”(Field Programmable Gate Array),其基本原理是在FPGA芯片內(nèi)集成大量的數(shù)字電路基本門電路以及存儲器,而用戶可以通過燒入FPGA配置文件來來定義這些門電路以及存儲器之間的連線。這種燒入不是一次性的,即用戶今天可以把FPGA配置成一個微控制器MCU,明天可以編輯配置文件把同一個FPGA配置成一個音頻編解碼器?,F(xiàn)在FPGA和人工智能相關(guān)的主要機會是云端服務(wù)器的可配置運算 ,目前這個領(lǐng)域的玩家主要是兩個,Xilinx和Altera,后者已經(jīng)被Intel收購。
當下FPGA遇到的一個最關(guān)鍵的問題就是開發(fā)者生態(tài)。傳統(tǒng)CPU也好GPU也好,編程是比較容易的,使用的是語言是C++、Java,大家都很熟悉,而且已經(jīng)形成了成熟的體系,開發(fā)環(huán)境、生態(tài)系統(tǒng)還有開發(fā)者的社區(qū)這些都很好。但是FPGA開發(fā)通常需要使用硬件描述語言,如Verilog、VHDL等等,這些對于程序員來說需要大量的時間才能掌握。這樣的話FPGA的生態(tài)就無法發(fā)展,因為門檻高意味著做的人少,做的人少意味著知名度低,相關(guān)項目數(shù)量少,這又導(dǎo)致了無法吸引到開發(fā)者參與項目,如此便形成了惡性循環(huán)。
針對這種情況,Xilinx就發(fā)布了一個比較能改善生態(tài)的東西,叫做可重配置加速棧,這些用于云端的FPGA將會使用部分重配置方案。什么意思呢?通常FPGA配置過程包括硬件描述語言的綜合、布局布線、最后產(chǎn)生比特流文件并寫入以完成配置。在這個過程中,綜合以及布局布線花費的時間非常長,可達數(shù)小時,而最后比特流文件寫入以及配置可以在一秒內(nèi)完成。用于云端的FPGA方案為了實現(xiàn)快速應(yīng)用切換,預(yù)計將會使用硬IP(即針對某應(yīng)用硬件加速的比特流),并在需要使用該應(yīng)用時快速寫入該比特流。在未來,云端FPGA的生態(tài)預(yù)計將不止包括Xilinx,還會包括許多第三方IP提供商,最后形成類似App Store的形式讓使用者方便地選購對應(yīng)的硬件加速方案并實時加載/切換。
目前國內(nèi)FPGA水平較弱,而且FPGA需要一整套從軟件到硬件的流程,需要深刻的積累,對于創(chuàng)業(yè)公司并不是一個最好的方向,更適合國家科研項目。但是創(chuàng)業(yè)公司使用FPGA,做FPGA的解決方案,基于FPGA開發(fā)或者做FPGA上的IP,是個不錯的機會。換句話說就是你不去手機,而是做APP。
五、玩人工智能軟件的正確姿勢
目前人工智能軟件最大問題是如何把技術(shù)真正落實到解決消費者的需求,一些算法非常有技術(shù)含量,但是落地并不容易,例如圖像分類等等。筆者覺得現(xiàn)在做的比較好的軟件是語音識別/交互類,比較典型的是訊飛輸入法,前陣子在錘子手機的發(fā)布會上被秀了一把。
圖像類的人工智能算法目前是最火的方向,比語音類要火很多,但是目前看來圖像算法大多數(shù)只能作為一個大系統(tǒng)的一部分。比如一個安防系統(tǒng),圖像算法可以用來檢測一個人是否帶刀,但是把這個軟件單獨拉出來賣就不一定能成立了。當然也有單獨做軟件的,例如Prisma,這個之前在Instagram很火的軟件就是利用深度學(xué)習(xí)來做圖像風(fēng)格變換??偨Y(jié)一句話就是,人工智能相關(guān)的軟件當然是一個非常好的創(chuàng)業(yè)方向,只是要找準這個創(chuàng)新的賣點,光有好的技術(shù)其實是沒什么大用的。
在人工智能領(lǐng)域,國內(nèi)也出現(xiàn)了一批還不錯的公司,筆者有在關(guān)注。在圖像檢測/人臉識別領(lǐng)域,有依圖科技、Face++、商湯科技三只領(lǐng)頭羊,它們主要為銀行和一些安防系統(tǒng)提供人臉識別的解決方案。在醫(yī)療領(lǐng)域,就是用人工智能幫忙人類判定疾病也有很多公司在做,一圖正在進軍這個領(lǐng)域。在自動駕駛領(lǐng)域,軟件方面做的比較有名的是圖森、地平線。其實地平線攤子鋪得比較大,硬件軟件都做,除了輔助駕駛外,還跟美的合作在做智能家居。還有一些比較小眾的領(lǐng)域,比如鑒黃,就是圖譜在做。硬件的話,比較有名的是寒武紀。
六、芯片行業(yè)的未來除了人工智能,還有……
最后再說回到整個芯片行業(yè)的發(fā)展上來。有人問,芯片行業(yè)是不是有一個強者恒強的規(guī)律,出現(xiàn)黑馬的幾率有多大。筆者認為是這樣的:在芯片這個地方,它是每隔一段就會換一個應(yīng)用方向,90年代時候最火的是多媒體電腦,也就是PC端,后來就變到了移動端,最近則是人工智能。眾所周知,Intel是PC時代永遠的老大,在那25年的時間里基本碾壓所有競爭對手,但移動設(shè)備這個方向它就完全錯過了。所以說,在同一個領(lǐng)域里基本上是強者恒強,很難有超越,但是在這個領(lǐng)域強,不代表在下一個領(lǐng)域也會強,在“時代”交替的時候是最容易出黑馬的。我們在評判企業(yè)價值的時候,要對芯片的技術(shù)應(yīng)用有一個判斷,要非常清楚下一個所謂的風(fēng)口在哪里。
現(xiàn)在芯片應(yīng)用最火的方向毫無疑問是人工智能了,筆者還同時看好另外一個方向,就是醫(yī)療。筆者相信在醫(yī)療電子領(lǐng)域還有很多可以做的事情,當然這個方向的發(fā)展還要倚賴一些基礎(chǔ)設(shè)施的建設(shè),比如在線的云平臺和大數(shù)據(jù)庫等等。