日前,飛騰已經(jīng)完成FT-2000plus服務(wù)器CPU的研制工作,飛騰公司的合作伙伴正在積極研發(fā)相應(yīng)的整機(jī)產(chǎn)品。FT-2000plus這款芯片是以FT2000為基礎(chǔ)的改進(jìn)版本,雖然在單核性能上和Intel還存在一定差距,但在多核性能上,已經(jīng)達(dá)到Intel服務(wù)器CPU E5 主流產(chǎn)品的水平。
據(jù)傳,國防科大正在研發(fā)的1000P超算天河3號(hào)(性能指標(biāo)是神威太湖之光的8倍),其原型機(jī)的CPU或?qū)⒉捎肍T-2000或其后繼產(chǎn)品作為主控CPU??紤]到在天河2A上,國防科大已經(jīng)用自主研發(fā)的加速器矩陣2000取代Intel的Xeon Phi計(jì)算卡。從今往后,天河系列超算也將和神威系列超算一樣,徹底告別國外CPU或加速器,實(shí)現(xiàn)芯片的全國產(chǎn)化。
FT-2000系列芯片是厚積薄發(fā)的結(jié)果
近年來,國內(nèi)某些企業(yè)熱衷于“走捷徑”,先后與Intel、IBM、ARM、高通等國外芯片巨頭技術(shù)合作或合資,有的公司把國外的CPU IP授權(quán)買回來做集成,就宣傳是自主知識(shí)產(chǎn)權(quán),甚至還有公司將國外的芯片包裝一下變成國產(chǎn)芯片。
雖然這種走捷徑的做法可以在短時(shí)間內(nèi)拿出性能不錯(cuò)的芯片,但由于國外公司始終懷有“教會(huì)徒弟、餓死師傅”心理,不會(huì)將最先進(jìn)的技術(shù)授權(quán)給中國,而且國內(nèi)單位在拿到國外技術(shù)授權(quán)后,容易陷入知其然,不知其所以然的困境,不具備技術(shù)發(fā)展的可持續(xù)性,在國外公司開發(fā)出下一代產(chǎn)品之后,只能再次引進(jìn)國外技術(shù)。
相比之下,飛騰選擇了較為困難的自主研發(fā)道路,雖然發(fā)展會(huì)慢一些,但更具后勁。早在十多年前,飛騰就基于IA-64指令集設(shè)計(jì)CPU,之后又以Sparc開源代碼為基礎(chǔ)設(shè)計(jì)了FT-1000和FT-1500兩款CPU,F(xiàn)T-1000被用于天河1號(hào)超算,F(xiàn)T-1500被用于天河2號(hào)超算。在2012年前后,飛騰選擇了ARM陣營,獲得了ARM指令集授權(quán),可以基于ARM 64指令集設(shè)計(jì)自己的CPU。并在數(shù)年時(shí)間里先后開發(fā)出了FTC660、FTC661兩款CPU核,以及FT-1500A/4、FT-1500A/16、FT-2000、FT-2000plus等CPU。
FT-1500A/4被用于PC和筆記本,采用28nm制造工藝。集成了4個(gè)FTC660 CPU核,主頻1.5GHz—2.0GHz,集成了2MB二級(jí)cache和8MB三級(jí)cache,集成了2個(gè)DDR3-1600存儲(chǔ)控制器,可提供25.6GB/s訪存帶寬,最大功耗為15W。
FT-1500A/16被用于服務(wù)器,采用28nm制造工藝。集成了16個(gè)FTC660 CPU核,主頻1.5GHz,集成了8MB二級(jí)cache和8MB三級(jí)cache,集成了4個(gè)DDR3-1600存儲(chǔ)控制器,可提供51.2GB/s訪存帶寬,最大功耗為35W。
FT-2000采用28nm制造工藝,可被用于超算計(jì)算節(jié)點(diǎn)和高性能服務(wù)器。集成了64個(gè)FTC661處理器核。工作主頻1.5GHz—2.0GHz。集成了32MB二級(jí)cache,擴(kuò)展支持128MB三級(jí)cache。支持16個(gè)DDR3-1600存儲(chǔ)控制器,可提供204.8GB/s訪存帶寬。
最新的FT-2000Plus采用了臺(tái)積電16nm制造工藝,主頻為2.0GHz—2.4GHz,集成了64個(gè)FTC661處理器核。為了提高集成度,拋棄了L3cache,將DDR4內(nèi)存控制器集成到了片內(nèi)。目前,飛騰系列CPU已經(jīng)形成了一個(gè)家族,可滿足黨政軍多個(gè)領(lǐng)域的實(shí)際需求。
足以和Intel主流服務(wù)器抗衡 CPU 在國內(nèi)ARM服務(wù)器CPU中處于領(lǐng)跑位置
根據(jù)實(shí)際測(cè)試FT-2000在2GHz主頻下,采用GCC4.8編譯器,SPEC2006的測(cè)試成績(jī)分別為SPECint_rate2006:570、 SPECfp_rate2006:482,與Intel Xeon E5-2695v3相當(dāng)。
而最新的FT-2000Plus因?yàn)閯h除了L3導(dǎo)致在SPEC測(cè)試中某些子項(xiàng)分?jǐn)?shù)下降,把集成DDR4等改進(jìn)帶來的提升抹平了,使FT-2000Plus在同主頻下與FT-2000的性能相差不大。那飛騰公司為何要這么做呢?原因應(yīng)該是為了商業(yè)化,提高FT-2000plus的集成度可以方便主機(jī)廠,降低開發(fā)FT-2000plus整機(jī)產(chǎn)品的成本。不過,在使用了更好的臺(tái)積電16nm制造工藝之后主頻可以最高穩(wěn)定到2.4G,使FT-2000plus相對(duì)于FT-2000還是有不小的性能提升,能夠滿足高端服務(wù)器和超算主控CPU的性能要求。
近年來,不少廠家都開始著手開發(fā)ARM服務(wù)器CPU。在國內(nèi),華為和華芯通也在著手開發(fā)ARM服務(wù)器CPU。不過,就目前而言,飛騰的ARM服務(wù)器CPU在性能上處于絕對(duì)領(lǐng)先地位。
華芯通是中國大陸與高通成立的合資公司,從高通手中獲得了源碼并基于該源碼設(shè)計(jì)自己的CPU。不過,由于華芯通北京研發(fā)中心啟用時(shí)日尚短,正式商用產(chǎn)品問世尚需時(shí)日。
相比之下,華為研發(fā)ARM服務(wù)器CPU的時(shí)間要早得多,而且在北京和美國都有研發(fā)中心,已經(jīng)有產(chǎn)品Hi1612問世。雖然在宣傳上,華為聲稱Hi1612是“自主研發(fā)”,“除存儲(chǔ)單元外均具有完整知識(shí)產(chǎn)品”,但其實(shí)上,這款服務(wù)器CPU采用臺(tái)積電16nm制造工藝,其內(nèi)核是ARM Cortex A57。
而且Hi1612的性能也比較一般,也許是因?yàn)槿A為缺乏服務(wù)器CPU設(shè)計(jì)經(jīng)驗(yàn),這款服務(wù)器CPU的性能相對(duì)有限,以飛騰的FT2000作參照,華為的這款服務(wù)器CPU在制造工藝領(lǐng)先2代的情況下,以FT2000一半的功耗實(shí)現(xiàn)了不足FT2000一半的性能。
不過,據(jù)小道消息,華為的下一款A(yù)RM服務(wù)器正在研發(fā)中,而且位于龍芯公司斜對(duì)門的華為北京研發(fā)中心已經(jīng)拿ARM Cortex A72修改了至少2個(gè)版本(華為有錢,買了ARM的“大禮包”),加上位于美國的研發(fā)中心可以提供技術(shù)支持,在有ARM Cortex A72為基礎(chǔ)的情況下,華為的下一款A(yù)RM服務(wù)器CPU的性能值得期待。
結(jié)語
誠然,F(xiàn)T-2000/FT-2000plus還是存在一些短板的,比如單線程性能偏弱。無論是FT2000,還是FT-2000plus,雖然在多線程性能上達(dá)到了Intel中高端服務(wù)器CPU的性能,但在單線程性能上,還是有不小的差距——即便主頻控制在2.5GHz,Intel的服務(wù)器CPU的SPECint_base2006的成績(jī)也在25以上,而FT2000的SPECint_base2006只有12.4(@2.0GHz),F(xiàn)T-2000plus預(yù)計(jì)也只有14+分(@2.4GHz)。
軟件生態(tài)也是一個(gè)問題,由于飛騰選擇了跟隨ARM生態(tài)的道路,使飛騰的商業(yè)化推廣很大程度上取決于ARM生態(tài)的完善情況。而在服務(wù)器生態(tài)上,ARM和X86相比差距較大,這也非常不利于FT-2000/FT-2000plus的商業(yè)化。
不過,萬事開頭難,迄今為止,湖南長(zhǎng)城銀河公司、湘計(jì)海盾公司、航天706所已經(jīng)推出了基于新一代飛騰微處理器的自主可控產(chǎn)品。
長(zhǎng)城銀河公司就開發(fā)出了EF111系列計(jì)算服務(wù)器、智恒AF21B一體機(jī)、致翔NF15N筆記本電腦和世恒KF510系列桌面型臺(tái)式計(jì)算機(jī)等整機(jī)產(chǎn)品。其中,EF111系列計(jì)算服務(wù)器基于全新一代國產(chǎn)FT2000 Plus 處理器的高性能服務(wù)器,可應(yīng)用于ERP、高性能數(shù)據(jù)庫、虛擬化和商業(yè)智能、大數(shù)據(jù)分析等領(lǐng)域。航天科工二院 706所也推出天玥64核高端機(jī)架式服務(wù)器。
根據(jù)公開資料顯示,天河3號(hào)的原型機(jī)已經(jīng)選定FT-2000系列芯片作為其計(jì)算節(jié)點(diǎn)上使用的CPU。這不僅對(duì)天河超算擺脫進(jìn)口芯片掣肘是一個(gè)好消息,對(duì)于FT-2000來說,也是一個(gè)非常好的廣告。