美國的最新禁運 會讓中國下代超算遭致命打擊?
2019年06月24日16:02

  原標題:美國的最新禁運,會讓中國下代超算遭致命打擊?告訴你實情!

  最近這幾天,有許多美國媒體幸災樂禍,認為中國超算行業將受到致命打擊,離開了美國的CPU,中國將造不出超算。事實是這樣的嗎?這個禁令對我國的超算行業有什麼影響?

  據多家媒體報導,在當地時間6月21日,美國商務部以國家安全為由,再次將中國的5家實體列入進出口管製的實體清單,禁止它們從美國的供應商採購零部件,相關決定於6月24日生效。這五家實體與中國超算行業的“三巨頭”中的兩位相關,涉及到“曙光”和“神威”兩款超算。這五家實體中的江南計算技術研究所就是“神威”超算的研發製造單位。而其他四家實體,中科曙光,天津海光(Higon)、成都海光集成電路、成都海光微電子技術全都與“曙光”系列超算有關。

  最近這幾天,有許多美國媒體幸災樂禍,認為中國超算行業將受到致命打擊,離開了美國的CPU,中國將造不出超算。事實是這樣的嗎?這個禁令對我國的超算行業有什麼影響?本文將對這個問題進行詳細分析。

  首先,美國為什麼要再次對我國超算企業進行製裁?

  實際上,早在2015年初,美國商務部就將中國的四大超算中心列入了禁運清單。這源於美國長久以來的焦慮:在大約40年中,中國的超算行業從完全進口美國產品,到購買美國的CPU自己製造超算,再到使用自己的CPU和加速器製造超算; 從只有幾台超算,在全世界超算市場里不值一提,到擁有超算的數量全球第一,大大超越美國;從擁有的超算性能低下排不上號,到稱霸全球最快超算排行榜第一名多年;中國超算行業走出了一條完美的逆襲之路。

  世界超算組織top500.org每半年推出一次全球最快的500台超算排行榜。今年6月剛剛推出了最新的榜單。全球最快的500台超算數量按國家的分佈圖如下:

▲數據來源於top500.rog,由筆者整理
▲數據來源於top500.rog,由筆者整理

  TOP500榜單中,中國超算的數量達到了219台,占全球的44%,世界第一;美國以116台的數量占全球的23%,比中國落後甚多。

  要知道,在僅僅一年前的2018年6月,中國在TOP500中的超算總數還是206台,美國還是124台。這一年中,中國又有了進步,美國又在退步。從趨勢來看,中國的優勢會越來越大。

  由於超算在軍事,科研和經濟中的巨大作用,美國心裡的焦慮是可以理解的。他們急於抑製住中國的發展勢頭,於是就把商業誠信和公平貿易原則仍進下水道,祭出了禁運大法。那麼,這次的禁運措施對中國超算行業有什麼影響?

  對中國正在研製中的三台E級超算影響不大

  在2018年夏天,美國的超算SU女生IT終於排上了TOP500的第一名,把霸榜多年的中國“太湖之光”擠到了第二名,它比“太湖之光”快60%左右;接著,美國的另一台超算Sierra投入使用,它以微弱的優勢把“太湖之光”擠到了第三位。

  美國的媒體興奮起來,一改多年的沉默,開始吹噓下一代E級超算的威力。所謂E級超算,是指每秒鍾運算一百億億次的超級計算機,比SU女生IT還好快許多倍。美國的E級超算計劃在2021年左右投入使用,而中國為E級超算準備了三個方案,全部使用國產CPU和加速器,也計劃在2020到2021年期間陸續投入使用。

  這裏需要介紹一下加速器,超算的核心部件不止是CPU,由於超算做的是密集的科學計算工作,CPU執行這樣的計算任務並不是效率最高的,擁有眾多運算單元的加速器處理器的效率更高,比較典型的加速器芯片就是Nvidia公司的通用型GPU,以及英特爾公司的至強Xeon Phi處理器。

  最近幾年出現的超算有一個趨勢,就是使用一顆CPU帶多顆加速器的架構,計算任務主要由加速器芯片完成,CPU主要做協調,通訊和分配任務的工作。

  那麼,美國的這次禁運對我們的E級超算有什麼影響呢?讓我們來仔細看看。

  我國為下一代E級超算準備的三套方案,全都使用國產CPU和加速器芯片:

  天河三號E級超算:

  2018年5月19日,國家超算天津中心展示了天河三號原型機,在2018年底投入使用。天河三號的全配置主機計劃在2020年投入使用,性能計劃為1EFlops。 天河三號將使用國產飛騰FT2000plus或者後續型號的CPU,以及國防科技大學的Matrix2000plus或者後續型號的加速器芯片。

  飛騰CPU採用ARM架構。

  Matrix2000加速芯片是國防科大的通用DSP芯片,GPDSP,就像英偉達公司通用GPU(GPGPU)那樣,DSP(數字信號處理器)也擁有大量的運算單元。

  神威E級超算:

  神威系列超算是由江南計算機研究所研製的。2018年7月神威E級原型機落戶於國家超算濟南中心,需要三年左右的研發時間,將在2021年正式投入使用。神威的CPU肯定是申威系列的最新型號,加速器可能也會採用Matrix2000plus或者其後續型號。

  申威系列CPU脫胎於DEC Alpha處理器架構。

  曙光E級超算:

  中科曙光主要使用X86架構的CPU。在最新的TOP500榜單里,共有曙光公司製造的63台超算。除了一台以外,其它62台全部使用英特爾的至強CPU,有些超算還使用了英偉達的Tesla加速器芯片。

  猛的一看,似乎這次禁運對曙光公司是致命的打擊。因為英特爾和英偉達的芯片以後都買不到了。但是,曙光公司早就有了全國產化佈局。秘密就在這62台之外的那一台超算上。

  CPU:

  這台型號為TC8600的超算是2018年投入使用的,它的CPU採用的是天津海光公司的Hygon Dhyana處理器,32核,2Ghz頻率。天津海光公司在2016年初得到了美國AMD公司的第一代ZEN架構的永久授權,起點相當高,要知道AMD公司在2018年才推出第二代ZEN2的架構。海光3000系列CPU使用的是x86通用架構,完全支持Windows10 Pro, Windows Server2019, Linux Centos 7.x等主流操作系統,而且還有類似AMD EPYC的服務器版,最多32核64線程,基礎頻率2.0GHz,加速頻率可達3.0GHz,而且涵蓋了從4核到32核在內的多個產品線。

  在這次禁運公佈後,海光公司無法再得到AMD新的產品架構授權,但這並不影響已經得到的授權。海光公司已經組建了超過500人的研發團隊,有能力在已經得到的授權的基礎上,進一步開發新的產品,提升CPU的性能。這也意味著未來X86架構的CPU在中國可能會產生硬分叉,我們將從此與美國分道揚鑣,走出自己的路來。

  加速器芯片:

  而這台曙光超算的加速器芯片更有意思:它的名稱為Deep Computing Processor。根據公開的新聞報導,曙光的加速器芯片是基於我國寒武紀公司的AI處理器架構研製的,全球獨一無二。曙光公司的通稿上說:“2017年11月,曙光基於寒武紀低功耗深度學習處理器,率先推出PHANERON,引起業界廣泛關注。時隔6個月,寒武紀發佈性能更為強勁的MLU100,曙光同步升級PHANERON產品,並發佈一系列搭載寒武紀MLU100的服務器產品,保持著在智能服務器領域的持續領先”

  這意味著曙光TC8600超算應用於AI領域將擁有極大的優勢。

  未來曙光公司的E級超算,應該就是基於海光公司的最新CPU和曙光自己設計的PHANERON AI加速芯片的最新版本。

  由此也可以看出美國商務部的這次禁運,也根本影響不了曙光公司的E級超算產品。

  禁運可能對曙光公司的商用超算產品線的影響巨大

  我們還需要看到,由於曙光公司的主要產品線都是基於英特爾的CPU和英偉達的加速器芯片,在這次禁運之後,這些產品線都難以為繼了。從商業層面來說,對曙光公司的影響巨大。但是好在曙光有了全國產的CPU和加速器芯片替代產品。我們可以從排名第43的曙光TC8600和排名第88位的曙光TC4600LP/W740l這兩台超算的測試數據看出一些細節來:

  表格來源於top500.org,筆者進行整理分析

  曙光TC4600LP超算是基於英特爾至強CPU和英偉達Tesla加速器的產品。從以上測試數據來看,使用國產CPU和加速器的TC8600超算,在使用了3倍多的CPU核心數量以及5倍左右的加速器核心數量的情況下,跑分只不過增加到了1.4倍到1.7倍。但是功耗下降了很多,功耗效率提升了3倍多。

  筆者分析這主要是因為TC8600採用的AI加速器並不適合傳統的浮點運算,它只是在AI運算上具有巨大優勢。

  這也意味著,曙光公司缺乏合適的加速器芯片,來提升系統的浮點運算能力。這可能會對曙光公司的商業發展產生不利影響。

  也許曙光公司的未來銷售重點將轉向AI運算。但是,也不排除未來曙光公司開發基於國產Matrix2000加速芯片的產品。

  在這裏必須介紹一下,為何曙光公司不能放棄X86架構的CPU。

  全球TOP500強的超算100%都使用Linux操作系統的不同發行版。這些版本都為各自的CPU和加速器芯片做了優化。 而在超算上跑的應用軟件也會受到CPU架構的影響。

  從目前來看,對X86架構優化的Linux系統最成熟,應用軟件最多,程序開發最容易,整個軟件生態系統最成熟,穩定。而國產申威和飛騰CPU的系統則有些不足,軟件工具為它們優化得少,編程也有些麻煩,系統bug也較多,整個軟件生態系統只是解決了可用,離X86系統那樣的好用仍然有一定距離。

  所以,無論從國家的戰略方面,還是從曙光公司的商業前景而言,X86架構都是應該堅持做下去的。

  中國半導體製造技術的進步將極大地推進國產超算CPU和加速器芯片的性能

  中國的半導體製造業長期以來是我們最大的短板。在台積電和三星電子已經量產7納米工藝,英特爾已經小規模量產10納米工藝的時候,我國目前最先進的半導體製造工藝還是中芯國際的28納米工藝。

  而在上面提到的國產CPU,要麼使用國產較落後的工藝,自主性能夠保證,但性能落後;要麼在海外找半導體代工企業生產,性能可以提升,但自主性無法得到保證,說不定什麼時候就會被掐脖子。

  但這個狀態很快就要結束了。中芯國際在2018年8月的第二季度業界報告中宣佈,其14納米生產工藝取得了重大進展,第一代FinFET技術研發已經進入了客戶導入階段。而正式量產則計劃在2019年中期。所以,很快,我們就會擁有自己的14納米半導體生產工藝了。

  14納米有多厲害?要知道,現在英特爾所有的台式機和服務器芯片都是14納米的。英特爾在剛剛過去的台北電腦展上宣佈會小規模量產10納米工藝的低電壓筆記本電腦處理器,並且預計未來幾年14納米仍然是它的主力工藝。只有AMD在台積電的代工下,剛剛宣佈實現了CPU的7納米工藝生產。

  如果國產超算CPU和加速器芯片都使用中芯國際的14納米工藝生產,它們的性能將會得到一個飛躍。

  美國終將搬起石頭砸自己的腳

  實際上,美國在2015年對中國的四大超算中心的禁運,已經砸了它自己的腳:英特爾的至強Phi加速器芯片停產。

▲圖為美國《個人計算機》雜誌當年對美國封殺中國四大超算中心,禁止因特爾提供至強Phi加速器芯片給它們的報導
▲圖為美國《個人計算機》雜誌當年對美國封殺中國四大超算中心,禁止因特爾提供至強Phi加速器芯片給它們的報導

  筆者在這裏列一些事實:

  中國的天河2號超算分別使用了3.2萬顆Xeon E5 CPU和4.8萬顆Xeon Phi加速器。

  對於Xeon Phi的銷量,Intel CEO曾表示過2016年的目標是10萬顆出貨量。

  可見,單單我國的天河2號就能達到Intel 2016年約一半的Xeon Phi銷量。

  2015年4月9日,美國商務部宣佈對中國的四家超算中心禁運英特爾的至強Xeon處理器和至強Phi加速器芯片。

  2016年6月18日,至強Phi 7290/7250加速器價格直接腰斬。到2017年8月24日,英特爾宣佈至強 Phi 7200系列協處理器加速卡進入停產退市進程。

▲圖為美國《個人計算機》雜誌在當年的報導中也提到中國市場對於因特爾這一芯片的重要性,以及美國禁令將給因特爾帶來沉重打擊
▲圖為美國《個人計算機》雜誌在當年的報導中也提到中國市場對於因特爾這一芯片的重要性,以及美國禁令將給因特爾帶來沉重打擊

  筆者毫不懷疑英特爾至強Phi加速器芯片的停產就是因為對中國的禁運。這甚至影響到了美國下一代E級超算的開發。美國的E級超算,CPU可選擇英特爾和AMD的X86處理器以及IBM的Power處理器,而加速器芯片目前只有一個選擇,就是英偉達的通用GPU。

  那麼美國商務部的這次禁運會有什麼結果呢?筆者相信,在我們自力更生的努力之下,幾年之後,世界上會出現幾個新的超算CPU生態圈,徹底打破美國的壟斷。

  實際上,美國《紐約時報》和《華爾街日報》也都不認為美國政府的這一打擊中國超算的舉動會阻礙中國的發展。這兩家媒體採訪幾位不同的美國超算專家就表示,美國政府的行為雖然短期內或給中國的超算發展帶來阻礙,卻也會更加堅定中國開發本土技術替換美國科技的決心。

  而一件必然會要發生的事,就是在2020年和2021年,中國有三台E級超算將會衝擊TOP500排行榜的冠軍位置,把美國超算踢下去。讓美國看看,誰才是超算領域的王者!

關注我們Facebook專頁
    相關新聞
      更多瀏覽