全球超算TOP500榜單更新怎樣才算“看懂超算”
由國際超級計算大會(ISC)公佈的新一期全球超級計算機500強榜單出爐。中國繼續擴大數量上的領先優勢,在總算力上與美國的差距進一步縮小。
美國能源部下屬橡樹嶺國家實驗室開發的Summit(頂點)以每秒14.86 億億次的浮點運算速度再次登頂,與半年前的速度相同。美國能源部下屬勞倫斯利弗莫爾國家實驗室開發的Sierra(山脊)、中國超算神威·太湖之光和天河二號分列二三四位。
全球超算500 強榜單每半年發布一次。本次榜單顯示,中國境內有228 台超算上榜,在上榜數量上蟬聯第一,比半年前的榜單增加9 台。美國以117 台位列第二,日本、法國、德國依次位居其後。這是2017 年11 月以來,中國超算上榜數量連續第五次位居第一。榜單顯示,中國企業繼續保持上榜數量優勢。聯想、中科曙光和浪潮位居全球超算製造商前三位。
什麼是超算
超級計算機(Super computer),顧名思義,就是具有很強的計算和處理數據能力的計算機,主要特點表現為高速度和大容量,配有多種外部和外圍設備及豐富的、高功能的軟件系統。一般來說,超級計算機的運算速度平均每秒1000 萬次以上,存貯容量在1000 萬位以上。
從結構上看,超級計算機和普通計算機都是大同小異的,但它將大量的處理器集中在一起以處理龐大的數據量,同時運算速度比常規計算機快許多倍,進而影響到各個行業運行,其意義十分重大。
你認為是科技強國的那些國家,就是超算的強國,這兩個集合是高度重疊的。這也可以反映出超算的重要性,它相當於科技界的一種基礎設施。
從半年前也就是2019 年6 月開始,超算TOP500 的入門門檻超過1PFlops(每秒一千萬億次浮點運算),這是全球超算TOP500 榜單26 年以來的又一歷史性突破。
超算怎麼排名
TOP500 是按照什麼來給超算排名的?當然按照計算速度了,用專業語言來說,是每秒能夠執行多少次浮點運算。
當你去看TOP500 的榜單時就會發現,對於每台超算都列出了兩個計算速度,一個叫做Rmax,一個叫做Rpeak。例如對於目前排第一的Summit,Rmax 是每秒14.86 億億次,Rpeak 是每秒20 億億次。
Rmax 是實測的最高速度,Rpeak 是理論上的最高速度。總會有些實際原因使超算的性能達不到理論上限,所以Rmax 總是小於Rpeak。因此,TOP500 排名用的是實測的最高速度,也就是Rmax。
超算是不是芯片越多越強悍
在中國的超算佔據首席的5 年中,很多人對此不屑一顧。他們以為超算就是處理器堆出來的,有錢多買些處理器,計算能力就上去了。他們還以為中國的超算都是買的外國的處理器,因此計算能力再高也不值一提。
首先,超級計算機為什麼算得那麼快,的確是因為超算用了很多個芯片,讓它們同時執行任務,也就是高性能計算的基本法則:並行計算。
超算的單個芯片的性能跟個人電腦的芯片差不了太多,而讓多個芯片進行工作,要先給它們劃分好任務,這個任務劃分是要消耗時間的。當各個芯片開始計算之後,還不時地要和其他芯片交換數據,數據通信,這是也是要消耗時間的。
因此,當芯片很多的時候,任務劃分和數據通信會變成瓶頸因素,由此可見,芯片並不是越多越好,光靠堆芯片是堆不出超級計算機的,就跟企業越大,組織層級越多,辦事效率就越低一個道理。
一台超算能夠容納下多少芯片,並不是取決於你能買到多少芯片,而是取決於系統架構。只有擁有好的系統架構,你才能擁有更多芯片,也就能擁有更大的算力,所以芯片數增加不是超算升級的原因,而是結果。除了芯片之外,架構同樣也是核心技術。
那麼中國超算用的是國產芯片嗎
其次,來說說國產芯片的問題。TOP500 上的第三和第四,也就是神威太湖之光和天河二號,它們現在用的都是國產芯——注意是現在。
神威太湖之光用的是中國自主研發的“申威26010”眾核處理器。它的出現擊碎了外界對於超算芯片國產化的質疑。
天河二號以前用的是英特爾的Xeon Phi(至強融核)芯片,在它連續四次奪冠后,2015年4月,美國商務部禁止英特爾公司向中國國家超級計算廣州中心出售至強芯片。長沙中心、廣州中心、天津中心和國防科技大學這四家國家超算中心,均被美國列入了出口管制名單。
面對來自美國的扼殺,天河二號在2017 年底用國產的Matrix-2000 協處理器替換了用了五年的Xeon Phi。這次升級把天河二號的每秒計算次數從3.39 億億次提升到了6.14 億億次,而功耗只增加了不到4%。所以六年了,天河二號還能在TOP500 上排到第四,可以說相當出色。
另外還要說一句,天河二號取得突破的關鍵之一是中國自製的TH Express-2 主幹拓撲結構網絡連接,這項技術世界領先。所以說,構架也是核心技術就這個道理。
當然你可能又有話要說了,那其他的超算呢?事實上,出於商業和應用上的考慮,不管是中國還是美國,大多數企業部署的超算都趨向於採用成熟的芯片,比如本期TOP500 榜單中,94% 都使用了英特爾Xeon(至強)或Xeon Phi(至強融核)處理器。這是美國在計算機芯片研製方面的絕對優勢,中國短時間內很難打破。
超算到底有什麼用
很多人會問超算到底有什麼用。回答是當然非常有用了,不然全世界的科技強國紛紛製造超算幹嘛呢!
超算在情報收集、破解領域能力領先,可以強行攻破對方的安全系統,棱鏡計劃暴露了美國政府對公眾隱私和他國公民個人數據的龐大監控,這些海量情報需要進行處理,就要用到超算。
說個離老百姓近的例子,現在的天氣預報為什麼總那麼準,就是超算對雲層進行精確的模擬和觀測的結果。通過超算模擬還可以計算未來一段時間內大氣污染物濃度和分佈,進行空氣質量報告。
而我們用到的很多先進技術——比如處理器技術、虛擬技術包括未來的量子計算,最早都是超算先用,然後才普及為民用。目前的雲計算和大數據同樣也需要超算的算力支持。
醫療領域,超算已經在用於腫瘤研究、DNA 測序和藥物研發等等。此外超算還用於核業、軍事、航天等高科技領域。
總之,大到模擬宇宙的演變,小到測算一個分子結構,超算發揮作用的地方可太多了。
超算界有一個最高級榮譽——當然不是這個TOP500 排名了——叫做戈登·貝爾獎(Gordon Bell Prize),是授予最傑出的高性能計算應用的,每年頒發一次。獲得戈登·貝爾獎的應用,一般都在最快的超算上運行。
基於神威·太湖之光的兩項應用“千萬核可擴展全球大氣動力學全隱式模擬”、“非線性地震模擬”分別在2016 年和2017 年獲得戈登·貝爾獎。其中非線性地震模擬,模擬的就是唐山大地震。
中國超算什麼時候能重回第一
神威太湖之光曾經在從2016 年6 月到2017 年11 月的四期TOP500 榜單中排在首位,四連冠。
天河二號曾經在2013 年6 月至2015 年10 月的六期榜單中六連冠,直到2016 年6 月讓位給神威太湖之光,然後一直保持亞軍。
而美國重新奪回TOP500 的第一名已經是2018 年6 月的事了,當時外媒鋪天蓋地地報導,國內也有不少人關注。
自從TOP500 開始發布的1993 年以來,美國曾經不止一次地失去速度最快的桂冠,但始終保持著上榜數最多的地位。到了2017 年11 月,中國第一次在上榜數目上登頂,美國失去這個第一。在最新的榜單中,中國擴大了上榜數目的優勢,在總算力上接近美國,美國超算佔比為37.1%,中國超算佔比為32.3%。而半年前,這個數據是美國38.4%,中國29.9%。
從這一點看,中國超算已經相當強悍,而且繼續發展下去很快會在總算力上超越美國。如果你要問中國超算什麼時候拿回TOP500 的第一名,機會不久就會到來,那就是世界超算格局的新變化之一:E 級超算的出現。
E 級超算,即百億億次超算,被公認為超級計算機界的下一頂皇冠。從Summit 的每秒近15 億億次浮點運算速度到百億億次,這中間有相當大的發展空間,到E 級超算實現時,將會出現全新的榜單。
美國對此高度重視,相繼宣佈建造“極光”、“前沿”和“酋長岩”三台E 級超算,交付時間預計為2021 年至2023 年。
中國也在已經開始E 級超算部署三連發,其中E 級超算“天河三號”原型機2018 年7 月已開放應用,“天河三號”有望於2020 年研製成功。神威E 級原型機和曙光E 級原型機系統也已完成交付。
下一個第一,不出意外的話應該就在這幾個名字之間誕生,我們拭目以待。
而大家在關注第一的時候也應該清楚,科技競爭不等於戰爭,並沒有真正意義的失敗者,只要你參與競爭,就能從中獲得科技進步,分享科技成就。在超算領域,我們已經是國際上數一數二的競爭者,這本身就非常了不起。而在超算的競爭中,我們同樣能在高性能芯片、構架系統、軟件應用等眾多方面積累領先的成果,實現最終理想。