國產AI訓練集群進入超算領域相當於50萬台PC算力
被稱為“國之重器”的超算技術正在開啟國產替代的步伐。在新技術架構的窗口期,如何更快構建超算良性生態系統,尋找新一代計算平台的落地方向,正成為重要課題。
李娜
11月29日,鵬城實驗室與華為在深圳共同發布鵬城雲腦Ⅱ一期項目,正式開啟千E級AI集群應用。據悉,鵬城實驗室是廣東省啟動建設的首批4家省實驗室之一,主攻方向與人工智能緊密相關,研究重點包括網絡通信、先進計算、網絡安全等。
中國工程院院士、鵬城實驗室主任高文在接受包括第一財經在內的媒體採訪時表示,鵬城實驗室將著力解決中國AI開源開放平台之短板,而補短板要從開源開放平台開始。鵬城實驗室針對開源開放共享創新平台推出鵬城雲腦,雲腦一期工程100P算力的大型集群系統已出具規模,雲腦二期將建成的是E級AI大科學設施,用以支撐構造更好的AI生態。
據悉,當今業內頂尖的AI集群一般還停留在百P級FLOPS的水平,也就是每秒十億一次的計算能力,但隨著算法和需求的不斷發展,將來必將擴展到E級FLOPS, (1 EFlops,百億億次計算,每秒鐘可執行1018 次雙精度浮點計算)也就是每秒百億億次計算能力。
“現在的計算機可以破掉128位的密碼,但人工智能起來之後,大量的數據進去,訓練一些模型出來,更多的是在做矩陣運算,數據越大的時候需要的算力就越強。 ”高文對記者說。
隨著AI算法和需求的不斷發展,算力不足、訓練時間長一直是困擾人工智能領域的主要矛盾,而造成這一問題的一個主要原因在於算力的供應壟斷在少數廠商手裡。
“過去我們接觸的數字世界是建立在英特爾、英偉達、微軟這些公司上,華為希望提供第二種選擇。”華為Cloud&AI產品與服務總裁侯金龍對記者表示,Atlas 900是當前全球最快的AI訓練集群,能為各行各業提供充足的AI算力,打破算力壟斷。該集群基於數千顆華為自研的昇騰910AI處理器,相當於50萬台PC的計算能力。
華為智能計算業務部總裁馬海旭則補充道,Atlas 900代表了當今全球AI計算的最高水平,它由數千顆昇騰910 AI處理器構成,打造一套這樣的集群系統需要克服芯片設計、組網、散熱、軟件調度等各方面世界級難題。
“Altas人工智能計算平台產品自今年4月份上市以來,已經與40多家ISV形成聯合解決方案,涉及智慧城市、金融、電力等領域。”馬海旭說。
對於AI領域的挑戰,高文此前曾總結道,中國人工智能的發展面臨著“4+4”的局面,有4個優勢,也有4個短板。四個優勢分別是,強有力戰略引領和政策支持,海量的數據資源,豐富的應用場景,大批有潛力的青年人才快速成長。而四個短板則是AI基礎理論和原創算法差距較大,高端芯片、關鍵部件、高精度傳感器等基礎薄弱,未形成具有國際影響力的人工智能開源開放平台,高水平人才不足。