Intel發布全新Sunny Cove架構最快2019年下半年面世
在聖克拉拉舉辦的架構日活動上,Intel高級副總裁兼矽工程師集團總經理Jim Keller公開展示了一系列處於研發中的基於10nm的系統,將用於PC、數據中心和網絡設備,並預覽了其他針對更廣泛工作負載的技術,其中最吸引人的便是基於10nm的下一代“Sunny Cove”處理器架構。
據悉,Sunny Cove架構旨在提高通用計算任務下每時鐘計算性能和降低功耗,並包含了可加速人工智能和加密等專用計算任務的新功能。明年晚些時候,Sunny Cove將成為Intel下一代PC和服務器處理器的基礎架構。
Sunny Cove能夠減少延遲、提高吞吐量,並提供更高的並行計算能力,有望改善從遊戲到多媒體到以數據為中心的應用體驗,其功能特性包括:
增強的微架構,可並行執行更多操作。
可降低延遲的新算法。
增加關鍵緩衝區和緩存的大小,可優化以數據為中心的工作負載。
針對特定用例和算法的架構擴展。例如,提升加密性能的新指令,如矢量AES和SHA-NI,以及壓縮/解壓縮等其它關鍵用例。
同時,Intel首席架構師、核心與視覺計算集團高級副總裁兼邊緣計算解決方案總經理Raja Koduri向大家介紹了全新的Gen 11核心顯卡,並重申了在2020年推出獨立圖形處理器的計劃。
Gen 11核心顯卡將於2019年開始隨10nm處理器一同面世,配備64個EUs(增強型執行單元),運算規模是此前Gen 9核心顯卡的2倍,浮點運算性能超過1TFlops,並採用Intel自適應同步技術,旨在提高遊戲的可玩性。該顯卡還將採用業界領先的媒體編碼器和解碼器,在有限的功耗下支持4K 流和8K內容創作。
此外,Intel還在活動上介紹了傲騰技術、Foveros邏輯芯片3D堆疊技術、One API軟件以及深度學習參考堆棧等內容。
邏輯芯片3D堆疊技術:繼2018年推出EMIB(嵌入式多芯片互連橋接)2D封裝技術之後,Intel此次展示了業界首創的名為Foveros的全新邏輯芯片3D堆疊技術,可實現在邏輯芯片上堆疊邏輯芯片。
該技術有望首次將晶片的堆疊從傳統的無源中間互連層和堆疊存儲芯片擴展到CPU、GPU和AI處理器等高性能邏輯芯片,為整合高性能、高密度和低功耗矽工藝技術的器件和系統鋪平了道路。設計人員可在新的產品形態中“混搭”不同的技術專利模塊與各種存儲芯片和I/O配置。並使得產品能夠分解成更小的“芯片組合”,其中I/O、SRAM和電源傳輸電路可以集成在基礎晶片中,而高性能邏輯“芯片組合”則堆疊在頂部。
Intel預計將從2019年下半年開始推出一系列採用Foveros技術的產品。首款Foveros產品將整合高性能10nm計算堆疊“芯片組合”和低功耗22FFL基礎晶片。它將在小巧的產品形態中實現世界一流的性能與功耗效率。
One API軟件:Intel宣布推出“One API”項目,以簡化跨CPU、GPU、FPGA、人工智能和其它加速器的各種計算引擎的編程。該項目包括一個全面、統一的工具組合,以將軟件匹配到能最大程度加速軟件代碼的硬件上。公開發行版本預計將於2019年發布。
傲騰技術:Intel傲騰數據中心級持久內存作為一款新產品,集成了內存般的性能以及數據的持久性和存儲的大容量。這項技術通過將更多數據放到更接近CPU的位置,使應用在人工智能和大型中的更大量的數據集能夠獲得更快的處理速度。其大容量和數據的持久性減少了對存儲進行訪問時的時延損失,從而提高工作負載的性能。
Intel傲騰數據中心級持久內存為CPU提供緩存行(64B)讀取。一般來說,當應用把讀取操作定向到傲騰持久內存或請求的數據不在DRAM中緩存時,傲騰持久內存的平均空閒讀取延遲大約為350ns。如果實現規模化,傲騰數據中心級固態盤的平均空閒讀取延遲約為10000ns(10μs),這將是顯著的改進。在某些情況下,當請求的數據在DRAM中時,不管是通過CPU的內存控制器進行緩存還是由應用所引導,內存子系統的響應速度預計與DRAM相同(小於100 ns)。
Intel還展示了傲騰與QLC固態硬盤的結合,將降低對最常用數據的訪問延遲。總體來說,這些對平台和內存的改進重塑了內存和存儲層次結構,從而為系統和應用提供了完善的選擇組合。
深度學習參考堆棧(Deep Learning Reference Stack):這是一個集成、高性能的開源堆棧,基於Intel至強可擴展平台進行了優化。該開源社區版本旨在確保人工智能開發者可以輕鬆訪問Intel平台的所有特性和功能。深度學習參考堆棧經過高度調優,專為雲原生環境而構建。該版本可以降低集成多個軟件組件所帶來的複雜性,幫助開發人員快速進行原型開發,同時讓用戶有足夠的靈活度打造定制化的解決方案。
操作系統:Clear Linux 操作系統可根據個人開發需求進行定制,針對Intel平台以及深度學習等特定用例進行了調優;
編排:Kubernetes可基於對Intel平台的感知,管理和編排面向多節點集群的容器化應用;
容器:Docker容器和Kata容器利用Intel虛擬化技術來幫助保護容器;
函數庫:Intel深度神經網絡數學核心函數庫(MKL DNN)是Intel高度優化、面向數學函數性能的數學庫;
運行時:Python針對Intel架構進行了高度調優和優化,提供應用和服務執行運行時支持;
框架:TensorFlow是一個領先的深度學習和機器學習框架;
部署:KubeFlow是一個開源、行業驅動型部署工具,在Intel架構上提供快速體驗,易於安裝和使用。