AMD直連型機器學習加速器專利曝光垂直堆疊芯片I/O連接方案成焦點
2020 年9 月25 日,AMD 介紹了一項獨特的處理器專利,特點是在I/O 芯片上垂直堆疊了機器學習(ML)加速器。這意味著AMD 可能正在準備基於數據中心的片上系統(SoC),並在其中整合現場可編輯門陣列(FPGA)或專用的GPU 加速器。此前,該公司已在銳龍R7-5800X3D 桌面處理器上嘗試過3D V-Cache,但這項技術可能很快推廣到其它領域。
通過WCCFTech _
雖然除了3D 堆疊緩存之外,我們不大可能在消費級市場上看到整合其它類型加速器的AMD SoC 。
但由《直連型機器學習加速器》的專利描述可知,該技術主要由一個FGPA 或計算GPU 組成,用於處理堆疊在專用加速器相連的IO 小芯片上的機器學習工作負載。
通常情況下,機器學習工作多在數據中心開展。而AMD 的新技術,有望極大地加速運算,而無需在硬件系統中結合使用昂貴的定制芯片,其它優勢還包括更高的能源效率、傳輸速率、以及豐富的功能擴展。
當然,AMD 在一年半前宣布收購Xilinx 的時候,就已經有人猜到了這一天。由3 月下旬公佈的信息可知,這項新專利的署名人為AMD 研究員Maxim V. Kazakov 。如果進展順利,我們或於2023 年見到相關產品。
目前AMD 正在開發代號為Genoa 和Bergamo 的霄龍(EPYC)服務器處理器,推測該公司很可能在EPYC 產品線上,嘗試集成機器學習加速器的AI 處理器設計。
考慮到Genoa 和Bergamo 處理器的使用場景,整合垂直堆疊的ML 加速器,確實有助於提升性能與功能體驗。但隨之而來的,很可能是功率的暴漲。
據說該公司的第五代EPYC Turin 產品線具備600W 的可配置熱設計功耗(cTDP),直接較當前的EPYC 7003 Milan CPU 翻番,且SP5 新平台可提供700W 的瞬時峰值功率。
此外基於已公開的文本內容,AMD 還給自己留下了相當大的靈活變通的空間。比如通用/ 專用處理器、常規的CPU / GPU / ML 處理器、DSP / ASIC / FPGA,以及其它類型的集成電路(IC)。
更重要的是,AMD 可藉助處理器後的硬件描述語言(HDL)指令和netlists 等中間數據來製造,而這些指令集能夠存儲在可被計算機讀取的介質上。
相信在Xilinx 技術的加持下,AMD 最終可提供以計算為中心的CPU、強大的FPGA 設計、Pensando 可編程處理器系列、以及可靠的x86 微架構。
至於多芯片設計,AMD 已經在Infinity Fabric 互聯技術上相當精進。對於企業客戶來說,垂直堆疊技術還可為數據中心處理器帶來更豐富的選項。
比如將面向數據中心的多瓦片APU 和基於台積電N4X 性能節點製造的處理器拼接到一起,並藉助GPU / FPGA 加速器、以及優化的增強型N3E 工藝技術來進一步完善。
綜上所述,AMD 將在未來產品線中更普遍地整合加速器,通過站在行業風口的最前沿,為數據中心客戶提供更加多樣化的產品組合。