Arm:AI時代晶片設計需要一場深度變革
曾經,摩爾定律是推動晶片設計快速變革的隱形推手,但如今隨著物理和經濟極限的逼近,它已漸漸不再適用。尤其是隨著AI運算浪潮的崛起,晶片設計面臨許多挑戰,迫切需要一場全新的深度變革,從多個層次重構,才能滿足當下、適應未來。

憑藉35年來在SoC晶片設計領域的豐富經驗與深厚積累,Arm一直走在晶片技術革命的前沿,從移動晶片到再到定制晶片莫不如此。
近日,Arm解決方案工程部執行副總裁Kevork Kechichian分享了Arm對於AI時代晶片設計變革的深度思考,並從多個角度提出了下一步的方向。

摩爾定律早在1965年就誕生了,尤其是在20世紀八九十年代,它持續且精準地指導著芯片和半導體行業的快速迭代,推動了芯片和其他組件的小型化、移動化,行業呈現出一片欣欣向榮的景象,這也為Arm的發展提供了廣闊空間,使其開始大展拳腳。
從1990年代中期的行動晶片組崛起,到21世紀初期SoC系統級晶片的繁榮,技術的演進歷程推動了整個行動產業的繁榮發展,SoC也逐漸滲透至更多領域,甚至包括對效能、擴展性要求極高的資料中心。
AI時代來臨,隨著運算負載規模、複雜性的持續攀升,能源消耗、成本劇增的壓力越來越大,這顯然並非可持續發展之路,計算能效、客製化、平台化等正受到越來越高的重視。

能效無疑是其中最為核心的關鍵點。從晶片設計的角度來看,最主要的能耗來源有兩個:運算和資料傳輸。此外,還需要對過程中所產生的熱量進行冷卻處理。
AI對於算力的渴求,導致晶片功耗呈現爆炸性成長趨勢,例如NVIDIA最新的Blackwell B200 AI晶片,其功耗可能將達到1千瓦。
權威機構高盛也預測,AI將推動資料中心的電力消耗快速成長160%,為一座大型資料中心配備一座專門的發電廠並不是開玩笑。
更不要提這對環境的破壞…
為此,整個產業都在進行各種新的探索嘗試,從多角度解決能耗問題,包括但不限於:更高效的晶片設計、更深層的架構與指令集創新、更小尺寸和更高效率的AI模型、雲端端結合的AI執行,等等。

AI 驅動的網路威脅- 來源:DarkTrace—2024 年AI 網路安全狀況報告
同時,安全威脅也在AI時代日益突出。
DarkTrace 2024年公佈的一項調查報告,接近74%的受訪者表示AI驅動的網路威脅已帶來顯著衝擊,60%的受訪者擔心尚未做好充分準備應對這類威脅與攻擊。
311研究所甚至提出,「我們已經到達了這樣一個階段:完全自主的智能體AI 網路攻擊能夠自我進化、識別系統漏洞,並發動複雜攻擊。」科幻中的場景已經開始成為現實。
在一個實際案例中,一種AI攻擊不到2分鐘就通過串聯零日漏洞,攻破了軍用級系統。
這意味著,如今的安全防禦已不再只是對抗傳統惡意軟體的問題,而是為一個AI本身就是攻擊者的未來做好準備。
為此,Arm和其他晶片企業在現代SoC中整合了越來越多層次的安全機制,協同工作抵禦各種威脅,包括但不限於:嵌入式加密保護、機密計算架構(CCA)、硬體信任根(RoT)、安全飛地、可信賴執行環境(TEE)、安全內存管理單元(MMU)、內存擴展標記(MTE)、PSA認證、定制晶片安全晶片標準,等等。
同時,業界正在不斷加大對硬體級安全的投入,透過建構具備信任根和標準化安全機制的系統,抵禦AI驅動型攻擊。

可以說,AI正在深刻影響著晶片設計。由於AI負載的興起,尤其是它的多樣化、複雜化,正在從根本上改變晶片的設計方式,特別需要針對大規模並行處理、記憶體頻寬優化的差異化架構。
具體來說,AI時代的晶片設計,迫切需要新型的專用加速器架構、記憶體子系統的創新與突破、能源效率的高度聚焦、封裝與整合方式的演進。
Arm在報告中提出,未來的晶片,將具備幾個鮮明的特點:不同技術與路徑的深度集成、更成熟的電源管理技術、更緊密的生態系統協作、內存架構與集成方式的創新、面向AI及其他高性能計算需求的專用解決方案。
同時不容忽視的是,除了設計晶片服務AI,AI也在服務晶片設計,AI正成為晶片設計流程中不可或缺的一部分,例如機器學習(ML)技術正廣泛應用於佈局佈線、能耗優化等各個設計環節。
由此,形成了一個有趣的回饋迴路—— AI正在協助設計用於運行AI工作負載的晶片本身。
基於此,Arm提出了五個清晰可辨的晶片設計大趨勢.
一是協作深化:
現代晶片設計日益增加的複雜性,要求IP供應商、晶圓代工廠、封裝廠、系統整合商之間,建立更緊密的合作關係,因為沒有一家公司能夠獨立完成所有工作。
二是聚焦系統:
晶片成功的關鍵,不再是單一元件的最佳化,而是對系統進行整體最佳化,包括運算、記憶體、電源管理、散熱管理等各個面向。
三是標準化:
為了實現真正模組化的晶片設計,靈活、高效匹配不同的負載和場景,業界必須制定新的標準,包括芯粒介面、電源管理、散熱管理等。
四是能耗感知設計:
從架構設計到具體落地,晶片設計的每一個環節,都必須以高能效為核心進行考量,不能單純追求效能而無視能耗問題。
五是專用化:
差異化的工作負載,將催生更多專用架構,推動晶片設計走向多元化。

尤其是在架構設計方面,正因為它決定了一款晶片幾乎所有方面的表現,包括性能、能源效率、安全性、靈活性、發展潛力等等,所以更加至關重要,AI時代的晶片架構設計自然需要及時轉換。
AI負載對運算的需求與以往截然不同。Arm堅信,只有透過異質運算,也就是CPU、GPU、加速器及網路等技術的共生協作,才能最大程度地滿足AI驅動的算力成長需求,而Arm計算平台就是這樣的一個產業優解。
異質運算方面,基於Arm架構的CPU,正在成為GPU、NPU、TPU等AI加速器的理想搭檔,既能高效管理資料流和運算任務,又不會遇到瓶頸。
推理效率方面,大型AI模型的訓練通常依賴高效能GPU,而對於端側和資料中心的推理任務,Arm的高能源效率處理器就非常適合。
可擴展性方面,Arm架構支援CPU、GPU與專用加速器的無縫集成,可組成優化到位的AI系統。
可以說,晶片架構如今已成為決定AI系統能效、效能的關鍵要素。 Arm正是憑藉著創新、客製化、高能源效率的獨特優勢,成為業界的核心力量。
創新方面,Arm定期發表新CPU架構及支援功能,專注於推動客製化晶片發展,確保與不斷演進的AI工作負載需求保持同步。
客製化潛力方面,隨著AI模型在複雜度和規模上的不斷增長,Arm架構的靈活性使其能夠針對特定AI任務打造專用解決方案。
能源效率方面,基於Arm架構處理器的高能源效率特性,使其在管理大規模AI部署的總擁有成本方面,展現出更高的價值。

當然,單純的硬體是無法解決任何問題的,軟體的協同至關重要,可以說AI發展的未來就在於軟體與硬體的深度融合與協同發展。
例如AI框架之間的互通性、AI模型為客製化硬體的移植、AI開發中的標準化、各種新的資料類型的處理,以及各種開發工具的適配,都為產業帶來了新的挑戰。
Arm致力於支援能與所有主流AI框架廣泛相容的晶片解決方案,從而確保Arm運算平台能夠與多樣化的AI工具無縫集成,使開發者在擁有軟體靈活性選擇的同時,還能充分利用Arm架構晶片卓越的性能和能源效率。
對於AI軟體的開發,Kevork也提出了四點關鍵建議:
一是善用廣泛的通用工具,有助於簡化開發流程,減少開發片段化,進而加速結果落地、降低成本。
二是提供預先建構的後端支持,為定制晶片提供「開箱即用」的兼容性,從而加快其落地。
第三是維持對上游的貢獻,積極開發開源框架,從而確保相容性,避免技術發展停滯不前
前。
四是緊跟框架演進步伐,隨著AI框架的快速演進,保持與最新技術同步對於維持競爭力至關重要。

當下,半導體產業正處於一個重要的轉變時刻。傳統的摩爾定律和製造製程縮放技術已陷入瓶頸,客製化晶片、芯粒等創新方案正煥發全新活力。
AI時代的到來,更是對整個晶片產業提出了全新的考驗,需要上下游企業摒棄以往的傳統觀念,針對AI負載的突出特點,重新思考晶片的架構、性能、能效、安全、軟體工具等各方面如何協同設計才能達到最佳成果。
正如Kevork所總結,運算的未來,尤其是AI的未來,取決於我們能否持續突破晶片技術的極限。
未來幾年,半導體產業如何持續創新以適應AI需求,將變得至關重要。只有透過整個生態系統的協作,才有可能達成最理想的境界,既能釋放AI的變革潛力,又能有效控制複雜度、能耗和成本,從而透過AI讓我們的世界變得更加美好。