AMD Zen 2處理器架構為何要如此設計?
AMD在E3 2019前夕的Next Horizon Gaming大會上正式發布了Ryzen 3000系列第三代銳龍桌面處理器,新的處理器擁有最高16核心32線程的規格,CPU架構也從現在的Zen+升級為Zen 2 ,性能上會有明顯的提升。
按照AMD提供的數據顯示,第三代銳龍桌面處理器的遊戲性能已經追平甚至超過同價位下英特爾的第九代酷睿處理器,在創作性能方面則是全面碾壓對方,在加上主板平台支持PCI-E 4.0的優勢,從各種意義上說已經展現出足夠的優勢來超越對手。
不過當我們仔細去看第三代銳龍桌面處理器時,我們發現了一個很有趣的事情,那就是CPU的內部不是一個封裝在一起的大核心,而是被分為了CPU核心以及I/O核心兩個部分,其中CPU核心採用的是7nm工藝打造,而I/O核心則採用12nm工藝打造,內存控制器也不再整合於CPU核心中,而是被拿出來放到了I/O核心中,通過Data Fabric總線與CPU核心進行數據交換。
實際上不僅僅是內存控制器與CPU進行數據交換時要用到I/O核心上的Data Fabric總線,由於提供PCI-E 4.0通道的PCI-E控制器也整合在I/O核心中,因此CPU、內存與GPU直接的數據交換都會通過Data Fabric總線進行。看到這里大家是不是覺得這樣的結構有點眼熟呢?是的,此時處理器的I/O核心實際上就相當於很久之前主板上的北橋芯片,是整個平台的數據交換中心,因此我們甚至可以說,第三代銳龍桌面處理器對應的整個平台,似乎又回到了很久之前的“CPU+北橋+南橋”結構。
那麼為什麼AMD要在自家最新款的桌面處理器中使用這種看起來已經落後的結構呢?這點我們不妨從內存控制器的發展進程看起,來看看內存控制器放在不同的位置會有些什麼優點和缺點,這樣或許我們可以更好地理解AMD為什麼要在第三代銳龍桌面處理器中,把內存處理器放到I/O核心中。
傳統的南北橋主板芯片組時代
在AMD的K8架構處理器、英特爾的第一代酷睿處理器登場之前,他們兩家的CPU平台都是最傳統的“CPU+北橋+南橋”結構。此時的CPU就是純粹的CPU,除了運算指令外並不具備其他功能。北橋芯片則是整個主板的數據交換中樞,整合有內存控制器以及AGP/PCI-E控制器等重要的控制功能,CPU、GPU與內存之間的數據交換都要通過北橋芯片進行;南橋芯片則用於擴展外圍I/O接口,例如SATA和USB接口等。
經典的英特爾3系列南北橋主板芯片搭配
在這個時代,主板能支持什麼樣的內存和顯卡,都是由北橋芯片決定的,南橋芯片則決定主板可以提供多少外圍I/O接口。因此當時不少主板都是以其北橋芯片來劃分市場的,產品型號命名上也會想法嵌入北橋芯片的名字,以此來強調自己產品的定位。這樣的架構同時也賦予了平台極高的靈活性,通過不同的北橋和南橋芯片的搭配,廠商可以進一步細分產品線,同時舊款的CPU也可以通過用在新主板上的方式來獲得新的功能,例如英特爾Pentium E5200處理器在搭配P965主板使用時可支持DDR2內存,搭配P45主板使用的話就可以使用DDR3內存了。
但是這種結構有個缺點,那就是北橋芯片的負荷實在太重了,由於整個平台的數據交換都需要經過北橋芯片,因此北橋芯片的數據帶寬必須要非常充足才能滿足整個平台的使用需求。而隨著各種應用對CPU、內存與顯卡性能的需求越來越高,三者之間的數據交換速率也越來越快,這種傳統架構開始不堪重負,特別是CPU與內存之間的數據交換,北橋芯片與CPU之間的總線帶寬越來越難以滿足需求,在一定程度上也制約了CPU性能的發揮,這時候就需要一種新的結構來滿足整個平台的性能需求了。
CPU核心整合內存控制器時代
從時間點來看,AMD要比英特爾更早地在桌面CPU中整合內存控制器,早在K8架構處理器時代他們就已經這麼做了,而那個時候英特爾的平台還處於傳統的南北橋結構階段,AMD也因此實現了技術層面上的逆襲。內存控制器整合到CPU內部帶來的最大好處,就是CPU與內存之間的數據訪問延遲得到了大幅度的縮短,兩者的運行幾乎達到了同步的水平,使得CPU核心的性能可以得到完全的發揮。
AMD的推土機架構,其CPU內部整合了內存控制器,但沒有整合PCI-E控制器
同時由於北橋芯片剝離了內存控制器,其負荷可以說是大大降低了,因此自身的體積、功耗和發熱量都得到了縮減。但由於本身還需要承擔PCI-E控制器的功能,因此這個時候北橋芯片仍然是區分主板級別的重要判定標準,但至少主板能支持什麼樣的內存,已經不再需要由北橋芯片來決定,不同等級的主板之間的差別在一定程度上是減少了。
英特爾X58平台上的Core i7-9xx系列只整合了內存控制器
英特爾直到第一代酷睿處理器才在CPU中整合了內存控制器,同時也是那個時候開始酷睿處理器有了我們熟悉的i3/i5/i7等級劃分。不過與AMD在整合內存控制器後仍然維持南北橋主板芯片組的做法不同,第一代酷睿處理器除了X58平台的Core i7-9xx系列外,其餘產品都只需要搭配一個主板芯片即可,因為英特爾不僅在CPU中整合了內存控制器,就連PCI-E控制器都已經整合到了CPU當中(Core i7-9XX系列並無整合PCI-E控制器),所以這個時候的CPU就像是“CPU+北橋”的結合體,不過由於原本北橋芯片的部分功能仍然需要主板芯片來實現,因此這個時候主板芯片的作用就不僅僅是南橋了,而是要比傳統的南橋芯片承擔更多的工作。
Clarkdale核心處理器結構
不過第一代酷睿處理器的“整合”也並非是將所有組成都放在一個核心中,實際上基於32nm工藝和Clarkdale核心打造的第一代酷睿處理器實際上還是會分為CPU+GPU兩個獨立的核心,CPU核心提供的仍然是純粹的運算功能,而內存控制器和PCI-E控制器都位於GPU核心中,但畢竟兩者之間的距離被大大縮短,內部走線也可以得到最佳的優化,所以從綜合性能仍然有著很明顯的增長。
反觀AMD,雖然他們從K8架構就在CPU內部整合了內存控制器,但是一直到推土機、打樁機架構CPU,其仍然沒有將PCI-E控制器整合到CPU中,因此從整個主板的結構來看也仍然是傳統的“CPU+北橋+南橋”設計,這對於主板的生產製造就產生了一定的難度,也不利於整機綜合性能的進一步提升。
全面整合內存控制器與PCI-E控制器的時代
英特爾在經歷了第一代酷睿處理器的“CPU+北橋”簡單整合後,從第二代酷睿處理器開始就全面將內存控制器、PCI-E控制器與核芯顯卡都整合到了一個核心當中,當然為了讓不同主板芯片的檔次得到區分,有部分平台部分功能仍然需要搭配相應主板芯片才能實現,例如只有P系列與Z系列的主板才能支持K系列處理器超頻,而P系列主板不支持核顯輸出等等。
第一代銳龍桌面處理器中,內存控制器與CPU核心是封裝在一起的
而AMD雖然要到第一代銳龍處理器才將北橋芯片的主要功能整合到CPU當中,不過他們家的APU倒是更早地就實現了相應的技術,在AMD的第一代桌面APU上我們就可以看到其擁有完整的“CPU+GPU+北橋”功能,而且三者是封裝到一個核心當中,有著很高的整合度,相應的主板平台也因此從“芯片組”變為了“芯片”。從這裡我們也可以看出,AMD並非在技術上無法將北橋芯片整合到CPU當中,而是出於各種各樣的原因和需求,要到第一代銳龍處理器的時候才全面引入這樣的設計而已。
AMD:Zen 2架構是平衡度最佳的設計
現在我們把目光返回到第三代銳龍桌面處理器的身上,從其目前的結構來說,其實它是用回了類似於英特爾第一代酷睿處理器的結構,就是CPU核心與I/O核心(相當於傳統意義上的北橋核心)分別封裝,然後整合到一個PCB上。從理論上來說,這樣的結構並不利於CPU核心與內存控制器之間的數據交換,即便在是同一塊PCB上,其內存延遲相比整合到CPU核心內部是要更高一些的。而且我們也可以看到,如果是對應8核以上產品,那麼兩個CCD之間想要交換數據,那麼也得通過I/O核心上的Data Fabric總線進行,這也不是一個有利於提升CPU性能的設計。從這些方面來看,我們甚至可以說第三代銳龍處理器反而有點像是走了回頭路。
大緩存設計很大程度上可以解決內存延遲問題
那麼AMD為什麼會採用這種“回頭路”設計呢?對此AMD表示所有的設計其實都在他們的考慮當中,實際上你不能將這些設計的任何一個部分單獨剝離出去看,你要從整個CPU的設計來進行看待,不可否認這樣的結構並不是CCD模塊相互之間交換數據的最佳設計,也不是CPU核心與內存控制器通訊的最佳方式,但是在綜合考量多方面的表現後,這種設計的平衡度是最佳的,首先憑藉CPU內部的大緩存設計以及Zen 2架構種的指令預測機制,這些問題其實很大程度上已經得到了解決,最終的CPU性能表現可以說明一切。
不同數量的CCD模塊與I/O核心搭配可以衍生出不同的級別的CPU產品
其次這是一種靈活度很高的結構,通過不同數量的CCD核心與I/O核心搭配,是可以輕鬆衍生出各種不同級別的產品,例如8核心16線程的處理器,就只需要搭配1個CCD模塊即可,或者也可以將其中一個CCD模塊換成GPU,那麼就可以衍生出對應的APU產品了。而且這種模塊化的設計在更換或去掉其中一個模塊後,並不會影響其它模塊的運作和性能表現,這讓CPU或者APU的設計可以變得更為簡單。
退一步講,目前7nm工藝對於AMD來說仍然是一種新工藝,產能與成熟度都處於爬升階段,在這個時期就應該把產能分配最優化,把最重要的組成部分放在7nm工藝上,剩下的部分使用更為成熟的12nm工藝,這樣也有利於提升產品的良品率,進而提升有效產能,讓玩家可以在第一時間感受到新架構處理器的威力。
那麼未來Zen 2架構會不會有整合度更高的產品呢?AMD方面並未進行透露,但可能性還是很大的,例如當7nm工藝足夠成熟,產能非常充足的時候,Zen 2架構的CPU和APU很有可能會回歸到全整合型設計。如果真的有那個時候,Zen 2架構是否還會迸發出更高的性能呢?大家不妨拭目以待。