龍芯處理器性能怎麼樣?下一代CPU同頻性能可達英特爾90%
在高性能處理器領域,英特爾是天花頂一般的存在(先不算地位特殊的IBM公司),國內發展CPU處理器的公司很多,絕大多數實力跟英特爾相比都差很遠,但是大家都非常想看到國內這些小公司跟英特爾比拼處理器性能。在國產CPU領域,龍芯是起步較早的公司之一,不過龍芯處理器走的是MIPS指令集體系,目前已經發展出了多款龍芯處理器,其中針對桌面市場的最新產品是龍芯3A3000,它的性能到底如何呢?
有龍芯愛好者做了實際性能測試,測試下來單核性能相當於intel i5-7200U的30%~40%,不過下一代龍芯3A4000處理器同頻性能將從i5-7200U的60%~70%提升到80%~90%,不過總體差距還是非常大的,龍芯要走的路還很長。
有關龍芯處理器的測試這幾年來零零散散在網上出現過多次,前不久有龍芯愛好者在龍芯社區發表過龍芯3A處理器的全面性能測試,只是這篇文章的圖片掛了,他最近在知乎上也發了一次,發表在龍芯往事專欄中,知乎ID是第一千零一人。
這套平台是去年9月份龍芯俱樂部的龍芯3A主板團購時買的,由作者自行搭建好一套平台,使用phronix-test-suite對龍芯3A3000 處理器做了一個盡可能理性、中立、客觀、全面的評測,不吹不黑,不誇大成績也不迴避問題。
這裡節選龍芯3A3000處理器的測試及總結部分,首先來看看龍芯3A3000平台的樣子。
龍芯3A3000 主板照片,風扇下面是龍芯的CPU。另外兩塊散熱片下面分別是南橋和北橋。
拆下風扇後,龍芯3A3000 CPU 的近照, 其中的LS3A3000D-LP 意思是說這是一個低功耗版本的龍芯3A3000CPU。
開機後BIOS 中的信息,可以看到CPU 的主頻是1400MHZ,一級指令緩存64KB,一級數據緩存64KB,二級緩存4MB。
主板上的國產Unilc(西安紫光國芯半導體)內存條。
補充一下龍芯官方的龍芯3A3000處理器的架構及規格
上圖是龍芯3A3000的主要規格,頻率最高1.5GHz,不過原文作者拿到的這塊龍芯3A3000處理器不是性能最高的1.5GHz主頻版本,而是性能略低的1.4GHz 版本。因此,在估算龍芯3A3000(1.5GHz)的性能時,應該將我的測試結果乘以1.07。此外,需要說明的是龍芯3A3000筆記本里帶的龍芯3A3000的主頻被限制在了1.2GHZ。
規格對比
性能測試基本環境
龍芯3A3000處理器性能測試
測試是在Linux系統上進行的,很多測試內容都偏重CPU理論性能測試,跟大家熟悉的Windows下CPU性能測試不同,原作者對每個測試項目有詳細的解釋,感興趣的可以仔細看下,這裡就不對測試性能一一介紹了,覺得長的直接看最後的結論。
對比的CPU除了英特爾酷睿i5-7200U、賽揚J1900之外還加入了國內另外的處理器FT-1500A、FT-2000+的。
作者的結論:
從縱向上看龍芯的發展,相比龍芯2F,龍芯3A3000 的性能有了很大的進步。工藝上,從龍芯2F 的90nm,提高到了龍芯3A3000 處理器的28nm;主頻從龍芯2F 的800MHZ 提高到了1.5GHz。在用戶實際應用上,基本可以達到流暢使用的程度。與Intel 處理器相比,龍芯3A3000 綜合性能相當於Intel J1900 處理器,單核性能相當於intel i5-7200U 的30%~40%。
通過本文中所進行的34 項測試,我們發現龍芯3A3000 在性能不好的根源有以下幾個:
同主頻性能較弱
從同主頻性能來看,龍芯3A3000 已經超過了J1900, 但只有intel i5-7200U 的60%~70%。預計2019 年流片的龍芯3A4000 同主頻性能至少有30%的性能提升。
主頻太低
這是龍芯處理器讓眾多愛好者耿耿於懷的的一個難以迴避的弱點。誠然,主頻不代表所有性能,但主頻太低是萬萬不行的。J1900 的同主頻性能弱於龍芯3A3000,但由於它的主頻可以到1.99GHz,並且還可以睿頻到2.4GHz,在多項測試中一樣超過了龍芯3A3000。Intel i5-7200U 基礎主頻達到2.5GHz,睿頻可以到3.1GHz。飛騰2000+主頻可以到2.2GHz,而兆芯的KX-6000 主頻甚至可以到3.0GHz。飛騰、兆芯處理器可能在同主頻性能上弱於龍芯,但還是可以靠著較高的主頻擊敗龍芯3A3000。
龍芯主頻較低的原因之一是落後的工藝製程,目前還在使用28nm 工藝,而Intel、飛騰、兆芯等已經在使用14nm 工藝。根據龍芯的發展規劃,到2020 年龍芯將使用14nm 工藝對了龍芯3C5000 進行流片,主頻能夠達到2.5GHz。
系統軟件優化不夠
在測試中,我們發現的問題有三角函數等數學函數運算速度過慢,看起來部分硬件浮點運算的沒有得到應用,而且龍芯缺少一個優化的數學函數庫。在加密解密指令上,缺少AES 硬件實現。在測試中,我們發現使用Debian 操作系統、GCC 7.3 和1.4GHz 的龍芯3A3000 進行的各項測試基本優於使用Loongnix 操作系統、GCC 4.9 編譯器和1.5GHz 龍芯3A3000 的組合。我們認為編譯器的優化對發揮龍芯的性能非常重要。在測試中,我們也發現使用4.14 的Linux 內核會比3.10 的Linux 內核上有相當程度的性能提升,龍芯依然缺少優化的Linux 內核。
應用軟件優化不夠
由於MIPS 架構缺少軟件生態,各種應用軟件缺少針對MIPS 架構的優化。具體表現就是在很多軟件有針對X86 系統的彙編優化。要建立龍芯的生態,發揮龍芯處理器的性能,相同級別的優化不可缺少。
隨著龍芯未來架構的優化、主頻的提升,影響龍芯發展的瓶頸將不是處理器的性能,而是軟件生態的建設,也就是系統軟件優化以及應用軟件優化。其中,各種應用軟件的優化將是提昇龍芯用戶體驗的捷徑。實際上,龍芯也已經意識到了這些問題,提出了要學習蘋果,”app by app, feature by feature, pixel by pixel” 的進行優化。
龍芯下一代處理器龍芯3A4000的展望
原作者對龍芯3A3000處理器的評價確實做到了不吹不黑,龍芯3A3000處理器有進步有優點,不過不足之處也非常多,除了架構方面的原因之外,落後的製造工藝也限制了龍芯3A處理器的性能,這些問題想解決也不是一蹴而就的,好在龍芯3A3000已經是問世幾年的產品了,下一代龍芯3A4000處理器也箭在弦上,預計2019年初問世,第一千零一人也對此作了性能預測:
當下,龍芯3A4000 的流片工作正在開展,預計到2019 年初就能看到芯片了。
在3A4000出現之前,我們對3A4000的性能進行一下預測。基於我們的評測,我們認為,3A4000的同主頻性能將從i5-7200U的60%~70%,提升到80%~90%,2.0GHz下單核性能達到i5-7200U的2/3,多線程性能超過i5-7200U。和國內其他CPU相比,龍芯3A4000的同主頻性能將超過飛騰以及兆芯,單核性能也將超過飛騰2000+,但由於3A4000落後的28 nm工藝、依舊較低的主頻(2.0 GHz) ,龍芯3A4000的綜合性能將可能依舊無法超過採用14 nm工藝,主頻3.0GHz的兆芯KX-6000。但鑑於KX-6000並沒有看大規模量產出貨的跡象,龍芯3A4000依然可能會是2019年國內可以買到的單核性能最強的國產自主處理器。
龍芯處理器和Intel、AMD的高性能處理器差距還是非常巨大,龍芯要走的路還很長。期待龍芯在未來採用更好的工藝,更優化的微架構,也期待龍芯能夠在編譯器、數學庫、操作系統等系統軟件支持上有更好的表現,構建更好的應用軟件生態系統,期待著龍芯3A4000、3B 4000、龍芯3C 5000早日流片成功。