華為全新麒麟810處理器解析:拋棄寒武紀採用自研達芬奇架構NPU
2019年6月21日華為在武漢發布nova5系列手機。發布會上簡單的開場之後,華為消費者業務手機產品線總裁何剛表示,好銷量源於好產品,好產品源於更用“芯”。並宣佈在麒麟9系列和7系列處理器的基礎上,推出全新的高端8系列處理器,首款產品是麒麟810。
此次發布的麒麟810最大的亮點在於搭載全新華為達芬奇架構NPU。此前,華為麒麟970和麒麟980處理器都採用寒武紀的NPU,此次則採用了自研NPU。對於自研的達芬奇架構NPU,何剛列出了四大特性:
創新架構達芬奇魔方張量化立體運算單元
澎湃算力單位晶元面積最佳能效
算子多支持數量多達240+ 通用性好
FP16 精度INT8量化精度業界領先
具體的性能表現上,何剛給出的數據顯示,在ETH Zurich開發的AI-Benchmark跑分中,麒麟810以32280的成績領先於驍龍855的25428分和驍龍730的13908分。在AI-Benchmark查詢到的以處理器AI跑分進行的最新排名,麒麟810以23944分排名第一,驍龍855和HelioP90分列第二和第三。
麒麟810能夠取得這樣的成績架構能發揮重要作用,華為的達芬奇架構在去年十月的Huawei Connect 2018正式發布,是華為未來AI戰略中非常關鍵的項目。當時華為發布了基於達芬奇架構的Ascend系列處理器。不過那時除了知道達芬奇架構能滿足從終端到雲端的運算需求之外,華為並未透露關於這一自研架構的更多消息。
關於麒麟810的NPU,華為表示,不同於以往的二維運算模式,達芬奇架構以高性能3D Cube計算引擎為基礎,針對矩陣運算進行加速,大幅提高單位面積下的AI算力,充分激發端側AI的運算潛能。
何剛表示,華為將會更加註重軟硬件的協同,會在硬件領先的基礎上增加在軟件方面的投入。據悉,2017年華為推出HiAI移動開放平台,與合作夥伴共同推動首批AI應用上線。2018年,華為推出HiAI生態2.0,在麒麟980強勁AI運算力下,使能開發者創新AI應用,大幅縮短AI應用的開發週期,提升開發集成效率。麒麟810的推出,更多算子、開源框架的支持以及提供更加完備的工具鏈將幫助開發者快速轉換集成基於不同AI框架開發出的模型,增強華為HiAI移動計算平台的兼容性,易用性,提高開發者的效率,節約時間成本,加速更多AI應用的落地。
AI性能是目前手機 SoC比拼的一項重要指標,除了架構,製程也非常關鍵。7nm是目前業界最領先的量產半導體工藝,已經採用7nm製程的手機SoC包括麒麟980、A12、驍龍855,最新推出的麒麟810也採用7nm工藝,這就意味著麒麟810是全球第四款採用7nm工藝的手機SoC。先進的半導體工藝是提升處理器性能最直接的方式,根據何剛的說法,7nm製程對比8nm和10nm製程晶體管密度分別提升50%和64%,能效分別提升20%和28%。
CPU和GPU依舊是手機SoC的重要參數。麒麟810採用的是2×2.27 GHz Cortex-A76 和6×1.88 GHz A55的組合,華為表示他們採用了全新系統級AI調頻調度技術,2+6大小核架構也是創新的設計。不是麒麟980的Big Middle Little架構,也沒有採用Arm最新發布的Cortex-A77,當然這也符合華為對麒麟810高端系列,強勁性能的定位。CPU跑分華為用麒麟810和驍龍730進行對比,單核性能和多核性能分別高11%和13%。
何剛還給出了日常應用冷啟動時間的對比,包括QQ、手機淘寶、百度等應用。
GPU方面麒麟810也沒有採用Arm最新的Mali-G77,而是使用定制的Mali-G52 GPU,這個定制的GPU針對遊戲場景深度優化。在遊戲方面,華為通過AI調頻調度、GPU負載優化、60FPS高性能HD畫質優化,何剛說要用更底層的麒麟Gaming+技術讓玩遊戲更痛快。
圖像性能方面,麒麟810採用的是IVP+ISP,具備新升級旗艦級像素處理單元;增強白平衡算法;增加DE模塊增加RAW域降噪處理支持深度信息模塊支持畸變矯正模塊。
通信性能方面,麒麟810支持一卡VoLTE通話,一卡4G上網,可以讓通話不斷,娛樂不間斷,同時支持一卡VoLTE通話,一卡VoLTE來電,能夠讓來電不漏接。
華為nova5將是首款搭載麒麟810的華為手機。