華為芯片20年
華為1991年從成立ASIC設計中心起,到2004年成立海思半導體,直至成為中國自主芯片設計的代表,那麼華為究竟做了哪些芯片呢?從大類上看,華為主要設計了五類芯片:
1、SoC芯片
2、AI芯片
3、服務器芯片
4、5G通信芯片
5、其他專用芯片。
華為芯片全景圖
1. SoC芯片(麒麟系列):手機 SoC芯片一直是華為的主力研究,至2018年8月31日推出的麒麟980處理器以及預計今年下半年將推出麒麟985芯片,華為手機芯片已經達到世界一流水平。
2. AI芯片(昇騰系列):2018年10月10日,在華為的HC大會上發布了昇騰910和昇騰310兩款AI芯片,分別採用7nm工藝製程和12nm工藝製程。昇騰系列AI芯片採用了華為開創性的統一、可擴展的架構,即“達芬奇架構”,實現了從極致的低功耗到極致的大算力場景的全覆蓋。
3.服務器芯片(鯤鵬系列):華為優化調整設計了其合作夥伴ARM授權提供的技術,在2019年1月7日發布了鯤鵬920以及基於鯤鵬920的泰山服務器、華為雲服務。
4. 5G通信芯片(巴龍、天罡系列):華為的5G芯片主要分為終端芯片(巴龍系列)和基站芯片(天罡系列)。巴龍系列是手機終端基帶芯片,一直是華為手機的專用芯片。2019年1月24日,華為推出業界首款面向5G的基站核心芯片(天罡芯片)和5G多模終端芯片(巴龍5000)。
5.其他專用芯片:(路由器芯片、NB-IoT芯片、IPC視頻編解碼和圖像信號處理的芯片等):凌霄系列主要用於家庭接入類的產品;利爾達NB-IoT模組為全球領先的窄帶物聯網無線通信模塊;IPCSoC芯片涵蓋了視頻監控的核心技術——ISP技術和視頻編解碼技術。
1.1 麒麟芯片:全球領先的國產手機SoC芯片
所有手機芯片方案的核心都是兩塊:AP和BP。AP即Application Processor(應用處理器),包括CPU(中央處理器)和GPU(圖形處理器),BP即Baseband Processor (基帶處理器),負責處理各種通信協議,如GSM、3/4/5G等。此外,還有射頻等核心單,它們組合在一起構成了SoC芯片集成電路的芯片。
SOC可以有效地降低電子/信息系統產品的開發成本,縮短開發週期,提高產品的競爭力,是未來工業界將採用的最主要的產品開發方式。華為的SOC芯片是由海思半導體來設計和研發的。
華為海思芯片SOC結構
海思芯片的發展經歷了較長的一段時間。
2004年,華為海思開始研發手機芯片,並於2009年如期推出一個GSM低端智能手機解決方案,使用的是Windows mobile操作系統。該方案中BP技術是自研的,技術源自華為的GSM基站。AP芯片名叫K3V1,工藝製程上採用的是110nm,落後於當時競爭對手採用的65/55/45 nm製程。加上操作系統上選擇的是日落西山的Windows Mobile,因此第一代海思芯片性能不理想,很快遭到市場淘汰。
2012年,華為發布了K3V2,號稱是全球最小的四核ARM A9架構處理器。與K3V1最本質的不同是K3V2採用了ARM架構,支持安卓操作系統而不再是Windows Mobile。同時期的高通APQ8064和三星Exynos4412都已經用上了28、32nm的工藝。K3V2工藝是40nm,發熱量大,遊戲的兼容性不強,也沒有獲得市場認可。
2015年5月,全球第一款採用16nm FinFET Plus工藝製造的中低端芯片麒麟650發布,帶領榮耀5C、G9繼續破千萬銷量。
2015年8月20日,麒麟芯片出貨量突破1億顆兩個月內日均出貨29萬顆。
2015年11月,華為發布麒麟950 SoC芯片,該芯片的綜合性能再次飆至第一,憑藉性能優勢和工藝優勢,成功領先高通半年。該款芯片陸續用在華為旗下的Mate 8、榮耀8、榮耀V8運營商定製版和標配全網通版等手機上。
2016年4月,發布麒麟955 SoC芯片,把A72架構從2.3GHz提升到2.5GHz,帶領P9系列成為華為旗下第一款銷量破千萬的旗艦機。
2017年9月2日,華為發佈人工智能芯片麒麟970並用於華為Mate 10,在2017年10月16日在德國慕尼黑正式發布。截至目前,華為已經成功發布了最新的新一代繼任者,第二代AI芯片麒麟980,將旗艦手機CPU的水平再次提升到了一個新高度。
華為海思芯片的歷史沿革
目前市場上生產手機芯片的幾大龍頭分別是蘋果,華為,高通和三星。
蘋果A系列:蘋果的A12處理器是全世界第一款7納米的芯片,性能穩居第一,不過由於蘋果沒有自主基帶技術,GPS/WIFI芯片都需要外購,所以A系列芯片從來不含基帶部分,也無需承擔GPS/WIFI的功能;
華為麒麟系列:華為的麒麟980,採用最先進的八核心設計,最高主頻高達2.8GHz。預計麒麟990還會繼承5G基帶,實現真正5G全網通;
高通驍龍系列:發布的驍龍855處理器,它採用全新的Kryo 485構架,7納米工藝技術,圖形渲染提升20%,CPU性能提升45%,最高主頻2.84GHz,也是十分強大;
三星Exynos系列: Exynos 9810處理器是三星自主研發M3架構,擁有4個2.9GHz的M3大核和4個1.9GHz的A55小核,10納米製作工藝。
全球各大手機芯片廠商對比
1.2 鯤鵬芯片:打破服務器領域壟斷局面的新晉者
服務器是一種高性能計算機,作為網絡的節點,存儲、處理網絡上80%的數據、信息,因此也被稱為網絡的靈魂。服務器最核心的部位就是服務器芯片,可以說是整個服務器的大腦。但是正是因為它的重要性,也決定了它的技術難度是不容小覷的。
2019年1月7日,華為發布了鯤鵬920(Kunpeng 920)服務器芯片,該芯片基於ARMv8指令集研發,採用7nm工藝,最多可達64核心,支持8通道DDR4內存及PCIe 4.0協議,因此擁有其獨特的性能優勢:1. 性能跑分超出之前業界標杆產品的25%,能效提高30%,但功耗反而降低;2. 雙端口設計使得這款芯片的速率達到業內主流產品的兩倍;3 . 鯤鵬920所搭載的內存寬帶超過業界主流46%,網絡寬帶提升四倍。華為鯤鵬芯片目前在性能上已經達到行業領先水平。
服務器芯片市場是利潤豐厚的市場,之前的服務器芯片技術一直作為科技核心被美國所壟斷,根據DRAMeXchange數據,全球97%的服務器用處理器為X86架構,因此英特爾是服務器領域絕對的霸主。鯤鵬920芯片的推出對於國產服務器水平的飛躍也起著極為關鍵的作用。儘管華為宣布鯤鵬920處理器僅供自用,但參考麒麟系列處理器發展歷程,我們有理由相信,通過自採自用鯤鵬920處理器能夠讓ARM 架構處理器得以發展壯大。考慮到服務器市場主要是針對企業用戶,這一過程將會比手機處理器面臨的困難更大、花費的時間更長。
華為服務器芯片性能與其他廠商對比
除了鯤鵬920處理器,華為還推出了三款泰山(TaiShan)系列服務器,使用的就是鯤鵬920,包括TaiShan 22080、Taishan 5280/5290、TaiShan X6000,分別面向均衡服務器、存儲服務器及高密度服務器市場。
1.3 昇騰芯片:全棧全場景AI解決方案
目前芯片發展開始面臨一個矛盾的窘境:一方面處理器性能面臨物理極限,無法按照摩爾定律進行增長;另一方面數據體量隨著雲、深度學習、AI等新應用興起,對計算性能要求超過了“摩爾定律”增長的速度。處理器自然發展本身無法滿足高性能應用的需求,出現了技術缺口。在這種情況下,採用專用協處理器的異構計算方式來提升處理性能成為最為理想便利的解決方案。
異構芯片在應用中通常有CPU、GPU、FPGA、ASIC四種架構選擇,可提供專門的硬件加速實現各種應用中需要的關鍵處理功能,足以滿足AIoT平台下對於芯片個性化需求。CPU與GPU是常見的通用型芯片,CPU適合邏輯控制、串行運算與通用類型數據運算,GPU擁有大規模並行計算架構,擅長處理諸如圖形計算等多重任務。由於深度學習通常需要大量的但並不復雜的訓練算法,因此相比CPU而言,GPU更適合深度學習運算。FPGA(現場可編程門陣列)是一直可編程的半定制芯片,具有並行處理優勢,並且也可以設計成具有多內核的形態。FPGA最大的優勢在於其可編程的特性,用戶可以根據需要的邏輯功能對電路進行快速燒錄來實現自定義硬件功能。
相較於CPU、GPU等通用型芯片以及半定制的FPGA來說,ASIC芯片的計算能力和計算效率都直接根據特定的算法的需要進行定制的,因此ASIC芯片具有體積小、功耗低、可靠性高、計算性能高、計算效率高等優勢。所以在其所針對的特定的應用領域,ASIC芯片的能效表現要遠超CPU、GPU等通用型芯片以及半定制的FPGA。
AI時代的四種異構芯片選擇
2018年,華為發布了兩顆雲數據中心AI芯片:單芯片計算密度最大的昇騰910和極致高效計算低功耗的AI SoC 昇騰310。
昇騰910屬於Ascend Max系列,用於數據中心服務器,性能表現超過英偉達最強芯片AI V100,是全球已發布的單芯片計算密度最大的AI芯片。基於昇騰910華為還將推出大規模分佈式訓練系統昇騰Cluster,鏈接1024個昇騰910芯片,構成AI計算群,提供超高級AI計算能力,計算能力最高可達256P,使AI的訓練速度達到嶄新的水平。
昇騰910,昇騰cluster與現有產品的算力比較
昇騰系列AI芯片採用了華為開創性的統一、可擴展的架構,即“ 達芬奇架構 ”,實現了從極致的低功耗到極致的大算力場景的全覆蓋,目前全球市場上還沒有其它架構能做到。
“達芬奇架構”能一次開發適用於所有場景的部署、遷移和協同,大大提升了軟件開發的效率,加速AI在各行業的應用落地。
華為在2018年全聯接大會上重點介紹了全棧全場景AI解決方案。全棧全場景AI解決方案是華為曾經發布了面向政府、企業的華為雲EI,以及面向智能終端的HiAI這兩套解決方案的整合。
縱軸全棧是技術功能視角,是指包括芯片、芯片使能、訓練和推理框架和應用使能在內的全堆棧方案。
橫軸全場景包括消費類終端、公有云、私有云、各種邊緣計算、IoT行業終端這5大類場景。
華為全棧全場景AI解決方案
1.4 5G芯片:基站和終端全方位佈局
5G是指第五代移動通信技術,是4G之後的延伸,其峰值理論傳輸速度可達每秒數十Gb,相對於4G的網絡傳輸速度快了數百倍,同時,5G還擁有毫秒級的傳輸時延和千億級的連接能力,是開啟萬物互聯、人機深度交互的通訊基礎。
5G相對於4G的獨特優勢
5G通信的技術底層是5G芯片,5G芯片主要分為射頻芯片和基帶芯片。
射頻芯片主要用於接受和發射信號,包含PA(功率放大器)、濾波器、開關芯片等。基帶芯片主要用於對傳輸的信號進行調製解調。華為作為全球通信設備龍頭企業,擁有眾多的專利儲備,因此擁有強大的基帶芯片設計能力,相較之下,蘋果A系列芯片雖然達到世界一流水平,但是卻缺乏基帶芯片的設計能力,因此需要外掛第三方的基帶芯片。
相對於2G、3G、4G基帶芯片而言,5G基帶芯片有眾多設計難點。1. 多頻段兼容帶來的設計複雜度。2. 支持毫米波也成了5G基帶芯片的一個設計難點。3. 支持的模式數增加也使得設計難度有所增加,5G基帶芯片需要同時兼容2G/3G/4G網絡。
在2019世界移動大會預溝通會上,華為發布了兩款5G芯片,分別是5G基站核心芯片(華為天罡)和5G終端的基帶芯片(巴龍5000)。
天罡芯片——業界首款5G基站核心芯片。華為天罡是全球第一個超強集成、超強算力、超寬頻譜的芯片,為AAU 帶來了革命性的提升,實現基站尺寸縮小超55%,重量減輕23%,功耗節省達21 %,安裝時間比標準的4G基站,節省一半時間,有效解決站點獲取難、成本高等挑戰。同時天罡芯片可以讓市場上存在的大多數基站直接升級到5G,這就意味著4G升5G可以在不更改供電或者是斷電的情況下直接升級,極大的方便了更新5G。
華為5G天罡芯片應用與使能概念圖
巴龍5000——全球第一個支持5G的3GPP標準的商用芯片組。Balong 5000具備5項世界之最,1個世界領先:全球領先的集成2G、3G、4G的多模單芯模組;速度世界最快,@Sub-6 GHz 200MHz:下行鏈路速度4.6Gbps,上行速度2.5Gbps;世界首個上行/下行解耦多模終端芯片;世界首個同時支持NSA和SA架構的芯片組;世界最快的高峰下行速度@毫米波800MHz Gbps;世界首個5G芯片上的R14 V2X。
巴龍5000它支持5G跨所有頻帶,提供一個完整的5G解決方案,是全面開啟5G時代的鑰匙,它可以支持多種豐富的產品形態,除了智能手機外,還包括家庭寬帶終端、車載終端和5G模組等,將在更多使用場景下為廣大消費者帶來不同以往的5G連接體驗。
主流生產商5G終端2018年商用CPE,2019年商用智能機
華為發布了首個基於巴龍5000芯片的5G終端產品:5G CPE Pro。這是世界上最快的5G CPE,支持Wi-Fi6技術。主要的應用場景是智能家居。5G CPE Pro可支持4G和5G雙模,在5G網絡下可以實現3秒下載1GB的高清視頻,即使是8K視頻也可以做到秒開不卡頓,為小型CPE設立了新的網速標準。
華為5G CPE Pro基本情況
本文作者:西南証券電子陳杭團隊,來源:半導體風向標