龍芯CPU的佈局與未來:引入大小核、沖向64核心128線程
2023年4月8日上午,龍芯中科在河南鶴壁舉辦信息技術自主創新峰會。會上,龍芯正式發布了新一代龍芯3D5000服務器處理器,標誌著龍芯中科在服務器CPU領域進入國內領先行列。
龍芯3D5000首次使用小芯片(chiplet)技術,將兩顆龍芯3C5000整合封裝在一起,取得了32核心、64MB三級緩存、八通道DDR4內存的高規格,四路可達128核心,而且是百分百自主的LoongArch指令集架構,無需國外授權。
峰會上,龍芯中科公司董事長胡偉武重點介紹了龍芯CPU的技術和產品佈局,以及未來規劃。
一起來深入了解下!
胡偉武表示,龍芯CPU的主要特點是“一個唯一、三個不同”。
龍芯CPU是國內唯一基於自主指令系統構建、獨立於Wintel/AA的開放信息技術體系,和國內多數企業直接購買國外商業IP進行芯片設計、基於x86/Arm指令系統融入國外信息技術體系、依賴境外先進工藝提升性能的做法,是完全不同的。
目前,龍芯CPU的主要IP核,都是自主研發。
其中,硬IP包括寄存器,以及內存、HT總線、PCIe/SATA/USB、網絡等等的物理層,並適配從130nm到12nm等不同製造工藝。
軟IP則包括CPU內核、GPU圖形核心、加解密算法,以及存儲、總線、網絡、音頻、工業等各種接口。
龍芯CPU的產品佈局分為三大系列:
龍芯1號是MCU(微控制器),專門面向嵌入式應用。
龍芯2號是SoC(片上系統),面向工控、終端應用,又可以細分為龍芯2K1000LA、龍芯2K2000、龍芯2K3000三大平台,目前分別使用40nm、28nm、12nm工藝,同時結合具體引用,還可以定制專用的SoC。
龍芯3號是CPU(通用處理器),面向桌面和服務器應用,也是多數人更熟悉的,搭配自研橋片(芯片組)形成雙芯片的解決方案。
該系列已經演進了三代,第一代是龍芯3A1000、龍芯3B1500,第二代是龍芯3A2000、龍芯3A3000,第三代則是龍芯3A4000、龍芯3A5000、龍芯3C5000。
胡偉武表示,龍芯CPU的設計設計基本原則是先提高單核性能,再增加核心數;先優化設計,再結合先進工藝提高性能,有些類似Intel當初的Tick-Tock策略,交替升級工藝和架構。
經過20多年的發展,龍芯CPU的單核性能已經達到國際主流水平。
在服務器領域,龍芯CPU提升單核性能的同時,結合多核、多線程、高速互連、先進封裝等技術,快速形成系列化、強競爭力的產品佈局。
2010年到2020年這十年,可以說是龍芯的“補課”時間,全力提升架構和單核性能。
在此期間,龍芯用同一款產品適配桌面、筆記本、服務器的不同需求,即便被客戶和市場評價性能太低也堅持一步一個腳印地走下去。
在完成了足夠的性能積累之後,龍芯開始全面佈局服務器、桌面、移動終端等各個領域,針對性地推出不同產品,逐步枝繁葉茂。
在服務器領域,龍芯3D5000發布之後,龍芯將先後推出龍芯3C6000/3D6000,延續龍芯5000系列的12nm工藝,內核升級為LA664,前者原生16核心32線程,後者雙芯封裝組成32核心64線程。
再往後的2024-2025年,我們將看到龍芯3D7000/3E7000,仍舊是LA664架構核心,但升級製造工藝,分別達到32核心64線程、64核心128線程!
桌面領域,接下來將分別是龍芯3A6000/3B6000、龍芯3A7000/3B7000,與服務器端的同系列產品同工藝、同架構,只是核心數等規格略低一些。
龍芯2號家族後續將陸續迎來龍芯2K3000、龍芯2P0500、龍芯2K0300,龍芯1號家族則會有新的LS1系列,詳情暫未披露。
龍芯3號系列在不同領域採用不同的內存通道設計,其中在服務器上是單片四通道內存、雙片整合封裝組成八個內存通道。
下一代龍芯3C6000將在片內集成PCIe高速通道,從而提升芯片間互連帶寬,龍芯3D6000會同步推出。
龍芯3D7000單芯片設計,核心數量24-32個,四個內存通道。龍芯3E7000雙芯片封裝,規格翻番,核心數量達到48-64個,八個內存通道。
在桌面上則是雙通道內存,下一代龍芯3A6000仍然是4核心,主頻首次達到2.5GHz,搭配龍芯7A2000橋片,大幅提升性價比,今年上半年會流片回來,將會提供樣品給合作夥伴,預計大批量的出貨將在明年。
根據龍芯此前公佈的白皮書,龍芯3A6000的性能評估比現在的龍芯3A5000提升多達40-60%,同時矽片面積減少10%,設計水平可對標AMD Zen2。
之後的龍芯3B6000,將首次採用大小核架構,同時集成GPU圖形核心、PCIe控制器等,而與之搭配的下一代橋片龍芯7A3000,將成為一個“弱南橋”,因為它的HT總線、GPU圖形核心、顯存接口等模塊,都將轉移到CPU內部。
在筆記本上是單通道內存,主打的將是龍芯2K2000、龍芯2K3000等單片方案(也用於工控領域)。
龍芯2號家族中,龍芯2K2000在去年12月中旬官宣流片成功,並完成初步功能調試、性能測試,達到設計目標。
它採用28nm工藝,並且是境內外同步進行,境外是FD-SOI(全耗盡型絕緣層上矽)技術,境內則是體矽技術,支持USB 3.0。
龍芯2K1500可以視為它的一個變種版本,今年年初流片成功,集成兩個LA264核心,主頻1.0GHz,支持DDR3、PCIe 3.0、SATA 3.0,典型工作場景下功耗不高於2.8W。
還有龍芯2K0300面向嵌入式,龍芯2P0600專用於打印機。
下一代的龍芯2K3000,將升級到12nm工藝平台,集成八個LA364 CPU核心、LG200 GPGPU圖形核心,總線升級支持PCIe 4.0。
龍芯1號家族在2022年經歷了一次調整,從早起的SoC、MCU兩種類型改為全部做MCU,更加專一。
龍芯1C102、龍芯1C103已經在去年底流片成功,均採用LA132內核,其中前者主要面向智能家居、其他物聯網設備,比如智能門鎖類產品、電動助力車、跑步機等。
後者主要面向電機驅動類物聯網產品,比如筋膜槍、修枝機、電鋸、電扳手、跳繩機、風扇、汽車電子等。
下一步將是龍芯1C201,是一款高性能的MCU,詳情未知,但看編號就知道提升幅度,架構自然是全新的。
另外還有龍芯1D100,主要面向流量表解決方案。
目前,龍芯中科自主的LoongArch指令集架構,從小巧的龍芯1C103,到龐大的龍芯3D5000,已經形成了完整的系列化產品。
有了好的硬件,更要有好的軟件,才能協同釋放性能,便於落地商用。
為此,龍芯設計了不同的基礎版操作系統,便於客戶二次部署,完成基礎軟件體系建設,包括桌面的Loongnix_Desktop,服務器的Loongnix_Server,工控嵌入式的Loongnix_Embedded、LoongOS、LoongWorks。
其中在嵌入式領域,Loongnix_Embedded是基於桌面版深度定制,進行簡化、實時化,可以跟隨Linux技術路線,擁有海量軟件生態支持。
LoongOS參照開源社區Yocto自主研發,LoongWorks則基於vxWorks深度定制開發,達到了相當於DOS到Windows的飛躍。
在基礎軟件、應用軟件的生態建設上,龍芯採取了二進制翻譯的做法,實現跨平台兼容,打印機、瀏覽器、辦公與日常軟件、遊戲等等都可以移植。
在歷史上,Linux桌面還沒有成功先例,IBM、Ubuntu都嘗試又失敗了,而龍芯的Linux桌面生態已經局部超過x86、Arm,預計到2023年底可以全面超過!
最後簡單說說大家非常關心的製造工藝問題。
如今,國際(主要是美國)的半導體工藝依然處於絕對領先,而且優勢巨大,但我們也要看到,先進工藝的發展正在放緩,所帶來的效益提升也越來越小,摩爾定律漸漸失去了魔力,包括成本越來越高、功耗越來越高等等,不得不通過各種新的封裝工藝彌補。
我國自主工藝還落後太多,但近些年取得了長足進步,可以基本滿足自主CPU的需求。
其中,28nm可滿足所有工控應用需求,14nm工藝已經實現穩定量產,可滿足所有生產辦公類信息化應用需求,5nm刻蝕機也有了。
經過20年的發展和積累,龍芯已經在2021年基本完成了自主CPU處理器和OS系統的“補課”工作,CPU性能達到市場主流水平,而且推出了自主的LoongArch龍架構指令集,基本完成了基礎軟件技術體系(接下來就是軟件應用體系的建設)。
“十四五”期間,龍芯將努力完成“三個轉變”,包括從技術“補課”到生態建設,從政策性市場到開放市場,從跟隨發展到自主發展!
胡偉武表示,當前,龍芯已經開啟了生態建設的新征程,構建與Wintel體系和AA體系“三足鼎立”的自主信息體系新格局,而信創替代一定要做到體系替代,只有從指令系統層面的獨立創新,才是真正的自主。
2022年,鶴壁市和龍芯中科達成全面戰略合作協議,以龍芯中科為龍頭、龍芯產業鍊為核心,吸引龍芯產業生態鏈上下游企業聚集,打造“全場景+一基地+五中心”的龍芯生態產業鏈,促進鶴壁信創產業發展。
本次峰會上,還舉辦了龍芯生態產業園集中籤約儀式,16家產業鏈代表性企業進行集中籤約,合力助推全國信創產業發展。
共勉!
來源:快科技