Intel發布Gaudi 3 AI加速器：4倍性能提升、無懼1800億參數大模型

2024-04-10 Comments 0 Comment

美國當地時間4月9日，Intel舉辦了一場面向客戶和合作夥伴的Intel Vision 2024產業創新大會，做出多項重磅宣布，包括全新的Gaudi 3 AI加速器，包括全新的至強6品牌，以及涵蓋全新開放、可擴展系統，下一代產品和一系列策略合作的全端解決方案。

數據顯示，預計2030年，全球半導體市場規模將達1兆美元，AI是主要推動力，不過在2023年，只有10％的企業能夠成功將其AIGC專案產品化。

Intel的最新解決方案，可望協助企業應對推廣AI專案時所面臨的挑戰，加速實現AIGC落地商用。

Intel現有的Gaudi 2誕生於2022年5月，並於2023年7月正式引進中國，擁有極高的深度學習表現、效率，以及極高的性價比。

它採用台積電7nm製程製造，整合24個可程式化的Tenor張量核心(TPC)、48MB SRAM快取、21個10萬兆內部互連乙太網路介面(ROCEv2 RDMA)、96GB HBM2E高頻寬記憶體(總頻寬2.4 TB/s)、多媒體引擎等，支援PCIe 4.0 x16，最高功耗800W，可滿足大規模語言模式、生成式AI模型的強算力需求。

新一代的Gaudi 3面向AI訓練和推理，升級為台積電5nm工藝，帶來了2倍的FP8 AI算力、4倍的BF16 AI算力、2倍的網路頻寬、1.5倍的記憶體頻寬。

對比NVIDIA H100，它在流行LLM上的推理表現領先50％、訓練時間快40％。

Gaudi 3預計可大幅縮短70億和130億參數Llama2模型、1750億參數GPT-3模型的訓練時間。

在Llama 70億/700億參數、Falcon 1800億參數大型語言模型上，Gaudi 3的推理吞吐量和能效也都非常出色。

Gaudi 3提供多種靈活的形式，包括OAM相容夾層卡、通用基板、PCIe擴充卡，滿足不同應用需求。

Gaudi 3提供開放的、基於社區的軟體，以及行業標準以太網網絡，可以靈活地從單個節點擴展到擁有數千個節點的集群、超級集群和超大集群，支援大規模的推理、微調和訓練。

Gaudi 3 AI加速器具備高效能、經濟實用、節能、可快速部署等優點，能夠充分滿足複雜性、成本效益、分散化、資料可靠性、合規性等AI應用需求。

Gaudi 3將於2024年第二季對OEM廠商出貨，包括戴爾、慧與、聯想、超威等。

目前，Intel Gaudi加速器的產業客戶及合作夥伴有NAVER、Bosch(Bosch)、IBM、Ola/Krutrim、NielsenIQ、Seekr、IFF、CtrlS Group、Bharti Airtel、Landing AI、Roboflow、Infosys，等等。

此外，Intel也宣布聯合Anyscale、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、RedHat、Redis、SAP、SAS、VMware、Yellowbrick、Zilliz等夥伴，共同創建開放平台，協助企業推動AI創新。

該計劃旨在開發開放的、多供應商的AIGC系統，透過RAG（檢索增強生成）技術，提供一流的部署便利性、效能和價值。

初始階段，Intel將利用至強處理器、Gaudi加速器，推出AIGC管線的參考實現，發布技術概念框架，並持續加強Intel Tiber開發者雲端平台基礎設施的功能。

WONGCW 網誌

記錄生活經驗與點滴

Intel發布Gaudi 3 AI加速器：4倍性能提升、無懼1800億參數大模型

2024-04-10 Comments 0 Comment

相關

發表迴響取消回覆

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

分享此文：

相關

發表迴響取消回覆