Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

英特爾宣布針對Llama 3.1進行最佳化以提升所有產品的效能

英特爾宣布針對Llama 3.1進行最佳化以提升所有產品的效能

2024-07-26 Comments 0 Comment

日前Meta正式發布了Llama 3.1開源大模型,以其龐大的參數量和卓越性能,首次在多項基準測試中擊敗了GPT-4o等業界領先的閉源模型。允許開發者自由地進行微調、蒸餾,甚至在任何地方部署,這種開放性為AI技術的普及和創新提供了無限可能。

Intel-Meta-Llama-3.1-AI-1456x817.jpg

Llama 3.1支援128k的上下文長度和多語言能力,無論是在基本常識、可操作性還是數學、工具使用和多語言翻譯方面,都展現出了行業領先的能力。

緊隨其後,晶片巨擘Intel迅速回應,宣布其AI產品組合已全面適配Llama 3.1,並針對Intel AI硬體進行了軟體最佳化。

Meta-Llama-3.1-70B-Intel-Gaudi-2-1456x666.jpg
Meta-Llama-3.1-405B-Intel-Gaudi-2-1456x672.jpg

包含了資料中心、邊緣運算以及客戶端AI產品,確保使用者能夠在Intel平台上獲得最佳的效能體驗。

Intel的適配工作涵蓋了PyTorch及Intel PyTorch擴充包、DeepSpeed、Hugging Face Optimum函式庫和vLLM等,確保了從研發到部署的全流程支援。

目前,Intel AI PC及資料中心AI產品組合及解決方案已面向全新Llama 3.1模型實現最佳化,OPEA(企業AI開放平台)亦在基於Intel至強等產品上全面啟用。

根據基準測試,在第五代Intel至強平台上以1K token輸入和128 token輸出運行80億參數的Llama 3.1模型,可以達到每秒176 token的吞吐量,同時保持下一個token延遲小於50毫秒。

在配備了酷睿Ultra處理器和銳炫顯卡的AI PC上,進行輕量級微調和應用定制比以往更加容易,並且AI工作負載可無縫部署於CPU、GPU以及NPU上,同時實現性能優化。


基於第五代Intel至強可擴展處理器的Llama 3.1推理延遲


在配備內建Intel銳炫顯示卡的Intel酷睿Ultra 7 165H AI PC上,Llama 3.1推理的下一個token延遲


在使用Intel銳炫A770 16GB限量版顯示卡的AI PC上,Llama 3.1推理的下一個token延遲


基於Llama 3.1的端到端RAG流水線,由Intel Gaudi 2加速器和至強處理器提供支援

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
研究人員使用空間光調製來創建針狀雷射光束在矽片內部進行3D結構製造
NEXT
巴黎奧運火炬傳遞外骨骼輔助截癱火炬手實現站立與行走

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2024 年 7 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
293031  
« 6 月   8 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 微軟裁員風暴:軟體工程崗位成重災區AI搶走程式設計師飯碗? 2025-05-15
  • 星巴克據悉已啟動出售龐大中國業務部分股份的進程 2025-05-15
  • 資料外洩後Valve向Steam用戶保證其係統沒有被入侵 2025-05-15
  • 小米盒子5系列今日開賣:299元起支援4K 2025-05-15
  • 假期3天不調休端午假期火車票即將開售 2025-05-15
  • 網友在馬耳他偶遇劉強東夫婦打扮顯眼被認出 2025-05-15
  • 智慧仿生魚已投入長江保護:模仿魚類遊動進行生態資料採集 2025-05-15
  • 華為折疊PC將在5月19日正式發布 2025-05-15
  • 小鵬全新純電轎跑官宣:還叫P7 2025-05-15
  • DeepMind放出新AI大招:竟能自我糾錯但有致命弱點 2025-05-15

熱門文章與頁面︰

  • 您可以在Windows 11 24H2 中找回WordPad
  • 傳三星2nm良品率逐漸提高英偉達及高通都有下單意向
  • 新研究發現輔助駕駛技術更容易導致駕駛分心
  • 富士闢謠拍立得相紙停產:仍在生產停產說法並不屬實
  • 傳NVIDIA全球總部將設在台灣黃仁勳將於下周宣布選址
  • 宇宙壽命大縮水科學家將毀滅倒數提前萬億倍
  • 76%美國汽車高層認為中國電動車登陸美國是遲早的事
  • NVIDIA對川普的迎合促成了AI技術擴散限制的逆轉以及對華為的進一步壓制
  • 川普稱波音747是卡達贈送給美國而非其個人的
  • PS5過熱釀成EVO日本總決賽重大事故比賽結果引爭議

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.