Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

AI iPhone前奏?蘋果發表論文解決“在手機內存上運行大模型”

AI iPhone前奏?蘋果發表論文解決“在手機內存上運行大模型”

2023-12-21 Comments 0 Comment

根據媒體報道,近日,蘋果發布了一篇論文,介紹了一種可以再超出可用DRAM容量的設備上運行LLM(大語言模型)的方法。這項新研究支援有限容量的裝置運行記憶體2倍大小的LLM,GPU的推理速度可以提升數十倍。媒體稱,蘋果將生成式AI整合到iOS 18的計畫或將加快推進。

透過大幅提高記憶體使用效率,這項新研究支援有限容量的裝置運行記憶體2倍大小的LLM,GPU的推理速度可以提升數十倍。

論文稱,LLM密集的運算量和記憶體需求對於DRAM容量來說是一大挑戰,該論文建構了一個以快閃記憶體為基礎的推理成本模型,將在兩個關鍵領域進行最佳化:減少從快閃記憶體傳輸的資料量、更多更流暢地讀取資料塊。

這意味著,這項突破性研究擴大了LLM適用性和可及性,蘋果將生成式AI整合到iOS 18的計畫或將加快推進。

LLM能在手機上運作了?

一般來說,DRAM就是我們常說的“內存”,而flash(閃存)指的是硬碟。

運算資料時,CPU通常會以DRAM為“中間橋樑”,把硬碟中的資料複製到記憶體中來,再在記憶體中做資料處理,這樣速度可以提升至數百萬倍。

但在容量上,DRAM相較於硬碟小一個數量級。而LLM運作時,需要同時處理的資料量龐大,對容量有限的裝置來說構成了極大的挑戰。

但這篇論文提出的新框架似乎發現了突破點。該框架旨在將模型參數儲存在快閃記憶體中,在需要的時候再將資料調入DRAM,解決了LLM運行時資料處理量超過DRAM可用容量的的難題。

具體而言,蘋果主要運用了兩種技術:

(1)「視窗化」技術:重複使用先前啟動的神經元,以此減少資料傳輸;(2)「行列捆綁」技術:針對快閃記憶體的資料特徵,客製化存取資料區塊的順序,從而增加從快閃記憶體讀取的資料區塊大小。

論文提及,一個70億參數的模型就需要超過14GB的記憶體來載入半精度浮點格式的參數,超過了大多數網路端點的承受能力。但透過此框架,能夠實現最小化資料傳輸並最大化快閃記憶體吞吐量,從而減少資料負載、提高記憶體使用效率。

研究結果顯示,與傳統的載入方法相比,此框架支持DRAM兩倍大小的模型,在CPU和GPU中推理速度可分別提升4-5倍、20-25倍。研究團隊在文末總結:

“這項突破性技術對於在資源有限的環境中部署先進的LLM尤為重要,從而擴大LLM適用性和可及性。”

手機巨頭們瞄準了AI

在AI潮下,各大手機製造紛紛開始佈置「人工智慧+手機」。

根據先前市場消息,蘋果將在其iOS 18中引入AI,主要用於Siri和通訊應用程式的智慧問答、生成語句等功能,此外,蘋果還在探索AI在Apple Music、Page、Keynote和Xcode等應用中的潛能。

三星於11月初推出其生成式AI模型Samsung Gauss,報導該模型將納入即將於2024年初發布的Galaxy S24系列手機中,三星旗下筆記型電腦、平板電腦也有可能整合該模型。

Google的雙子星大模型(Gemini)也將整合到Google旗下產品,11月,Google官宣Gemini1.0將在Google產品中逐步推出;Gemini Pro將整合到Bard中以進行高級推理和規劃;Gemini Nano將為Pixel 8 Pro智慧型手機的功能提供支援。

分享此文:

  • 按一下即可分享至 X(在新視窗中開啟) X
  • 按一下以分享至 Facebook(在新視窗中開啟) Facebook
  • 分享到 WhatsApp(在新視窗中開啟) WhatsApp
  • 按一下以分享到 Telegram(在新視窗中開啟) Telegram
  • 分享到 Pinterest(在新視窗中開啟) Pinterest
  • 分享到 Reddit(在新視窗中開啟) Reddit
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟) 電子郵件
  • 點這裡列印(在新視窗中開啟) 列印

相關


網絡資訊

Post navigation

PREVIOUS
加入標普500三週年特斯拉有點失意
NEXT
三箭資本聯合創辦人的10億美元資產被法院凍結

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2023 年 12 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 11 月   1 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 中國新創公司曾淡化出身如今一些新創公司卻開始自豪於這一點 2025-05-18
  • 《生化危機9》為何遲遲不公佈?可能是優化問題 2025-05-18
  • 任天堂解釋《瑪利歐賽車:世界》成為首發遊戲的原因 2025-05-18
  • 墨西哥海軍大型帆船撞布魯克林大橋造成55人受傷 2025-05-18
  • 新型火山預警系統在爆發前就能聽到地球的聲音 2025-05-18
  • 洋紅色極光和陷入錯亂的衛星:接管了美國宇航局演習的甘農太陽風暴 2025-05-18
  • 新研究顯示瓦薩奇斷層比之前認為的更危險下一次強震遲早會發生 2025-05-18
  • iPhone 17 Air 電池容量和重量資訊外洩 2025-05-18
  • 華為nova 14系列明天發布:三款機型樣機到店提前拆罰20萬起 2025-05-18
  • 中國電信5G-A套餐正式商用:比5G快10倍更穩定 2025-05-18

熱門文章與頁面︰

  • 三星20000尼特微型OLED推動VR頭顯亮度達到日光級別
  • 您可以在Windows 11 24H2 中找回WordPad
  • 南極冰蓋數十年來首次成長
  • 鳥寶寶有多內捲?為了讓父母投餵自己長出恐怖的嘴巴
  • z-sms – 在線免費云短信臨時手機號接碼平台網頁版
  • OpenAI的GPT-4可透過閱讀安全公告自主利用真實漏洞
  • 打車叫到特斯拉不會開門很尷尬?官方介紹開關門方法
  • A24新片《遺軍之戰》 取自門多薩的戰爭回憶
  • 不只員工違規事件蘋果與米哈遊的關係越來越脆弱了
  • 小米手機開始限制跨區解鎖BL 國行版設備禁止使用國際帳號申請解鎖

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2025   All Rights Reserved.