Skip to content
WONGCW 網誌
  • 首頁
  • 論壇
  • 微博
  • 壁紙下載
  • 免費圖床
  • 視頻下載
  • 聊天室
  • SEO工具
  • 支援中心
  • 表格製作
  • More
    • 在線名片
    • 網頁搜索
    • 天氣預報
    • 二維碼生成器
    • WordPress 插件及主題下載
  • Search Icon

WONGCW 網誌

記錄生活經驗與點滴

挑戰英偉達H100霸權IBM模擬人腦造神經網絡芯片效率提升14倍

挑戰英偉達H100霸權IBM模擬人腦造神經網絡芯片效率提升14倍

2023-08-30 Comments 0 Comment

最近,IBM推出一款全新的14nm模擬AI芯片,效率達到了最領先GPU的14倍,可以讓H100物有所值。目前,生成式AI發展道路上最大的攔路虎,就是它驚人的耗電量。AI所需的資源,是不可持續增長的。

論文地址:https://www.nature.com/articles/s41928-023-01010-1而IBM,一直在研究重塑AI計算的方法。他們的一大成就,就是模擬內存計算/模擬人工智能方法,就可以藉助神經網絡在生物大腦中運行的關鍵特徵,來減少能耗。這種方法,可以最大限度地減少我們在計算上花費的時間和精力。英偉達的壟斷,要被顛覆了?IBM AI未來的最新藍圖:模擬AI芯片能效高出14倍

根據外媒Insider的報導,半導體研究公司SemiAnalysis的首席分析師Dylan Patel分析,ChatGPT每天的運行成本超過了70萬美元。ChatGPT需要大量算力,才能根據用戶的提示生成回答。絕大部分成本,都是在昂貴的服務器上產生的。在往後,訓練模型和運行基礎設施的成本只會越來越飆升。IBM在Nature上發文表示,這款全新芯片能夠通過削減能耗,來緩解構建和運營Midjourney或GPT-4等生成式AI企業的壓力。這些模擬芯片與數字芯片有不同的構建方式,數字芯片可以操作模擬信號,理解0到1之間的漸變,但只適用於不同的二進制信號。模擬內存計算/模擬AI而IBM的全新方法,就是模擬內存計算,或簡稱模擬AI。它藉助神經網絡在生物大腦中運行的關鍵特徵,來減輕了能耗。在人類和其他動物的大腦中,突觸的強度(或’權重’)決定了神經元之間的交流。對於模擬AI系統,IBM將這些突觸權重存儲在納米級電阻存儲器器件(如相變存儲器PCM)的電導值中,並利用電路定律,減少在存儲器和處理器之間不斷發送數據的需求,執行乘法累加(MAC)運算——DNN中的主要運算。現在為很多生成式AI平台提供動力的,是英偉達的H100和A100。然而,如果IBM對芯片原型進行迭代,並且成功推向了大眾市場,這種新型芯片就很有可能取代英偉達,成為全新的支柱。這款14nm模擬AI芯片,可以為每個組件編碼3500萬個相變存儲設備,可以模擬多達1700萬個參數。並且,這款芯片模仿了人腦的運作方式,由微芯片直接在內存中執行計算。這款芯片的系統能夠實現高效的語音識別和轉錄,準確性接近了數字硬件設施。而這款芯片大約達到了14倍,而之前的模擬表明,這種硬件的能效甚至達到了當今最領先GPU的40倍到140倍。這場生成式AI革命,才剛剛開始。而深度神經網絡(DNN)徹底改變了AI領域,隨著基礎模型和生成式AI的發展而日益突出。然而,在傳統的數學計算架構上運行這些模型,會限制它們的性能和能源效率。雖然在開髮用於AI推理的硬件方面,也取得了不少進展,但其中許多架構,在物理上拆分了內存和處理單元。這就意味著,AI模型通常存儲在離散的內存位置,要完成計算任務,就需要在內存和處理單元之間不斷打亂數據。這個過程會大大減慢計算速度,限制可實現的最大能效。PCM設備的性能特點、使用相位配置和導納來存儲模擬式的突觸權重IBM的基於相變存儲器(PCM)的人工智能加速芯片,擺脫了這種限制。相變存儲器(PCM)可以實現計算存儲融合,在存儲器內直接進行矩陣向量乘法,避免了數據傳輸的問題。同時,IBM的模擬AI芯片通過硬件級的計算存儲融合,實現了高效的人工智能推理加速,是這一領域的重要進展。模擬AI的兩大關鍵挑戰為了將模擬AI的概念變為現實,需要克服兩個關鍵挑戰:1.存儲器陣列的計算精度必須與現有數字系統相當2.存儲器陣列能與其他數字計算單元以及模擬人工智能芯片上的數字通信結構無縫對接IBM在Albany Nano的技術中心製造了著這種基於相變內存的人工智能加速芯片。該芯片由64個模擬內存計算內核組成,每個內核包含256×256的交叉條陣突觸單元。並且,每個芯片中都集成了緊湊的時基模數轉換器,用於在模擬和數字世界之間進行轉換。而芯片中的輕量級數字處理單元,也可執行簡單的非線性神經元激活函數和縮放操作。每個核心可看作一個tile,可以進行與深度神經網絡(DNN)模型的一個層(比如卷積層)相關的矩陣向量乘法及其他運算。權重矩陣被編碼成PCM器件的模擬電導值存於芯片上。在芯片的核心陣列中間集成了一個全局數字處理單元,用來實現一些比矩陣向量乘法更複雜的運算,這對某些類型的神經網絡(如LSTM)執行是關鍵的。芯片上在所有核心以及全局數字處理單元之間集成了數字通信通路,用於核心之間以及核心與全局單元之間的數據傳輸。用該芯片,IBM對模擬內存計算的計算精度進行了全面的研究,並在CIFAR-10圖像數據集上獲得了92.81%的精確度。這是目前所報導的使用類似技術的芯片中精度最高的。IBM還將模擬內存計算與多個數字處理單元和數字通信結構無縫結合。該芯片8位輸入輸出矩陣乘法的單位面積吞吐量為400 GOPS/mm2,比以前基於電阻式存儲器的多核內存計算芯片高出15倍以上,同時實現了相當的能效。而在字符預測任務和圖像標註生成任務中,IBM通過在硬件上測量的結果與其他方法的比較,展示了相關任務在模擬AI芯片上運行的網絡結構、權重編程以及測量結果的信息。權重編程過程英偉達的護城河深不見底?英偉達的壟斷,有這麼容易打破嗎?Naveen Rao是一名神經科學出身的科技企業家,他曾試圖與全球領先的人工智能製造商英偉達競爭。‘每個人都是基於英偉達進行開發的。’Rao說,’如果你想推出新的硬件,你就得趕上去和英偉達競爭。’Rao在英特爾收購的一家初創企業中致力開發旨在取代英偉達GPU的芯片,但在離開英特爾後,他在自己領導的軟件初創公司MosaicML裡使用了英偉達的芯片。Rao表示,英偉達不僅在芯片上與其他產品拉開了巨大的差距,還通過創建一個大型的AI程序員社區,實現了芯片之外的差異化——AI程序員一直在使用該公司的技術進行創新。十多年來,英偉達在生產能夠執行複雜AI任務(如圖像、面部和語音識別)以及為ChatGPT等聊天機器人生成文本的芯片方面,建立了幾乎無法撼動的領先地位。這家曾經的行業新貴之所以能夠取得AI芯片製造的主導地位,是因為它很早就認識到了AI發展的趨勢,為這些任務專門定制了芯片,並開發了促進AI開發的關鍵軟件。從那時起,英偉達的聯合創始人兼CEO黃仁勳,就在不斷地提高英偉達標準。這使得英偉達成為了人工智能開發的一站式供應商。據研究公司Omdia調查,雖然谷歌、亞馬遜、Meta、IBM和其他公司也生產人工智能芯片,但到目前,英偉達佔人工智能芯片銷售額的70%以上。今年6月,英偉達的市值已突破1萬億美元,成為全球市值最高的芯片製造商。FuturumGroup分析師表示:’客戶會等18個月才購買英偉達系統,而不是從初創企業或其他競爭對手那裡購買現成的芯片。這太不可思議了。’英偉達,重塑計算方式1993年,黃仁勳聯合創立了英偉達,主要的業務是製造在電子遊戲中渲染圖像的芯片。當時的標準微處理器擅長按順序執行複雜的計算,但英偉達生產的GPU可以同時處理多個簡單任務。2006年,黃仁勳進一步推進了這一進程。他發布了名為CUDA的軟件技術,該技術可幫助GPU為新任務編程,使GPU從單一用途的芯片轉變為更通用的芯片,能承擔物理和化學模擬等領域的其他工作。2012年,研究人員利用GPU在識別圖像中的貓等任務中實現了與人類相似的準確度,這是一項重大突破,也是根據文本提示生成圖像等最新發展的先驅。而據該英偉達估計,這項工作在十年間耗資超過300億美元,使英偉達不再僅僅是一個零部件供應商。除了與頂尖科學家和初創企業合作,公司還組建了一支團隊,直接參與人工智能活動,如創建和訓練語言模型。此外,從業者的需要導致英偉達開發了CUDA以外的多層關鍵軟件,其中也包括數百條預構建代碼的庫。在硬件方面,英偉達因每兩三年就能持續提供更快的芯片而贏得聲譽。2017年英偉達開始調整GPU以處理特定的AI計算。去年9月,英偉達宣布生產名為H100的新型芯片,並對其進行了改進,以處理所謂的Transformer運算。這種運算被證明是ChatGPT等服務的基礎,黃仁勳稱之為生成式人工智能的’ iPhone時刻’。如今,除非有其他廠家的產品能和英偉達的GPU形成正面競爭,才有可能打破目前英偉達對AI算力的壟斷格局。IBM的模擬AI芯片,有這個可能嗎?

分享此文:

  • 分享到 Twitter(在新視窗中開啟)
  • 按一下以分享至 Facebook(在新視窗中開啟)
  • 分享到 WhatsApp(在新視窗中開啟)
  • 按一下以分享到 Telegram(在新視窗中開啟)
  • 分享到 Pinterest(在新視窗中開啟)
  • 分享到 Reddit(在新視窗中開啟)
  • 按一下即可以電子郵件傳送連結給朋友(在新視窗中開啟)
  • 點這裡列印(在新視窗中開啟)

相關


網絡資訊

Post navigation

PREVIOUS
“越南特斯拉”盤中暴漲35%市值突破2100億美元相當於兩個高盛
NEXT
宇航員拍到的壯麗景色:月光、阿留申群島火山和北極光

發表迴響取消回覆

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

More results...

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by 分類
網站公告
Featured
限時免費
Windows 軟件下載
系統軟件
辦公軟件
圖像處理
影音媒體
網絡軟件
應用軟件
Mac 軟件下載
安卓軟件下載
網絡資訊
Mac資訊
Linux資訊
VPS資訊
NASA資訊
WordPress資訊
WeChat資訊
PHP資訊
教學資源
開源程序
網頁工具
SEO工具
醫療健康
其他資訊
Content from
Content to
2023 年 8 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 7 月   9 月 »

分類

  • 網站公告
  • 限時免費
  • Windows 軟件下載
  • 系統軟件
  • 辦公軟件
  • 圖像處理
  • 影音媒體
  • 網絡軟件
  • 應用軟件
  • Mac 軟件下載
  • 安卓軟件下載
  • 網絡資訊
  • Mac資訊
  • Linux資訊
  • VPS資訊
  • NASA資訊
  • WordPress資訊
  • WeChat資訊
  • PHP資訊
  • 教學資源
  • 開源程序
  • 網頁工具
  • SEO工具
  • 醫療健康
  • 其他資訊

彙整

近期文章

  • 三星3nm GAA製程需要70%的良率才能贏得高通訂單進度目前依然舉步維艱 2023-10-04
  • Sage Geosystems發明效率高達200%的“地球電池” 2023-10-04
  • 諾貝爾化學獎得主提早4個多小時曝光?官方回應 2023-10-04
  • Xbox遊戲工作室正在開發兩款基於授權IP遊戲新作 2023-10-04
  • 2023硬碟實測故障率:SSD比機械硬碟可靠 2023-10-04
  • 高端夢不滅一加有望重啟數位Pro系列 2023-10-04
  • 韋伯之謎解開了天文物理學家解釋宇宙黎明時的”不可能”亮度 2023-10-04
  • 高端夢不滅一加有望重啟數位Pro系列 2023-10-04
  • 造訪華強北:iPhone 15發售後蘋果二手舊機價格不降反漲 2023-10-04
  • 客戶拖欠款項把這家成立16年的遊戲工作室拖死了 2023-10-04

熱門文章與頁面︰

  • 完美解碼PureCodec 2019.11.20
  • 打車叫到特斯拉不會開門很尷尬?官方介紹開關門方法
  • 世界上有多少個國家
  • 靠養貓養狗年入百萬:寵物博主是門怎樣的生意?
  • 拆解報告:20000mAh 18W PD雙向快充版小米移動電源3 PLM18ZM
  • Autodesk AutoCAD 2021 正式版註冊版-簡體/繁體中文/英文版
  • QS版ES版的CPU能買嗎?
  • DP vs HDMI 誰才是遊戲玩家最佳選擇?
  • Windows 10玩遊戲死機重置顯卡驅動的秘籍你知道嗎?
  • 微信消息撤回也沒用???這些辦法都能查看撤回的內容

投遞稿件

歡迎各界人士投遞稿件到admin@wongcw.com

請提供以下資料:

1.你的名字

2.你的電郵

3.分類目錄

4.文章標題

5.文章摘要

6.文章內容

7.文章來源

 

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

快帆

MALUS

極度掃描

DMCA.com Protection Status

WONGCW 網誌

  • 免責聲明
  • 捐助我們
  • ThemeNcode PDF Viewer
  • ThemeNcode PDF Viewer SC
  • Events

服務器提供

本站使用之服務器由ikoula提供。

聯繫我們

查詢,投稿,商務合作:
​admin@wongcw.com
​技術支援:
​support@wongcw.com
​客户服務:
​cs@wongcw.com

QQ群:833641851

© 2023   All Rights Reserved.