讓電腦加速100倍這家英國創業團隊的芯片新思路
與其他數字處理軟件不同的是,英國人工智能(AI)芯片硬件設計初創公司Graphcore專為電腦開發“大腦”,而且這種大腦更擅長猜測。作為Graphcore首席技術官,西蒙·諾爾斯(Simon Knowles)面帶微笑地在白板上勾畫著自己對機器學習未來的願景。
圖1:英國人工智能芯片硬件設計初創公司Graphcore推出的IPU加速卡他用黑色記號筆在人類大腦的“節點”上打點並繪製圖表,這些節點通常負責大腦中“沉思或思考的部分”。他的初創公司正試圖在下一代計算機處理器中模擬這些神經元和突觸,該公司押注下一代計算機處理器能夠幫助“智能機械化”。
AI通常被認為是挖掘大量數據集的複雜軟件,但諾爾斯及其聯合創始人、Graphcore首席執行官奈傑爾·圖恩(Nigel Toon)認為,運行該軟件的電腦仍然存在更大的障礙。坐在位於英國港口城市布里斯托爾通風良好的辦公室裡,諾爾斯和圖恩表示,問題在於芯片本身(基於它們的功能,可分為中央處理單元CPU或圖形處理單元GPU),它們並沒有以任何可識別的類人方式進行“思考”。
人類的大腦利用直覺來簡化某些問題,比如識別一個正在接近的朋友,而計算機可能會嘗試分析那個人臉部的每個像素,並將其與包含數十億張圖像的數據庫進行比較,然後才會試圖打招呼。當計算機主要充當計算器時,這種精確度是有意義的,但對AI來說,它的效率卻非常低下,需要消耗大量能量來處理所有相關數據。
2016年,諾爾斯和更有商業頭腦的圖恩創建了Graphcore,他們把“不那麼精確”的計算作為芯片的核心,稱之為智能處理單元(IPU)。諾爾斯表示:“你大腦中的概念相當模糊。它實際上是非常近似的數據點的集合,使你可以產生精確的想法。”諾爾斯的英語口音和經常發出咯咯的笑聲,讓人把他比作《哈利·波特》中霍格沃茨學院的院長。
關於人類智慧為何會以這種方式形成,有各種各樣的理論。但對於機器學習系統來說,它們需要處理龐大且不規則無組織的信息結構(即圖形),為此建立專門用於連接類似大腦節點數據點的芯片,可能是AI繼續演變的關鍵。諾爾斯說:“我們想建造一台高性能的計算機,它可以非常不精確的方式處理數字。”
換句話說,Graphcore正在為電腦開發“大腦”,如果其聯合創始人的想法是對的,它將能夠更像人類那樣處理信息,而不是通過大規模的數字運算來偽造信息。圖恩解釋稱:“幾十年來,我們始終在步步為營地告訴機器該做什麼,但現在我們不再這樣做了。”他描述了Graphcore的芯片是如何教機器學習的:“這就像回到了20世紀70年代,那時微處理器剛剛問世,我們需要徹底改造英特爾。”
投資者赫爾曼·豪澤(Hermann Hauser)是Arm Holdings Plc的聯合創始人,該公司控制著應用最廣泛的芯片設計工作。豪澤押注諾爾斯和圖恩的IPU將掀起下一波計算浪潮,他說:“這在計算機歷史上只發生過三次,分別是20世紀70年代的CPU、20世紀90年代的GPU,Graphcore的IPU則是第三次。”
圖2:Graphcore辦公室的IPU 服務器機架
Graphcore起源於豪澤於2011年和2012年在劍橋大學皇家學會組織的一系列研討會,皇家學會是艾薩克·牛頓(Isaac Newton)和查爾斯·達爾文(Charles Darwin)的校友組成的科學團體。在國王學院的豪華餐廳裡,AI專家、神經學家、統計學家和動物學家圍繞著先進計算技術對社會的影響展開了辯論。
豪澤認為,諾爾斯“有個地球般大小的大腦”,他在這個“象牙塔”裡感到不自在,儘管他從劍橋大學開始的職業生涯。20世紀80年代畢業後,諾爾斯在英國政府的一個研究實驗室學習早期的神經網絡。之後,他與人合作創辦了無線處理器初創企業Element 14,並於2000年以6.4億美元的價格將其賣給了博通公司(Broadcom)。
不久之後,諾爾斯和有半導體創業經驗的圖恩第一次合作。2002年,他們創建了移動芯片製造商Icera,並在不到10年後以4.36億美元的價格賣給了英偉達公司(Nvidia)。當時兩人還沒有準備好退休,圖恩說:“我們都不擅長打高爾夫球。”諾爾斯去參加劍橋大學的系列講座時,他們正在討論其他的想法。諾爾斯回憶說:“我是房間裡那個邋遢的傢伙,戴著一頂煙囪帽,只想做些東西。你知道:’別管熱力學了,我想做個蒸汽機!’”
當劍橋大學信息工程學教授史蒂夫·楊(Steve Young)做了一個關於計算對話系統極限的演講,諾爾斯不斷地向他提出有關能源效率的問題。史蒂夫·楊後來向蘋果公司出售了語音處理服務,該服務現在用於Siri。諾爾斯表示:“我問他在算法中使用的數字精度,這在史蒂夫看來有些離題了。”但他強調,在矽材料中,“數字的精度作為能量的決定因素非常關鍵”。
幾天后,史蒂夫·楊給諾爾斯發了一封電子郵件,說他的學生調查了這件事,發現他們每次計算都使用了64位數據。他們意識到,他們可以像諾爾斯所建議的那樣,用8位數據執行同樣的函數,只是運算不那麼精確。當計算機有更少的數學任務要做時,它可以利用節省下來的能源來處理更多的數字。這有點像人類大腦從計算某家餐廳的GPS坐標轉換到僅僅記住其名字和鄰居。
諾爾斯說:“如果我們製造出一種更適合這種工作的處理器,我們可以將性能提高一千倍。”史蒂夫·楊和其他人對此印象深刻,諾爾斯和圖恩決定他們必須創建Graphcore。早在2013年,他們就開始籌集資金來開發這個想法,並在2016年向世界展示了這家公司。
半導體行業目前正在討論摩爾定律的可持續性問題。摩爾定律是上世紀60年代的一項觀察發現,一塊芯片上的晶體管數量將會每兩年翻一番。Graphcore的領導者們關心的是個相關概念,叫做丹尼德量表(Dennard scale),它指出隨著晶體管密度的提高,功率需求將保持不變。
但這一原理已不再適用,現在在芯片中添加更多的晶體管意味著芯片將變得更熱、耗能更高。為了緩解這個問題,許多芯片製造商自己設計他們的產品,這樣他們就不會每次都耗盡所有的處理能力,只運行支持應用程序所必需的部件。在芯片上,這些一度未使用的區域被稱為“暗矽”。
諾爾斯和圖恩表示,除非電路能從根本上被重新設計以提高效率,否則高溫問題將成為阻礙手機和筆記本電腦在未來幾年變得更快的重大障礙。負責Graphcore芯片架構的丹尼爾·威爾金森(Daniel Wilkinson)表示:“我需要從零做起,這種情況在芯片設計領域從未發生過。”
這不禁向這個由幾十名工程師組成的團隊發起挑戰,要求他們設計一種芯片,既能同時利用所有的處理能力,又比最先進的GPU功耗更少。矽的一個較大的能量壓力涉及移動和檢索數據,但從歷史上看,處理器與內存是分開的。諾爾斯說,在這些組件之間來回傳輸數據“非常耗費能源”。Graphcore開始設計諾爾斯所謂的“同質結構”,即將芯片的邏輯與內存“混合”在一起,這樣它就不需要花費太多的能量來將數據傳輸到其他硬件上。
在過去的三年多時間裡,諾爾斯和圖恩模擬了數百種芯片佈局的計算機測試方法,最終確定了包含1216個處理器核心的設計方案,諾爾斯將其稱為“許多分散能源的處理器小島”。最終的IPU於2018年首次亮相,這是看起來非常時尚的微型芯片,擁有近240億個晶體管,能夠以GPU的一小部分功率訪問數據。圖恩站在布里斯托爾總部一間凌亂的電子實驗室裡,手指滑過IPU鏡面般的表面說道:“每塊芯片的功率都是120瓦,與明亮的白熾燈泡差不多。”
為了測試這種芯片的原型,研究團隊給它提供了標準的數據訓練模型,其中包含了數百萬張標有普通物體(水果、動物、汽車)標籤的圖像。一位工程師隨後向IPU查詢了他自己的貓宙斯(Zeus)的照片,不到一個小時,計算機不僅正確地識別出了它,而且正確地描述了宙斯的外貌。諾爾斯說:“IPU能夠認出它是一隻斑貓。”
自從第一次測試以來,IPU已經加快了速度,現在每秒可以識別一萬多幅圖像。該芯片的目標是能夠消化和確定複雜得多的數據模型,使系統能夠在更基本的層面上理解什麼是貓。諾爾斯稱:“我們不會告訴機器該做什麼,只是描述了它應該如何學習,並給它提供了大量例證和數據,它實際上並不需要監督,機器正在探尋自己該做什麼。”
圖3:Graphcore的第一款芯片Colossus
在Graphcore公司辦公室的五樓,笨重的工業空調將冷空氣吹進公司的數據服務器室,前後晃動著的窗簾,讓布里斯托爾五月中旬不同尋常的陽光照射進來。儘管這些芯片安裝在冰箱大小的盒式服務器上,非常節能,但這些機器仍然會產生大量的熱量。這些IPU服務器機架足夠執行64千萬億次浮點運算,相當於183000部iPhone X以最高速度同時運行。諾爾斯和圖恩以世界上第一台電子可編程計算機的名字給他們的IPU取了個綽號“Colossus”,這台計算機是英國政府在二戰期間為破解來自德國的加密信息而開發的。
Graphcore已從包括寶馬(BMW)、微軟 (Microsoft)和三星(Samsung)在內的投資者那裡籌集了3.28億美元資金,該公司去年12月份的估值為17億美元。Graphcore以簽署有保密協議為由,拒絕就其芯片的具體應用置評,但考慮到其投資者,許多用例似乎已經顯而易見,比如自動駕駛汽車、類似Siri的語音助手和雲服務器農場等。但是諾爾斯對改變人性的應用最感興趣,比如IPU可能對科學家在氣候變化和醫學研究中需要的複雜分析產生更大影響。
為了幫助大公司客戶解決如何構建下一代計算機以正確使用芯片的問題,Graphcore提供了服務器藍圖,並使用免費軟件工具對其產品進行打包。圖恩稱:“我們會給你電腦設計的配方,然後賣給你配料。”IPU依賴於所謂的“並行計算”概念。編寫程序的基本思想是需要為每個處理器設定功能,但隨著芯片內置處理器的激增(大型Graphcore芯片包括大約500萬個處理器內核,每次可以運行近3000萬個程序),這個編碼任務已經取代了人工編寫程序,這意味著處理器必須自動編程才能獨立執行。
用外行人的話說,Graphcore將龐大的計算任務分割成一個個小數據問題,每個問題都在這些“處理器小島”上單獨處理,然後像海軍陸戰隊軍樂隊一樣同步,在最高效的時刻分享它們學到的東西。
寶馬風險投資部門的首席投資家託拜厄斯·揚(Tobias Jahn)設想將Graphcore芯片應用於該公司的數據中心,或許還包括其汽車中。他說:“寶馬有意讓Graphcore成為一家大規模的全球矽供應商。”自動駕駛汽車必須立即執行超多的關鍵任務,這使得它們成為IPU之類產品的關鍵市場,因為在雲計算中工作往往會有延遲。Arm Holdings聯合創始人豪澤(Hauser)估計,每輛無人駕駛汽車可能需要兩個IPU。Graphcore表示,2019年其收入有望達到5000萬美元。
大牌競爭對手也紛紛湧入這個領域。電動汽車製造商特斯拉公司最近為自己的AI芯片申請了專利,谷歌去年推出了一款專為機器學習設計的微處理器。英偉達始終在改進其主要的GPU芯片設計,使其變得更不精確卻更高效,這更像Graphcore的做法。
市場研究機構Gartner 分析師艾倫·普里斯特利(Alan Priestley)表示:“其他所有公司都在敲英偉達的門。Graphcore擁有很大優勢,但與英偉達的市場份額相比,它仍然是個非常小的競爭對手。因此,儘管他們的IPU在這些工作負載上可能優於英偉達的GPU,但他們面臨的風險是,客戶往往選擇’足夠好’即可,而不是’卓越’。”
如果像承諾的那樣,IPU能使機器運行起來比今天的電腦強大100倍,其面臨的另一個重大挑戰將是道德困境。圖恩和諾爾斯對這些危險保持警惕,尤其是這些技術如何可能被濫用於武器和監控。不過,他們說,最終需要政府來設定限制。諾爾斯指出:“機械動力幫助我們發明了飛機和汽車,但它也幫助發明了坦克。隨著時間的推移,社會將不得不在善與惡之間尋找平衡。”
目前,Graphcore專注於開發更多的軟件,讓客戶看到IPU的強大功能,同時將業務拓展到最終上市的程度。對於每個重大的里程碑,該公司都會開瓶香檳慶祝,比如2017年末融資5000萬美元和2018年實現1000萬美元銷售訂單。這種增長的跡像在Graphcore的辦公室裡隨處可見,香檳的瓶子也越來越大。
諾爾斯圖恩總是從Pol Roger寶祿爵香檳品牌開始,他們認為這種飲品代表他們的驕傲,他們可能會幫助英國誕生首家科技巨頭。諾爾斯說:“從Pol Roger開始,也從Pol Roger結束。”諾爾斯最近喝光了9升大酒瓶的香檳,他說:“當你首次公開募股(IPO)時,你會打開最大瓶的香檳。”