2018年全球最值得關注的AI芯片初創公司
在《芯片巨頭們2019年的AI芯片之爭會如何?》一文中作者Karl Freund詳細介紹了巨頭公司們的AI芯片。此外,還有數十家矽谷創業公司和中國獨角獸公司估值超過10億美元,並且也參與了AI芯片的競爭。在本文中,作者將介紹全球的最傑出,或至少是最受關注的AI芯片創業公司。
Wave Computing
Wave Computing在2018取得了不少進展,推出其第一個DataFlow處理單元,收購MIPS,創建MIPS Open,並將首批系統交付給少數客戶。雖然Wave架構有一些非常有趣的功能,但我們更期待用戶的大規模真實體驗反饋。
Wave不是插入到服務器的加速器,它是用於圖形計算的獨立處理器。這種方法有利有弊。從積極的方面看,Wave不會受到GPU等加速器面臨的內存瓶頸影響。從消極方面來說,安裝Wave設備將是新的升級,需要完全替換傳統的X86服務器,也讓其成為所有服務器製造商的競爭對手。
我不認為Wave能從某個點擊敗NVIDIA,但該架構的設計的非常好,該公司已經表示它很快就會有客戶的反饋。
圖1:Wave是從上面顯示的4節點“DPU”構建的系統。Wave Computing
Graphcore
Graphcore是一家資金雄厚(融資3.1億美元,目前估值為17億美元)的英國獨角獸創業公司,擁有全球化的團隊。它正在構建一種新型的圖形處理器架構,其內存與其邏輯單元位於同一芯片上,這應該能夠實現更高的性能。該團隊產品的發佈時間暫不明確,不過他們去年四月表示“幾乎準備好發布”了,12月的最新信息表明它將很快開始生產。
Graphcore的投資者名單令人印象深刻,包括紅杉資本、寶馬、微軟、博世和戴爾科技。
我了解了該公司的架構,它非常令人印象深刻。從邊緣設備擴展到用於數據中心的訓練和推理的“Colossus”雙芯片封裝。在最近的NeurIPS活動中,Graphcore展示了其RackScale IPU Pod,它在一個32台服務器的機架中提供超過16 petaflops的算力。雖然該公司經常聲稱它將提供比同類最好GPU強100倍的性能。
Graphcore表示,4“Colossus”GC2(8芯片)服務器可提供500 TFlops(每秒數万億次操作)的混合精度性能。單個NVIDIA V100可提供125 TFlops,因此理論上4 個V100就可提供與其相同的性能。
與往常一樣,細節更能發現差別,V100峰值性能僅在重構代碼執行TensorCore的4×4矩陣乘法時才可用,這是Graphcore架構巧妙避免的限制。更不用說V100消耗了300瓦的電能和大量現金這一事實。
此外,Graphcore支持片上互連和“處理器內存”(片上存儲器)方法,可以得到超出TFlops基準所認可的優秀性能。在一些神經網絡中,如Generative Adversarial Networks,內存是瓶頸。
再次強調,我們將不得不等待真實的用戶用實際應用程序來評估此體系結構。儘管如此,Graphcore的投資者名單、專家名單和台天價估值告訴我,這可能是一件好事。
圖2:GraphCore展示了ImageNet數據集處理的照片。可視化可幫助人員了解其訓練處理佔用處理週期的位置。
Habana Labs
Habana Labs是一家以色列創業公司,去年9月在第一次AI硬件峰會上宣布它已經準備好推出其首款用於推理的芯片,其創紀錄的性能用於卷積神經網絡圖像處理。結果顯示在Resnet50圖像分類中該處理器每秒分類15,000張圖像,比NVIDIA的T4高出約50%,功耗僅為100瓦。
在2018年12月,Habana Labs的最新一輪融資由英特爾風險投資(Intel Venture Capital)領投,WRV Capital,Bessemer Venture Partners和Battery Ventures跟投,該公司的融資也由此前的4500萬美元增加了7500萬美元。
據悉,Habana Labs新的融資將部分用於流片其名為“Gaudi“的第二款芯片,該芯片將專注於訓練市場,據稱可擴展到1000多個處理器。
其它創業公司
我知道世界上有超過40家公司在為人工智能設計訓練和推理芯片。我發現大多數公司都在進行簡單的FMA(浮點乘法累加)和混合精度數學(整型8位和浮點16位和32位)。對此我不會感到驚訝,因為這種方法相對容易實現並且會獲得一些成果,但它不會為像NVIDIA,英特爾以及少數初創公司做出不一樣的架構提供持久的架構優勢。
以下是一些引起我注意的公司:
- Groq:前Google員工創立,從事TPU工作,他們有雄心統治世界其他地區。
Tenstorrent:加拿大前AMD員工創立,目前仍處於保密階段。我只能說其首席執行官的願景和架構給我留下了深刻的印象。
ThinCi:印度公司專注於邊緣設備和自動駕駛汽車,與三星和Denso建立了合作夥伴關係。
Cerebras:由前SeaMicro(雷鋒網注,AMD子公司,專注於超密集計算機服務器行,在2015年4月16日停止運營)員工領導,包括Andrew Feldman,目前仍處於深度“隱身”模式。
Mythic:一家採用獨特方法進行邊緣推理處理的創業公司,類似於非易失性存儲器上的模擬處理; 應該在2019年有芯片。
中國AI芯片初創公司
中國一直試圖找到一條擺脫美國半導體的方式,人工智能加速器可能會提供它一直在尋求的機會。中國設定了2030年要建立一個價值數万億美元的人工智能產業的目標,自2012年以來,投資者已經向創業公司投入了超過40億美元的資金。
美國國會稱這是一場人工智能軍備競賽,美國科技產業可能落後於中國公司和研究機構,因為其不太關注阻礙西方進步的隱私問題。
Cambricon(寒武紀科技)和SenseTime(商湯科技)可能是最值得關注的中國人工智能玩家,但像邊緣AI這樣的玩家更關注Horizon Robotics(地平線)。此外,大型科技公司如百度、華為、和阿里巴巴也值得關注,所有這些公司都對人工智能軟件和硬件進行了大量投資。
寒武紀科技估值為25億美元,是已經發布了第三代AI芯片的中國獨角獸公司。寒武紀稱它可以用更低的功耗提供比NVIDIA V100更好的AI性能,他們還銷售其AI IP,搭載在華為麒麟970和麒麟980的處理器當中,作為AI加速硬件。
商湯科技也許是估值最高的AI創業公司,以在中國推廣智能監控攝像頭而聞名。這些安防攝像頭數量超過1.75億,包括其他公司生產的攝像頭。商湯科技在香港成立,最近一輪融資數額達6億美元,由阿里巴巴領投。據報導,這家初創公司的價值目前為45億美元。
商湯科技與阿里巴巴、高通、本田甚至NVIDIA等主要公司建立了戰略合作夥伴關係。該公司今天擁有一台超級計算機,運行大約8000塊(可能是NVIDIA提供?)GPU,併計劃再建造5台超級計算機來處理數百萬個攝像頭採集的面部識別數據。