驍龍855在AI性能上真的秒殺麒麟980?噱頭而已
前段時間的高通發布會上,有關驍龍855 AI性能達到友商競品兩倍的言論可謂是賺足了眼球。高通指出,驍龍855針對CPU、GPU、DSP都進行了AI計算優化,結合第四代AI引擎可以實現每秒超過7萬億次運算(7 TOPs)的AI算力。
高通在發布會上指的“友商”,特意點名是安卓平台另一款使用7nm工藝的處理器,目前三星最新的處理器Exynos 9820是基於8nm工藝打造,蘋果A12芯片雖然使用了7nm工藝,但平台不同很難比較。言下之意,這裡的“友商”很明顯就是指的華為的最新處理器麒麟980。
說到手機芯片的AI性能,麒麟980主要依靠獨立內置的NPU來支撐,這顆NPU就是AI芯片創企寒武紀的1H處理器。而就在12月13日於清華大學舉辦的嵌入式人工智能大會上,寒武紀創始人兼CEO陳天石在演講中提到:“前段時間高通發布驍龍855時宣稱,其AI性能是友商競品的2倍,我不知道這是不是在指我們,如果是,我不認為1H的AI性能會落後於驍龍855。”陳天石還表示,“在我們內部測試中,1H的測試結果非常優秀,測試峰值非常的高。如果高通有信心地話不妨公佈測試結果,比一個高下。”
顯然,火藥味很濃。
難道,沒有搭載獨立的NPU內核的驍龍855真的比搭載寒武紀1H處理器的麒麟980芯片在AI性能上强两倍嗎?最近,這一話題在知乎上也得到了一些從業者的關注和討論。智能菌整理如下:
知乎作者麥克阿攝認為:從7萬億這個數字來看,驍龍855是橫掃蘋果的A12和華為麒麟980的(根據970的數據,算上980的增幅,可得麒麟980的算力為4.2TOPs)。
但從AIMark平台上的跑分成績來看,高通855平台獲得2.2萬分,和麒麟980的得分2.15萬分相差不大,這又是怎麼一回事呢?
原來,高通得出這個所謂的7 TOPS算力,是基於CPU+GPU+DSP這三部分的總計所得。但不管是華為還是蘋果,給出的AI算力數據都是來源於其單獨的NPU。
需要科普的是,CPU非常適合邏輯運算和整數運算,也可以進行浮點運算,但其效率低並且功耗高。隨著技術和應用的發展,單單CPU已經難以滿足是來自圖形渲染的需求了,於是專門進行浮點運算的GPU應運而生,它大大提升了浮點運算的效率,降低了功耗。而AI主要是做卷積運算,需要超大量的浮點運算來支撐,但這裡的浮點運算並不需要GPU提供那麼高的精度,只需要更低精度的浮點運算就完全勝任,而這正是NPU所最擅長的領域。另外,高通的發布會中也特別強調了DSP的設計,但這畢竟也不是什麼新概念。從硬件角度來說,可能有所提升,但也絕不具備NPU在AI計算上的專業和高效率。
知乎用戶養貓的哈士奇認為:衡量AI性能沒有統一的標準,有很多都指標,有的跑卷積、有的跑池化、有的跑浮點、還有跑挖礦的,這裡的指標最重要的應該是卷積。
本著“大膽假設,小心求證”的思路,拜託一位搞AI研發的朋友跑了一下卷積運算。測試機型是搭載驍龍845的小米MIX 2S和搭載A12芯片的iPhone XS。如果按照高通的說法,驍龍855的AI性能是845的三倍。
結果顯示,在基於AI神經網絡實測的場景下,搭載驍龍845的小米MIX 2S測試數據為10.39,而搭載蘋果A12芯片的iPhone XS測試數據為72.64,測試數據越高代表AI性能越強。如果驍龍855的AI性能是845的三倍,那麼測試數據應該是31.17,這一數字遠低於A12的72.64,但是蘋果A12芯片對外公佈的AI算力只有5 TOPS。是不是很奇怪?
那麼,高通驍龍855所公佈的7 TOPS是怎麼得來的?
驍龍855公佈的AI性能是通過CPU+GPU+DSP的方式來實現的,如果是這樣這個數字基本沒意義。因為在移動端能耗比是非常重要的指標,更何況CPU、GPU、DSP還有其它任務不能全力投入AI運算,高通驍龍855的在AI運算上的能耗比太低了。
以上知乎作者都認為,高通宣稱的驍龍855可以達到7 TOPS 算力完全是用來吹牛逼的。
但從另外一個角度看,不管是華為麒麟980還是高通驍龍855,以現有的應用來看,其AI性能都是大量過剩的。因為手機中所謂的AI只是一個執行加速器,並不會用來進行訓練,現在的性能根本用不完,很多廠家在這方面都製造了足夠的噱頭。