AIIA AI公佈首輪評估結果:瑞芯微RK3399數據搶眼
人工智能產業發展聯盟(AIIA)正式發布“AIIA DNN benchmark V0.5”首輪評估結果。該評估在AIIA權威測試平台完成,基於端側推斷任務的深度神經網絡處理器基準測試。在四大典型應用場景下,能夠客觀反映具有深度學習處理能力的處理器或加速器的性能水平。評估結果顯示,海思麒麟980和瑞芯微RK3399表現上佳。
“AIIADNN benchmark V0.5”評估的標準較為嚴苛,包含四大典型場景和兩大類評測指標等,指標包含速度(fps)和算法性能,如top1 、top5、mAP、mIoU、PSNR等。同時,這也是深度學習處理器領域首次區分整型和浮點對比的Benchmark。福州瑞芯微電子的RK3399 板展現出搶眼數據。
採用28nm工藝的福州瑞芯微電子RK3399開發板,在評估中展現出超強性能。評估數據顯示,在浮點模型不需要定點化重新訓練的情況下,int8計算以精度損失最大為1%的代價,達到相對於浮點計算兩倍的性能。
此外,在Interpretation評測中AIIA第一次嘗試在基準測試中將量化和浮點模型分開評測。而福州瑞芯微電子RK3399開發板同樣取得多項優異數據,在業內處於前列水平。
值得一提的是,福州瑞芯微電子RK3399開發板數據搶眼的背後,離不開前沿技術的支持。比如RK3399融入了Tengine,後者是由OPEN AI LAB開發的一款輕量級模塊化高性能神經網絡推理引擎。Tengine專門針對Arm嵌入式設備優化,且無需依賴第三方庫,可跨平台使用支持Android、Liunx等。
Tengine支持各類常見卷積神經網絡,包括SqueezeNet,MobileNet,AlexNet,ResNet等,支持層融合、8位量化等優化策略。通過調用針對不同CPU微構架優化的HCL庫,能將Arm CPU的性能充分挖掘出來。而RK3399的Cortex-A72單線程運行移動端常用的MobileNet,一次只需要111ms。
在IoT設備、智能交互設備、個人電腦、機器人等人工智能設備的創新與研發上,福州瑞芯微電子已經在技術上展現出領先優勢,除了RK3399以外,旗艦級人工智能芯片RK3399Pro同樣極具看點,其首次採用CPU+GPU+NPU的硬件結構設計。這一芯片集成的NPU(神經網絡處理器)融合了福州瑞芯微電子在機器視覺、語音處理、深度學習等方面的關鍵技術,片上NPU運算性能高達3.0TOPs,具備高性能、低功耗、開發易等優勢。