华为胡厚崑:中国算力网络标准需统一,硬件、应用接口、数据共享应相互兼容
480 2022-09-26
我们只谈移动嵌入式设备。
首先明确一点,目前希望在嵌入式设备上做训练是不可能的,算力和功耗都难以达到要求。
目前能做的是什么呢?在云端训练推送parameter到嵌入式设备或者将训练好的parameter内置在设备中。目前国内基于深度学习的人脸识别已经在手机上实现。但是速度和功耗都不理想。目前很多厂商都在推出手机端的深度学习芯片,准确的说,是深度预测芯片。框架的支持不是问题,有直接自己porting的,也有直接用tensor flow lite的。需要解决的有两个问题,一是芯片的运算速度和功耗的权衡,二是和系统整合后的功耗和运算速度。大家可能觉得这两点不是一样吗?大不一样,一即便能做好,二也很难做好。手机摄像头是工作时启动的,所以功耗相对经济。如果要做人脸解锁,camera始终处于工作态是用户体验最好的。但这样带来的功耗增加包括camera本身的功耗和ISP的功耗。这是其一,parameter动辄几十兆,load速度是个问题。运算采用专用芯片后倒问题不大。另外,有些专家谈到的闭环人工智能,使用用户的设备来采集数据也是难以实现的,图像数据上传到云端这是很差的用户体验。