Qualcomm博客

TensorFlow机器学习针对骁龙835和Hexagon 682 DSP进行优化

2017年1月17日

Qualcomm products mentioned within this post are offered by Qualcomm Technologies, Inc. and/or its subsidiaries.

针对Qualcomm Hexagon DSP进行优化的应用程序能够更快地运行,耗电更少。Qualcomm目前正为Google的机器学习架构TensorFlow提供更多支持。目前TensorFlow针对Hexagon 682 DSP进行了专门优化,而这项技术集成于我们的顶级处理器骁龙835之中。

TensorFlow是Google的机器学习软件库,并且是开源的,开发者可以免费使用TensorFlow来创建模型,并在其手机和电脑应用程序或云服务中加入人工智能。开发者可采用多种方式充分利用骁龙835的异构核心,其中最佳方式是充分利用DSP。Google已在多款产品中使用TensorFlow机器学习功能,包括Google Photos和Google Cloud Speech。

TensorFlow可在处理器内部的处理单元运行。骁龙处理器集成了CPU、GPU和DSP在内的许多其他技术。与CPU或GPU相比,我们的DSP架构在处理某些音频和视频功能时速度更快,耗电更少,因此有必要充分利用其潜力,深挖其优势。下图展示了针对DSP专门优化的应用程序具备的优势。

用于GoogleNet Inception DNN(深度神经网络)的最佳功率和性能。选择核心来匹配用户体验。(实际性能可能有所差别)

Qualcomm Technologies与Google密切合作之后,TensorFlow将运行在DSP上,让应用程序运行得更快、更高效,而无需使整个系统都工作。

Qualcomm Technologies还通过Qualcomm 骁龙神经处理引擎SDK为Tensorflow提供支持。这是一种异构软件框架,让OEM厂商能够在CPU、GPU或DSP等核心上运行Tensorflow模型,为预期的用户体验提供最佳性能和功率分布。

我们做了一个测试,Google创建了一个内置TensorFlow的应用程序,并将其加载到两部完全相同的智能手机上。应用程序能够识别放在智能手机相机面前的实物。唯一的区别是,一部智能手机在CPU上运行应用程序,而另一个在Hexagon DSP上运行。

与在CPU上运行的应用程序相比,运行在DSP上的应用程序能够在既定时间内识别更多图像,更快地分析并做出结论,在识别物体时更为肯定。

你会注意到下面三个衡量标准:

•FPS——DSP捕捉更多图像(帧/秒),从而增强应用程序的精确度。

•MS——DSP在识别物体时更快(较少毫秒)

•0-1——DSP在判断物体为何物时具有更高的确定性(0代表未知,1代表确定。)