Qualcomm博客
Qualcomm 作为低功耗、高性能应用处理技术领域的领军企业, 提供了面向人工智能的商用终端侧移动平台。同时扩展了产品方案,支持采用骁龙平台的合作伙伴生态系统,利用人工智能去提供令人惊叹的用户体验。
Qualcomm 的人工智能解决方案可应对诸多不同的市场,包括智能手机、笔记本电脑、头显设备、物联网(IoT)终端和汽车系统。所有领域的体验都在加速,包括增强型计算机视觉(例如更智能的图像分类、运动追踪、面部识别等)、音频(例如语音识别和自然语言处理等)、游戏(例如游戏中非玩家角色模拟用户行为)、安防应用(例如识别非法活动的物联网安防摄像头),以及工业和医学领域的许多其他类型应用等。
Qualcomm 的平台支持一系列广泛的人工智能框架、软件和算法,同时也被软件与云服务合作伙伴采用,在骁龙平台上支持人工智能。
骁龙人工智能引擎 (Snapdragon AIE) 是帮助加速终端侧人工智能用户体验实现的硬件与软件组件的集合。其中关键组件包括:硬件:Hexagon 向量处理器、Adreno GPU 和 Kryo CPU 的人工智能优化组合;以及一套软件工具和库:骁龙神经处理 SDK、Android NN 和 Hexagon NN。
硬件 (Hexagon、Adreno、Kryo) + 软件工具 (SNP SDK、Android NN、Hexagon NN)
= 人工智能引擎 AI Engine
上述所有共同支持开发者与OEM厂商,轻松实和现加速骁龙内核上的人工智能处理。
大部分人工智能都将在“终端侧”运行,这正是 Qualcomm 所专注的部分。为了将人工智能算法从云端迁移到移动终端上以实现出色性能,Qualcomm 将充分利用其骁龙可编程架构,例如 Hexagon 向量处理器、Adreno GPU 视觉处理子系统和 Kryo CPU。除了针对全新人工智能工作负载进行的优化,Qualcomm 还对骁龙进行了硬件升级,来保持在单位功耗人工智能性能方面的领先优势,但事实证明,高效运行终端侧人工智能是一个涉及多方面的问题,仅靠单颗人工智能内核是无法以最佳方式解决的。与之相反的是,因为人工智能用户体验的功耗和性能状况各不相同,所以为了应对这种差异需要可编程的异构计算。
Qualcomm 的异构运算方案为开发者提供了更广泛的选择,面向不同类型的功能、基于不同类型的数据、 在不同的计算精度水平上,可支持大量卷积或循环神经网络。异构计算核心(如骁龙的 CPU、GPU 和向量处理器)具备了开发者、OEM 厂商或独立软件开发商(ISV)所需的诸 多优势,让他们可通过精确控制或 Qualcomm 开发的预优化人工智能库加速其应用实现。
相较于 GPU 或 CPU,涉及向量数学的应用工作负载通常更适合在 Qualcomm 的向量处理器上运行。 Qualcomm Hexagon 向量处理器是向量处理器子系统中的加速引擎,支持实现以 8 位定点加速神经网络运行。
具有庞大的并行数据集、需要大量的向量数学,尤其是对浮点精度有要求的应用工作负载, 都非常适宜在骁龙的 Adreno GPU 上运行。人工智能应用通常先使用 “GPGPU”(通用GPU) 建模,有的是全部建立在 GPU 上,有的则分布于 GPU 和向量处理器间。
神经网络模型通常以 32 位浮点(高精度)在云端完成训练。它也可以在终端侧的 CPU 上实现类似运行,但其成本较高,并需要终端在性能和功耗上作出一些牺牲。在骁龙 845 中, 我们在 Kryo CPU 上优化了对 8 位定点精度的支持,帮助支持包含较大内核、相对较少向量处理、非规则性数据结构和/或复杂流程控制的应用。
骁龙神经处理(SNP)SDK 旨在帮助开发者节省在骁龙终端上优化已训练好的神经网络运行的性能的时间和工作量。为了实现这一目的,Qualcomm 为模型转换和操作提供工具,并为选择具备特定功耗和性能组合的内核提供 API,以满足所期望的用户体验。该 SNP SDK 支持 卷积神经网络(CNN)、LSTM 与自定义层。
Google 的全新 Android NN API,为手机带来硬件加速的推理能力,可支持快速执行此前训 练过的机器学习模型。通过降低时延和网络侧的加载,在边缘侧运行这些计算可为终端用 户带来极大的实用性,同时也可在终端侧保存更敏感的数据。
Hexagon NN 是帮助开发者在 Hexagon 向量处理器上直接运行其人工智能算法的库。当在 Hexagon 向量处理器上运行时,Hexagon NN 为基础性的机器学习模块提供了优化的部署, 并显著加速诸如卷积、池化和激活等人工智能运行。这个库也可能被直接使用,在向 Hexagon 向量处理器卸载人工智能工作负载时,它也可以被 SNP SDK 和 Android NN 使用。
如果有这样一个世界,所有终端、设备和一切事物都具有更强大的直觉,那么这个世界将会变得更加简化而丰富。 例如,智能手机能够更了解我们的喜好和所处环境,然后预测我们的需求,并在恰当的时间为我们提供相关信息。在现有智能手机和移动行业规模基础上,Qualcomm 期望这些认知技术能够突破移动领域的局限,也能为其他领域的终端、机器和事物提供帮助。
骁龙平台凭借终端侧人工智能,创造了机器学习驱动端到端的解决方案,更点燃了语音交互的革命。支持多种语言的深度学习,提升性能表现,达到更个性化的互动从而打造出真正的虚拟助理。
Qualcomm 研发部开展的计算机视觉研究项目专注于通过不断开发技术来丰富移动设备的用户体验。 该项目努力开发了传感器融合、增强现实、运算摄影、HW 加速器等功能,以增强移动设备在已知或未知环境下的计算机视觉能力。
沉浸式体验给我们的感官带来刺激,让我们陶醉其中,前往全新领域,感受精彩瞬间。 不仅如此,它还让我们的日常生活更加精彩,无论是在智能手机上玩视频游戏、在平板电脑上开视频会议、还是通过虚拟现实头盔观看比赛,所有设备上的体验都将更真实、更生动、更引人入胜。 Qualcomm 的目标是根据设备的形状要素、活动和环境提供相应的沉浸级别
.
.