英特尔携生态伙伴展示AI计算盒最新落地成果，XPU综合实力凸显|ai|cpu|处理器|英特尔|计算盒

集微网消息，7月28日，在以“同芯智远，共赢边缘”为主题的2021英特尔AI计算盒参考设计（以下简称“AI计算盒”）主题分享会上，英特尔携手边缘AI领域的众多合作伙伴一同见证了英特尔AI计算盒一系列最新落地成果。

5G、物联网、云计算、边缘计算如今正在为中国带来基础设施的大变革，而人工智能作为核心引擎，正在显著推动多种新技术的融合发展。在这一趋势之下，基于边缘AI的智能视频分析解决方案不仅广受市场青睐，还呈现出极为强劲的增长态势。

据预测，到2022年，智能视频分析市场的规模将超过1800亿元人民币，复合增长率达到34%；且基于边缘AI的智能视频分析解决方案将在智慧城市、智能交通、智能制造、智慧零售等10余个领域得到广泛运用。

英特尔2020年已向业界推出AI计算盒参考设计。该方案充分融合了英特尔领先的软硬件技术与AI算法，以第11代英特尔酷睿处理器、OpenVINO工具套件以及英特尔 Media SDK等先进软硬件产品和技术为抓手，通过英特尔成熟的平台级能力，来帮助各层面合作伙伴与最终用户加速边缘AI应用的开发和工程化落地。

其中，在基础算力层面，英特尔AI计算盒基于全新10nm工艺（SuperFin技术）的微架构设计、增强的单线程/多线程计算处理性能、更低的功耗设计，以及对最新PCIe 4.0高速扩展接口的支持，使得处理器的单线程处理能力提升23%，多线程处理能力提升19%，为智能视频分析提供强劲的算力支撑。

在AI加速上，通过全新集成的英特尔锐炬Xe显卡提供的AI推理算力加成，以及由英特尔GNA 2.0神经加速器、面向深度学习优化的VNNI指令集等带来的AI加速能力，英特尔AI计算盒可获得高达8倍的AI推理加速能力。

此外，英特尔AI计算盒在软件栈配置上也具备显著的优势。例如英特尔Media SDK通过统一的API访问接口、优化的媒体库访问，能够让AI计算盒提升视频播放、编解码以及格式转换效率，获得实时4K视频通信所需的60 FPS HEVC视频编解码能力。同时，AI计算盒所集成的英特尔OpenVINO工具套件，能够有效支持从边缘到云端的深度学习推理。

事实上，目前市面上针对AI计算的产品并不少，英特尔公司高级首席工程师张宇博士认为，无论时TPU、GPU还是其它类型平台，都只是其中的一个架构类型，“英特尔AI计算盒最大的优势是我们有XPU的战略，英特尔的产品线里有CPU、GPU、FPGA，也有人工智能加速芯片，这是英特尔最独特的地方。”

张宇博士：英特尔公司高级首席工程师、物联网事业部中国区首席技术官

张宇博士认为，用户对于计算的需求是多样化的，很少有一个用户只做标量运算或只做矢量运算，涉及的负载类型也是多样化的，英特尔通过不同架构的融合，已经不是传统意义上的CPU，还有集成显卡，能满足用户对于标量和矢量运算的综合要求，有了这样的能力以后，可以运用CPU做逻辑运算，满足日常办公应用、线上运用。

英特尔技术专家刘波进一步解释称：“这个世界是多元的，边缘设备上的工作负载也不是单一的，英特尔的架构在很多方面单个性能不是最强，但综合实力很强，比如说CPU的通用计算等等，都比较适合在边缘侧做成融合性比较高、容纳很多负载的应用。”

对此，开域集团数字科技负责人应翔翔深有体会：“现在市面上有比较多可供选择的边缘硬件、边缘设备，开域集团在开发AI计算盒时做了比较多的探索和选型，最后发现，英特尔是我们最好的选择、最好的合作伙伴。”

应翔翔分析认为，首先英特尔AI计算盒方案提供有完整开发套件，在整个算法的复杂算法计算实践中，英特尔AI计算盒参考设计发挥了举足轻重的作用，应用的实时性、准确性也相当理想，这在以前比较难实现。

其次，英特尔AI计算盒参考设计的算力、性能，可以根据不同的场景对算力进行提升，发挥出最大的性能。可以支撑端、边、云比较完整的结构，“使得开域集团在场景、适用和对场景的覆盖度上没有任何阻碍，也让开域集团和英特尔的合作水到渠成。”

趋视科技事业部副总经理夏晶也持有相同的观点，他认为：“采用英特尔AI计算盒参考设计方案后，得益于算法在落地性、准确性方面的优势，我们竞标的项目评分比较靠前，在不少项目中排第一。”据夏晶介绍，趋视科技过去在进行AI计算盒开发时，CPU方案最高只能做到32路视频处理，但采用英特尔AI计算盒方案后，目前小盒可以做到48路视频结构化分析，大盒则高达80~100路视频接入及处理。

据了解，英特尔不仅为合作伙伴提供AI计算盒，还提供有优化工具，可以在系统级别对软件做调优，“英特尔提供了很多围绕着芯片的SDK和相关的优化工具，除此之外还有非常强的技术支持团队。把这些工具用好，客户这边的应用在英特尔的平台上跑出最好的性能。”英特尔技术专家刘波如是介绍道。

在满足特定负载的优化中，具体到AI执行层面，英特尔提供包括MO等优化功能，可以在客户的人工智能网络模型训练开发好以后，把等效计算量降低，提升实际的应用性能。（校对/James）