打开网易新闻 查看精彩图片

集微网消息,7月28日,在以“同芯智远,共赢边缘”为主题的2021英特尔AI计算盒参考设计(以下简称“AI计算盒”)主题分享会上,英特尔携手边缘AI领域的众多合作伙伴一同见证了英特尔AI计算盒一系列最新落地成果。

5G、物联网、云计算、边缘计算如今正在为中国带来基础设施的大变革,而人工智能作为核心引擎,正在显著推动多种新技术的融合发展。在这一趋势之下,基于边缘AI的智能视频分析解决方案不仅广受市场青睐,还呈现出极为强劲的增长态势。

据预测,到2022年,智能视频分析市场的规模将超过1800亿元人民币,复合增长率达到34%;且基于边缘AI的智能视频分析解决方案将在智慧城市、智能交通、智能制造、智慧零售等10余个领域得到广泛运用。

英特尔2020年已向业界推出AI计算盒参考设计。该方案充分融合了英特尔领先的软硬件技术与AI算法,以第11代英特尔酷睿处理器、OpenVINO工具套件以及英特尔 Media SDK等先进软硬件产品和技术为抓手,通过英特尔成熟的平台级能力,来帮助各层面合作伙伴与最终用户加速边缘AI应用的开发和工程化落地。

其中,在基础算力层面,英特尔AI计算盒基于全新10nm工艺(SuperFin技术)的微架构设计、增强的单线程/多线程计算处理性能、更低的功耗设计,以及对最新PCIe 4.0高速扩展接口的支持,使得处理器的单线程处理能力提升23%,多线程处理能力提升19%,为智能视频分析提供强劲的算力支撑。

在AI加速上,通过全新集成的英特尔锐炬Xe显卡提供的AI推理算力加成,以及由英特尔GNA 2.0神经加速器、面向深度学习优化的VNNI指令集等带来的AI加速能力,英特尔AI计算盒可获得高达8倍的AI推理加速能力。

此外,英特尔AI计算盒在软件栈配置上也具备显著的优势。例如英特尔Media SDK通过统一的API访问接口、优化的媒体库访问,能够让AI计算盒提升视频播放、编解码以及格式转换效率,获得实时4K视频通信所需的60 FPS HEVC视频编解码能力。同时,AI计算盒所集成的英特尔OpenVINO工具套件,能够有效支持从边缘到云端的深度学习推理。

事实上,目前市面上针对AI计算的产品并不少,英特尔公司高级首席工程师张宇博士认为,无论时TPU、GPU还是其它类型平台,都只是其中的一个架构类型,“英特尔AI计算盒最大的优势是我们有XPU的战略,英特尔的产品线里有CPUGPUFPGA,也有人工智能加速芯片,这是英特尔最独特的地方。

打开网易新闻 查看精彩图片

张宇博士:英特尔公司高级首席工程师、物联网事业部中国区首席技术官

张宇博士认为,用户对于计算的需求是多样化的,很少有一个用户只做标量运算或只做矢量运算,涉及的负载类型也是多样化的,英特尔通过不同架构的融合,已经不是传统意义上的CPU,还有集成显卡,能满足用户对于标量和矢量运算的综合要求,有了这样的能力以后,可以运用CPU做逻辑运算,满足日常办公应用、线上运用。

英特尔技术专家刘波进一步解释称:“这个世界是多元的,边缘设备上的工作负载也不是单一的,英特尔的架构在很多方面单个性能不是最强,但综合实力很强,比如说CPU的通用计算等等,都比较适合在边缘侧做成融合性比较高、容纳很多负载的应用。

对此,开域集团数字科技负责人应翔翔深有体会:“现在市面上有比较多可供选择的边缘硬件、边缘设备,开域集团在开发AI计算盒时做了比较多的探索和选型,最后发现,英特尔是我们最好的选择、最好的合作伙伴。”

应翔翔分析认为,首先英特尔AI计算盒方案提供有完整开发套件,在整个算法的复杂算法计算实践中,英特尔AI计算盒参考设计发挥了举足轻重的作用,应用的实时性、准确性也相当理想,这在以前比较难实现。

其次,英特尔AI计算盒参考设计的算力、性能,可以根据不同的场景对算力进行提升,发挥出最大的性能。可以支撑端、边、云比较完整的结构,“使得开域集团在场景、适用和对场景的覆盖度上没有任何阻碍,也让开域集团和英特尔的合作水到渠成。”

趋视科技事业部副总经理夏晶也持有相同的观点,他认为:“采用英特尔AI计算盒参考设计方案后,得益于算法在落地性、准确性方面的优势,我竞标的项目评分比较靠前,在不少项目排第一。”据夏晶介绍,趋视科技过去在进行AI计算盒开发时,CPU方案最高只能做到32路视频处理,但采用英特尔AI计算盒方案后,目前小盒可以做到48路视频结构化分析,大盒则高达80~100路视频接入及处理。

据了解,英特尔不仅为合作伙伴提供AI计算盒,还提供有优化工具,可以在系统级别对软件做调优,“英特尔提供了很多围绕着芯片的SDK和相关的优化工具,除此之外还有非常强的技术支持团队。把这些工具用好,客户这边的应用在英特尔的平台上跑出最好的性能。”英特尔技术专家刘波如是介绍道。

在满足特定负载的优化中,具体到AI执行层面,英特尔提供包括MO等优化功能,可以在客户的人工智能网络模型训练开发好以后,把等效计算量降低,提升实际的应用性能。(校对/James)