智能视觉，构建智慧城市的心灵之窗

2019-08-05

中国公共安全 2019年6期

4月3日，“英特尔以数据为中心，加速企业数字化变革”2019英特尔® 创新产品发布会在北京盛大举行。在大会的主题演讲环节中，浙江大华技术股份有限公司研发产品线产品总监陆振善先生作为用户代表登台，为大家分享了大华与英特尔合作，在智能感知大数据分析领域的成功经验。据陆振善介绍，大华基于第二代英特尔® 至强® 可扩展处理器的产品技术，打造端到端的AI解决方案，解决了传统深度学习对未知、复杂目标检测困难的问题，以全感知、全计算的能力，多维度提升目标感知能力和数据总结归纳性能，在智能感知大数据分析领域取得重大成就。

而作为企业的未来展望，大华表示希望与英特尔联合打造HOC城市中心，以全感知、全智能、全计算和全生态四大能力为支撑，联动物联网，在善政、惠民、兴业的各类应用上，锻造出一架强大的智慧城市发展引擎，从而实现新型智慧城市架构。

大华科技与英特尔在物联网的深度合作由来已久。眼睛是心灵的窗户，那么对于一个城市而言，视觉系统便是城市的心灵之窗。大华基于英特尔产品和技术，在城市安防中搭建端到端的的视频监控解决方案、系统及服务，打造城市智能视觉系统，为城市运营、企业管理、个人消费者生活创造价值。

边缘视觉计算，覆盖全领域

人的眼睛有一个独特的能力：可以从看到的事物中自动提取有用的信息，忽略无效的冗余细节，从而减少大脑的处理负担。大华和英特尔合作提供的智能视觉技术，同样可以做到这一点，也就是说：针对得到的海量视频数据，让人工智能和机器视觉技术进入边缘侧，结合 AI和边缘计算，提升效率并降低成本。

比如大华和英特尔合作提供的ITS智能交通解决方案，现在已经在全球多个地方部署，其中融合自动车牌识别、交通灯管制、路速体系和绿波带，为缓解道路拥堵现象、实现智慧交通，提供了高效的解决办法。在英特尔的支持下，大华提供的HOC智慧零售解决方案，帮助小型连锁便利店、大型商超和商业购物中心转型新零售，使个性购物、智能库存管理和精准营销成为可能。

大华这一系列物联网的布局，建立于英特尔面向物联网的软硬件技术和解决方案之上，特别是在智能视觉领域。英特尔的一系列处理器和芯片，从凌动到酷睿，再到至强，从CPU、GPU到英特尔® MovidiusVPU，再到英特尔® FPGA的各类芯片，满足不同应用场景，符合各种人工智能架构的性能、成本和功效要求。

英特尔® OpenVINO™ 开发工具包，专门面向机器视觉和深度学习。开发人员使用统一的视觉机器学习API，快速开发和构建视觉应用，同时还能简化英特尔系列产品的部署流程。针对视觉的加速器产品，英特尔拥有全系列CPU、GPU、VPU和板卡平台，以满足不同客户各类需求。

因此，英特尔的物联网和智能视觉技术，可以应用在多个领域：

工业制造业：实现对机器的预测性维护并有效提升生产效率，降低人力和设备维护成本。

运输行业：增强驾驶舱使用体验，实现货物追踪，让驾驶更加安全。

医疗保健行业：英特尔视觉产品能够让医学影像更强大并能辅助医生诊断。

AI 护航，动定结合，“深眸”智能监控全局

人类作为自然界的万物之灵，能够发展到今天，有赖于使用眼睛作为主要感知器官，因为比起听觉、嗅觉，视觉的感知范围更远；有赖于结合手、眼、心的强大学习能力，这样才能改造我们的世界，让这个世界中的万物互联，形成一个强大的、更美好、更便利、更智能的有机体。

在这个有机体中的一个又一个智慧城市里，有了AI、机器学习和智能视觉技术的支持，物联网必将迅速呈现出爆炸式发展。数据显示，到2020年，这是一个价值超过三千亿美元的市场，不知道你心动了吗？

随着“平安城市”、“智慧城市”建设的不断加快，城市安防飞速发展，视频监控设备普及程度日渐提升，视频监控和大数据应用是重中之重。据市场研究机构iHS预测，到2020年，全球每年出货约2.5亿个监控摄像头，所有数字监控系统的摄像头，每天会生成总计1.6EB的数据。

然而，传统上以监控为主的方法，重点放在“看得全”上，并没有充分利用收集到的视频数据，太过被动；海量存储的视频调用困难，不够智能灵活，不足以提供最好的安全性；在视频调用、回放中费时费力，人工参与应对乏力，容易出错。

海康威视是全球视频监控数字化、网络化、高清化的重要推动者，连续六年蝉联iHS全球视频监控市场占有率第一。海康威视研究院算法总监沈林杰举了这样一个例子：“在治安监控里，需要对人、人体、人脸、机动车等进行高清图片抓取。传统的视频，都是以做监控为主，图像清晰度不足，无法进行智能解析。公安部门的需求，是从图像中获取高清的车辆、人脸，为后面的结构化大数据应用提供支持。”

这就涉及到智能化视频监控接下来要解决的两个核心问题：

如何保证摄像机端优先捕捉有特征信息的高清图像，来缓解后端分析系统的工作压力，并为深度学习提供更多高质量的样本数据？

如何充分利用深度学习和训练的成果，不仅用于数据挖掘和分析上，还要正向反馈给前端摄像机，让它们在捕捉高价值信息时能更高效，更可靠?

有鉴于此，海康威视与英特尔公司密切配合，使用英特尔® Movidius VPU视觉处理单元，采用人工智能和机器学习相关的软硬件技术，开发了“深眸”全局摄像机，推进视频监控智能化，为平安城市保驾护航。

定点+动点：看得全，更看得清、看得准

“深眸”全球摄像机采用创新的“双镜头”设计，集合定点广角摄像头和动点长焦摄像头。广角摄像头负责视频采集，长焦摄像头负责捕捉视频关键特征信息画面。定点看全景，动点看细节。监控距离远、范围广，可以持续抓拍细节，解决了使用场景单一、抓拍效率低、无法在开放式场景进行特征信息采集的问题，绝对“看得全”。

▲具备“双镜头”功能的海康威视“深眸”全局摄像机

更重要的是，在英特尔® Movidius VPU视觉处理单元的指挥下，两个镜头可以彼此配合。

在城市监控视频后期调用的过程中，VPU 中内置的智能学习芯片会让摄像机先借助算法做判断，自动检测和识别人员、车辆等特征信息，只要发现有目标进入预定区域，它就会调动定点镜头进行快速检测，并协调动点镜头进行快速锁定和抓拍。从而做到“看得清”，“看得准”。

因此，集成了人工智能的“深眸”，避免了误报和误拍，不会传送大量无效图像到后端，也不再需要大量枯燥无味的人工人眼识别过程，节省了宝贵的网络和计算资源，更让人解放出来，可以做更有价值的事情。

到目前位置，“深眸”已经在各地公安和交通部门进行大量测试，相较传统前端设备的高误报率，“深眸”全局摄像机对人、车等特征信息的识别率达到了90%以上，大幅提升了图像识别准确率。

闭环反馈，智能进化

“深眸”的特别之处还在于，它是一款可以不断进化的摄像头。

在英特尔的协助下，海康威视设计了一套高效的“数据采集—计算识别—算法优化—算法更新”的正反馈创新模式。摄像头采集和传送的数据，经过英特尔® Movidius VPU处理、提取信息特征后，会传送到后端的深度学习平台，用于进行样本训练，优化机器学习算法，然后可以远程升级前端的摄像机，使其不断进化，更加智能。

▲海康威视智能视频监控系统正反馈创新逻辑示意图

同时，为了满足深度学习平台的大量浮点运算能力需求，海康威视准备使用英特尔® 至强融核™处理器，以及用于并行计算环境I/O 加速的英特尔®Omni-Path 架构（简称 OPA）。单颗至强融核™ 处理器可以有多达72个内核，以及超过3TFLOPS的性能，并可直接访问大容量内存，非常适合处理海量视频内容。而 OPA 的传输能力可以达到100G bps，以超低延时，提升多机训练时的交互和并行效率。在深度训练的软件上，海康威视和英特尔携手优化相关算法和计算框架，例如基于英特尔提供的MKLDNN库，以及针对英特尔® 架构优化的Caffe框架，以便于向至强融核™ 处理器平台和 OPA 平滑迁移，加速整个智能监控系统的进化。