视频大数据:挑战和机遇

在各类大数据中,图像视频是“体量最大的大数据”。据思科统计,视频内容约占互联网总流量的90%;而在迅速发展的移动网络中,视频流量的比例也高达64%,并以超过130%的年复合增长率增长,预计2013年将达到2,184PB。可见,图像视频数据在大数据中占据着主导地位,因此图像视频的处理是大数据应用的关键所在。而且,相对于文本、语音等数据,图像视频的数据量更大、维度更高,其表达、处理、传输和利用的技术挑战性更大。因此,以图像视频为对象的大数据研究将成为新的发展方向和研究热点
近年来,我国通过平安城市建设实现了城域范围的视频监控系统。据统计,2013年全国监控摄像头的规模已经超过了3000万台。以监控视频为例(如下图),我们可从应用、数据、技术三个维度来分析了当前视频大数据的总体发展趋势:

  • 应用维度来看,视频感知技术与系统在安防、交管上有初步成功应用,但在城市运行(如城市范围内的运行态势分析)和社会服务(如重点景区的实时直播、家庭看护)方面才刚起步。因此,如何从“管、控”到“服务”是视频大数据应用发展的重点。
  • 数据维度来看,基于单摄像头的视频感知分析技术与系统已初步可应用。一个典型的例子就是交通电子警察的监控与违章发现。然而,随着城市视频监控系统规模的不断扩大和应用需求的爆炸式增长,处理跨摄像头视频数据、大规模摄像头网络数据、甚至融合各类视频图像及关联数据的视频大数据就成为当务之急。
  • 技术维度来看,过去20年已基本解决监控视频摄像系统的数字化问题,近五年开始解决大规模监控摄像头的高清化问题。然而在现阶段,大量布设的监控摄像节点的智能程度低,信息不能实时处理,从而造成以人工监测为主的应用模式效率低下,对突发事件的反应缓慢。因此,视频监控的智能化是今后相当长一段时间内的研究与应用重点。更进一步,由于目前仍缺少广域范围内多摄像机视频数据的协同处理与计算技术,因而难以深度利用和挖掘这些广域视频中丰富的人、物、行为乃至事件信息。因此大数据智能化(简称大数据化)是未来若干年的必然研究与发展趋势。

1 视频大数据的主体是监控视频,但广义的视频大数据还包括会议视频、家庭视频、教学视频、法庭视频等,它们往往采用固定摄像头来对某个特定的场景(如家庭、教室、会议室、法庭、交通道口等)在一段时间内进行拍摄。由于这类视频都有较为固定的场景特性,场景的拍摄并没有预定义的剧本或意图,我们称之为“场景视频”(Scenic Video)。与其他类型视频(如新闻视频、影视视频、体育视频)相比,场景视频是机器视觉研究的最可能突破口,也是解决视频大数据问题的最佳实验数据。首先,场景视频是通过摄像头长期注视单一场景而采集的视频,场景中的“变”与“不变”要素能有效地进行建模、分析与推理,从而有可能达到高效压缩、场景理解甚至精确识别;其次,场景视频的体量巨大,是视频大数据中的主要研究对象,因此场景视频处理与分析技术的发展能直接推动视频大数据的技术水平。
从更大的视角来看,信息技术领域正在孕育重大技术突破与变革,视频大数据是主要的推动力之一及最佳的应用问题。一方面,认知与脑科学、机器视觉等相关领域正在发生从“量变”到“质变”的过程,预期能在未来若干年内获得理论上的突破。另一方面,近一两年来以深度学习和电子大脑为代表的人工智能技术获得了迅猛的发展,产生了包括Google Brain、百度大脑、IBM的类人脑芯片TrueNorth等一批标志性的阶段成果。这些成果将为场景视频的处理与分析提供强有力的计算与处理能力。