基本原理
视频运动目标的检测与跟踪是机器视觉中研究热点之一,是目标识别、行为分析等后续应用的基础,在社会安全、航空航天等领域中有广泛的应用前景。目标跟踪在学术界经过了数十年的研究,发展出了许多算法,目前较为有效的算法是基于检测的跟踪算法。其基本思想是,在跟踪开始时对目标建立一个初始模板,以记录目标的外观;为了确定目标在下一个时刻的位置,利用当前的目标模板,在前一时刻目标位置附近处搜索与目标模板相似的区域,选择相似度最大的区域作为这一时刻目标的真实位置;跟踪过程中,由于目标的外观受到各种因素的影响(目标变形、姿态变化、光照、遮挡等)而发生变化,目标模板也进行相应的更新,使其能体现出目标当前的变化。
基于这种跟踪框架的算法都面临着以下几个重要的问题。目标模板要有较强的表达能力,即目标外观特征表示要强健;该特征应具有较高的判别能力以区分目标与背景的差别;同时该特征对于各种影响目标外观的因素有较好的鲁棒性,以解决目标在跟踪过程中的外观变化问题,保证跟踪的稳定性。目标模板与候选区域的相似度计算要具有较高的准确性,在目标与背景较为相似的情况下,要能够体现出真实目标与背景的差别,不能把相似的背景判定为目标。目标模板要能自适应地更新,当目标的外观发生变化,模板也要进行更新,这种更新是自我学习的过程,要保留目标稳定、不变形的特征,去除姿态、光照、遮挡等带来的干扰因素。针对这些问题,我们提出了基于受限自适应层次化稀疏表示的多目标跟踪算法,该算法的框架图如下:
图 1:算法框架图
该算法利用稀疏表示的能力,结合分层表达思想,将层次化和稀疏表示(特征)相结合,有效提高了目标的模板的表达能力。在建立模板时,不仅对目标建立模板,对背景也建立建模,在判断候选区域是否为目标时,可以结合两个相似度进行判定,分类结果更准确。在跟踪过程中,不断更新模板时,对目标和背景建立模板池,收集一段时间内的目标和背景特征分布,使得模板池的鲁棒性更强。为了保证算法的实时性,有选择性地对模板进行更新,对当前的新目标进行判断,如果和模板池差别很小,则不更新模板;差别非常大说明跟踪失败,也不更新;只有在合适的时机才更新模板,即保持模板的稳定性,又能减少运算,达到实时性。为了更准确地度量目标和背景之间差异,采用自适应权重调整方法,将目标模板和背景之间不相似的特征赋予较大的权值,相似的特征赋予较小的权值,增强目标与背景之间的区分度。通过建立目标的时序特征模型,保证目标模板的时序连贯性与完整性。
算法的主要流程:算法对视频中多目标的状态采样后,结合时间约束、空间约束对多层稀疏表示特征进行加权,并通过目标基、背景基的更新机制,在标准对冲跟踪框架判断后得到目标的状态(包括大小、方向、位置等);在目标丢失后,结合稀疏分类器网格粗略检出目标后再次判断,从而实现复杂场景下实时的目标跟踪。