您的当前位置:首页正文

一种基于区域划分的人群密度估计快速方法

2024-08-29 来源:我们爱旅游
总第258期 2011年第4期 计算机与数字工程 Computer&Digital Engineering Vo1.39 No.4 128 一种基于区域划分的人群密度估计快速方法 张燕黎宁刘福美 南京210016) (南京航空航天大学信息科学与技术学院摘要公共场景监控下的人群密度估计是公共安全管理中的一个重要内容。针对大场景监控情况,研究了一种基于 区域划分的智能化人群密度估计快速方法。在帧差提取出的彩色视频背景的基础上,按视觉比例将大场景分成子区域,然 后对某个子区域采用像素统计的方法实现人群密度估计,其余子区域采用自适应比例的方法实现人群密度快速估计。实验 结果表明该方法在实际应用中简单、有效、快速,能为公共场所的预警系统提供有力的帮助。 关键词人群密度估计;彩色背景提取;区域划分;自适应比例 TP391 中图分类号A Fast Crowd Density Estimation Based on Region Division Zhang Yan Li Ning Liu Fumei (College of Information Science and Technology,Nanjing University of Aeronautics and Astronautics,Nanjing 210016) Abstract Crowd density estimation in public scene surveillance is an important issue of public security.A intellectual— ized method of fast crowd density estimation based on region division was studied to resolve the people number estimation of full big scene.The full big scene was divided into some needed sub—areas according to the visual scale after the color back ground had been extracted by the frame difference.The method of pixel statistics was used to estimate the density of a certain SUb-area,and then a method of adaptive scale was used to realize the fast estimation of the other SUb-areas.Experimental re— sult shows that this method is simple,effective and fast in practical application.And it can also provide powerful help to the public warning system. Key Words crowd density estimation,color background extraction,region division,adaptive scale Class Number TP39】 1 引言 近年来随着城市人口密度的急剧增大,许多公 工作人员对监视场景进行人工判断。传统方法不 仅费时费力,而且监控人员容易因为疲惫等原因而 忽视监控场景的突发情况,从而造成不可挽回的后 共基础设施,如机场、地铁站、车站等经常会迎来短 期的人流高峰_1]。人群的高度拥挤容易引起各种 突发事件,如果不能对人群迅速有效地疏散分流, 不仅会影响居民日常生活,更可能造成重大的人员 伤亡和财产损失。因此对公共基础设施进行人群 果l2]。本文利用闭路电视监控系统l3],使用智能化 方法对监控场景的人群密度进行快速估计。 Davies和Chow提出了基于像素统计的图像 处理方法,通过背景减的方法计算前景人群所占的 像素数,对人群密度进行估计l4]。该方法简单有 效,其中背景提取的实际效果和人群人数的计算实 时性是实现人群密度估计最重要的部分。在一些 大监控场景中,整个大场景的训练工作量往往很 密度估计是十分必要的,人群密度估计有着广泛的 应用前景和研究价值。传统的人群密度估计是通 过闭路电视对不同场景进行人工监控,由监控室的 *收稿日期:2010年1O月14日,修回日期:2010年11月24日 基金项目:民航基金项目(编号:El002—071B)资助。 作者简介:张燕,女,硕士研究生,研究方向:图像处理、模式识别、计算机视觉等。黎宁,女,副教授,研究方向:图像处 理、目标识别与跟踪和计算机视觉等。刘福美,女,硕士研究生,研究方向:图像处理、数字视频处理等。 2011年第4期 计算机与数字工程 129 大,因此对整个大场景直接使用基于像素统计的方 法进行人群密度估计往往不具有现实意义。针对 值加入到背景像素R分量累计结果CBr中,否则认 为是目标区域像素点。重复进行 一1次帧差,统计 这些实际问题,本文根据场景大小将场景分成N 块子区域分别处理,某个子区域直接采用基于像素 该像素点判为背景区域像素点的次数Nr,则彩色视 频背景中该像素点的R分量值Br等于R分量累计 结果CBr除以次数Nr。G和B分量采用同样的处 理方法,最后将RGB三分量组合成彩色背景。 以尺分量为例解释算法: CBr(i, )一 统计的方法进行人群密度估计,其余子区域利用自 适应比例方法实现人群密度的快速估计。 2彩色视频背景帧差提取 传统提取视频背景的原理[5 是:对于视频流中 的前后两帧灰度图像,如果两帧图像的对应像素点 灰度变化不大(小于某个阈值T),则认为此像素点 是背景区的像素点;如果两帧图像的对应像素点灰 度变化较大(大于某个阈值T),则认为此像素点是 目标区的像素点。彩色视频图像不能简单使用传 统提取灰度背景的方法。本文提出了彩色视频的 fCBr(i, ) 1 r( , )l一 ,.( , )l T (1) 【CBr(i, )+f2r(i, ) I r( , )一厂2r( , )l<T Nr(i,J)一 fNr(i, ) }flr(i, )--f2r(i, )I T … (3) 【Nr(i, )+1 fflr(i, )一 r( , )f<丁 Br(i,J)一CBr( , ')/Nr(i,J) 背景帧差提取方法:将前后两帧彩色图像对应像素 点的RGB三分量分别单独运用灰度图像的处理方 法,然后再将得到的属于背景像素点的RGB三分 量组合成彩色背景。 式(1)和式(2)中,flr(i, )和f2r(i,J)分别代 表前一帧和后一帧像素点( ,J)处的R分量值。从 第一帧到第 帧共进行n一1次帧差,CBr(i,J)代 表的是背景像素点(i,J)处R分量累计结果,Nr(i, J)代表的是 一1次帧差中像素点(i,J)被判为背 景像素点的次数,均初始化为0。根据式(3),得出 彩色视频背景中像素点( , )的尺分量值Br( ,J)。 阈值丁的选择有一定的随意性,主要靠经验或者 大量试验总结,本论文中取1O。 彩色视频的背景帧差提取算法:取一个时间段 视频的 帧图像序列,为了完整地提取彩色视频背 景,通常取 100。在R分量上:将前后相邻两帧同 一像素点的R分量值相减,若绝对差值小于阈值丁, 则认为是该点是背景区域像素点,将该点的尺分量 图1 帧差提取的彩色视频背景 图2背景减前的人群图像 图3 背景减二值化的人群图像 图1是帧差提取的彩色视频背景,图2是第 980帧背景减之前的人群图像,图3是第980帧图 像背景减并二值化后的人群图像。 vies等人提出的人群人数和像素数成正比的关系 来估计整个大场景的人群人数,训练样本时需人工 数出整个大场景中的实际人数。由于整个场景较 3 墨划分的自适应比 决速估计 /、。姒 篓 下文3.2.1)由近至远划分成实际监控面积基本相 选择遮挡现象不严重的大场景作为本文研究 对象,并且针对由于摄像机光轴与大地平面所成角 度使得人群在图像上呈现近大远小的现象,提出了 基于区域划分的自适应比例快速估计人数的方法。 3.1场景子区域纵向划分 在一幅较大的场景中,如果直接采用基于Da一 等的子区域,然后只需对其中某个子区域训练样 本,其余子区域可采用下文提出的基于区域划分的 自适应比例快速估计人数的方法。大场景的区域 划分效果如图4所示。 3.2 自适应比例快速估计人数 同一目标处于同一场景的不同位置时,在图像 13O 张燕等:一种基于区域划分的人群密度估计快速方法 第39卷 系之间的几何关系,可以推导出: 2 (6H+cH—oh)(6+c)(口+6) hl(ah+bH+cH—ch)(a+『)+c)6’ (6H+CH--oh)(6+c)(2a+b) , hl (2aH+bH+CH—ch)(2a+b+c)b 3』 其中口一 ,f—Hcot0。 0 3.2.2摄像机二维成像宽度比例 图4大场景的区域划分效果图 一一 , 当目标距离摄像 头较近时,目标在图 。 ,' ,J 上成像大小也会不同。当目标距离摄像头较近时, 成像比较高比较宽,即所占像素数比较多,反之较 像上成像比较宽[ , 少。为了提高估计人数的准确率,本文提出一种自 适应比例的方法,即依据摄像机的成像规律对同一 基准目标进行高度和宽度比例缩放,以适应图像中 不同区域的人群目标。 3.2.1摄像机二维成像高度比例 根据计算机立体视觉测量技术中经常采用的 针孔模型_6],得到图5所示的二维成像高度比例模 型。图5中,(Yc,Zc)为摄像机坐标系,原点 定 义在摄像机的光心,Zc轴为摄像机的光轴;(Yw, Zw)为世界坐标系,Zw轴垂直于水平面,将原点 Ow定义在Zw轴与Yw轴的交点处;H为摄像机 与地面的垂直拍摄高度,H为摄像机与地面的拍摄 角度,拍摄到的图像垂直于Zc轴。 图5摄像机二维成像高度比例模型 通过在实际场景中的测量,按照离摄像机的距 离由近及远均匀标定出三个区域,如大场景地面区 域长度范围是图5中AD线段,三个均匀长度范围 区域是AB,BC,CD线段,然后计算出AB,BC,CD 线段在成像图像中对应的各个区域范围纵向长度 Hab,Hbc和Hcd,并以此作为3.1节中场景子区 域纵向划分的比例关系。假设地面上一个高为 的基准目标分别站在等距离间隔的A,B,C三点位 置,这三个位置处的基准目标对应于成像照片中的 成像长度分别为 1, 2和矗3。 根据图5中给出的摄像机坐标系与世界坐标 F、、J l l岛 即所占像素数比较 、、 多,反之较少。图6 中,EF线段是大场景 图6摄像机二维成像 中距离摄像头最近的 宽度比例模型 区域边缘的实际宽 等一生L 6+ ’L ,髻一 6+ ㈤ Rat 1=== ,Rat 1一 (6) 2011年第4期 计算机与数字工程 子区域1中通过二值化得到的像素数与在子区域2 后根据摄像机二维成像模型得出划分区域的自适 和子区域3中得到的像素数之比。 应比例,从而快速实现对大场景下的智能化人群密 4实验结果及分析 度估计。实验结果表明该方法在实际应用中简单、 有效、迅速,能够实时发现公共基础设施中的异常 对南航江宁校区拍摄的学生下课高峰时的视频 情况,为公共场所的安全预警提供有效的帮助。在 进行抽帧,从抽帧图像序列中选取1800帧作为实验 遮挡现象十分严重的情况时采用基于像素统计的 图像,如图2所示。为了体现算法的真实有效性,训 方法效果不是十分理想,可以采用纹理分析l9]等其 练样本使用前799帧,测试样本使用后1001帧。 他方法来对人群密度估计做进一步完善的研究。 按图4将图像划分为3个子区域,用帧差提取的 参考文献 彩色视频背景对每帧测试样本图像进行背景减并二 值化,根据拟合直线计算每帧图像子区域1的人群人 Eli梁英宏,王知衍,曹晓叶,等.视频图像理解在客流统计中 的应用[J].计算机工程与设计,2008,29(5):1203 ̄1206 数,子区域2和子区域3采用基于区域划分的自适应 [2]衣淑凤,黄祥林,沈兰荪.智能化人群监控技术研究 比例方法快速估计人数。图7表示的是子区域1的拟 [J].测控技术,2003,22(5):22 ̄24 合直线,图8表示从第800帧到第1800帧大场景图像 [3]DaviesAC,Yin J H,VelastinSA,et a1.Crowdmonito— 的实际总人数和估计总人数之间的曲线关系。从图8 ring usign image processingF-J].IEE Electronics and Com— 可以看出,本文算法实现的大场景人群密度估计与实 munication Engineering Journal,1995,7(1):37 ̄47 际人群密度非常接近,高密度时由于人群重叠现象过 [4]胡波,李晓华,沈兰荪.场景监控中的人群密度估计 于严重从而导致误差较大,低密度时估计的大场景人 F-J].电路与系统学报,2007,12(6):19 ̄22 群总人数与实际总人数基本一致。 [5]李娜,方卫宁.基于视频流的地铁人群目标识别F-J].北 2 京交通大学学报,2006,30(1):96--99 2 [6]SHA Ling,LU Chao-hui.A Camera Calibration Meth— <1 od for Stereoscopic Vision Measurement[J].Machiner Y,2003,41(5):1O~11 、 g7]Stefan Huwer,Heinrich Niemann.Adaptive Change Detection for Real—Time Surveillance Applications 图7子区域1的 图8大场景下测试帧的 [C]//Proceedings of Third IEEE International Work— 拟合直线 人数变化(共1001帧) shop 2000.Dublin:IEEE Computer Society Press, 考虑到人群运动的速度有限,所以一秒钟处理 2000:37 ̄46 两帧图像已经足够,实验表明,每帧图像的平均处 [8]A.Chan,Z.S.Liang,N.Vasconcelos.Privacy pre— serving crowd monitoring:Counting people without 理时间为0.125s,因此可以满足实时性。 people models or tracking[J].CVPR,2008:1~7 5 结语 [9]Wu Xinyu,Liang Guoyuan,Lee Ka Keung,et a1. Crowd Density Estimation Using Texture Analysis and 在帧差提取的彩色视频背景基础上,首先根据 I earning[c]//IEEE International Conference on Dec, 视觉比例将大监控场景合理划分为若干子区域,然 2006:214--219 不 尔 J, 乖 乖 ; 乔 尔 不 不 (上接第24页) [8]周相兵.基于Ontology的语义Web服务聚合自动机研 multiple information sources[J].IEEE Transactions 究及应用[c]//Proceedings of the 27th Chinese Control on Knowledge and Dala Engineering,2003,15(4):871 Conference,Kunming,Yunnan,China,IEEE Press, ~882 2008:719~723 [11]陈友玲,张永阳,孙亚南,等.基于Petri网的敏捷化生 -F9]Alexander Maedche.Ontology learn ing for the seman— 产调度建模方法[J].计算机集成制造系统,2010,16 tic web[M].Kluwer Academic Publishers:Boston/ (3):598~602 Dordrecht/London,2002:11~2 1 -F12]Yu-Liang Chi,Hsun-Ming Lee.A formal modeling [1O]LI YUHUA,BANDAR Z,McLEAD D.An approach platform for composing web services[J].Expert Sys— for measuring semantic similarity between words using terns with Applications,2008,34(2):1500 ̄1507 

因篇幅问题不能全部显示,请点此查看更多更全内容