基于邻域算法的农业害虫图像分割
2022-06-09
来源:我们爱旅游
--——174———— 江苏农业科学2017年第45卷第11期 姚巧鸽,夏银红.基于邻域算法的农业害虫图像分割[J].江苏农业科学,2017,45(11):174—177 doi:10.15889/j.issn.1002—1302.2017.1 1.048 基于邻域算法的农业害虫图像分割 姚巧鸽 ,夏银红 (1.黄淮学院信息工程学院,河南驻马店463000;2.黄淮学院数学与统计学院,河南驻马店463000) 摘要:针对分割农业害虫图像时不能区分相邻灰度值的问题,提出邻域算法。首先确定像素的邻域度,像素的邻 域通过移除低于某一给定阈值的所有边并将所有相连的样本点作为域类而获得;然后采用基于关系权重方法区分邻 域类别,从全局的角度衡量了每个特征项对所有类别的区分能力;接着基于可变聚类半径对像素数据排重,删除重复 性数据;最后给出了算法流程。仿真试验结果表明,本研究算法分割农业害虫图像的效果清晰,消耗的时间较少。 关键词:邻域关系;像素;聚类;权重;农业害虫;图像分割 中图分类号:TP391.41 文献标志码:A 文章编号:1002—13o2(2017)11—0174—04 农业生产中需要检查农产品中是否存在害虫,避免农业 要做最小连接二等分 ;基于密度与噪声应用的空间聚类算 灾害的发生,在农业害虫的检测中图像背景复杂,害虫在图像 法(density—based spatial clustering of applications with noise, 中很难与背景分离” 。 DBSCAN)对农业图像数据聚类中的每个对象通过连接区域 传统的检测技术主要依赖于人眼,是农民自己对农产品 划分为簇,但是对参数敏感,若没有采用空间索引,时间复杂 的每个细节进行检查。但是检查环境往往很恶劣,同时受天 度高 ;基于共享型邻居聚类算法(shared neighbor clustering, 气干扰,检查工作很难展开,利用计算机视觉处理代替人工检 SNC)具有对输入样本的顺序不敏感、输入参数的邻域知识最 测成为了一种必然的发展趋势。目前使用的算法主要有以下 小化等特点,但是存在孤立点的预处理不够,同时代表点的确 几种,K均值算法(K—means)是基于划分的算法,只有农业 定过程不够全面 。 图像数据聚类簇的平均值被定义的情况下才能使用,对噪声 本研究通过邻域算法(neighborhood relationship,NR)对 和孤立点数据敏感 ;基于统计信息算法(statistical informa. 农业害虫图像分割,首先确定像素邻域度,像素的邻域通过移 tion d,STING)将农业图像空间区域划分为矩形单元,单元 除低于某一给定阈值的所有边并将所有相连的样本点作为域 中存储着预先计算的统计信息,可处理高维数据,但是检测质 类而获得;然后采用基于关系权重的方法对邻域类别区分,从 量取决于网格的粒度,由于聚类的边界是直线,检测质量较 全局的角度衡量了每个特征项对所有类别的区分能力;接着 低 ;基于动态模型的层次聚类算法(dynamic model hierar. 基于可变聚类半径对像素数据排重,删除重复性数据,最后给 chical clustering,DMHC)不依赖于静态模型,适应被合并簇的 出了算法流程。 内部特征,但是算法过于复杂,在每次判断子类的相似度时都 1 图像像素邻域关系数据聚类划分 收稿日期:2016—11~18 1.1像素邻域度计算 基金项目:河南省高等学校重点科研项目(编号:16B510003);黄淮 在图像像素集合S=(s ,S。,…,s )中2个元素(s。, ) 学院青年教师科研能力提升项目(编号:20151271 1)。 (q=1,2,…,m;p=1,2,…,m)间的关系R=(r。,r ,…, )为 作者简介:姚巧鸽(1984一),女,河南洛阳人,硕士,讲师,主要从事图 有限集A=( ,, ,…,X ),对于任何 (i=1,2,…,/n),通过 像信号处理、嵌入式技术等研究。E—marl: ̄20142015@ f( ,eA)描述2个元素(s , )相对 的邻域度,邻域函数 foxmail.com。 ( )表示邻域度,』4中所有集合的共同作用反映(s ,S )相 通信作者:夏银红,硕士,讲师,主要从事计算数学、算法研究及应用。 对于 (i:1,2,…,m)的邻域度 , (s , ): ,.(s ,5 )= E—mail:xyh2017@foxmail.corno c1 ,( 1)+c ,( 2)+…+。 ,( )。其中,c1,c2,c 为权重 ..[12]苏占雄,石辉,郭晋伟,等.利用数码照片估算灌木地上生物 45~50. 量的研究[J].安徽农业科学,2010,38(7):3620—3624. [17]万里强,李向林,苏加楷,等.长江三峡地区灌木生物量及产量 [13]孙伟,马志波,曹姗姗,等.林业资源数据特征分析[J].西北 估测模型[J].草业科学,2001,18(5):5一lO,l5. 林学院学报,2014,29(6):200—2O6,233. [18]黄劲松,邸雪颖.帽儿山地区6种灌木地上生物量估算模型 [14]尹英姬.基于数字摄影测量的森林调查因子的提取[D].哈尔 [J].东北林业大学学报,201l,39(5):54—57. 滨:东北林业大学,2012. [19]孙钦平,李吉进,邹国元,等.应用数字图像技术对有机肥施用 [15]闰飞.森林资源调查技术与方法研究[D].北京:北京林业大 后玉米氮营养诊断研究[J].光谱学与光谱分析,2010(9): 学,2014. 2447—245O. [16]何列艳,亢新刚,范小莉,等.长白山区林下主要灌木生物量估 [20]李飞飞,吕国玮,刘 涛,等.北京地区乔木郁闭度测量研究 算与分析[J].南京林业大学学报(自然科学版),2011,35(5): [J].林业资源管理,2011(1):91—95,99. 江苏农业科学2017年第45卷第11期 一175一 系数,且0≤c,≤1,∑c,=1。 类,判断规则: 对q和P取不同值,构成模糊关系矩阵[ (s , )] , c=argmax [score(d,c )]=argmaxq[.王Sim(d, ) (d,c )]。 .反映的是图像像素集合Js中各像素相互间关系密切程度的分 式中:|j}M( )为像素d的k个邻域;c 为类别;6(d,c )的含义为 布情况。邻域度越大,2个像素彼此之间的关系越密切,即可 r1 d∈C. 归为图像目标或者图像背景 ]。 6(d,c )={一to d芒Ci, ‘ 。 1.2邻域像素排重 对小图形进行两两比较,计算它们之间的相似度,根据给 1.2.1像素相似度计算假定P和q 2个像素点之间的相 定的相似度阈值判断,如果2个小图形的相似度大于闽值,认 似度定义为 为这2个小图形重复;否则,这2个小图形不重复,删除重复 similarity(p,q)=size(NN(p))n(ⅣⅣ(q))。 小图形。把小图形分成若干个称为聚簇的子集,使得每个聚 式中:NN(p)、NN(q)分别为对应P、q的最近邻域。通过移除 簇内的成员之间具有较大的相似性,而聚簇和聚簇之间的小 低于某一给定阈值的所有边,并将所有相连的样本点作为域 图形具有较小的相似性。并且随着聚类半径的减小,聚簇内 类而获得,本研究选取的阈值为 成员之间的相似性会增大” “ 。因此,通过不断缩小聚类半 ^ 艺ⅣⅣ(q) 径矗,使得被聚集到同一聚簇下的小图形之间的相似度越来 √∑[NN(q)] 越高 直到可以认为它们就是相同的小图形为止。这样就达 到了通过聚类算法来进行小图形排重的目的,然后保留该聚 1.2.2邻域关系权重为了区分邻域类别,采用基于关系权 簇中的某一个小图形,删除其他的重复小图形。步骤如下: 重的方法,权重计算为 ∑C ( ):-_:/∑ ①给定聚类半径R:— ,以其中的某个样本向量 .[TF(£,m)×W(tIc)] 。√ (Ci) 式中:Tr(t,ra)为像素t在像素总数m中出现的频数;W(t}e) 初始化一个聚类中心C = ; 为关系权重, tIe)值越大,则特征项对于类别c的区分能力 ②对于样本 ,寻找距离样本 最近的聚类中心C。,并得 越强 “ o 厂 —=『——————一 设关系权重W(tI c)=lg(m/n +0 02),n 为训练集中出 到它们之间的相似度r √寺蒿( 叫一cfI1) ; 现t的像素数,衡量了每个特征项对所有类别的区分能力。 ③如果r≤ ,把样本 归入聚类中心c 所在的聚簇C , 若给定^:个类别k。,k:,…,k ,其中特征项t同属于k 、 2个 同时更新该聚类中心为 类别的特征集,那么: ,. 、TF(t,m)×lg(m/n +0.02) q :专∑ ^/∑,[TF(t,m)×lg(m/n +0.02)] 式中: 为聚簇c 所包含的向量个数。如果r>R,把 初始 从全局的角度衡量了每个特征项对于所有类别的区分 化为新的聚类中心c = ,n为目前的聚簇个数。 能力。 ④重复步骤②,直至所有的样本聚类完毕。 如果对于任意类别c的任意特征项t,如果W(tI c)=1, 2农业害虫豳像分割过程 则频数归一化: (£,m)= ’贝Ⅱ所有特征项 在农业图像灰度分布曲线中,灰度值较低的是农业图像 相对于所有类别的区分能力均相同“ 。 背景区域,灰度值较高的是农业害虫图像区域,灰度值变化比 1.2.3基于可变聚类半径的像素数据删重在图像中点为 较大的地方为害虫区域与背景的边缘交接处。对农业图像的 P (i=1,2,3,…, ),线为 (i=1,2,3,…,n;),样条线为 某列灰度值g(x,Y)自上而下求微分,每次移动距离为Ax: s (i=1,2,3,…,n。),设Pi为已存在基点,基于点P。(*,Y)选 Ig( +Ax,Y)一g( +Ax,Y)I>T。 择点P:,基于点P 选择水平点p3,基于点P2、P,选择线段z , 式中: 为阈值。 基于线段fl选择平行于z 距离为z的线段i:,垂直于线段f2 当灰度值变化比较大时,获得第一个点的行数i。 是该列 过点P:、p 分别选择线段f3、z.,这样便选择出分割小矩形。基 害虫区域的上边缘,以及最后一个点的行数i: 是该列害虫区 于点P。( ,Y)选择点P ,基于点P 选择水平方向上的点Ps; 域的下边缘,每列灰度扫描后,获得上边缘行向量,。=[i.., 分别以点P 、P,为圆心选择半径为 、r2的圆c 、c:,选择一线 i :,…,i ]和下边缘行向量厶=[f。 ,i ,…,i: ],n为农业图 段切于圆c。、c ,这样便选择出分割小圆形,以此类推,可以选 像的列数。 择任意分割小图形的实体集合。假设节点集合为 对确定的害虫区域上、下边缘进行分割,统计图像边缘行 V( , :, ),分割小图形之间的关系集为 {( 。, :),( -, 所有像素的分布概率: ),(口:, ),( 2,” ),( , ),( ,,1)9),…},通过选择适当 L 的聚类半径,把相似的分割小图形聚集到同一个聚簇,保留其 P( )=mf/三m 。 中的一个小图形,删除其他小图形,达到聚类排重的目的,同 式中:m 为灰度值为f的像素个数,z∈L,L最大为255。 时大大降低了程序的时间复杂度。考察和待分类像素最相似 通过阈值P将缺陷图像划分为缺陷和背景2类,2类的 的k个小图形邻域,根据k个小图形邻域的类别来判定待分 方差 、 计算公式为 汀 }j:农、 科学2017 第45卷第11期 用/f I州算法对农、l 阉像滤波后进行分割,硬件计算机 参数:InteJ‘CORE I5—2430M,主频2.4 GHz,=:级缓存为 f ÷ 二 = 【C 1 P( 圭 :P I 2 一 3 MB.内仃DDR4系列,人小为4 GB,硬盘串行接口,软件程 哼通过Madab 现 计算灰度均值 以及图像总体灰度均值肛 一一 』}J M算法埘 1的自菜蚜虫J刳像进行分割,结果如图 2所,J;, jI以看出本研究算法NR的分割效果清晰,整体上保 持 较为稳定的分割效果,并且在局部轮廓边缘上比其他算 法分割的翅精细.这足【天1为本研究算法通过可变聚类半径对 像豢数据蕈复性的删除,使得聚类之间像素分布相差不大,减 少了误分割: ÷ “J = 主 i 】 eJ ̄/,t i£ 式中: 力并类的熨生慨率 f :二二∞1( 一,tL ) ∞2( 一肛!) 川不川算法对 3的梨小食心虫图像进行分割,结果如 4昕示,_nJ以荷出奉研究算法NR分割受其他边缘影响小, 计算类问方等 ;和类内 手r,j: i := + 2 从最小灰度使 蚨九恢 f 遍 所有的p,、lj r, =I。ll,3X J 埭炎过程号虑r邻域像素点对中心像素点聚类结果的影响, 使壤类结粜较为准确 最大时,p就是最佳分割阈值 算法流程:(1)输入 像,汁箨像素相似吱:(2)对 同的 像素进行邻域关系权重计 .划分m不l一】聚类;(3)通过可变 聚类半径将像素数据排重,去掉相同的聚类;(4)若当前聚类 中心和前一次中心的误筹小于0 02,则可得最 分割闾值P. 执行步骤(5),否则,执行步骤(2);f 5)输 分割 像 3仿真试验 3.i 农业害虫图像分割 图1 白菜蚜虫 像在位置(i, )处的灰度值。NC值越接近于1越好,对 菜蚜虫、梨小食心虫图像的分割NC值定性分析结果如图 5、罔6所示 时图像分割来说,分割速度1 分重要,为r衡堵各个算法 的分割效率,对每幅图像进行多次重复分割,取平均分割时间 作为 价标准,对门菜蚜虫、梨小食心虫罔像的分割速度定性 分析结果如『矧7、图8所示。 图5、图6、 7、图8吖知,本研究算法NR的NC值较接 图3 梨小会心虫 近于1,分割消耗的时间较少,这是因为本研究算法将像素数据 对象分割成集群, 同一个簇中的对象之间具有较高的相似度, 3.2定性分析 而矸 同簇巾的对象差别较大,以便减小数据对象之间的影响。 4 总结 用归一化互相关系数(IlO1’tna]ized correlation,NC)来评价 分割效果: ⅣC √ 式中:M×.、 / 竺== ___ ; (i, )x (i, ) 本研究通过邻域算法对农业害虫图像进行分割,仿真试 验结果表}1月,本研究算法分割的效果清晰,分割消耗的时间 少.为农、I 害虫图像分割研究提供r一种新的参考方法,但是 如何找出像素周围邻域的最佳大小和个数,仍然是目前面临 二==n ( ,,) √ ( .J) 尺小; (i, )、 (i,J)表示源图像与分割 江苏农业科学2017年第45卷第11期 ~177一 uz丽 O O 匝茸容 皿 O O O 趔u 挑 函 铝÷ 一∞一基莒 涎幂 团哥蜜 皿 NR算法 STING算法DMttC尊 SNC算法 图4 不同算法对梨小食心虫图像的分割效果 2013,6(5):822—835 试验次数 图5白菜蚜虫图像分割NC值 试验次数 图8 梨小食心虫图像分割时间 [4j Sun W,Hansen A,ZhalIg L Y,et .Neonatal nicotine exposure 一∞~量曹攫涎丽 匝哥 钲÷ impairs development of auditory temporal processing【.J].Hearing Research.2008,245(1/2):58—64 5】Pokntilovski Y N.Constraints OI1 strongly coupled chameleon fields from the experimental test of the weak equivalence principle for the neutronf J].JETt Letters,2013,96(12):75l一753 [6_】Li X Y,Gao G}f,Sun J x.A new semi—unsupervised intusiron detection methnd based on improved DBSCAN[J].Journal of 试验次数 图6 梨小食心虫图像分割NC值 Networks,2010,5(12):1527一l534. 7]Pande S,Morgan F,Cawlev S。et a1.Modular neural tile architecture for compact embedded hardware spiking neural network[J].Neural Processing Letters,2013,38(2):131—153. 8]Sehtlblm’E.Decker C,Lereh F.Networks of clusters:a governance perspectivefj].Industry.and Innovation,2013,20(4):357—377. [9.!Kim H.Kim H J.I e J H,et a1.Scheduling dual—armed clustertools with cleaning processes[J].International Journal of Production Research,2013,51(12):3671—3687. [10]Ye J.1nter ̄’al—valued intuitionistie fuzzy cosine similarity measures for nmhiple attirbute decision—making[J].International Journal of 试验次数 图7 白菜蚜虫图像分割时间 General Systems,2013,42(8):883—891 [11]Rocha A R,Pirmez L,Delicato F C.et a1.WSNs clustering based on semantic neighborhood relationships[J],ComputerNetworks.2012. 56(5):1627—1645. 的挑战。 参考文献 [1]王爱新,李春友,张拮.基于计算机视觉的农业图像害虫定位 【1 2]Aljaber B,Stokes N,Bailey J,et a1.Document clustering of scientiifc texts using citation contexts[J].Information Retrieval Journal 2010.13(2):10l一131. 检测算法[Jj.江苏农业科学,2016,44(7):361—364. [2]田海韬,赵 军,蒲富鹏.马铃薯芽眼图像的分割与定位方法 [I3]Hansen P,Brimberg J,Urogevi D.et a1.Solving lrge P~mediaan clustering problems by primal—dual variable neighborhood search [J].浙江农业学报,2016,28(11):1947—1953. [3]Qiu c Y,Wang C L,Zuo x Q.A novel multi—objective particle swarm optimization with K—means based global best selection strate ̄' [J].Data Mitirng and Knowledge Discovery,2.9OO9,19(3):351—375. [14]Gan G J.Application of data clustering and machine learning in var・ iable annuitv valuation『J].Insurance Mathematies&Economics, [J].International Journal of Computational Intelligence Systems, 2013,53(53):795—801.