(12)发明专利申请
(10)申请公布号 CN 111447211 A(43)申请公布日 2020.07.24
(21)申请号 202010214979.8(22)申请日 2020.03.24
(71)申请人 济南诚方网络科技有限公司
地址 250101 山东省济南市高新区汉峪金
谷A3地块5号楼7层(72)发明人 王在学
(74)专利代理机构 济南千慧专利事务所(普通
合伙企业) 37232
代理人 左建华(51)Int.Cl.
H04L 29/06(2006.01)G06F 16/9535(2019.01)G06F 16/955(2019.01)G06F 40/289(2020.01)G06F 40/30(2020.01)
权利要求书1页 说明书5页 附图1页
(54)发明名称
一种网络防诈骗系统(57)摘要
本申请公开了一种网络防诈骗系统,用以解决现有的防诈骗方法明显具有滞后性,不利于互联网用户的财产、信息安全,不能有效遏制网络诈骗等行为的发生的问题。该系统包括管控设备,用于获取流量数据,并对校验未通过的流量数据进行屏蔽;数据解析模块,用于对所述流量数据进行解析,获得网站信息;数据校验模块,用于根据预设的校验规则,对所述网站信息进行检查校验;自学习模块,用于对校验未通过的网站信息进行学习。本系统可自动对流量数据进行解析、校验,从而自动对含有敏感内容的网站信息进行拦截、屏蔽,实现对流量数据的自动监控,有利于保护网络用户的财产安全。
CN 111447211 ACN 111447211 A
权 利 要 求 书
1/1页
1.一种网络防诈骗系统,其特征在于,包括:管控设备,用于获取流量数据,并对校验未通过的流量数据进行屏蔽;数据解析模块,用于对所述流量数据进行解析,获得网站信息;数据校验模块,用于根据预设的校验规则,对所述网站信息进行检查校验;自学习模块,用于对校验未通过的网站信息进行学习。2.根据权利要求1所述的系统,其特征在于,所述数据校验模块,具体用于对所述网站信息进行语义分析,并根据数据库中预存的敏感内容,与语义分析后的网站信息进行匹配,根据匹配度,确定所述网站信息是否校验通过。
3.根据权利要求2所述的系统,其特征在于,所述数据校验模块,具体用于在所述网站信息与所述预存的敏感内容的匹配度高于预设阈值时,确定所述网站信息校验未通过。
4.根据权利要求3所述的系统,其特征在于,所述敏感内容为敏感词;所述数据校验模块,具体用于在所述网站信息与所述敏感词的匹配个数不小于3个时,确定所述网站信息校验未通过。
5.根据权利要求1所述的系统,其特征在于,所述自学习模块,还用于根据学习结果,对数据库中预存的敏感内容进行补充。
6.根据权利要求1所述的系统,其特征在于,所述数据校验模块,还用于根据预设的白名单,对所述网站信息进行筛选,并对筛选未通过的网站信息进行检查校验。
7.根据权利要求6所述的系统,其特征在于,所述系统还包括:白名单管理模块,用于根据校验通过的网站信息,对所述白名单进行更新。8.根据权利要求1所述的系统,其特征在于,所述管控设备还包括,将校验未通过的网站信息添加到黑名单。
9.根据权利要求6所述的系统,其特征在于,所述系统还包括:白名单管理模块,用于获取来自网络用户的举报信息,并根据所述举报信息,对所述白名单进行检验。
10.根据权利要求1所述的系统,其特征在于,所述管控设备还用于,确定校验未通过的网站信息之间的关联,并将与所述关联有关的网站加入特别关注名单。
2
CN 111447211 A
说 明 书一种网络防诈骗系统
1/5页
技术领域
[0001]本申请涉及防诈骗技术领域,尤其涉及一种网络防诈骗系统。
背景技术
[0002]随着科技的迅速发展,互联网逐渐成为人们身边不可或缺的重要工具之一。互联网在发展过程中,除了为互联网用户提供便利,有利于信息传播与共享之外,还孕育了一些新形势的网络犯罪,例如,网络诈骗、色情等。[0003]目前,政府部门或第三方厂商往往会设置相应的举报途径,接收来自互联网用户的举报信息,对举报信息进行核实,再对违法网站、违禁内容进行查封,以实现对互联网内容的监督。
[0004]但是,大多数互联网用户缺乏一定的鉴别能力,往往只有在上当受骗后,才能进行举报,甚至在不知情的情况下,根本不会进行举报。因此,这种方法明显具有滞后性,不利于互联网用户的财产、信息安全,不能有效遏制网络诈骗等行为的发生。发明内容
[0005]本申请实施例提供一种网络防诈骗系统,用以解决现有的防诈骗方法明显具有滞后性,不利于互联网用户的财产、信息安全,不能有效遏制网络诈骗等行为的发生的问题。[0006]本申请实施例提供的一种网络防诈骗系统,包括:[0007]管控设备,用于获取流量数据,并对校验未通过的流量数据进行屏蔽;[0008]数据解析模块,用于对所述流量数据进行解析,获得网站信息;[0009]数据校验模块,用于根据预设的校验规则,对所述网站信息进行检查校验;[0010]自学习模块,用于对校验未通过的网站信息进行学习。[0011]在一个示例中,所述数据校验模块,具体用于对所述网站信息进行语义分析,并根据数据库中预存的敏感内容,与语义分析后的网站信息进行匹配,根据匹配度,确定所述网站信息是否校验通过。[0012]在一个示例中,所述数据校验模块,具体用于在所述网站信息与所述预存的敏感内容的匹配度高于预设阈值时,确定所述网站信息校验未通过。[0013]在一个示例中,所述敏感内容为敏感词;所述数据校验模块,具体用于在所述网站信息与所述敏感词的匹配个数不小于3个时,确定所述网站信息校验未通过。[0014]在一个示例中,所述自学习模块,还用于根据学习结果,对数据库中预存的敏感内容进行补充。
[0015]在一个示例中,所述数据校验模块,还用于根据预设的白名单,对所述网站信息进行筛选,并对筛选未通过的网站信息进行检查校验。[0016]在一个示例中,所述系统还包括:白名单管理模块,用于根据校验通过的网站信息,对所述白名单进行更新。[0017]在一个示例中,所述管控设备还包括,将校验未通过的网站信息添加到黑名单。
3
CN 111447211 A[0018]
说 明 书
2/5页
在一个示例中,所述系统还包括:白名单管理模块,用于获取来自网络用户的举报
信息,并根据所述举报信息,对所述白名单进行检验。[0019]在一个示例中,所述管控设备还用于,确定校验未通过的网站信息之间的关联,并将与所述关联有关的网站加入特别关注名单。
[0020]本申请实施例提供的一种网络防诈骗系统,至少包括以下有益效果:[0021]通过对数据流量进行获取、解析以及校验,可确定对应的网站信息中是否存在敏感内容。管控设备可自动对存在敏感内容的网站信息进行屏蔽,从而实现对流量数据的监控。
[0022]这种方法无需网络用户对流量数据进行人工监控,也无需管控部门采用专门的人力进行监控,而可通过一定的规则,对网站内容进行检查、校验,从而自行判断网站内容是否合法,实现对网站内容的自动监控。
[0023]这样在一定程度上大大提高了对流量数据进行监控的即时性,在发现流量数据不合格时,即可对流量数据进行拦截,避免这些流量数据对网络用户造成干扰,对网络用户的财产安全、信息安全产生威胁,更加实时高效的防止诈骗发生。[0024]并且,本申请通过自学习模块,能够对网站内容中的敏感内容时时进行更新,不断完善对敏感内容的覆盖面,使得本防诈骗系统能够跟上网络环境日新月异的变化趋势,实现系统的不断更新。
附图说明
[0025]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:[0026]图1为本申请实施例提供的网络防诈骗系统结构示意图。
具体实施方式
[0027]为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。[0028]图1为本申请实施例提供的网络防诈骗系统结构示意图,本系统包括管控设备110、数据解析模块120、数据校验模块130、自学习模块140与数据库150。其中,管控设备110、数据解析模块120、数据校验模块130、自学习模块140依次连接,数据库150与自学习模块140连接,并通过自学习模块140与数据校验模块130连接,自学习模块140还与管控设备110连接。
[0029]具体的,管控设备110可从互联网中获取流量数据,并将获取到的流量数据发送至数据解析模块120。管控设备110具体可以是政府机关有关部门设置的负责监控互联网流量的网络拦截设备、网络信息获取设备等,并通过现有技术进行流量数据的获取,本申请对此不做限定。
[0030]需要说明的是,在对流量数据进行校验之前,管控设备110在获取流量数据时,仅对流量数据进行复制等操作,以获取流量数据的内容,但并不对流量数据进行拦截。
4
CN 111447211 A[0031]
说 明 书
3/5页
数据解析模块120接收到的来自管控设备的数据为封装好的流量数据包,数据解
析模块首先可对流量数据包进行解封,再对数据进行分析及抽取,以获取相应的网站信息。其中,网站信息至少可包括网站的统一资源定位符(UniformResourceLocator,URL)、网站内容。
[0032]数据解析模块120可将获得的网站信息发送至数据校验模块130,由数据校验模块130根据预设的校验规则,对网站信息进行检查校验,以确定网站信息中是否存在违禁内容。
[0033]具体的,数据校验模块进行校验的步骤可包括:[0034]第一,数据校验模块可对网站内容进行语义分析。数据校验模块具体可根据预设的词库,对网站内容中的文字信息,包括文章标题、语句等,进行分词处理,判断得出对语句进行最佳分词的方法,并确定分词得到的各个词语的词性,以获得网站内容的语义分析结果。[0035]第二,数据校验模块可根据数据库中预存的敏感内容,对网站信息进行检查校验。数据校验模块具体可将数据库中存储的敏感内容与网站信息语义分析后的结果进行对比匹配,并确定匹配得到的匹配度。其中,敏感内容表示需要进行检查的违禁内容,匹配度可表示敏感内容与网站信息的相似程度。[0036]第三,数据校验模块可根据获得的匹配度,确定网站信息是否校验通过。通过上述第二步可知,敏感内容与网站信息的匹配度与相似程度成正相关关系,于是,匹配度越高,表示网站信息包含违禁内容的可能性越大。[0037]于是,数据校验模块具体可在预存的敏感内容与网站信息的匹配度高于预设阈值时,确定网站信息中包含敏感内容,并判定对该网站信息的校验不通过。其中,预设阈值可根据需要设置,本申请对此不做限定。[0038]在一个实施例中,数据库150中预存的敏感内容可以是敏感词。数据校验模块可将网站信息的分词结果与各敏感词进行匹配,若词语一致,表示相匹配。于是,数据校验模块可确定网站信息与数据库中存储的敏感词的个数达到预设数量时,判定网站信息校验不通过。其中,预设数量可根据需要进行设置,如3个、5个等,本申请对此不做限定。[0039]在一个实施例中,数据库150中预存的敏感内容还可包括联想词语。数据校验模块可确定网站信息的分词结果,将分词结果与预存的敏感词的拼音进行匹配。若字形不同、拼音相同,表示网站信息中有敏感词存在的可能性。[0040]于是,数据校验模块可将匹配到的网站信息中相应词语的上下文预设范围的词语与数据库中预存的联想词语相匹配,若存在相匹配的联想词语,则认为上述与敏感词的拼音匹配的词语实际上与敏感词相匹配。其中,联想词语表示与敏感词相关联的、通常与敏感词同时使用的词语,例如,“赌博”为敏感词,“翻倍”为联想词语。[0041]通过这种方法,可加大对网站信息中敏感内容的校验力度,防止不法人员通过变换字形、以拼音代替文字等方法,对敏感词进行隐蔽,从而躲避校验,这样能够加强对流量数据的监控。
[0042]数据校验模块在完成校验后,针对校验通过的网站信息,可认为校验合格,视为正常网站,则可将合格的网站信息丢弃,即剔除出校验范围。对于校验不通过的网站信息,可认为校验不合格,视为非法网站,则可将校验不合格的网站信息发送至自学习模块140。
5
CN 111447211 A[0043]
说 明 书
4/5页
自学习模块140可根据预设的学习方法,对校验不通过的网站信息的内容进行深
度学习,并根据学习结果,对数据库中存储的敏感内容进行完善与丰富。[0044]在一个实施例中,自学习模块140可根据校验不通过的网站信息的分词结果,确定该网站信息中出现频次较高的词语,并从这些词语中提出一些常用词,再将剩余的词语添加到数据库存储的敏感内容中。[0045]最终,自学习模块140可将接收到的校验不通过的网站信息发送给管控设备110,管控设备110可在监控网络数据流量的过程中,对这些网站信息进行拦截、屏蔽。[0046]在本申请实施例中,通过对数据流量进行获取、解析以及校验,可确定对应的网站信息中是否存在敏感内容。管控设备可对存在敏感内容的网站信息进行屏蔽,从而实现对流量数据的监控。
[0047]这种方法无需网络用户对流量数据进行人工监控,也无需管控部门采用专门的人力进行监控,而可通过一定的规则,对网站内容进行检查、校验,从而自行判断网站内容是否合法,实现对网站内容的自动监控。
[0048]这样在一定程度上大大提高了对流量数据进行监控的即时性,在发现流量数据不合格时,即可对流量数据进行拦截,避免这些流量数据对网络用户造成干扰,对网络用户的财产安全、信息安全产生威胁。[0049]并且,本申请通过自学习模块,能够对网站内容中的敏感内容时时进行更新,不断完善对敏感内容的覆盖面,使得本防诈骗系统能够跟上网络环境日新月异的变化趋势,实现系统的不断更新。
[0050]在一个实施例中,数据校验模块130可根据预设的白名单,对网站信息进行筛选。若网站信息在白名单之内,表示筛选通过,若网站信息不在白名单之内,表示筛选未通过。[0051]具体的,数据校验模块130可在确定网站信息中网站的URL信息属于白名单范围内时,不再进行校验,直接判定网站信息内容合格,而仅对筛选未通过的网站信息进行校验。[0052]这种方法可应用在流量数据较大的场景下,通过设置白名单,可赋予部分网站一定的信任,对该部分网站免除校验,从而有效减少数据校验模块的工作量,减轻数据校验模块的工作压力,提高校验效率。[0053]在一个实施例中,系统可包括白名单管理模块(图中未示出),白名单管理模块可对预设的白名单进行管理。具体的,白名单管理模块可对校验通过的网站信息进行统计,统计信息可包括校验时间、校验次数等。
[0054]白名单管理模块可根据预设的更新规则,对白名单中的网站信息进行更新。其中,预设的更新规则可包括校验通过次数超过预设阈值、校验通过频率超过预设阈值等。[0055]在一个实施例中,白名单管理模块还可获取来自网络用户的举报信息,并据此对白名单中的网站信息进行检验。具体的,白名单管理模块可确定获取到的举报信息中是否存在白名单中的网站信息,若存在,在核实举报信息的真实性后,白名单管理模块可将相应的网站信息从白名单中移除。这种方法增加了人工检验的过程,可对白名单中的网站信息的可信任性进行监督。
[0056]在一个实施例中,管控设备110可根据数据校验模块的校验结果,将校验未通过的网站信息添加到预设的黑名单中。于是,管控设备可根据黑名单中的网站信息,对流量数据进行监控。
6
CN 111447211 A[0057]
说 明 书
5/5页
在一个实施例中,管控设备110可根据校验未通过的网站信息,确定这些网站信息
之间是否存在关联。若存在关联,则管控设备可将相关的网站加入特别关注名单中,对该网站相关的网页信息给予特别关注措施。例如,提高数据校验的优先级、加大数据校验审查力度等。其中,网站信息之间存在的关联可包括同属一个域名、同属一个主网页、URL信息相似等。
[0058]以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
7
说 明 书 附 图
图1
8
1/1页
CN 111447211 A
因篇幅问题不能全部显示,请点此查看更多更全内容