专利名称:一种动态网页的页面数据采集方法专利类型:发明专利
发明人:焦毓葳,崔乐乐,王贵友申请号:CN201510332025.6申请日:20150616公开号:CN104991904A公开日:20151021
摘要:本发明公开了一种动态网页的页面数据采集方法,其具体实现过程为:使用脚本解析环境并将其嵌入到分布式网络爬虫中,通过该网络爬虫的数据挖掘、索引和搜索功能,实现动态页面的数据采集。该一种动态网页的页面数据采集方法与现有技术相比,将各种各样的动态数据以完整的形态采集下来,存入数据库当中,方便我们实时了解互联网动态,避免采集数据不准确、不及时的状况,弥补了传统的采集方法中采集页面只采集一遍而且不根据需求采集的缺点,极大的提高了采集的准确度和采集效率,实用性强,适用范围广泛,易于推广。
申请人:浪潮软件集团有限公司
地址:250100 山东省济南市高新区科航路2877号
国籍:CN
代理机构:济南信达专利事务所有限公司
代理人:姜明
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容