[发明专利]网页下载解析系统及方法无效
申请号: | 200710203039.3 | 申请日: | 2007-12-13 |
公开(公告)号: | CN101458693A | 公开(公告)日: | 2009-06-17 |
发明(设计)人: | 李忠一;叶建发;李大鹏;李支红 | 申请(专利权)人: | 鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518109广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种网页下载解析方法,该方法包括如下步骤:访问设置的网页并将其以XML文件形式下载;获取所述XML文件中的标题及其链接地址;当数据库中不存在所述标题及其链接地址时,访问该标题网页并将其以XML文件形式下载;截取标题网页的XML文件中用户需要的资料,生成新的XML文件;解析新生成的XML文件中的资料;将解析的资料保存到数据库中;当新生成的XML文件中存在图片资料时,访问该图片并下载该图片,在服务器中生成图片的存放路径,根据图片存放路径将图片保存到服务器中。另外,本发明还提供一种网页下载解析系统。 | ||
搜索关键词: | 网页 下载 解析 系统 方法 | ||
【主权项】:
【权利要求1】一种网页下载解析系统,包括客户端计算机、服务器及数据库,其特征在于,所述客户端计算机包括访问下载模块、获取模块及截取生成模块,所述服务器包括判断模块、解析模块、保存模块及生成模块,其中:访问下载模块,用于访问设置的网页并将其以XML文件形式下载到客户端计算机的内存中;获取模块,用于获取所述XML文件中的标题及标题对应的网页链接地址;判断模块,用于判断数据库中是否存在所述标题及标题对应的网页链接地址;所述访问下载模块,还用于当数据库中不存在所述标题及标题对应的网页链接地址时,根据上述标题的网页链接地址访问该标题网页并将其以XML文件形式下载到客户端计算机的内存中;截取生成模块,用于根据资料在XML文件中对应的标签及存放位置,截取标题网页的XML文件中用户需要的资料,之后将用户需要的资料生成新的XML文件;解析模块,用于根据资料在XML文件中对应的标签,将所述新生成的XML文件中的相关资料解析出来,使其与数据库中存放资料的格式一致;保存模块,用于将所述解析的资料保存到数据库中,并对所述解析的资料建立全文索引;所述判断模块,还用于判断所述新生成的XML文件中是否存在图片资料;所述访问下载模块,还用于当所述新生成的XML文件中存在图片资料时,用于根据图片的链接地址访问该图片并将该图片下载到客户端计算机的内存中;生成模块,用于在服务器中生成该图片的存放路径;及所述保存模块,还用于根据所述图片存放路径将客户端计算机内存中的图片保存到服务器的存储介质中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司,未经鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200710203039.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种高效的小分子干扰RNA设计的方法
- 下一篇:一种百合淀粉的制备方法