小向真奈美番号封面:求免费工具软件,关于网页内容抓取的。

来源:百度文库 编辑:中科新闻网 时间:2024/05/13 16:19:31
谁知道这样的免费的软件吗?
根据指定的关键字去指定的网站搜索内容,去掉多余的图片,标签什么的,然后把内容放到指定的数据库中。
to 瞎日摸摸插:自己写到也可能。不过有现成的最好了。我只是想搜集点感兴趣的新闻而已。没有那么高的追求。
to woshijacky:有点类似。阿有现成的工具?

这样的程序 需要自己写!你不会打算做搜索引擎吧?
-----------------------------
这样的东西都建议是自己去写,因为别人的东西很难达到
自己预计的要求,其实就是一个string分析而已!其实原理跟离线浏览差不多分析一下200,500,404,302之类然后提取HTML内容进行分析,或者简单的方法你用离线浏览器去下载整站,然后用一些文本查找工具(这样的程序代码到处都是).

应该类似RSS新闻吧