漫画投稿怎么赚钱:网络蜘蛛能提取页面中的脚本部分(如javascript)吗?

来源:百度文库 编辑:中科新闻网 时间:2024/04/29 13:37:37
网络蜘蛛提取页面时, 除了文本图片等, 也能提取脚本语言(比如 javascript)的源码吗? 那么对于动态网页的源码(比如 asp,jsp)呢?
我感觉蜘蛛能提取的内容仅限于和用户浏览器看到的内容一样, 如果js代码和html一样发送到客户端, 那么蜘蛛应该是可以搜得到.
对于动态网页的源码, 如果一样能查到, 那么安全性就存在问题. 蜘蛛可能可以通过动态网页提供的接口访问数据库吧.
请问我的理解是否正确?

不是这样的,目前的蜘蛛在这方面还是很欠缺的。其实,蜘蛛是靠网页里的超级链接向前进的,提取脚本,就是想提取它里面的链接。因此,需要在蜘蛛里面加一个脚本解释器。