梦幻西游175召唤兽:如何让我的网站(nangua.eicp.net)被百度之类的搜到

来源:百度文库 编辑:中科新闻网 时间:2024/04/30 02:50:11
如何让我的网站(nangua.eicp.net)被百度之类的搜到

先说明,其实不关出不出名的事,和搜索引擎爬虫”沟通“好就行了。

1、通过robots.txt和爬虫对话:搜索引擎发现一个新站,原则上第一个访问的就是robots.txt 文件,可以通过allow/disallow语法告诉搜索引擎那些文件目录可以被抓取和不可以被抓取。
  关于robots.txt 的详细介绍:about /robots.txt
  另外需要注意的是:allow/disallow 语法的顺序是有区别的
  2、通过meta tag和爬虫对话:比如有的时候我们希望网站列表页不被搜索引擎收录但是又希望搜索引擎抓取,就是限制搜索引擎抓取页面,那么可以通过<meta name=“robots” content=“noindex,follow”> 告诉爬虫,其他常见的还有noarchive,nosnippet,noodp 等。
  关于 meta tag 的更多介绍:Metadata Elements
  3、通过 rel=“nofollow” 和爬虫对话:关于 rel=“nofollow” 最近国平写了一篇文章《如何用好 nofollow》很值得一读,相信读完之后你会有很大的启发。
  4、通过 rel=“canonical” 和爬虫对话:关于 rel=“canonical” 谷歌网站站长工具帮助有很详细的介绍:深入了解 rel=”canonical”
  5、通过网站地图和爬虫对话:比较常见的是xml格式sitemap和html格式sitemap,xml 格式sitemap可以分割处理或者压缩压缩,另外,sitemap的地址可以写入到 robots.txt 文件。
  6、通过网站管理员工具和搜索引擎对话:我们接触最多的就是谷歌网站管理员工具,可以设定googlebot抓取的频率,屏蔽不想被抓取的链接,控制sitelinks等,另外,Bing和Yahoo也都有管理员工具,百度有一个百度站长平台,内测一年多了仍旧在内测,没有邀请码无法注册。

http://www.haobest.com/free-website-submission.htm
我试了

网页搜索原理是自动进行完成的 不需要什么额外的操作
只要你的网页在网上发布了 就可能被其他搜索到

在网上发布了,不是可能是肯定能查到!!!

不过因为并不出名,应该不容易查到~~!!!

可以用QQ搜,搜狐,雅虎,搜狗等搜啊!