wordpress seo之robots.txt
wordpress seo之robots.txt
wordpress seo之robots.txt
在继续说明如何采用实际方法进行WordPress的SEO优化前,我插入了这一篇:robots.txt。
什么是robots.txt?其实它只是一个放在网站根目录内,并且记了些文字的文本文件罢了。但它是如何在网站的SEO优化中起到作用的呢?简单的说就是,搜索引擎会根据robots.txt的内容“按规操作”。哪些内容应该搜索,哪些内容不应该搜索,全部都由robots.txt来指挥。
那我们应该如何设置robots.txt的内容呢?以下是我自己的设定,适合WordPress使用的:
User-agent: *
# disallow all files in these directories
Disallow: /cgi-bin/
Disallow: /z/j/
Disallow: /z/c/
Disallow: /stats/
Disallow: /dh_
Disallow: /about/
Disallow: /contact/
Disallow: /tag/
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /contact
Disallow: /manual
Disallow: /manual/*
Disallow: /phpmanual/
Disallow: /category/
Disallow: /wp-
Disallow: /feed/
Disallow: /trackback/
Disallow: */feed*
Disallow: */trackbackUser-agent: Googlebot
# disallow all files ending with these extensions
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /*.gz$
Disallow: /*.wmv$
Disallow: /*.cgi$
Disallow: /*.xhtml$# disallow all files with ? in url
Disallow: /*?*# disable duggmirror
User-agent: duggmirror
Disallow: /
# allow google image bot to search all images
User-agent: Googlebot-Image
Disallow:
Allow: /*# allow adsense bot on entire site
User-agent: Mediapartners-Google*
Disallow:
Allow: /*
你可以把它复制,然后另存为robots.txt并放在你的WordPress根目录下就行了。
请注意下面的一句:
# disallow all files with ? in url
Disallow: /*?*
上面的那句是让搜索引擎不去搜索所有带“?”的网址。如果你的WordPress的链接形式是默认的那一种:yourweb.com/?pxx的形式的话,请把它删掉。
这样,搜索引擎在搜索我们的网站时才会显得更有效率,避免了浪费时间什么的去搜索一些无意义的目录,如是wp-admin/这一类目录。我们也能通过robots.txt更好的让自己的网站被收录。所以,如果你的WordPress还没有robots.txt,赶快设置一个吧!
原文题目以及连接:我的WordPress这样SEO (3)-robots.txt
http://www.saywp.com/wordpress/robottxt-in-wordpress.html
本文源于:一心而已 [http://www.yeeones.com]
本文链接: http://www.yeeones.com/articles/wordpress-seo-robots-txt.html
3 Comments: Trackback URL | Comments RSS
四月 18th, 2010 at 1:53 下午
谢谢在我的小站留言,不知道怎么回事我的小站百度收录一直不是太好。刚才查看了你的收录都2000多页了,有什么技巧呢?对了问你一个问题,刚才我点进来之后弹出两个页面,对于adsense这样不违规吗?
四月 18th, 2010 at 11:27 下午
不违规的说,弹出的又不是adsense的广告
四月 18th, 2010 at 11:28 下午
收录没用啊 要有权重。