<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>三十而立 &#187; robots</title>
	<atom:link href="http://as30.com/tags/robots/feed" rel="self" type="application/rss+xml" />
	<link>http://as30.com</link>
	<description></description>
	<lastBuildDate>Thu, 02 Feb 2012 08:31:23 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>wordpress的robots规则展示</title>
		<link>http://as30.com/robots-120</link>
		<comments>http://as30.com/robots-120#comments</comments>
		<pubDate>Thu, 04 Jun 2009 10:02:01 +0000</pubDate>
		<dc:creator>普洱</dc:creator>
				<category><![CDATA[wordpress文章]]></category>
		<category><![CDATA[收藏夹]]></category>
		<category><![CDATA[robots]]></category>
		<category><![CDATA[wordpress]]></category>

		<guid isPermaLink="false">http://as30.com/robots-120.html</guid>
		<description><![CDATA[robots,根据维基百科上的说法是，是一种存放于网站根目录下的ASCII编码的文本文件，它通常告诉网络搜索引擎的漫游器（又称网络蜘蛛），此网站中的哪些内容是不能被搜索引擎的漫游器获取的，哪些是可以被（漫游器）获取的。白话来说，就是设置给搜索引擎看的规则，允许它收录什么，不允许它收录什么的规则。
r[......]<p class='read-more'><a href='http://as30.com/robots-120'>继续阅读</a></p>]]></description>
			<content:encoded><![CDATA[<p>robots,根据维基百科上的说法是，是一种存放于网站根目录下的ASCII编码的文本文件，它通常告诉网络搜索引擎的漫游器（又称网络蜘蛛），此网站中的哪些内容是不能被搜索引擎的漫游器获取的，哪些是可以被（漫游器）获取的。白话来说，就是设置给搜索引擎看的规则，允许它收录什么，不允许它收录什么的规则。</p>
<p>robots的设置规则可以多种多样，针对wordpress来说，主要就是设置后台程序禁止搜索引擎的访问，可以这样写：</p>
<blockquote><p>User-agent: *      <br />Disallow: /wp-admin</p>
</blockquote>
<p>user-agent： * 意思是允许所有的搜索蜘蛛访问，如果您想禁止某个搜索蜘蛛，只需要在这里写上蜘蛛的名字，然后disallow里面写上 / ，就可以了</p>
<p>比如全站屏蔽百度蜘蛛：</p>
<blockquote><p><font style="background-color: #ffffff">User-agent: </font>baiduspider       </p>
<p><font style="background-color: #ffffff">Disallow: /</font></p>
</blockquote>
<p>下面给出一些蜘蛛的名字，请参考：</p>
<p>google蜘蛛： googlebot    <br />百度蜘蛛：baiduspider     <br />yahoo蜘蛛：slurp     <br />alexa蜘蛛：ia_archiver     <br />msn蜘蛛：msnbot</p>
<p>nicky在他的博客中给出了一个wordpress的robots协议例子，大家可以参考下，放这里收藏起来好了：</p>
<blockquote><p>User-agent: *     <br />Disallow: /wp-      <br />Disallow: /feed/      <br />Disallow: /comments/feed      <br />Disallow: /trackback/</p>
</blockquote>
<p>下面的是三十而立的,也放上来展示一下，嘿嘿~</p>
<blockquote><p>User-agent: *     <br />Disallow: /wp-admin      <br />Disallow: /wp-content/plugins      <br />Disallow: /wp-content/themes      <br />Disallow: /wp-includes      <br />Disallow: /?s=      <br />Disallow: /comments/feed      <br />Disallow: /trackback/ </p>
<p>Sitemap: <a href="http://as30.com/sitemap.xml">http://as30.com/sitemap.xml</a></p>
</blockquote>
<p>关于最后的sitemap，用google xml sitemap插件的话，会是以gz结尾的，我给更改了，目前还不清楚是什么原因。先暂时改成这样好了。</p>
<p>最后需要注意的一点是，robots.txt文件必须是小写的字符，放到根目录即可。</p>
<p><!--aiospwlwbstart<br />
aiosp_description=wordpress的robots规则展示，给出了两个案例，请参考<br />
aiospwlwbsend--></p>
]]></content:encoded>
			<wfw:commentRss>http://as30.com/robots-120/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>

