<?xml version="1.0" encoding="utf-8" ?>















<feed version="0.3" xmlns="http://purl.org/atom/ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" xml:lang="zh_CN">
<title><![CDATA[谷哥空间]]></title>
<link rel="alternate" type="text/html" href="http://gugeguanggao.blog.bokee.net"/>
<modified>2007-06-20T15-19-26 CST</modified>
<tagline type="text/html" mode="escaped"><![CDATA[谷哥的个人空间]]></tagline>
<generator url="http://www.bokee.net/" version="2.0">bokee.net</generator>
<copyright>Copyright (c) 2005,  gugeguanggao</copyright>


<entry>
<title>用robots.txt探索Google Baidu隐藏的秘密</title>
<link rel="alternate" type="text/html" href="http://www.bokee.net/blogmodule/weblogcomment_viewEntry/812495.html"/>
<issued>2007-06-20T15-19-26 CST</issued> 
<created>2007-06-20T15-19-26 CST</created>
<modified>2007-06-20T15-19-26Z</modified>
<id>tag:gugeguanggao.blogchina.com,2005://812495</id>
<author>
<name>gugeguanggao</name>
<url>http://www.bokee.net/blogmodule/weblogcomment_index/gugeguanggao.html</url>
</author>
<dc:subject>网络知识</dc:subject>
<content type="text/html" mode="escaped" xml:lang="zh_CN" xml:base="http://www.bokee.net"> 
<![CDATA[<p><br />搜索引擎通过一种程序robot（又称<a href="http://www.jiu128.cn">spider</a>），自动访问互联网上的网页并获取网页信息。但是，如果网站的某些信息不想被别人搜索到，可以创建一个纯文本文件robots.txt，放在网站根目录下。这样，搜索机器人会根据这个文件的内容，来确定哪些是允许搜寻的，哪些是不想被看到的。 </p>
<p>　　有趣的是，这种特性往往用来作为参考资料，猜测网站又有什么新动向上马，而不想让别人知道。例如通过分析Google的robots.txt变化来预测Google将要推出何种服务。</p>
<p>　　有兴趣的读者可以看一下Google的robots.txt文件，注意到前几行就有&ldquo;Disallow: /search&rdquo;，而结尾新加上了&ldquo;<a href="http://www.jiu128.cn">Disallow: /base/s2</a>&rdquo;。</p>
<p>　　现在来做个测试，按照规则它所隐藏的地址是<a href="http://www.Google.com/base/s2">http://www.Google.com/base/s2</a>，打开之后发现Google给出了一个错误提示：&ldquo;服务器遇到一个暂时性问题不能响应您的请求，请30秒后再试。&rdquo;</p>
<p>现在来做个测试，按照规则它所隐藏的地址是<a href="http://www.google.com/base/s2">http://www.Google.com/base/s2</a>，打开之后发现Google给出了一个错误提示：&ldquo;服务器遇到一个暂时性问题不能响应您的请求，请30秒后再试。&rdquo;</p>
<p align="center"><img alt="" src="http://www.pconline.com.cn/pcedu/soft/wl/brower/0610/pic/061009_r1.jpg" border="0" /></p>
<p align="center">图1</p>
<p>　　但是把s2最后的数字换成1、3或者别的什么数字的时候，错误提示又是另一个样子：&ldquo;我们不知道您为什么要访问一个不存在<a href="http://www.jiu128.cn">的页面</a>。&rdquo;</p>
<p align="center"><img alt="" src="http://www.pconline.com.cn/pcedu/soft/wl/brower/0610/pic/061009_r2.jpg" border="0" /></p>
<p align="center">图2</p>
<p>　　很显然&ldquo;/base/s2&rdquo;是一个特殊的页面，鉴于Google曾表示过今年的主要焦点是搜索引擎，我们推测一下，所谓的&ldquo;s2&rdquo;是否表示&ldquo;search2&rdquo;，也就是传说中的第二代搜索引擎？　出于好奇，尝试了一下<a href="http://www.baidu.com/robots.txt" target="_blank">百度的robots.txt</a>，比密密麻麻的Google简洁了许多，只有短短几行：</p>
<p>　　User-agent: Baiduspider<br />　　Disallow: /baidu</p>
<p>　　User-agent: *<br />　　Disallow: /shifen/dqzd.html</p>
<p>　　第一段就不用说了，第二段也遇到了同样打不开的错误，不过，按以前的资料来看，这是百度曾经的竞价排名的区域核心<a title="代理相关知识技巧" href="http://www.vipcn.com/InfoList/Catalog_39_1.html" target="_blank">代理</a>一览表以及地区总代理一览表，出于某些可以理解的原因做了模糊处理。</p>
<p align="center"><img alt="" src="http://www.pconline.com.cn/pcedu/soft/wl/brower/0610/pic/061009_r3.jpg" border="0" /></p>
<p align="center">图3</p>
<p align="right">（出处：<a title="网络学院" href="http://www.vipcn.com/" target="_blank">http://www.vipcn.com</a>）</p>]]>
</content>
</entry>

<entry>
<title>怎样识别香蕉</title>
<link rel="alternate" type="text/html" href="http://www.bokee.net/blogmodule/weblogcomment_viewEntry/794367.html"/>
<issued>2007-06-12T18-35-35 CST</issued> 
<created>2007-06-12T18-35-35 CST</created>
<modified>2007-06-12T18-35-35Z</modified>
<id>tag:gugeguanggao.blogchina.com,2005://794367</id>
<author>
<name>gugeguanggao</name>
<url>http://www.bokee.net/blogmodule/weblogcomment_index/gugeguanggao.html</url>
</author>
<dc:subject>生活小常识</dc:subject>
<content type="text/html" mode="escaped" xml:lang="zh_CN" xml:base="http://www.bokee.net"> 
<![CDATA[<span style="FONT-SIZE: 11pt; FONT-FAMILY: 宋体; mso-ascii-font-family: 'Times New Roman'; mso-hansi-font-family: 'Times New Roman'">可用眼看手捏法。</span><span lang="EN-US" style="FONT-SIZE: 11pt"><br />&nbsp;&nbsp;&nbsp; </span><span style="FONT-SIZE: 11pt; FONT-FAMILY: 宋体; mso-ascii-font-family: 'Times New Roman'; mso-hansi-font-family: 'Times New Roman'">有些人购买香蕉时，往往爱拣色泽鲜黄、表皮无斑的果实。其实这样的香蕉内部还没有完全脱涩转熟，吃起来果肉硬而带涩味</span><span style="FONT-SIZE: 11pt"> </span><span style="FONT-SIZE: 11pt; FONT-FAMILY: 宋体; mso-ascii-font-family: 'Times New Roman'; mso-hansi-font-family: 'Times New Roman'">。</span><span lang="EN-US" style="FONT-SIZE: 11pt"><br />&nbsp;&nbsp;&nbsp; </span><span style="FONT-SIZE: 11pt; FONT-FAMILY: 宋体; mso-ascii-font-family: 'Times New Roman'; mso-hansi-font-family: 'Times New Roman'">香蕉应该挑选果皮黄黑泛红，稍带黑斑，最好其皮上有黑芝麻的（人们常说的广东芝麻香蕉）。表皮有皱纹的香蕉风味最佳。</span><span lang="EN-US" style="FONT-SIZE: 11pt"><br />&nbsp;&nbsp;&nbsp; </span><span style="FONT-SIZE: 11pt; FONT-FAMILY: 宋体; mso-ascii-font-family: 'Times New Roman'; mso-hansi-font-family: 'Times New Roman'">手捏香蕉有软熟感的其味必甜，果肉淡黄，纤维少，口感细嫩，带有一股桂花香。</span><span lang="EN-US" style="FONT-SIZE: 11pt"><br />&nbsp;&nbsp;&nbsp; </span><span style="FONT-SIZE: 11pt; FONT-FAMILY: 宋体; mso-ascii-font-family: 'Times New Roman'; mso-hansi-font-family: 'Times New Roman'">香蕉买回来后，最好用绳子串挂起来</span><span style="FONT-SIZE: 11pt"> </span><span style="FONT-SIZE: 11pt; FONT-FAMILY: 宋体; mso-ascii-font-family: 'Times New Roman'; mso-hansi-font-family: 'Times New Roman'">，拣带黑斑较软熟的先吃，越熟越甜，越软越好吃。</span>]]>
</content>
</entry>

</feed>
