关于Go安装时出现错误的解决方案

gopack grc _test/http.a _gotest_.6
--- FAIL: http.TestClient
Get http://www.google.com/robots.txt: read tcp:192.168.1.2:49664->64.233.189.103:80: connection reset by peer
FAIL
make[1]: *** [test] Error 1
make: *** [http.test] Error 2

这个问题我个人认为可能和中国网络环境有关, 由于Go在编译了每一个包后都要做一个测试, 而选择的服务器都是美国的服务器. 解决这个问题的方法很解决, 将测试条件改成国内的就可以了.

文件位置在$GOROOT/src/pkg/http. 也就这个包可能出现这样的问题

File: client_test.go
Line:19
将http://www.google.com/robots.txt 换成http://www.google.cn/robots.txt 或者其他的你自己喜欢的地址, 当然要注意的是下面有一行测试条件,是查看返回的内容是否以"User-agent:" 开头的, 如果你换成其他地址,请确认你所替换的地址返回的内容和测试条件想匹配.


File:request_test.go
Line:106,107
将两个地址替换掉, 可以选择http://www.google.cn和http://www.baidu.com, 这个就随你喜欢了.

如此在安装编译的时候就不会出错了.

Google Chrome

Google Chrome 谷歌浏览器. 下了一个回来用用. 觉得还可以. 至少看起来挺简单的 而且还挺炫的–可以把标签单独拖成单独的窗口.

有任务管理器 可以关闭单独的标签而非整个窗口. 估计以后这个功能会普及.

其他的就正常了

不是很占资源. 不过问题是 使用 “审查元素” 这个功能的时候CPU处于很高的状态. 基本是100% . 不知道为什么? 还是我电脑的问题.

不太喜欢的功能 就是地址栏自动搜索. 我一般都是靠记住地址的. 所以觉得有点不习惯. 就像那个Firefox3 也是的.

如果可以把 所有的收藏夹里面的东西 放在一个页面里面就好了. 或者把那个换成一个按钮放在上面. 觉得现在这样子有点怪怪的. 我希望页面 尽量大 尽可能合在一起..

不过我自己认为 Google Chrome 不是带来一个新的浏览器. 而是带来了一些革新. 一些很新颖的功能.

奇怪的地方 可以导入火狐的密码文件. 我想知道这个文件在什么地方. 因为我曾经有过 seamonkey的密码全部丢失的事情. 都不知道是怎么回事. 有谁能告诉我…

AT&T改变态度向谷歌Android示好

[1] 此前一直拒绝加入谷歌力推的开放手机联盟的AT&T如今改变态度对Android示好.有了AT&T的支持.Google的手机平台将更好的推行.

[2] 此前传闻的辞职的唐骏现在真的辞职了.据报道唐骏因个人原因辞去盛大总裁一职.这一决定在3h号下午的盛大高层会议中宣部.消息详文.

[3]诺基亚拒绝返还德国政府补贴.3月31日的截止期限已经过去,但诺基亚并没有向德国北莱茵-威斯特法伦州政府返还6000万欧元的补贴和利息。

今年1月,诺基亚宣布将于今年关闭位于德国西部城市波鸿的工厂,并将生产业务转到劳动力成本较低的罗马尼亚。受这一决定的影响,诺基亚波鸿工厂的2300名员工将会失业,同时还会间接导致更多人失业。北莱茵-威斯特法伦州政府此前表示,已经要求诺基亚在3月31日之前返还过去几年在该州获得的巨额政府补贴和利息。

见龙卸甲
[4]见龙卸甲.炒了很长时间的一部电影.今天上映.等待DVD清晰版的出现.

[5] 手机用户信息泄露源头追踪 运营商内部出售号码 .事实上这个已经不是新闻了.因为现在出售个人信息的现象很多.尤其是现在的求职网站.如51job,智联招聘,中华英才网.只要你在上面注册.隔天垃圾邮件如雪花般飞来. 真是头疼.很多网站都不尊重此前他们自己承诺的用户隐私条款.

[6] 淘宝深陷”评价门” 对此消息我不做评论.但是我知道淘宝现在越来越垃圾了.以前的页面清爽.现在打开页面CPU就飙.而且现在的搜索垃圾的一塌糊涂.我想给手机充值.以前有自动发货的平台.而现在根本就搜不到.我花了一个下午想找到一个自动发货的平台都没有.都是一两心得卖家所谓的自动都是卖家帮你充.而我懒得去打交道. 还有我投诉了一个卖家都现在都没有回应.根本就没有处理的表示.现在的淘宝终究会失去用户.因为不久以后的电子商务交易的规范出台将会限制C2C的发展,而是如果人们其实也逐步接受网络不是免费的现实了.当年易趣失去用户是因为收费.如果现在看来收费不一定会失去用户. 店大欺客屡见不鲜.当当.淘宝都是一样的.

unavailable_after标签

如果你有一个网页希望在某个时期后不希望搜索引擎抓起应该怎么做呢? google提供了unavailable_after标签

方法 <META NAME=”GOOGLEBOT” CONTENT=”unavailable_after: 日期 时间 时区”> 其中的日期、时间、时区(缩写)分别用23-Jul-2008、20:18:17、EST这种格式。当Google的爬虫看到网页里包含这个标签时,它不仅会不再抓取这个网页,还会在一天左右的时间内将网页从Google的搜索结果里除去。

如果你希望从移除Google Cache里的记录,得给网页加上noarchive标签。

相关信息

NOINDEX:告诉Google不要索引含此标签的网页。但根据实际经验,Google并非100%遵守。
NOFOLLOW:告诉Google不要关注含此标签的网页里的特定链接。这是为了解决链接spam而设计的Meta标签。
NOARCHIVE:告诉Google不要保存含此标签的网页的快照。
NOSNIPPET:告诉Google不要在搜索结果页的列表里显示含此标签的网站的描述语句,并且不要在列表里显示快照链接。

[转载]如何使用robots.txt

robots.txt 文件对抓取网络的搜索引擎漫游器(称为漫游器)进行限制。这些漫游器是自动的,在它们访问网页前会查看是否存在限制其访问特定网页的 robots.txt 文件。如果你想保护网站上的某些内容不被搜索引擎收入的话,robots.txt 是一个简单有效的工具。这里简单介绍一下怎么使用它。

如何放置 Robots.txt 文件

robots.txt 自身是一个文本文件。它必须位于域名的根目录中并 被命名为”robots.txt”。位于子目录中的 robots.txt 文件无效,因为漫游器只在域名的根目录中查找此文件。例如,http://www.example.com/robots.txt 是有效位置,http://www.example.com/mysite/robots.txt 则不是。

这里举一个robots.txt的例子:
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~name/

使用 robots.txt 文件拦截或删除整个网站

要从搜索引擎中删除您的网站,并防止所有漫游器在以后抓取您的网站,请将以下 robots.txt 文件放入您服务器的根目录:

User-agent: *
Disallow: /

要只从 Google 中删除您的网站,并只是防止 Googlebot 将来抓取您的网站,请将以下 robots.txt 文件放入您服务器的根目录:

User-agent: Googlebot
Disallow: /

每个端口都应有自己的 robots.txt 文件。尤其是您通过 http 和 https 托管内容的时候,这些协议都需要有各自的 robots.txt 文件。例如,要让 Googlebot 只为所有的 http 网页而不为 https 网页编制索引,应使用下面的 robots.txt 文件。

对于 http 协议 (http://yourserver.com/robots.txt):

User-agent: *
Allow: /

对于 https 协议 (https://yourserver.com/robots.txt):
User-agent: *
Disallow: /

允许所有的漫游器访问您的网页

User-agent: *
Disallow:

(另一种方法: 建立一个空的 “/robots.txt” 文件, 或者不使用robot.txt。)

使用 robots.txt 文件拦截或删除网页

您可以使用 robots.txt 文件来阻止 Googlebot 抓取您网站上的网页。 例如,如果您正在手动创建 robots.txt 文件以阻止 Googlebot 抓取某一特定目录下(例如,private)的所有网页,可使用以下 robots.txt 条目:
User-agent: Googlebot
Disallow: /private

要阻止 Googlebot 抓取特定文件类型(例如,.gif)的所有文件,可使用以下 robots.txt 条目:

User-agent: Googlebot
Disallow: /*.gif$

要阻止 Googlebot 抓取所有包含 ? 的网址(具体地说,这种网址以您的域名开头,后接任意字符串,然后是问号,而后又是任意字符串),可使用以下条目:
User-agent: Googlebot
Disallow: /*?

尽管我们不抓取被 robots.txt 拦截的网页内容或为其编制索引,但如果我们在网络上的其他网页中发现这些内容,我们仍然会抓取其网址并编制索引。因此,网页网址及其他公开的信息,例如指向该网站的链接中的定位文字,有可能会出现在 Google 搜索结果中。不过,您网页上的内容不会被抓取、编制索引和显示。

作为网站管理员工具的一部分,Google提供了robots.txt分析工具 。它可以按照 Googlebot 读取 robots.txt 文件的相同方式读取该文件,并且可为 Google user-agents(如 Googlebot)提供结果。我们强烈建议您使用它。 在创建一个 robots.txt 文件之前,有必要考虑一下哪些内容可以被用户搜得到,而哪些则不应该被搜得到。 这样的话,通过合理地使用 robots.txt , 搜索引擎在把用户带到您网站的同时,又能保证隐私信息不被收录。

用Google Docs写博客

用Google Docs写博客
昨天在mercy的博客上看到Google Docs可以编辑文章发到博客.于是我也用这个Google Docs写了看看好不好使 .
今天刚考完网络数据库.感觉不错七八十分应该没有问题.郁闷的是自己整理的复习资料知道其中哪些的内容会考居然自己没有看.这个真是郁闷了.用我复习资料的人反而看了好多.
明天晚上考VB.这个估计很是简单就选择题和填空题.估计没有什么难的东西.下午复习复习.
如mercy所说的确不能包含文章标题.这个不知道是Google的bug还是WP的bug.不管是谁的bug.只是希望以后能解决这个问题.