SEO利器-Google GSA虚拟机版本

标签: SEM工具 | 发表时间:2010-12-03 16:29 | 作者:国平 Class4
出处:http://www.chedong.com/blog/

在所有的SEO工具中,能够被称为利器的工具不多,但Google GSA虚拟机版本绝对算是一个。去年我介绍了《利用Google Search Appliance 服务器做SEO 》,不过这个正式版实在太昂贵而且根据美国的某条法律不销售给中国,所以很多人都没办法用来做SEO应用。 而Google GSA虚拟机版本就很好的解决了这个问题。 

GSA

GSA

先讲讲这个Google GSA虚拟机版本怎么应用到SEO上面吧。 

如我以前所说: 

你可以把这个GSA看做是google 的微缩版,它有爬虫,有索引库,有排序算法。它的的硬件和软件都是现在google.com这个网站正在用的东西。所以两者之间相似程度非常的高。我在过去操作google mini的时候已经证实:至少它的抓取机制和现在的google.com几乎是一摸一样的。 

其实何止爬虫抓取机制,连绝大部分排序的算法都是一样的。虽然这个GSA内置了更多给离线文档(如 pdf\word\)排序的算法,但是在给网页排序这块的算法和google.com如今正在用的算法是非常接近的。因为这个GSA的本意是给某些需要搜索的企业用户来索引他们自己的信息,是希望用google的技术能力来帮他们索引最相关的信息,不然就没有必要非得用google的产品了。 开发过小规模搜索引擎的人都知道,对于小型搜索引擎,其他东西大家都能基本做到,GSA值钱的地方就是这个排序算法,这是大家选择GSA的首要原因。 

另外,这个方法是一个有着11年SEO经验并且在美国google做过2年产品经理的人强烈推荐使用的方法,他自己就买了2台正式版。 

不过排序算法总还是有差别的,根据我使用了2年多GSA的经验,对于网页的排序算法90%以上是一样。 

GSA在SEO方面至少有以下几个应用。 

第一个应用就是检查搜索引擎爬虫在你网站上可能遇到的问题。 

因为这是一个真正的搜索引擎,而且对于google来说,GSA和google.com的爬虫是一模一样的,所以检查到的问题都是真正的搜索引擎爬虫会遇到的问题。 

操作方法为: 

点击“抓取并编制索引” —>  “抓取网址”,按如下格式输入你要检查的网址,按后点击“保存要抓取的网址”。 

设置待抓取URL

设置待抓取URL

在“状态和报告”—>“ 抓取状态”里,点击“恢复抓取”。 

等一段时间以后,如果一切正常,在GSA的前台就可以开始搜索到网站的内容。 

在“状态和报告”—>“抓取状态”里,就可以看到爬虫遇到的一些问题。如: 

检索错误

检索错误

点击出错的部分,会列出哪些URL因为什么原因出错。 

出错的URL

出错的URL

这个虚拟机版本已经内置了一些数据。每次测试前,都需要把数据清空。 在 “管理”—>“重置索引”里, 点击“立即重置索引”可以清空所有已经抓取的数据。 

看着这些似曾相识的界面,应该能明白我以前写那篇《google 的良苦用心:网站管理员工具》的依据了。 

第二个应用就是可以探测到google大部分基本的排序规则。 

以前很多人在做SEO过程中对很多排名因素都是不能确定的。 如:到底 h1 放多少个好、有没有必要加导出链接等等。 

有了GSA,就可以做大量的 A/B测试,就能把很多因素都测试出来。 如:测试<h2>  和 <strong> 这两个标签哪个对排名的影响更大一点。 

那就可以设计A和B两个网页,其他部分都一模一样,只是某个特定的关键词,A网页是用 <h2> 加粗的,B网页是用 <strong> 加粗的。 用GSA只收录这两个网页,并且只对这两个网页进行排名。在前台搜索这个关键词,看哪个网页排在前面,这样就可以知道哪个因素对排名的影响大一些了。 

有点需要注意一下的是,那些被测试的网页,如果上面有链接而你又没做限制的话,爬虫会顺着这些链接把很多网页都收录进来,那会对测试结果造成干扰。 

A/B测试

A/B测试

类似的测试方法还有很多,只要你想得到都可以去测试。 这样能把google宣称的200多项排序规则中的一大半规则都可以测试出来。 不过要明白一点的是:即使能把所有的规则测试出来,也不一定能做好SEO,在《怎样形成一套非常科学系统的SEO方法》中我说过:做搜索引擎是一回事,在搜索引擎上拉流量又是另一回事。 等大家把很多排序规则都测试出来了再来做SEO就明白了。

只是知道了这些规则,那就不需要听那些毫无来由的SEO规则了,很多事情你自己完全能确定是怎么回事。还有就是就算要向你老板交代你的SEO做法的时候也可以理直气壮一点。

另外,由于百度也在不停的“学习”google的算法,所以这里的很多规则对百度也适用。(其实大部分搜索引擎的很多做法,甚至开发语言都是一模一样的。 顺便广告一下: 杭州光年已经能开发搜索引擎及其很多应用。如小型搜索引擎、网站站内搜索、基于搜索的舆情监控系统、公司内部文档搜索等等。不是用开源程序开发。)

第三个应用就是可以查看内部链接的结构,看哪些网页被内部链接推荐得多一点。 

在《内部链接还是外部链接?》一文中,讲述了内部链接的重要性。 但是极少有网站知道自己的每个网页内部链接的分布情况,有了GSA,这个就很容易办到了。 

在“状态和报告”—>“ 抓取状态”里,输入刚才GSA收录的网址,“网址状态”选 “已抓取”,就可以查询到已经被收录的网页的PR在站内有多高。 

站内PR分布

站内PR分布

这是在没有任何外部链接的情况下,网站纯依靠自身的内部链接造就的网站内部的PR值分布情况。 点击具体的URL,还可以查看详细的信息如: 

每个URL的信息

每个URL的信息

当然还有其他一些应用,如:只收录自己的网页和竞争对手的网页并进行排序,如果你自己的网页排在后面,就不停的改进直到超过对手的网页。其他更多的应用还是靠大家慢慢发掘吧,都写出来就没什么意思了。 用它确实是可以做出一个完美的SEO网页。

这个虚拟机版本是运行在Vmware上的,Vmware7.1.3 的下载地址是:http://download.pchome.net/system/sysenhance/redirectsrv-4673-1.html    

初次使用虚拟机的同学最好装个Vmware7.1.3的汉化补丁。

GSA虚拟机版本的下载地址放在光年论坛上:  (需要论坛会员才能看到下载地址)

http://www.gnbase.com/thread-310-1.html   

Vmware的安装过程略过,不过注意一下Vmware在安装过程中会安装几个虚拟网卡,如果电脑上的防火墙提示你的时候,一定要允许共享或通过。 

要使用GSA,google官方建议的电脑配置为: 

  • Intel Pentium D 处理器 915(双核)或同级别的处理器
  • 4 GB 内存
  • 40 GB 可用硬盘空间,且硬盘转速为 7200 RPM 或更快
  • SATA 或更佳存储接口

不过我在双核 1.8G 、2GB内存的笔记本上运行也不是太慢。之所以建议用40GB的硬盘空间是因为这个虚拟机版解压缩以后的大小是近35GB。 

Vmware安装好以后,直接导入解压缩以后的那个vgsa.vmx ,然后打开虚拟机电源,接下来就是一段漫长的等待。 

虚拟机导入

虚拟机导入

等出现配置界面的时候,就开始配置。 

配置界面

配置界面

大部分情况下,都需要手动配置GSA的设置,不然在后台抓取网页的时候会出现“DNS错误”。   先用 ipconfig 命令查看你本机的IP ,再来配置GSA。 

按 Ctrl + G 进入虚拟机,再按 F2  ,按键盘上的 -> 选择 Manual ,   IP 地址要填和你的电脑在同一个网段的其他IP地址。 其他和你本机的一样。 DNS就填和 Gateway 一样的地址,DNS Suffix 可以随便填。 

配置,按TAB键换行

配置,按TAB键换行

 即使配置好了,可能还不能马上使用,需要等待一会。 我记得GSA正式版从启动到能使用是需要等20分钟的,虚拟机版本也需要稍等一会。

GSA的后台访问地址是: http://{刚才配置的IP}:8000   , 前台访问地址是:http://{刚才配置的IP}。后台的登录密码压缩包里有。

软件的使用细节还有很多,GSA的使用交流可以到光年论坛。 因为现在大家都可以用它来探测google的排序算法,我相信会有很多的成果能发布在论坛上的。 

自从去年我发布那篇介绍GSA的博客2个月后,因为有google的朋友也看这个博客,我猜google可能意识到了某些问题,所以google中止了GSA虚拟机版的更新,我这个版本是最新的一个版本。 我放这个版本出来是希望SEO行业从此不要道听途说或人云亦云,SEO是可以做得很科学的,SEO要长久发展下去就必须走规范化和标准化的道路。

相关 [seo google gsa] 推荐:

SEO利器-Google GSA虚拟机版本

- Class4 - 车东[Blog^2]
在所有的SEO工具中,能够被称为利器的工具不多,但Google GSA虚拟机版本绝对算是一个. 去年我介绍了《利用Google Search Appliance 服务器做SEO 》,不过这个正式版实在太昂贵而且根据美国的某条法律不销售给中国,所以很多人都没办法用来做SEO应用. 而Google GSA虚拟机版本就很好的解决了这个问题.

Google+1 = 社交营销SEO的崛起?

- yun - 就SEO
3月31号Google推出了酝酿已久的Google+1,这款产品是Google在社交领域里一个新的尝试,将搜索结果和社交网络结合在一起,确实非常创新. 虽然Google在之前的社交领域表现的很逊色,但由于使用Google的人群基数大的可怕,这款产品可能获得的影响力还是令人期待的. Google+1具体是什么样呢,我用图片来说明:.

Google SEO信息年终总结

- - 月光博客
  2011年马上就要结束了,这里总结一下Google关于SEO方面的资讯. 谷歌每年对其搜索算法作出超过500次的修改,由于大多数修改只会影响极少部分的搜索结果,所以很少有人察觉. 这里也是从一些较为靠谱的新闻资讯来揣摩Google算法的修改方向,来指导SEO工作.   【1月20日]】有站长在Google webmaster help论坛中说自己的网站被降级.

【Google SEO快讯】Google只认一一映射的301跳转

- - 张亚楠博客
本着“师夷长技以自强”的原则,了解Google SEO进展,学习一些西方SEO先进技术是非常有必要的,所以就有了“Google SEO”系列. 这篇是快讯,主要是Google这两天公布的一些新规则. 来源有Twitter,Search Engine RoundTable. Google:301跳转必须是一一映射.

在Google名列前茅!SEO的13種方法(下)

- - 數位時代 Beta3.0 | Topics & Links
散佈影片:企業行銷服務Business Beware創辦人Ashley Bodi. 影片對於企業經營者很重要,不只賦予企業獨特的人格,而且很容易透過網絡效用傳播,並讓使用者連回你的網站. 建立一個很棒的影片,並提供人們想要分享並反覆觀賞的資訊,而且影片現在可以從一個平台發佈到多個平台,這會讓Google搜尋引擎愛上你.

WordPress SEO 宝典

- luckerme - 我爱水煮鱼
最基本的搜索引擎优化(SEO)是很简单的,而 WordPress 程序本身的一些优势使得 SEO 变得更加容易,比如我爱水煮鱼有超过 70% 的流量来自搜索引擎,所以做好 SEO 就是流量的保证,这篇文章就给大家介绍下在 WordPress 博客中最基本的一些 SEO 要求,希望能够帮助到你. 简单来说 SEO 分为页面优化和链接建设两大部分,页面优化是基础,而链接建设则是重点,两者缺一不可.

SEO已死

- - 网站运营优化
  美国知名财经杂志《福布斯》近日刊登营销专家家肯·克罗格(Ken Krogue)的分析文章称,传统意义上的搜索引擎优化(SEO)的做法已经过时,在SEO产业经过转型后,目前已到社交、实时内容大行其道之时.   今年3月,我曾在犹他州同业界知名SEO专家亚当·托基尔德森(Adam Torkildson)共进午餐.

WordPress SEO 宝典

- - 人人都是产品经理
最基本的搜索引擎优化(SEO)是很简单的,而 WordPress 程序本身的一些优势使得 SEO 变得更加容易,比如我爱水煮鱼有超过 70% 的流量来自搜索引擎,所以做好 SEO 就是流量的保证,这篇文章就给大家介绍下在 WordPress 博客中最基本的一些 SEO 要求,希望能够帮助到你. 简单来说 SEO 分为页面优化和链接建设两大部分,页面优化是基础,而链接建设则是重点,两者缺一不可.

【seo经验分享】seo的思维

- - 人人都是产品经理
思维决定着出路,seo的思维决定着我们优化的最终成败. 用户体验度以及搜索引擎蜘蛛体验,才是我们思维中应放在第一位的内容. 面对着搜索引擎的不断变化,中文搜索引擎优化工作越来越难作. 百度,一个善变的搜索引擎平台,让许多作中文搜索引擎优化的个人或是公司吃尽了苦头. 2012年一年,百度让更多的作搜索引擎营销的人们不再相信seo,认为作seo不稳定,不能很好的给他们带来流量.

HTML5的SEO探索

- Amo - HTML5研究小组
所有现代浏览器对HTML5的支持问题不大. HTML5被智能手机浏览器和越来越多的网站广泛的采用,甚至作为最优的选择. 但是,Googlebot,Bidubot等其他搜索引擎呢. 引擎是否会由于HTML5这任何额外因素,在搜索结果中优先推荐您的网站吗. 另一方面,少数搜索引擎会认为所有这些额外的H1标记的是垃圾网站吗.