详解GSA(Google Search Appliance)的安装和使用
作者:刘铭 来源:xmwebs.com 时间:2011-09-15 20:21:11
一:GSA是什么?
Google Search Appliance(简称:GSA)是由Google公司出品的一种机架设备。 Search Appliance 随附的 Google 软件安装于功能强大的硬件上,不需要进行一连串复杂的软件配置过程,就可以部署。
二:GSA的用途
1.提供文件索引功能
可以集成到企业内部,文件管理系统或网站上使用类似谷歌搜索的界面提供給终端用户检索。说简单一点就是为企业提供一个类似谷歌的小型搜索引擎。网上有不少山寨搜索引擎,就是使用GSA来抓取内容,再编写代码呈现搜索结果!你还在为他们的强大而感叹的时候,我很高兴的告诉你,用GSA也可以办到!
2. 搜索引擎人员的模拟抓取工具
谷歌百度这类搜索引擎可能会收录索引您网站的部分网页,如果您要尽可能多的收录,您就得利用GSA来找出没被收录的原因。您还可以用它检测出您网站上的 404,500错误页面,GSA就是一个测试工具,根据抓取的结果,您可以对您的网站做出相应的修改,对新手SEOER有很大帮助!
三:虚拟机版本的GSA
Google Search Appliance是一种机架设备,根据相关法律,大陆是无法购买该设备的,好在有为我们提供仿真式的虚拟机版本。
( 图为GSA虚拟机运行界面)
1.GSA 虚拟版下载
谷歌提供的虚拟机下载地址:http://dl.google.com/vgsa/vgsa_20081028.7z
文件为7-Zip格式,需安装7Z软件(7-zip是压缩比最高的压缩软件),将里面的文件解压到硬盘目录,并在虚拟机中选择打开。
2.配置GSA虚拟机
GSA 采用Linux+Python架构,进入后只允许我们对网络和时区进行配置,抓取,索引等其他操作是在Admin Home Page(管理后台)进行的,
Search Home Page 是一个供你搜索抓取到的网页的一个入口。
配置的一些经验:
1.网络都选NAT
2.IP设置选择DHCP,自动获取
3.DNS设置手动设为谷歌的8.8.8.8
4.DNS前缀设为任意字母,或者真实存在的域,比如笔者填写的 ***.cc,这样就可以使用域名代替IP来打开管理后台和搜索主页
谷歌为我们提供了一个文字版本的虚拟机的安装和配置向导,地址为:http://bbs.byr.edu.cn/wForum/boardcon.php?bid=249&id=7351&ftype=6&ap=422
3.进入管理后台
管理后台的用户名为:admin,密码如果未修改,则默认:test
接下来,我会整理一篇关于GSA管理后台使用的文章,帮助大家使用谷歌提供给大家的这个非常棒的测试工具。