搜索引擎是如何工作的(第一章)
搜索引擎有4个功能 – 抓取, 收录, 计算相关性和排名结果。
1. 抓取和收录
抓取和收录网络里数以亿计的文件,文档,新闻,音像等。
2.提供答案
对搜索关键词给出相关的页面以及相应的排名。
把整个网络想象成一个很大的城市,有许多的地铁站点。
每一个站点就是一个文件(有时候是一个网页,但有时候也可能是一个PDF,JPG或者是其他的文件)。搜索引擎需要通过一个方式来“抓取”整个城市并找到所有的站点,这个方式便是 — 链接。
“网络里的链接使得所有存在的页面关联在一起”
(至少可以说所有搜索引擎能够检索的页面。)搜索引擎的爬虫们,或者说蜘蛛们通过链接发现数以亿计的相互关联的页面。
一旦搜索引擎发现这些页面,他们接下来的任务便是解析页面的代码然后把选择好的页面储存进巨型硬盘,一般有对应的搜索时随时调出。为了不足一秒内完成这种超数量级的任务,搜索引擎的服务器遍布了全世界。
几乎难以用语言来形容这些成千上万台超级服务器处理的数据的庞大。无论如何,人们在搜索时总是希望立即获得搜索结果的,及时是3到4秒的延迟都会带来不满,所以搜索引擎努力让结果更快的呈现。
当人们在线搜索某样东西时,他们总是需要搜索引擎做两件事 — 首先,从数以亿计的页面里返回那些与搜索词相关或有用的结果,然后,按页面的价值(或重要程度)来对结果进行排名。搜索引擎优化就在于增加页面的”相关性”和”重要性”。
对搜索引擎来说,相关性并不是说页面里展现并强调了多次搜索词汇。早期,搜索引擎偏向于这种过分简单化的公式,但很快他们便发现搜索结果有很大的问题。经过反复的修改,聪明的工程师们设计了更好的公式来使得搜索结果更加合适。
如今上百种因素影响着相关性,我们将在整个指南里讨论这些因素。
重要性是一个很难量化的概念,但搜索引擎必须努力做好这个工作。
如今,大部分搜索引擎把重要性解释为流行程度 — 一个网站或一个页面的受欢迎程度一定是和他包含信息的价值程度成正比的。实践证明这个假设是非常成功的,搜索引擎的这套方法让用户的满意度不断上升。
流行程度和相关性不是由人工来定义的(幸好不是,否则全地球的人都来干这事才行)。相反,搜索引擎设计了一系列精妙的算法来将这些庞大的信息排序。这些算法包含了几百种元素。在搜索营销领域,我们称之为“排名因素”。SEOmoz精心制作了一份相关的材料 — 影响搜索引擎排名的因素
搜索营销人员是怎样在搜索排名中获得成功的
搜索引擎极为复杂的算法让人咋一看是完全琢磨不透的,更何况关于如何获得更好的排名以及更多的流量,他们提及的少之又少。他们提供的一些如何优化网站的建议如下:
Yahoo对网站管理员的建议
许多因素决定一个网页是否会出现在搜索排名中或者排名是上升还是下降,
这些因素包括:
- 来自其他网站链接的数量
- 页面的内容
- 收录页面的更新
- 新产品版本的测试
- 新网站的收录
- 搜索算法的改变以及其他因素的改变
Bing对网站管理员的建议
为了使网站获得更好的排名,Bing的工程师有以下一些建议:
- 在可见的网页文本里包含那些潜在的搜索词汇
- 页面的大小应该合适。我们建议一个页面对应一个主题。一个没有图片的HTML页面大小不应超过150kb
- 确保每个页面至少与一个静态文本链接相连
- 不要把你希望搜索引擎抓取的文本放在图片里。比如,如果你希望搜索引擎收录你公司的名字和地址,请不要把它们放在公司的LOGO里
Google对网站管理员的建议
下面是Goolge工程师的一些建议:
- 为用户,而不是为搜索引擎提供内容。不要欺骗性地对用户隐藏一些文字,而把这些文字展示给搜索引擎
- 网站应该层次分明。每个页面至少与一个静态文本链接相连
- 网站的信息应该是丰富且有用的。页面的title元素和ALT属性都应该用准确的语言来描述
- 一个页面的链接不应超过100个。
上面说的只是搜索营销庞大知识体系中的冰山一角,没关系,热爱搜索引擎营销的我们应该勇往直前!!
在过去的12年间, 搜索营销人员总结了许多搜索引擎的排名规则并用这些规则让他们以及他们客户的网站获得更好的排名
出乎人们的意料,搜索引擎支持其中一些做法。一些搜索营销会议也吸引了许多各大搜索引擎的工程师来参加。
使用搜索引擎来自由地进行实验,然后验证理论和形成观点,这种方式对于网站管理员来说比任何一个工具都来得有效。只有经历了反复且艰苦的不断实验的过程才能真正了解搜索引擎是如何运作的。
- 注册一个网站,域名用一个没有意义的词语(如ishkabibbell.com)
- 建立一些页面,这些页面都已同一个荒谬的词语来作为目标,如yoogewgally
- 使用多种文字布局,格式,关键词,链接结构等,但保持页面的一致性。
- 用这个域名下收录良好的页面做链接指向其他的域名
- 记录搜索引擎的活动及页面的排名
- 在目标页上做一些小小的改动,看看什么因素可以让排名的结果上升或者下降
- 记录任何有效的结果,然后用不同的域名及不同的词语来做相同步骤的测试,如果最后得到的结果一致的话,那说明你很有可能发现了搜索引擎使用的一种模式。
在实验中,我们假设在页面的代码中越靠上的链接能传递的权重越多。我们注册了一个没有任何意义的域名,这个域名指向3个页面,页面都只提及到一次这个没有意思的词。在搜索引擎抓取页面后,我们发现首页最高位的链接链向的页面在这个词上排名第一,第二第三则分别是中位链接和低位链接。
经过多种实验,分析以及纠正,搜索营销人员们发现了搜索引擎的基本运作方式以及让网站获得更高排名和更多流量的关键因素。
以后的章节将清晰且简明地介绍这些通过实践而得出的结果。
英文原文地址:http://guides.seomoz.org/chapter-1-how-search-engines-operate
有99.99%的可能性你也会喜欢: | |||
影响搜索引擎排名的因素 |
Google analytics增加网站速度监测 |
短网址对SEO的影响 |
做外链之前需了解的10个规则 |
无觅 |