<< 关于通过H5页面唤NNtive户端的介绍 | 首页 | 爬取百度网盘用户分享 | Guodong >>

《搜索引擎评分指南》阅读心得

#《搜索引擎评分指南》阅读心得  

##1、 搜索词的三种分类  
搜索引擎把搜索词分为三类:Know,Do和Go,以下是关于三类搜索的简单解释:

*   Know,信息性搜索,这类用户想要了解某些信息,如“南京五一天气怎样”,“南京五一有哪些地方好玩”等。
*   Do,事务型搜索,这类用户想要完成某个目标或参与某个网上活动。他的目标可能是下载,购买,娱乐等,比如“美图秀秀下载”,“植物大战僵尸online”,“cheap mp3 player”等。  
*   Go,导航型搜索,这类用户是要到达某个特定网页,比如“中国制造网”,“优酷”,“新浪微博”等。  

另外,很多搜索词会有不止一种用户意图,比如“ipad”,用户可能想要ipad的简介(Know型),可能想要到达ipad的官网页面(Go型),也可能是想要购买ipad(Do型)。
**搜索词分类的作用很多,可自行扩展。下面简单列举了2种:**

*   便于关键词分析。将关键词按用户意图区分,可以更了解这些关键词背后的含义,有利于对关键词做更好的布局。
*   方便关键词拓展。可以根据关键词的3种分类去对照自身网站,看是否有关键词拓展的空间。

**注:**
关键词分类对电商类网站尤其重要,比如电商类要将事务型搜索关键词作为网站转化的重点;还有淘宝客,可以说最核心的就是如何找到转化率高的长尾关键词;我之前工作过的医疗网站也是,寥寥几个事务型关键词(多为地区类病种词)几乎可以占据每天转化量的一半。




##2、用户意图  
之前一直以为影响网页排名的只有2个因素:**网页与搜索词的相关性**和**网页的重要性**。看了文档才知道有个更高级的因素,那就是**用户意图**。其实也很容易理解:搜索引擎的目的就是满足用户的搜索需求,因此搜索引擎会先根据**用户搜索词**判断**用户意图**(简单分为Do,Go和Know型),然后给出符合需求的一类网页,接着才会根据相关性和重要性对这一类页面进行排序。
例如用户搜索”宫保鸡丁“,而我有个网页是”宫保鸡丁的来历“,虽然我的网页相关性很强(关键词位置,密度,内外链等),也有很多高质量外链,但考虑到搜索这个词的大多数用户都想要知道”宫保鸡丁的做法“,只有极少数是想了解”宫保鸡丁的来历“,所以第一步就落后了,之后也不太可能有很好的排名。除非用户搜索”宫保鸡丁的来历“,这个网页因为很符合用户的需求,排名才会靠前。
也就是说,**要想让某个关键词的排名靠前,首先要分析这个关键词,了解搜索这个关键词的用户想要得到什么信息,然后根据用户需求去组织页面,这样才可能获得理想排名**。也就是说,如果网页是”宫保鸡丁的来历“,那还是不要把精力放在”宫保鸡丁“这个排名上了,因为匹配度太低了。 
**注:**
这东西说来很虚,但用户和搜索引擎都喜欢,可以看看夜息哥哥这篇文章http://www.imyexi.com/?p=853,花很大精力搞卡片分拣就只是为了满足用户需求,在侧边栏放上用户需要的链接。这些链接虽然不起眼,但想想如果有成千上万个页面都放上了用户更感兴趣的链接,那效果就不可同日而语,这其实也是产品,运营,体验的工作。


##3、 网页评级
谷歌根据用户意图与页面的匹配程度,将搜索结果分为5种类型:**至关重要型**,**实用型**,**相关型**,**基本相关型**与**离题或无价值型**。

*   至关重要型。一个页面可以满足用户的所有搜索意图,多用于导航型搜索。  
*   实用型。页面质量高,可满足大多数用户的需求。  
*   相关型。跟搜索需求相匹配,可以满足部分用户的需求。  
*   基本相关型。对大多数用户不那么有价值,但多少跟搜索需求相关。  
*   离题或无价值型。跟搜索请求不匹配,或者没有实际价值,对绝大多数用户没有帮助。

结合**用户意图**的解释可以得到2点:  
1.  只有符合用户意图,满足用户主体需求的页面,评级才会高,排名才会靠前。比如搜索”宫保鸡丁“时为什么”宫保鸡丁的来历“排名较低,因为他没有满足搜索者的主体需求,只是跟搜索词算是**基本相关**。
2.  如果页面内容与关键词匹配度不高,评级低,无法获得很好的排名。例如“宫保鸡丁的来历”想要获得“宫保鸡丁”的排名。

**注:**
相对于用户意图,那些关键词密度,H标签什么的简直弱爆了。

##4、 关键词堆砌  
谷歌对关键词堆砌的分类:  

*   关键词在页面上重复多次  
*   关键词的相关词在页面上重复多次  
*   关键词的拼写错误在页面上重复多次  
*   页面上存在大量胡乱的随机的关键词
*   页面上存在大量程序自动生成的文本,并没有任何意义。  

谷歌对关键词堆砌的处理方式:当页面上关键词数量过多,干扰了用户的正常访问,那就会认定为关键词堆砌;而如果没有察觉到关键词数量的影响,那将不被认为是堆砌。  

**注:**
有时候我们把搜索引擎想象的太弱智了,不是吗?!



##5、 对网页语言的判断  

谷歌已有很成熟的技术去判断网页语言,而不仅仅依靠HTTP响应头部的Charset和Content-Language。比如Google Translate的API里就有相应的功能,能识别网页的语言。(具体可以看<a href="https://developers.google.com/translate/v2/getting_started?hl=zh-CN">谷歌翻译API</a>里的detect source language一项。)  
也就是说,**如果Charset和Content-Language设置为中文,不一定会被谷歌认为是中文网页,只是会干扰谷歌的判断**。  
另外,这不表示Charset和Content-Language设置错误没有影响,Charset和Content-Language的合理设置会让网页更加规范,也避免了用户在浏览网页时弹出其他字符集下载。
 

阅读全文……

标签 :



发表评论 发送引用通报