百度搜索URL参数解析

标签: 网站分析 URL 百度 | 发表时间:2012-01-18 18:07 | 作者:标点符
出处:http://www.biaodianfu.com

百度的搜索URL存在着一定的规律和逻辑,下面的链接是我使用百度搜索“标点符”后得到的链接,下面就来一起分析下百度搜索结果URL的秘密。

http://www.baidu.com/s?wd=%E6%A0%87%E7%82%B9%E7%AC%A6&rsv_spt=1&issp=1&rsv_bp=0&ie=utf-8&tn=baiduhome_pg&inputT=2969

URL中的s?表示搜索,&符号起到参数分割的作用。上述链接涉及到的参数如下:

  • wd:Keyword,查询的关键词,有时还会是 word,比如 www.hao123.com打开的链接就是word,wd后面的关键词使用gb2312进行编码,如果搜索词中出现空格则使用+号替换;
  • rsv_spt:识别浏览器,目前测试下来Chrome、FireFox、Safari的为3,IE浏览器为1;
  • rsv_bp:判断搜索位置:0为从百度首页进入,1为搜索结果顶部搜索,2为搜索结果底部搜索;
  • ie:Input Encoding,查询关键词的编码,缺省设置为简体中文,即ie=gb2312;
  • tn:搜索框来源标识,如百度首页的就是baiduhome_ph,hao123站来的sitehao123,遨游浏览器的为tn=myie2dg等。除了百度自身用来数据统计好,词数据还对百度搜索联盟分成起到跟踪作用。tn=baidulocal 表示百度站内搜索,返回的结果很干净,无广告干扰;
  • inputT:搜索响应时间,单位是毫秒;

以上我上面的URL中出现的参数,但是百度的搜索引擎参数远远比上面的还要多。再来看看还有哪些参数:

  • bs:Before Search,上一次搜索的关键词;百度会记录上一次用户的搜索词是什么;
  • sr:结合bs使用。一般查询sr=0或者为空值,但sr=1时,查询将结合bs的值一起作为查询的关键字。默认值为0,除0,1外其它值无效。
  • pn:Page Number,搜索结果的页码,从零开始计数。即pn = ${结果页码-1}*rn;
  • rn:Record Number,搜索结果显示条数,缺省设置rn=10,取值范围:10-100;
  • cl:Class,搜索类型,cl=3为网页搜索,cl=2为图片搜索;
  • lm:搜索结果的时间限制。以天为单位,例如搜索最近一个月的网页,lm=30.默认值为0,表示没有时间限制;
  • ct:语言限制。0-所有语言,1-简体中文网页,2-繁体中文网页;其它不确定或者无效或。默认值为0;
  • q5:搜索内容位置限制。0-所有内容;1-网页标题(相当于使用’title:’查询前缀);2-url(相当于使用’inurl:’查询前缀);其它值等效于0,默认值为0 ;
  • q6:搜索内容网站限制。例如q6=www.biaodianfu.com,表示只搜索 http://www.biaodianfu.com/的网页;相当于使用了’site:前缀’,默认值为空
  • dq:不建议使用该参数。查询内容来原的地区限制。具体值有百度确定,默认值为空。使用这个参数的效果很差;
  • oq:相关搜索的主词,例如,搜索“标点符”后点击“标点符号”,出现的相关搜索,用来记录来源词“标点符”,或输入搜索词,输入到一半点推荐关键词的那个词,两个通过出现rsp/rsv_bp进行区分;
  • rsp:相关搜索词的位置,第一个推荐词为0,第二个为1,以此类推;
  • usm:在百度搜索任何词从任何一页点到第三页以后的,都会随机出现usm的参数。当usm=0的时候是正常排名 。当usm=1的时候所有排名后移一位,当usm=2的时候排名后移两位,以此类推。而词参数影响排名的效果只对第三页以及第三页以后的有效,也就是说前20名的排名不受词因素影响。此参数具体作用未知;
  • f:搜索判断,f=8用户自主搜索,f=3下拉框推荐,f=1相关搜索;
  • rsv_ers:出现的值为rsv_ers=xn0或rsv_ers=xn1,目前还不知道具体的作用。
  • rs_src:目前看到的都是rs_src=0,此参数与rsv_ers同时出现。

目前发现的参数就这么多,以后如有补充,后期会追加,关于Google搜索URL的分析,下篇日志中再发出。

Related posts:

  1. Google Analytics中organic和referral的区别
  2. 对卓越网的分析【SEO每周一站】
  3. JSON 轻量级的数据交换格式


相关 [百度搜索 url 参数] 推荐:

百度搜索URL参数解析

- - 标点符
百度的搜索URL存在着一定的规律和逻辑,下面的链接是我使用百度搜索“标点符”后得到的链接,下面就来一起分析下百度搜索结果URL的秘密. URL中的s?表示搜索,&符号起到参数分割的作用. wd:Keyword,查询的关键词,有时还会是 word,比如 www.hao123.com打开的链接就是word,wd后面的关键词使用gb2312进行编码,如果搜索词中出现空格则使用+号替换;.

MySQL中关于JDBC URL几个重要参数说明

- - ITeye博客
  常用的有两个,一个是gjt(Giant Java Tree)组织提供的mysql驱动,其JDBC Driver名称(JAVA类名)为:org.gjt.mm.mysql.Driver.   详情请参见网站:http://www.gjt.org/.   或在本网站下载mysql JDBC Driver(mm.jar).

URL的井号

- chenqj - 阮一峰的网络日志
一个显著变化,就是URL加入了"#!"符号. 在我印象中,这是主流网站第一次将"#"大规模用于直接与用户交互的关键URL中. 这表明井号(Hash)的作用正在被重新认识. 本文根据HttpWatch的文章,整理与井号有关的所有重要知识点. 其右面的字符,就是该位置的标识符. 就代表网页index.html的print位置.

将URL编码?

- - JavaScript - Web前端 - ITeye博客
    URL一般只能由字母、数字、$ - _. * ' ( ) 等一些字符构成. 那么当URL中需要用到汉字时怎么办,譬如有这样的URL: "www.test.com/search?name=张三",此时,只有通过将URL进行编码的方式进行传递了.     Javascript编/解码方法:.     如果对上面的URL(www.test.com/search?name=张三)进行编码的话.

理清URL编码

- winners - Thinking for Fun
关于URL编码,RFC1738做了如下的规定:. “Only alphanumerics [0-9a-zA-Z], the special characters “$-_.+!*’(),” [not including the quotes - ed], and reserved characters used for their reserved purposes may be used unencoded within a URL.”.

iOS UIWebView URL拦截

- - 移动开发 - ITeye博客
本文译者: candeladiao,原文: URL filtering for UIWebView on the iPhone. 说明:译者在做app开发时,因为页面的javascript文件比较大导致加载速度很慢,所以想把javascript文件打包在app里,当UIWebView需要加载该脚本时就从app本地读取,但UIWebView并不支持加载本地资源.

百度搜索评测三阶段

- - 互联网旁观者
作为搜索引擎,百度的目的是要让搜索结果的呈现次序更好. 这是设计任何算法之前必须考虑好的问题. “好”必须变成一个可以量化的指标. 来自百度网页搜索部的彭滔就跟我们介绍了他们的经验. 在百度搜索的发展历程中,“好”的评估方式大致被分为三个阶段. 彭滔取了一个query用作例子:“给我一片关于春天的作文,要长的,快点”.

URL最大长度问题

- - CSDN博客推荐文章
这几天为解决一个BUG头疼了一段时间,BUG现象如下:. 一个选择人员的选择控件,当选择多个人时(50多个的时候),返回没有错误现象,而再一次打开的时候就报404错误. 看到这个错误非常纳闷,无法下手,只能再一次看控件的代码,在详细看代码时,发现所有的参数都是经过URL传参的,赶紧百度一下URL参数的大小限制(从这个百度开始,我就进入一个误区:参数大小的限制).

URL中井号的作用

- - CSDN博客Web前端推荐文章
  URL中的井号(#)是比较常见的,它并不影响网址的指向,而是有众多功能和特点的. 下面就为大家介绍一些有关井号的故事.   1、页面中的某一个位置可以用井号在URL中指定.   井号作为比较长出现在URL的一种符号,通常也会代表这个页面中的某一个位置,比如:http://aoshu.juren.com/chzt/xiaoxueshijuan/index.html#nn1,此URL表示在这个页面中nn1的位置.