卖家内在因素对问卷调研有效响应的影响研究

标签: 用户研究 问卷调研;定量研究;影响因素; 随机抽样;方差分析;因子分析;回归分析 | 发表时间:2012-06-30 21:12 | 作者:渡劫
出处:http://ued.taobao.com/blog

Q2季度淘宝网用户研究部门、阿里巴巴集团研究部与北京大学社会学系联合发起了“谁在开网店”的研究,近期北大项目组已经产出了研究报告,本研究采用了科学严谨的抽样方法进行研究。作为项目的延展,笔者对整个调研的样本回收情况做了较为深入的研究,探讨卖家内在因素对网络问卷调研有效响应率的影响。

项目抽样与投放规则说明

本项目的抽样分为两阶段:第一阶段,以“地级市”为初级抽样单位。参考所有个体店家的地域分布,按照所属地级市划分为不同群体,对于个体店家数量较小的城市采用链接到周边邻近城市的方法。第二阶段,在地市级样本中,再抽取个体店家。在每个抽中的地级市内,以主营类目为分层变量,以卖家规模为排序变量,采用等距抽样的方法抽取个体店家6万家,进行投放。(抽样方案详见研究报告《谁在开网店?——淘宝个体店家的社会与执业特征研究》)

本项目的问卷共进行了7次投放,前6次分别采用了Email(3次)、旺旺浮起(2次)、站内信(1次)等方式交叉进行,最后一次采用了电话外呼的方式。为了研究常规网络投放前提下,问卷有效响应的影响因素;同时,本项目的电话外呼时间距离最后一次常规网络投放已经10天之久,网络投放的效果已经衰减殆尽。所以本篇文章将数据回收截止时间定为电话外呼前,以前6次投放的数据回收情况作为分析的基础。

 

本篇文章主要分析未打开问卷、打开问卷未完整填答、打开问卷完整填答的卖家之间存在哪些差异,从而探讨卖家的哪些内在因素会对网络调研问卷的有效响应有较大影响。需要指出的是,本文只是从样本的内在因素来研究对有效响应的影响,并未涉及到其他外在因素对有效响应的影响,比如淘宝是否有活动、问卷的标题是否吸引人、填答奖励是否吸引人等。

分析数据的前期处理

首先,从后台匹配了6万投放样本更为详尽的经营数据,包括商品信息(在线商品总数、商品均价、主营类目商品占比等)、旺旺响应信息、交易信息(日均交易、成交率、客单价等)、浏览信息(日均PV、UV、IPV、转化率等)、评价信息(好评率、动态评分、店铺评分等)、营销推广状况(淘客、直通车、VIP、促销工具使用情况等)、消保情况(消保范围数、是否七天无理由退换货等)、处罚情况(投诉率、维权率、退款率、处罚扣分率等);

由于本项目的投放周期比较长,在投放期间已经有部分样本出现违规关店和炒作嫌疑,因此,匹配后台数据后,删除了状态不正常的卖家,最终分析样本为57618个。其中未打开问卷的样本56213个、打开问卷未完整填答的样本187个、打开问卷完整填答的样本1218个。

未打开问卷的样本占了分析样本的97.6%,占绝对优势,做群体间差异分析的时候会影响分析结果,需要对其进行拆分,以便更真实地反映差异。所以,将未打开问卷的样本按照本项目第二阶段的抽样原则,将其等分成30组,每组1873或1874个样本,从中抽取4个组,分别与打开问卷未完整填答样本、打开问卷完整填答样本进行差异分析,确保未打开问卷样本的分析量级与打开问卷完整填答的样本量近似。

需要说明的是,未打开问卷的样本等分成30组,最理想状态是组间不能在分析变量上存在差异,因此对30组进行方差分析并两两检验,结果如下:


*卖家规模指按日均支付宝成交额的0%,20%,80%,99%,100%划分成小、中、大、超大卖家4种规模;
*卖家层级指将每个规模按照成交额最小20%,中间70%,和最大10%划分出差、中、好3个层级卖家。

经分析可知,30组样本在分析变量上不存在显著差异,当两两检验时,发现个别组与其他组存在一定程度的差异。综合来看,第5组、18组、19组、26组代表总体更为合适,因为他们与其他组不存在较大差异。

群体间的方差分析检验

将未打开问卷的样本第5组、18组、19组、26组重新命名为第1、2、3、4群,打开问卷未完整填答的样本为第5群,打开问卷完整填答的样本为第6群。对这六群样本做方差分析,并两两检验,考察他们在分析变量上的差异,结果如下:

从数据结果来看,

  • 卖家规模越大、卖家层级越高,打开问卷的积极性越大,且完整填答的可能越大;
  • 商品发往的省份越多的卖家,打开问卷的积极性越大;
  • 旺旺响应率越高的卖家,打开问卷的积极性越大;
  • 有交易的卖家,打开问卷的积极性越大;
  • 人均ipv越高的卖家,打开问卷的积极性越大;
  • DSR动态评分越高的卖家,打开问卷的积极性越大;
  • 店铺评价得分越高的卖家,打开问卷的积极性越大;
  • 旺铺卖家,打开问卷的积极性越大;
  • 使用满就减、满就包邮、限时打折、信用卡、货到付款、营销工具的卖家,打开问卷的积极性越大;
  • 设置淘客的卖家,打开问卷的积极性越大,且完整填答的可能性越大;
  • 参加消保、消保范围广、参加七天退换货的卖家,打开问卷的积极性越大。

综合而言,经营状况越好、经营思路越活跃、越诚信经营、越受买家欢迎的卖家,打开问卷的积极性越高。

分析变量的回归分析

从单变量方差分析的结果并不能看出多个变量共同作用下,是如何影响有效响应的,所以将未打开问卷的4组样本分别跟打开问卷未完整填答的样本、打开问卷完整填答的样本生成四个因变量,0代表未打开、1代表打开未完整填答、2代表打开完整填答,分析变量作为自变量,分别作逐步回归分析,得到结果如下:

从回归的结果来看,自变量并不稳定,其中旺旺响应率、店铺服务水平得分、第一主营二级类目商品占比、卖家星级、是否设置淘客、是否淘宝VIP、是否满就免邮、是否信用卡等变量始终影响着有效响应;

各分析变量综合作用下,旺旺响应率和店铺服务水平得分对样本有效响应的影响最大,旺旺响应越快、店铺服务水平得分越高,卖家有效响应的可能性越大;

同时,第一主营二级类目商品占比越高、卖家星级越高,卖家有效响应的可能性越小;这与单因素方差分析得到的结论不同,也正说明了,分析变量综合作用下,个别变量的影响会发生变化,所以单个变量逐个分析影响未必适合。

另外,还有22个分析变量分别在不同组中影响着有效响应,但影响不稳定。需要转换分析思路,对分析变量做因子分析,将其降维再进行分析。

分析变量的因子分析

对分析变量进行因子分析,经多次尝试,去掉被解释比例较低的变量,最终保留了51个变量,萃取出15个因子:服务能力、销售能力、经营意识、客单价、成交率、浏览转化率、消保意识、满就送、纠纷率、维权率、购买转化率、遵守规则、旺旺响应、退款率、主营占比,最后一个因子只有一个变量,未作删除处理,主要考虑这个变量在前述研究中,是非常重要的影响因素。最终结果如下:

因子分析的结果,不论从统计意义,还是从业务角度都能得到较好的解释,可以继续进行后续研究。

公因子的回归分析

以公因子为自变量,与上文提到的四个因变量进行逐步回归分析,所得结果如下:

从回归的结果来看,公因子的影响稳定性较强,其中销售能力、成交率、浏览转化率、纠纷率、维权率、购买转化率、退款率的影响较弱;

  • 服务能力的影响最大,服务能力越强,卖家有效响应的可能性越大;
  • 卖家越遵守规则,有效响应的可能性越小;
  • 卖家主营类目的商品占总商品的比例越高,有效响应的可能性越小;
  • 卖家的消保意识越强,有效响应的可能性越大;
  • 卖家的经营意识越强,有效响应的可能性越大;
  • 卖家旺旺响应越快速,有效响应的可能性越大;
  • 卖家使用满就送的积极性越高,有效响应的可能性越大;
  • 卖家的客单价越高,有效响应的可能性越小;

 

综上所诉,卖家的服务意识、经营意识、消保意识等对网络问卷的有效响应有积极影响,这类卖家在淘宝属于优质卖家,卖家问卷调研更能够触及到这部分卖家,研究结果更有价值。

 

小结:

1、本研究只涉及到了卖家的内在因素,并未考察外部因素,投放问卷时,仍然需要考虑外部因素,以便得到更高的有效响应率;

2、在多变量共同作用下,群体间在单个变量上的差异,可能会发生变化,此时需要尝试不同的分析方法考察差异;

3、整篇文章的分析思路如下:拆分大样本的群,以便能与小样本的群做差异性分析——通过方差分析,分析群间在分析变量上的差异——通过回归分析,考察分析变量在综合作用下的影响——当分析变量较多时,直接做回归不稳定,需要对分析变量做因子分析——通过回归分析,考察各公因子综合作用下的影响;

4、本研究后续可以通过结构方程式,来研究各类因素的影响。

相关 [问卷 有效 研究] 推荐:

卖家内在因素对问卷调研有效响应的影响研究

- - Taobao UED Team
Q2季度淘宝网用户研究部门、阿里巴巴集团研究部与北京大学社会学系联合发起了“谁在开网店”的研究,近期北大项目组已经产出了研究报告,本研究采用了科学严谨的抽样方法进行研究. 作为项目的延展,笔者对整个调研的样本回收情况做了较为深入的研究,探讨卖家内在因素对网络问卷调研有效响应率的影响. 本项目的抽样分为两阶段:第一阶段,以“地级市”为初级抽样单位.

用户研究

- - 技术改变世界 创新驱动中国 - 《程序员》官网
介绍自己的设计流程时,设计师通常都说它是“以人为中心”或是“以用户为中心”的. 笼统地讲,这表示设计师经常要考虑所设计产品的潜在用户,尽力为这些人创造出最好的产品. 这个问题看似简单,实际上却不好回答. 好的设计通常都是从用户研究着手的. 我们如何才能发现人们想要实现的目标. 虽然这样做有时会得到一些有用的信息,但一定要小心地评估人们给出的答案.

JVM研究

- - 开源软件 - ITeye博客
每天接客户的电话都是战战兢兢的,生怕再出什么幺蛾子了. 我想Java做的久一点的都有这样的经历,那这些问题的最终根结是在哪呢. JVM全称是Java Virtual Machine,Java虚拟机,也就是在计算机上再虚拟一个计算机,这和我们使用 VMWare不一样,那个虚拟的东西你是可以看到的,这个JVM你是看不到的,它存在内存中.

BigPipe学习研究

- maxiyun - 搜索技术博客-淘宝
技术背景 FaceBook页面加载技术. 试想这样一个场景,一个经常访问的网站,每次打开它的页面都要要花费6 秒;同时另外一个网站提供了相似的服务,但响应时间只需3 秒,那么你会如何选择呢. 数据表明,如果用户打开一个网站,等待3~4 秒还没有任何反应,他们会变得急躁,焦虑,抱怨,甚至关闭网页并且不再访问,这是非常糟糕的情况.

Mysql缓存研究

- - CSDN博客推荐文章
缓存机制简单的说就是缓存sql文本及查询结果,如果运行相同的sql,服务器直接从缓存中取到结果,而不需要再去解析和执行sql. 如果表更改了,那么使用这个表的所有缓存查询将不再有效,查询缓存值的相关条目被清空. 更改指的是表中任何数据或是结构的改变,包括INSERT、UPDATE、DELETE、TRUNCATE、ALTER TABLE、DROP TABLE或DROP DATABASE等,也包括那些映射到改变了的表的使用MERGE表的查询.

Web Service的研究

- - CSDN博客系统运维推荐文章
SOA和Web Service. 首先明白SOA和Web Service的关系:. * SOA面向服务架构,用于大型分布式系统的一个概念;. * Web Service是实现SOA的方式之一,不是所有的SOA都是基于Web service的;. * 但Webservice确实为最主流的SOA实现方式,有的人甚至把SOA等同于Webservice.

Phoronix: 2011 Linux Graphics 问卷调查

- L - LinuxTOY
Phoronix 现在每年都会举办 Linux Graphics 问卷调查(本站2010年报道),今年亦不例外. 本项调查试图通过了解 Linux用户的显卡、驱动以及需求状况,为开发者下一步的发展提供必要的参考信息. 该问卷调查的参与期从 8 月 18 日开始,截止在 9 月 20 日. 问卷由13个多项选择组成,用时少于5分钟,覆盖了与 Linux 图形显示相关的各个方面.

在线问卷调研实践心得

- - 新浪UED
今年负责的很多项目都用到了在线问卷. 今天,和大家分享一下我做在线调查的一些心得,侧重操作执行,具体包括适用需求、问卷投放、数据清洗、开放题整理以及使用报告模板. 问卷法既可用于定量研究,也可用于定性研究. 当然做定性研究时,和访谈可能不太相同. 我总结适宜的需求需符合以下特点:. 涉及过多的用户操作、需要深挖用户的需求不适于使用问卷.

问卷调查方法使用小结

- - 盒子UI
问卷调查(questionnaire)是用户研究或市场研究中非常常用的一种方法,这种方法可在短期内收集大量回复,而且借助网络传播调研成本也比较低,所以得到广泛的使用,但是似乎有些人认为问卷调查就是设计若干问题然后发给用户填写就行了,但其实越是简单的调查方法越是有需要注意的地方,这样才能真正发挥该方法的优势,下面就结合自己近期的项目实践对这种方法进行总结,意在总结流程,所以具体的题目此处不做呈现.

HTML5 & CSS3 研究文档

- Kings - 幸福收藏夹
已经说了好久,一直没把这个文件夹分享出来. 这是我去年第四季度里做的,里面有 11 一个文档. 包括 HTML5 中最主要的 JS API 文档,还有 CSS3 中两个比较难的属性. 主要还停留在纯 API 层面上的研究,没有深入到应用中去. 不过,当做工具来使用,和入门文档,还是不错的. 特别是其中的 HTML5 JS API 文档.