当问卷发布数据回收后,我们要如何对数据进行筛选清理,剔除无效问卷,保证样本数据更加有效可信呢?
选择题、排序题这类封闭题型的答案是有限制范围的,针对这类题型,在spss内使用频率统计功能,查看每个题目的总量、缺失值、异常值。
比如:性别只有1、2两个选项,出现其他选项则说明有问题。有个小技巧,在Excel中可以使用筛选功能,快速查看每个题目的结果是否有异常值。
还有些问卷,前后题目有逻辑关系,可以用这类题目做测谎题,筛选出前后矛盾的答案。比如前边用户选择了主要的出行方式是“自己开车”,后边却选择自己的年龄“小于18岁”,那么这类问卷可以视为不认真填答的删除。
如果技术支持,也可以通过后台数据和用户问卷中的数据做匹配,常用的是性别、年龄、常居地之类的数据,也可以问一些明确的行为数据,比如是否用地图买过火车票。
需要注意的是:
选择稳定的明确的数据来做校验题目,不要使用需要回忆的数据来校验,用户的记忆是模糊的有误差的,使用频率、使用年限,这些都不适合做校验,因为用户的记忆很可能与实际行为不完全相符。
移动端线上问卷调查可以收集用户行为数据、手机硬件数据等,这些都可以成为我们筛选数据的依据,最常用的是通过对用户的填写时间、重复提交、空题数量、逻辑错误等进行判断,可以过滤掉很大部分无效问卷。
有关线上问卷回收的数据,更多是用户使用产品的习惯、感受和评价等,与后台行为数据会有一定的差异,产品和研发的同学难免就会拿两个数据进行对比,可能还会对线上问卷数据产生一些疑问。
将两个数据配合使用更能相得益彰。调查前期可以抽取相关后台数据进行分析,了解用户对产品的使用行为和特点、功能或服务偏好等等,之后再与线上问卷数据进行对比和补充,如用户分布、硬件情况、功能使用等,并能为调查数据提供配额依据,让整个线上数据更有说服力。
除了之前我们说的,投放阶段选择合适的问卷渠道或精准推送,用来增加样本的代表性,通常在线上问卷回收后,为了让样本用户与产品目标用户更贴近,更好地代表用户的态度或评价,还可以对样本数据进行配额或加权处理。
一种方式是,从后台数据抽取某些维度进行分析,再对样本数据进行配额或确定权重,如用户地域分布、机型分布等;
另外还可以根据相对权威的行业报告数据或第三方调研数据,按照一些维度抽取样本数据。
或者上述两种方式结合,最终目的都是为了让问卷数据的说服力更强、更客观真实的了解产品用户。
END
发布者:调研工厂,转载请注明出处:https://baike.survey.work/84e7f268e8/