调查问卷的信度分析及其影响因素研究
摘 要:信度分析是综合评价调查问卷体系的稳定性和可靠性的有效方法,能有效反映问卷编制的科学性、合理性和有效性,可结合预调查及时对问卷进行增删修订和优化调整。本文综述了调查问卷设计中常用的信度分析方法及其使用范畴,可为进一步修订问卷提供统计理论依据。
关键词:问卷设计;信度检验;综合评价
中图分类号:G726 文献标识码:A
问卷调查是教育培训评估得以广泛应用的重要环节之一,是调查研究中定量统计的重要途径和有效工具。问卷质量的高低是各项评价指标的具体反映,因此调查问卷首先要接受小规模抽样测试,通过调查问卷的信度分析,检查问卷设计的结构、原则、内容等能否被受试者正确理解,及时增删或调整题目。
一、信度分析
信度是指测验的实得值与真值的相差程度。信度越高,反映多次测量结果间的一致性越大,可以通过评价数据离散趋势的指标来反映信度的优良。
信度分析是针对某一特定类型下问卷测量结果的稳定性和一致性而言,而非广泛一般的一致性,其大小用信度系数来表示,范围在0~1之间;信度系数越大,测量结果的可信程度越大。信度系数是衡量信度高低的统计指标,而不涉及结果是否正确,但研究对象的样本含量必须超过40人。
信度系数主要包括稳定系数(跨时间的一致性)、等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。按照评价对象的不同,信度可分成内在信度和外在信度。内在信度是衡量问卷中某一组问题所测量的是否同一概念、是否具有较高的内在一致性;而外在信度是衡量同一问卷在不同时间下对同一被调查者重复测量后评价结果的一致性程度。
二、信度的评价方法
(一) 同质信度
同质性问卷调查考查的是被调查者的同一性,问卷试题的几个部分间高度相关、同等重要。Cronbach’sα系数是目前最常用的内在信度系数和同质信度系数,通过各调查项目相关系数的均值测量、关注问卷中每一个题目得分间的内在一致性,其计算公式为:
而调查问卷中一般是嵌套多个功能模块,即当一份调查问卷包含有不同子问卷时,应分别计算每个子问卷的内部一致性可信度;可将整体问卷分成n个维度,计算整个问卷及其各维度的内部一致性信度系数,确保相应的信度系数均在0.80以上。当信度系数高于0.7时,表明问卷应进行较大的修改;低于0.7时,则应该弃之。
此外,依据量化得到的各项目间的相关系数矩阵和相关系数的均值,判断每一项内容和问卷整体的关联程度,实现对问卷的修订和改良。譬如,当出现负相关时,说明这些项目与其他项目间相悖,应考虑修改或删除部分内容;当修改剔除某项目后,问卷整体的信度系数的变化呈现下降趋势时,该题目应予以保留。
(二) 分半信度
分半信度,又称“折半信度”,是将同一问卷的全部调查问题按照奇偶或前后尽可能分成相等的两半,分别依照Cronbach’s α系数计算二者得分。当问卷中设置的题目越多时,分半信度愈高,但随机分半可能会使分半信度不具有稳定性。分半信度的计算公式为:
分半信度使用的关键是如何尽可能避免顺序效应,将调查问卷分成有效的对等两半。不同的拆半会产生不同的信度系数估计值,当高相关性的题目分在一组时,分半系数将接近于其最小值。常用的分半办法有三种:一是完全随机分配,简便、易行但并不客观;二是将整体问卷的奇偶题目分半,该法在问卷调查题目较多的时候才适用;三是将整个问卷分成若干块(每块的内容成偶数),再将各内容块的题目奇偶分半并各自组成子问卷,该法应用最为广泛。此外,若调查问卷中含有反向题项,应先逆向处理反意题项的得分,保证各题项的得分方向一致后,再考虑拆半。
(三) 重测信度
重测信度,又称“稳定性信度”,是最常用的外在信度,指的是不同的时间内,采用同一调查问卷前后两次施测同一组被试者得分的一致性程度,以两次相关系数的积差法表现的信度公式为:
其中,ICC平均内部一致性系数,、和
分别为被调查者之间的方差、处理组(即重复次数间)的方差和误差的方差,m为重复次数,n为被调查对象的数量。国际上,一般认为ICC在0.4以上可接受,大于0.6则表示有满意的稳定性,0.8以上则表示有很好的稳定性。✡
重测信度的特点要求同一份问卷在允许重测的情况下施测两次时须满足三个条件:一是所测量的心理特性须稳定。二是遗忘和练习的效果基本上相互抵消。三是两次施测的间隔时期忌过长,视具体的调查内容而定,一般间隔以2~4周为宜。重测信度较大时,说明前后两次测量结果较一致,调查问卷较稳定。但因被测对象对问卷的熟悉会产生“记忆效应”,易产生偏倚,并不一定能真实反映研究对象的特征。
(四) 复本信度
复本信度法,又称“等值性效度”,主要是让调查者同一时间或先后填答两份问卷,应确保问卷在形式、内容、难度和题项的提问方向尽可能保持高度一致,仅在表达方式上略有区别,两次结果的相关系数即为复本信度。在同一时间内或间隔一段时间后,复本调查时实测所得的信度系数分别称为等值系数、稳定和等值系数。复本信度愈高,问卷调查结果的一致性越强。整个调查问卷的信度的计算公式为: 其中, 为两部分之间的相关系数。
复本信度最接近于平行测试,但实际问卷调查中很难达到真正可相互替代的问卷设计,故采用的较少。
(五) 评分信度
若问卷是由调查员给被测试者打分或评定时,此时信度的可靠性取决于评分者,即评ღ分信度,可分为评分者间信度和评分内信度两类。评分者间信度是指由不同的调查员采用相同调查问卷测量评定时其得分的一致性情况,随机性抽取对问题的评分以及调查员的打分情况,常用组内相关系数来评价。而评分内信度是指度量检验同一调查者在不同时间和地点等不同场合时的一致性。
当评分者人数超过三人,且为等级评分时,可用下列公式计算其相关系数:
若多个调查员间的信度较好,说明调查问卷制定的客观、明确;反之,说明指标的操作概念模糊,易歧义。因此,调查前应对调查员集中培训,现场负责核查填写的问卷,即时发现问题并反馈,查缺补漏。
(六) 信度分析方法的对比
三、影响信度的因素
(一) 问答级数的设计
针对连续性变量应答时,多采用连续区间来标度;当信度区间在0.4♚~0.9之间时,常会随着拟定作答级数的减少而降低。较实际信度,“十级式”至“七级式”量表的信度损失极少,而“五级式”和“两级式”量表的信度损失分别为12%和35%。另有研究表表明,采用“四级式”、“五级式”、“七级式”和视觉模拟量表调查所获的信度还较为相似。因此,题目设计时,应尽可能多量▲化连续区间的级数,后续统计可根据需要整合区间的级数。
(二) 问卷题目的数量
适当增加问卷题目的数量可提高问卷的信度,如Cronbach’s α系数与调查问卷设计的题目数量十分相关,α会随着问卷设计的题目数量的增加(或减少)而升高(或降低)。新增的题目和之前应具有同等代表性,且新增数量须适度,否则被调查者会因疲劳致使误差增大。当问卷题目☭数量增至K倍时,信度的计算公式为:
(三) 题目的难度分布
调查问卷中的各个题目均应具有较好的代表性,忌应答的猜测性。其次,要尽量调整问卷题目或应答方式,控制难度在中等水平,使得区间落在较低或较高两端的比例要少,尽可能地接近正态分布,可有效提高信度。
(四) 问卷调查的偏倚
调查问卷属于回顾性调查,调查结果上会存在一定的信息偏倚。问卷信度很大程度上取决于被调查者对问卷工具的理解、作答、调查获知的信息提取程度。信度主要受随机因素的影响,但偏倚不具有方向性。
信息偏倚是指在收集资料的过程中,由于比较组间收集资料的方式不可比,导致研究结果与真实结果之间的系统差异;就被调查对象而言,信息偏倚主要涉及到无应答偏倚、回忆偏倚、说谎偏倚等。由于调查问卷填写时主观成分很大,回忆偏倚很难完全避免。回忆偏倚不同于单纯的记忆不准确;当被调查者回忆普遍较差时,回忆偏倚的可能性较大。回忆偏倚的产生主要是取决于调查时间至事件实际发生之间的时间差,以及调查员的提问方式和调查技术等。
(五) 调查的样本容量
在其他条件相同的情况下,样本容量越大,评估获得的信度越高。样本容量是随机从总体中抽取样本,推断总体数量特征的一种非全面统计,直接关系到抽样估计的精确度及调查成本和效益。当样本容量过大时,调查的工作量显得过大;但样本容量偏小时又易发生样本偏差,导致信度系数过低或过高估计。
实际调查中,不回复偏差是问卷调查中的一种客观存在,分为完全无应答和部分无应答两种。不回复的问卷会造成调查问卷的样本容量缩减,抽样误差的增大;而因无回答带来估计的偏误并不会随后续样本容量的增大而减少;一般要求无应答率应低于5%。控制无回答偏倚,应采用调整访问的策略、消除被调查者心理和顾虑、修正问卷设计以及加强调查员培训等方式。不回复的问卷会分别从回复率和不回复偏差方面影响调查结果的代表性,可通过不回复者和回复者间组间进行检验评价不回复偏差,深入寻找被调查者不回复的原因。
四、结语
高质量的调查问卷是问卷调查成功的关键,应采用客观的信度分析方法反复研究、修正问卷;因不同信度检验方法的适用范围、侧重均有所不同,应多种方法相互佐证,忌以偏概全反映整个调查问卷的可靠度和有效性,应依据问卷种类和目的选择合适的信度检验方法评价。问卷初稿须通过预调查数据的信度反馈调查工具设计的合理性,采用局部修订和调整优化问卷,直至通过信度检验,以满足统计分析的要求和为后续的效度检验提供保证。
参考文献
[2]马文军,潘波.问卷的信度和效度以及如何用SAS软件分析[J].中国卫生统计,2000,(6).
[3]倪宗瓒.医学统计学[M].北京:高等教育出版社,2003.
[9]曾五一,黄炳艺.调查问卷的可信度和有效度分析[J].统计与信息论坛,2005,(6).