让数据站住脚-浅谈用户研究中的信度与效度(2)
作者:Little S 来源:CDC 时间:2010-09-10 13:14:00
三、问卷调查与分析中的信度与效度
为了提高工作效率,问卷调查往往采用网络调查的方法,信度效度问题出现的可能性就更大。
最近看到一些满意度调查是采用量表加结构方程模型(SEM)的方式。我们看看哪些地方可能会出现信度和效度的问题。
1. 理论模型支持
由于SEM进行的是验证性因子分析,是检验而不是探索新的模型,因此,整个因果关系的假设必须有强有力的理论支持和严密的逻辑框架。包括模型中变量关系的假定、指标的选取、甚至测度项的表达方式等。如果最终输出的模型和理论模型结构不符,那么该模型是没有任何说服力的。比如用ACSI模型作为满意度的理论模型时,是否真的按照感知质量、感知价值、顾客期望这几个层面去设计问卷?
2. 保证份量
普通抽样调查中原则上是越多越好,但遇到目标用户较少的情况,只要保证一定的条件就ok的,样本量受到置信区间、抽样误差范围的影响,可以用公式算出最小样本量。
但对于结构方程模型大样本是必须的,SEM中涉及的变量众多,变量间的关系很复杂交错,小样本量会导致模型不稳定,收敛失败进而影响模型中参数。朱远程等[1]在文献中指出,当样本低于100时,几乎所有的结构方程模型分析都是不稳定的,大于200以上的样本,才称得上一个中型样本。若要得到稳定的结构方程模型结构,低于200的样本数量是不鼓励的。有些学者将最低样本量与模型变量结合在一起,建议样本数至少应为变量的十倍,这一规则经常被引用。模型中变量越多,对大样本的要求就越高。
3. 变量需遵循原则
a. SEM模型中各变量的函数关系要是线性的,否则是不能用回归计算路径系数的。
b. 在使用最大似然估计法时,变量一定要是多元正态分布的,这就要求指标要呈正态分布,否则就要对指标进行正态处理才行。
c. 变量间的多重共线性程度要低,否则路径系数会有很大误差。
d. SEM建立的过程中会不断的修正才能得到比较完美的模型,比如因子分析时,若发现某一测度项对应的因子载荷过小,就会人为的将该测度项删除,但是若模型建立之后,一些变量对应了4~5个测度项,一些变量只剩下1~2个测度项,那么我们就需要思考只有两个测度项的变量是否被完全解释,这仅有的两个测度项就全面真实的反映该变量么?如果是这样,就算KMO、Bartlett、因子载荷都通过了,效度也是难以保证的。所以问卷前期需要反复的预调研,不断的对问题进行修正,而不是随意的人为删除。我学生时代对某电子商务网站满意度进行调查时,就犯了类似的错误,模型中的“互动性”片段,互动性由四个变量衡量,其中“双向沟通性”一开始设计的时候由5个测度项支持,但是因子分析检验通不过,就直接将因子载荷比较小的客服、论坛、SNS三者去掉了,最后虽然在数据上通过了信度效度检验,但是只有IM、留言板这两个测度项支持是绝对不能解释“双向沟通性”的。