教育测验的信度和效度分析研究

[复制链接]
查看: 72|回复: 0

2万

主题

3万

帖子

7万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
76894
发表于 2025-5-21 15:43:14 | 显示全部楼层 |阅读模式
目:


雅宝题库答案
****此区域为收费内容****    需支付 1 知识币后可查看,1币=0.01元查看答案


雅宝题库解析:
教育测验是教育管理中使用的重要工具,是教育研究中收集数据的主要方法。与物理上的测量不同,教育和心理的测量对象是人类的精神活动。内隐性的特点决定了教育和心理测量不能达到物理测量的精确程度,其不具备等距离的测量刻度,也不存在绝对意义上的测量“零点”。因此,教育和心理测量的结果只能被看作是顺序数据,而无法形成物理测量结果所达到的等距或等比数据。但教育和心理测量学发展的早期,适合于顺序数据的计分与统计方法尚不存在,顺序数据只能被假定为等距数据进行分析,并在这个基础上形成了经典测验理论中信度和效度的估计方法。然而,传统的信度和效度分析方法忽视了数据间不等距的事实,其统计结果在一定程度上包含系统偏差;特别是在样本分布非正态时,误差会较大。本研究中,通过教育测验所获得的数据被作为顺序数据处理,并以之为基础构建出一套新的信度和效度分析方法。具体的研究工作包括以下几方面:(一)目前常用的皮尔逊相关系数是为等距数据或连续数据设计的,施用其于顺序数据会产生不可忽略的误差,因此,处理顺序数据间的关系需要使用多分格相关系数。多分格相关系数的模型假设、估计方法和发展历程在本文中被总结,一组计算机仿真实验被用于验证多分格相关系数的优势。仿真结果证明,多分格相关系数在处理顺序数据时表现稳定,数据的偏态分布对其精确程度影响有限。(二)构建基于顺序量表的信度估计方法使用了多分格相关系数和结构方程模型技术,三种下界信度(内部一致性系数α、组合信度系数ρ、最大下界信度glb)的估计被讨论,三个仿真实验表明基于等距数据假设的信度估计有可能大大低估测验的真实信度,而基于多分格相关的方法虽然有可能高估信度,却更接近于真实值。两种估计方法所获结果的差距表现出测验选项设计所带来误差的大小。(三)基于顺序量表的方法最先出现在对测验构想效度的分析上,也积累了一定的研究成果。本文通过对已有研究进行分析,发现极大似然法(ML)和对角线加权最小二乘法(DWLS)是顺序数据分析中比较可信的估计方法;同时,传统的卡方检验可能产生过高的模型拒绝率,不适宜作为判断模型拟合程度的指标。使用结构方程模型分析顺序数据时,将比拟合等距数据时发生更多的估计过程不收敛或估计结果不恰当现象。本研究中提出了一种针对极大似然估计的改进算法(RidgeML),将引发错误的非正定矩阵转换为正定方阵。仿真研究也证实,该改进算法大大提高了模型的正确收敛率、缩减了估计时间,同时没有影响估计值的无偏性和标准误。这也是本文中一个具有创新意义的研究成果。(四)一个典型的教育考试(语言类测验)和一个典型的李科特量表(中国大学生适应量表)被分别施用基于等距量表和顺序量表的信度和效度方法分析。对这个两个实测样本的分析表明,当测验的选项数目较少、数据呈偏态分布的时候,基于等距量表和顺序量表估计方法的结果间会有比较明显的差距,基于顺序量表的测验信度和效度分析更值得被推荐使用。本研究所讨论的基于顺序量表和多分格相关系数的分析,属于目前国际心理和教育测量研究的前沿题目,在国内更是具有填补空白的意义。总的来说,这篇博士论文在理论和实践两方面都具有积极意义,它的研究成果丰富和充实了顺序数据视角下的测验分析技术,为测验的信度和效度分析提供了新的思路和方法,有助于促进教育和心理测验分析的进一步科学化,并将有利于标准化和多元评价教育测验的研制。有理由相信,在这一方法基础上开发出的高质量教育测验最终会推进我国教育质量的不断提升。





上一篇:基于开源代码的通用查询报表构件的设计与实现
下一篇:渔船船位监测中心台系统的设计与实现
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图