学校增值的一致性与稳定性-基于多水平追踪数据的实证研究(3)
(三)研究问题的分析方法
本文聚焦于增值的一致性和稳定性,因此是对计量模型中对增值估计后的二次分析。本文拟用两个指标来分析。第一,斯皮尔曼等级相关系数(Spearman'srho)。由于学校增值在用于学校问责和家长择校时,利益相关者所关注的是各个学校增值的排名情况,所以我们用等级相关系数而非皮尔逊线性相关系数来衡量学校增值的一致性与稳定性。例如,如果所有学校语文的增值排名与数学的增值排名相关程度很高,那说明增值的一致性在这两个科目之间较高。第二,评分一致性系数(Cohen'skappa)。从统计意义来说,增值分析只将学校分为三类:显著高于平均值(即置信区间底端大于0)、与平均值无显著差异(置信区间与0重合)、显著低于平均值(置信区间顶端小于0)。在考察增值的一致性和稳定性时,相当于三个评分者(三个科目或三年)将所有学校归人这三个类别中。如果不同学校在三年内始终处于某一个类别,那么可以认定增值的稳定性较高。
三、研究发现
(一)模型参数估计
本部分给出总分增值模型的参数估计结果(见表2)。在控制其他变量时,学生个体的初始学习能力(人学总分)每增加一个标准差,学生中考总分能增加0.929个标准差。这表明学生个体的初始学习能力是学习结果的最佳预测变量。和女生相比,男生即使在人学总分上相同,其学业进步程度仍较低。同一届内的学生年龄越大(以月份计),成绩越低。进城务工子女的学习进步幅度要高于非农民工子女学生,但这种差异没有统计学意义。学生个体的社会经济地位在控制其他变量时,对学生学习结果仍有正的影响。家庭文化资源对学生成绩有正的影响,但该影响不显著。家庭财富则与学生成绩有负的关系。从学校层面看,校均人学成绩对学生个体的学习结果有负的影响,但这种影响的绝对程度要低于学生个体初始学习能力。校均社会经济地位的影响则正好相反,这也说明家庭背景因素的同伴效应要大于个体效应。
此外,对学生中考总分的零模型中随机效应部分分析得知,其组内相关系数(ICC)为0.20。这表示,学生中考总分中有20%的成绩差异位于学校水平上,且这种差异具有统计学意义,表示多水平模型在此具有适用性。在增值模型中,学生层次残差变异降低幅度非常明显,根据朗登布施和布瑞克(Raudenbush&Bryk)所提供的公式[U],上述变量的纳人能解释学生层次上77.6%的成绩差异。
高于平均水平的学校,最高端小于0的是增值显著低于平均水平的学校,其余学校的增值与平均水平无显著差异。从图中可以直观地发现,超过一半的学校在统计上与平均水平无显著差异。ID为18的学校在三科增值中均显著高于平均水平,而ID为2的学校则在三科中均低于平均水平。
(三)增值的跨年度稳定性估计增值的跨年度稳定性需要对每个年份的学校总分增值进行单独估算。例如,要估计第二年的学校增值,就需要以测试2成绩为学习基础变量,以测试3成绩为学习结果变量。其他自变量的选择仍然与前述模型一致。模型的参数估计部分从略。从表4中可以看出,学校增值在各个年度之间相关性极低,有时甚至为负值。学校增值排名和类别在各年间完全无规律可循k值和K值不能显著区分于0)。这表明学校的增值在各个年度之间变异极大,缺乏稳定性。
本文主要分析了学校增值在各学科之间的一致性以及在各年之间的稳定性。研究发现,学校增值在不同学科间一致性程度较低;基于同一届学生计算的学校增值在不同年份中缺乏稳定性。
本文中学校增值跨学科一致性较低的发现与国外有关研究的结论是比较一致的。如托马斯等学者的研究就表明,英国中学的增值效能在不同科目间不大一致,各科增值的相关系数仅在0.20到0.58之间。[12]这表明部门效应(departmenteffects)在中国学校中同样存在。由于不同学科的学习对于学生的要求是不同的,即使这些学生都同处一所学校,他们取得的进步在各科目之间也不一定相同;同时,学校内部不同部门(教研组)的效能受到这个"亚组织"内部的领导、结构和氛围的影响,导致了同一学校不同科目间学生进步的差异。从政策涵义上来说,增值的跨学科不一致性表明了评价学校效能不能仅依赖于某一种标准,因为一种标准可能只强调了学校教育的某一个特定方面。同时,基于学生各科总分计算的增值可能会掩盖校内各个学科教师效能的差异。如果以学校整体的增值来实施教育问责或绩效评价,好的结果是信息反馈到学校后能让教师反思来改进各科教学;不好的结果是可能会引起部分学科教师的"搭便车"行为。因为一所学校的增值可能仅仅是由部分学科的教师所贡献的,其他学科的教师即使不努力,也不一定能从总分增值指标中反映出来。
本文中有关学校增值跨年稳定性较低的结论,目前还很少有实证研究供佐证。国外的相关研究主要关注"跨届稳定性",普遍结论是增值的稳定性不足。增值跨年相关程度的影响因素有很多,如学校规模的大小、增值模型的类型、模型中情境变量的个数,等等。学校增值的跨年变异可能表示学校效能的真正改变,也有可能是受考试测量误差的影响,甚至有可能是向均数回归(regressiontothemean)所引起。该研究结论的政策含义在于不能仅根据某一个时间段(如一年)的增值来评价学校效能。在学校增值被运用于具有高利害性质的学校问责体系中时,仅利用年度的增值难以让学校和教师信服。这一问题是有先例的,比如范德格里夫特(VandeGrift)的研究发现,荷兰教育督导处在1997年实施单年增值评价就引起诸多学校的抱怨,因为学校增值的波动幅度太大。[13]-种可行的办法是计算至少三年的增值,再计算平均值,但这与增值评价的另一个目的产生了矛盾,民口及时将增值反馈给学校以改进教学。根据笔者的调研,那些开展过增值评价试点的学校希望能在考试结束后立即能获得增值的排名。这也表明增值的运用方式与其服务的目标之间存在一定的矛盾。
期刊库(http://www.zgqkk.com),是一个专门从事期刊推广、投稿辅导的网站。
本站提供如何投稿辅导,寻求投稿辅导合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。
【免责声明】本文仅代表作者本人观点,与投稿辅导_期刊发表_中国期刊库专业期刊网站无关。投稿辅导_期刊发表_中国期刊库专业期刊网站站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。
投稿辅导服务咨询与期刊合作加盟
陆老师联系QQ:
蒋老师联系QQ:
刘老师联系QQ:
联系电话:18015016272
17327192284
投稿辅导投稿邮箱:zgqkk365@126.com
期刊推荐
- 《校园英语》旬刊 省级 教育类学术期刊
- 《吉林教育》旬刊 省级 教育类学术期刊
- 《文教资料》 旬刊 省级
- 《科技风》半月刊 省级 科技类优秀期刊
- 《价值工程》旬刊 国家级 科技统计源期刊
- 《中国实验方剂学杂志》 半月刊 北大核心
- 《电影评介》半月刊 14版北大核心
- 《社科纵横》季刊 社科类优秀期刊
- 《求索》月刊 14版北大核心期刊
- 《中华建设》月刊 国家级 建设类优秀期刊
- 《继续教育研究》月刊 北大核心期刊
- 《网络空间安全》(信息安全与技术)月刊 国
- 《新闻传播》月刊 省级 新闻类优秀期刊
- 《财会月刊》旬刊 14版北大核心
- 《体育文化导刊》月刊 体育类双核心期刊
- 《机械研究与应用》双月刊 省级 机械应用类
- 《公路交通科技》 月刊 北大核心
- 《教学与管理》旬刊 北大核心
- 《新课程研究》旬刊 省级 教育类优秀学术期
- 《中国医药指南》 旬刊 国家级
- 《高教论坛》 月刊 省级
- 《课程教育研究》 旬刊 国家级
- 《语文建设》 旬刊 14版北大核心
- 《教育发展研究》 半月刊 双核心
- 《学术界》 月刊 双核心


