摘要:为了考察学校干预对中职生心理发展的影响,本研究采用整群随机抽样的方式,在广东、四川、贵 州三个地区内部中职学校数的 2%随机抽取学校,抽取了45 所中等职业学校 51949 名中职生(男生占59.1%), 年龄 13-19 岁(M±SD=16.85 ± 0.78)完成了第一次测试(T1),一年后有 43588 名中职生完成了第二测试 (T2)。在 45 所学校中,抽取 30 所学校作为干预组(干预组学校每年资助经费 30 万,按照要求完成奖学 金设置、相关实践活动等),19 所学校作为对照组。按照对照组(n=16180)完全随机取 50%样本(n=8090) 与干预组(n=47993 )进行倾 向得分 匹配(Propensity Score Matching ,PSM ) ,结合双重差分 法 (Difference-In-Difference Model,DID)构建了干预组(n=8090)与对照组(n=8090),并建立 DID 模 型。调查内容包括背景变量(年龄、性别、户口、是否留守经历、是否单亲家庭)家庭 SES(家庭年收入、 父母受教育水平)、学业成就、成长思维和自我肯定等心理发展特征变量。结果显示:(1)学校干预能够 显著提升中职生成长思维;(2)学校干预能够显著改善中职生心理发展特征,如对自我及心理健康、个体 感知的学校心理环境、学习相关变量都有不同程度的影响;(3)学校干预能够显著提高中职生推理能力、 注意能力以及阅读能力。这说明,学校投入是影响中职生心理适应的重要外部因素,增加学校投入能带来 中职生心理适应水平的显著提高。
关键词:学校干预,心理发展,家庭社会经济地位,学校投入
1 引言
学校环境因素和个体自身主体因素是影响学生学业成就的两大重要因素,关于主体因 素,特别是心理发展特征的相关因素前面研究已经做了详细论述,并且了解到自身的认知能 力对学业成就有着主要的影响,而认知能力受到成长思维、自我肯定的影响,并且起着不同 的作用。当然,这种作用还需要进一步运用干预实验来验证。在基于个体的干预实验之前, 通过学校干预,考察学校因素对中职生学业成就的影响。
随机对照试验(randomized controlled trial, RCT) 是检验干预是否有效的黄金标准 (Chambless & Hollon, 1998; Rounsaville et al., 2001) 。事实上,大规模学校干预要做到完全随 机几乎是不可能,在实际操作中也没有办法让未进入实验组的学生不在干预学校进行生活学 习。因此,本研究对照组的选取是按照属地原则,找了若干规模、办学水平相近的学校进行 匹配。即使如此,也远远没有达到完全随机带来的协变量均衡或控制。所以,采用倾向得分 匹配(Propensity Score Matching ,PSM)的方法进行“事后随机化” ,控制人口学等协变量, 实现干预组与控制组的可比性。运用倾向得分匹配虽然提升了干预组与对照组可比性,构建 了一个未实施干预的反事实(counter factual)组作为参照系,即控制组(control group), 但没有解决时间效应的影响(ycontrol, after - ycontrol, before),所以,在数据分析时需要使用新的方 法——双重差分法(Fu, Dow, & Liu, 2007)。
双重差分法(Difference-In-Difference Model ,DID)是近些年在经济学领域兴起的新方 法,它解决了很多经济学研究中有关政策实施无法建立一个真实的“反事实”的困境,同时即
通过 PSM 构建一个虚拟“反事实” ,往往跟实验组不在一个基线水平,并且最大的困难是 对时间效应的控制(Ashenfelter, & Card, 1985)。因为很多经济政策、措施的实施是不能做 到随机控制某一部分,如货币政策调整必然影响全局。所以,经济学领域的研究多采用“自 然实验”法,而传统实验室实验采用的是重复测量方差分析,其前提条件是完全随机化分组、 数据正态分布且重复测量数据,且不允许缺失值(沈敏学, 胡明, 曾娜, 孙振球, 2015)。“自 然实验”很难满足上述条件,而双重差分法能够解决上述难题。双重差分法其本质就是实验 组与控制组的效应减去时间效应才是“干净的”实验效果的影响(如图 1)。
图 1 双重方差(DID)示意图
其中,t = 1 表示干预前(before),而 t = 2 表示干预后(after) 。yc1 和 yc2是控制组 在 t1 、t2 两个时间点的效应,yt1 和 yt2 是实验组在 t1 、t2 两个时间点的效应;所以,干预的处 理效应(treatment effect),即 DID 估计值应该是(yt2-yt1)-(yc2-yc1)。值得注意的是,双重 差分法处理效应估计的假设前提是实验组若没有被干预,将与控制组具有一样的时间效应, 即“平行趋势”(parallel trend)或“共同趋势”(common trend)假定,也就是说干预之外的因 素对实验组和对照组影响相同。DID 的优点是既适用于重复测量的追踪数据,也适用于混合 横断面数据(沈敏学等, 2015)。
事实上,心理学、教育学的大量干预研究也是一种“自然实验” ,如果使用重复测量方差 分析就会忽略时间效应的影响,而得出的结论可靠性较差,基于此,本研究在 PSM 基础上 采用双重差分法对实验组(干预组)与控制组(对照组)的数据进行分析。但是本研究面临 的一个局限是只有干预后的横断面数据。横断面数据,又称截面数据(cross-section data) 是不同个体在同一时间点或同一时间段的数据,也称静态数据,是样本数据中的常见类型之 一。双重差分法适用于截面数据,但需要找到恰当的时间分组。本研究借鉴了著名经济学家、 麻省理工学院讲座教授Duflo(2003)的研究方法。
Duflo (2003) 开展了一项针对南非养老金计划项目(South African Old-Age Pension Program1)对学前儿童健康影响的研究,但只有一年的截面数据。她使用是否参与养老金计 划项目作为干预组(参与)与对照组(不参与);而时间分组采用项目实施前出生(基线) 与项目实施后出生(追踪)。项目后出生的孩子整个成长阶段都在项目影响之下,而项目前 出生的孩子仅有后一阶段的成长在项目影响之下。这样就构建了一个可以进行 DID 分析的 模型,以此估计养老金计划项目对儿童健康的影响效应。Duflo 的 DID 分析思路为没有基线 数据的情况下进行影响评估提供了借鉴。
基于此,在本研究中以入学时间为节点,分为干预后入校(2016 年 9 月入校,基线) 与干预前入校学生(2015 年 9 月入学,追踪)。由此构建了项目校(干预组)与对照校(控制组),并建立 DID 模型。
2 研究方法
2.1 研究对象
采用整群随机抽样的方式(在广东、四川、贵州三个地区内部中职学校数的 2%随机抽 取学校) 抽取了 45 所中等职业学校 64173 名中职生(男生占 59.1%) ,年龄 13-19 岁 (M±SD= 16.85 ± 0.78),农业户口占 66. 1% 。调查内容包括背景变量(年龄、性别、户 口、 是否留守经历、是否单亲家庭)家庭 SES(家庭年收入、父母受教育水平)、心理发展特征 变量、学业成就、成长思维和自我肯定等。
2.2 研究工具
2.2.1 学业成就
本研究学业成就主要由阅读能力、考试成绩来代表。此外,考虑到普通高中课程设置与 中职学校差异巨大,考试成绩不具有可比性,在进行中职生与普通高中生学业成就比较时使 用中考成绩代表。
(1)阅读能力。阅读能力测验采用中国儿童青少年心理发育特征调查全国项目组(简 称“发育项目组”)编制的中国儿童青少年语文成就测验 7~9 年级学段中的阅读部分(董奇, 林崇德,2011)。在全国样本使用中,语文阅读测验具有良好信效度,各题本的内部一致性 系数(Cronbach’s α) 在 0.72~0.94 之间(陶沙等,2016)。
(2)考试成绩。考试成绩是在征得学校、学生同意后,从各个学校教务部门获取上一 学年所有文化课和专业课考试成绩。考虑到中职学校课程设置、专业设置差异大,且试卷及 评分标准也不统一。故委托班主任根据班级人数,对每一名中职生文化课、专业课考试成绩 进行排名,然后根据排名分别把文化课、专业课考试成绩转化为等级分数(5=优秀;4=中 等偏上;3=中等;2=中等偏下;1=较差)。最后把文化课成绩等级与专业课成绩等级相加, 并进行标准化(Z 分数), 由此构成中职生学业成就的一部分。
2.2.2 家庭社会经济地位
家庭社会经济地位分别考察家庭收入、父亲受教育年限、母亲受教育年限。其中,家庭 收入 的 调查题 目 为 “ 你 家 最近 一年 的 总 收入 是: 1=3000 元 以 下 , 2=3001~6000 元 , 3=6001~ 10000 元 , 4= 10001~30000 元 , 5=30001~50000 元 , 6=50001~ 100000 元 , 7= 100001~ 150000 元,8= 150001~200000 元,9=200001 元以上”。
父母受教育年限的调查题目为“你父亲/母亲的受教育水平是:1=没有上过学,2=小学, 3=初中,4=高中(包括职高、技校、中专),5=大专,6=本科,7=研究生及以上” ,然后根 据结果转化为受教育年限(董奇,林崇德,2011)。
2.2.3 认知能力测验
由中国儿童青少年心理发育特征调查全国项目组研制,包括注意、视知觉-空间、记忆 与推理能力四方面,用时 90 分钟(董奇,林崇德,2011) 。本次研究采用了注意和推理能 力两个方面的测试内容。注意能力测验通过划消任务进行测查的;推理能力测验由类比推理 能力分测验和归纳推理能力分测验构成。认知能力测验信效度良好,各分测验及总体内部一 致性信度 0.74~0.94 ,间隔一个月再测信度 0.53~0.90 ,与韦氏测验(第四版中国修订版)相 关 0.61~0.72(陶沙等,2015)。
2.2.4 学校心理环境问卷
学校心理环境问卷(陶沙等,2015)包含安全与秩序(Safety and Order) 、接纳与支持 (Support and Acceptance) 、公平与公正(Equality and Fairness)和鼓励自主与合作(Encouraging Autonomy and Cooperation)等 4 个维度(周翠敏等,2016),每个维度 9 个题目,选项为 Likert 式 4 点计分(从不、很少、有时候、总是,分别计 1~4 分)。本研究中,学生自我报告学校心理环境的安全与秩序、接纳与支持、公平与公正和鼓励自主与合作等 4 个维度的内部一 致性系数分别为 0.80 、0.81 、0.88 、0.90。
2.2.5 自我悦纳量表
自我悦纳量表源于中国儿童青少年心理发育特征调查项目组完成(董奇,林崇德,2011) 编制的生活满意度量表的自我满意度的分量表。量表由“我是一个不错的人”“大多数人都喜 欢我”“跟我在一起很有趣”“我觉得自己长得不错”“我喜欢我自己”等5个问题构成,采取4点 计分(很不同意、不太同意、基本同意、很同意,分别计1~4分),总分越高代表学生自我 悦纳程度越高。量表的内部一致性系数为0.74 ,重测信度为0.54。
2.2.6 内在—外在心理控制源量表
该量表含 23 个项目和6 个插入题。每个项目均为一组内控性陈述和外控性陈述,要求 被试必须从中选择一个,对外控性选择记分,得分范围在 0(极端内控)到 23(极端外控) 之间。该量表为自评式量表,量表内部一致性系数为 0.70(Rotter ,1966)间隔一个月的重 测信度r=0.72 ,两个月的重测信度r=0.55 。与 Marhowe-Crowne 社会性期望量表的相关性在 -0.07 至-0.35 之间,与智力测验的相关性在 0.03 至-0.22 间(汪向东,王希林,马弘,1999)。
2.2.7 控制圈-个人实力量表
控制圈量表(Spheres of Control ,SOC)是由 Paulhus(1983)编制,包括个人成就控制 感(个人实力)、人际控制感与社会政治控制感三个维度。内部一致性系数分别为 0.78、0.77、 0.81 。间隔 1 个月的重测信度大于 0.90 ,间隔 6 个月重测信度大于 0.70 。本研究仅仅选取了 个人成就控制感分量表,该分量表由 10 个题目构成,评分采用 Likeert 7 分制,从不同意至 同意。得分越高说明个人成就控制感越强(汪向东,王希林,马弘,1999)。
2.2.8 孤独量表
儿童孤独感量表(Children’s Loneliness Scale, CLS)由Asher等(1984)编制。中国儿童 青少年心理发育特征调查项目组完成(董奇,林崇德,2011)在此基础上对儿童孤独感量表 进行了修订,形成儿童青少年孤独感量表中文版,并对全国24013个样本进行测查,建立了 常模。修订后孤独感量表为学生自评量表,共16题,是单维量表。该量表采取4点计分,每 个项目从“很不符合、不太符合、基本符合、很符合”分别计为“1 、2 、3 、4” 。将所有题目得 分相加即为被试孤独感的得分,得分范围为16~64分,得分越高代表该被试孤独感越强。量 表的内部一致性系数为 0.89。
2.2.9 流调中心用抑郁量表
流调中心用抑郁量表(Center for Epidemiologic Studies Depression Scale ,CES-D)共有 20 个条目,包含 4 个因素:抑郁情绪(Depressed affect)、积极情绪、(Positive affect)、 躯体症状与活动迟滞(Somatic and retarded activity)、人际(Interpersonal)。回答问题时要 求受试者说明最近一周内症状出现的频度。答案包括:“偶尔或无(少于一天)ℽ ; ℼ有时(1-2 天)”;“经常或一半时间(3-4 天)”;“大部分时间或持续(5-7 天)” ,每个频度的赋值为 0-3 。总 分范围为 0-60 ,分数越高抑郁出现频度越高。该量表的分半相关系数为 0.85 ,内部一致性α 系数为 0.90;4 周后重测信度为 0.67(汪向东,王希林,马弘,1999);CES-D 中国青少年 样本的内部一致性系数为 0.88(陈祉妍,杨小冬,李新影,2009)。
2.2.10 长处和困难问卷
长处和困难问卷(strength anddifficulty questionnaire, SDQ)是由Goodman (1997)编制,主 要用于筛查儿童和青少年的心理和行为问题的简短问卷。 问卷测量包括四个困难分量表 ——情绪症状(Emotional symptoms) 、行为问题(Conduct problems) 、多动-注意缺陷 (Hyperactivity)、同伴关系问题(Peer problems)和一个长处分量表——亲社会行为(Prosocial behaviors),共25个题目,3 点计分,其中扩展版SDQ增加了一个询问家庭不良影响附加题 和补充问题。SDQ内部一致性系数为0.81;各因子α系数在 0.48~0.88 之间;重测信度为0.72;五个分量表的条目与相应的因子分相关系数在0.47到0.75之间(章晨晨, 2009)。总体困难分 数(SDQ总分) 由情绪症状、行为问题、多动-注意缺陷和同伴关系问题4个维度求和组成。
2.2.11 主观健康自评量表
主观健康自评量表(Subjective health complaints ,SHC)适用于学生对自身健康状况的主 观评估,包括头痛、 胃痛、腰痛、郁闷、易怒或脾气暴躁、感到紧张、感觉头晕 (Haugland & Wold, 2001) 。按照过去 6 个月发生上述症状频率分为 5 个等级(1-5 分,每天、每周超过 1 次、每周 1 次、每月 1 次、很少或从不)进行评估,总分在 7-35 之间,分数越高说明主 观自评健康越满意 (Haugland et al., 2001) 。本次研究的α系数为 0.81。
2.2.12 生活满意度量表
生活满意度量表(Satisfaction with Life Scale ,SWLS)是单维度量表,主要是测评个体 对当前生活的满意程度。量表共有 5 个题目。选项包括非常不同意到非常同意,共 7 个等级 (1-7) 。有研究者将中文版生活满意度量表应用到香港大学生中,其内部一致性系数α为 0.78 ,分半信度为 0.70 。本次研究的α系数为 0.90。
2.2.13 同伴关系满意度量表
同伴关系满意度量表源于中国儿童青少年心理发育特征调查项目组完成(董奇,林崇德, 2011)编制的生活满意度量表的同伴关系满意度的分量表。量表由“如果我需要帮助,朋友 一定会帮我”“我的朋友都很棒”“我的朋友对我很友好”“和朋友在一起我有很多乐趣”等4个 问题构成,采取4点计分,每个项目从“很不同意、不太同意、基本同意、很同意”采取“1、2、 3 、4”四级评分,总分越高代表学生同伴关系满意程度越高。量表的内部一致性系数为0.78, 重测信度为0.55。
2.2.14 专业/职业认同问卷
学生专业/职业认同感问卷为自编问卷,共包含专业/职业自尊感(如“我喜欢我所学的专 业或即将从事的职业”等)、专业/职业归属感(如,“我乐意与别人谈论我现在从事的职业 或所学习的专业”)、专业/职业价值感(如,“在我从事的职业或所学习的专业中成为优秀 者,是我的人生目标”)等三个维度,每个维度 3 个题目,共 9 个题目。每个题目选项为 Likert 式 5 点计分(完全不符合到完全符合,1~5 分)。本次测试中专业/职业自尊感、专业/职业 归属感、专业/职业价值感的α系数分别为 0.94 、0.90 、0.95。
2.2.15 成就目标定向量表
本研 究采用 的 是Niemivirta (2002 ) 编制 的成就 目标定 向量表(Achievement goal orientations) 。该量表共有五个维度,分别包括内在型-掌握目标,如,“对我来说,我学习 的一个重要目标是为了获得新知识”;外在型-掌握目标,如,“我的一个重要目标是学习好。”; 趋向型-成绩目标,如,“如果我想办法向别人展示出我有能力,那我就感觉好”; 回避型-成 绩目标,如,“我尽力回避我可能显得笨或没能力的情境” ,再加上回避定向,如“如果我不 用在功课上大费功夫,那我特别满意” 。每个维度有3个题目,使用5点Likert型量表评分,从 1(完全不准确)到5(完全准确) 。每个维度计算3个题目得分的总分,得分越高该维度表 现越好。
2.2.16 控制信念量表
控制信念(control beliefs)或者控制感是人们对生活中各种行为的因果关系的概括与理解 (Skinner, Chapman, & Baltes, 1988)。Little ,Oettingen和Baltes(1995)在Skinner编制的80 题控制信念量表(Control, agency, and means-ends interview ,CAMI)基础上,进行了量表的 修订和简化。修订后量表为58题,共有三个不同信念子系统,分为10个维度,分别是控制期 望1个维度,主体信念4个维度(努力、能力、运气和教师),手段-结果信念5个维度(努力、 能力、运气、教师以及未知因素)。使用4点计分,从1(完全不准确)到4(完全准确)(Little et al., 1995)。本研究使用时选取了主体信念的2个维度(努力、能力)、手段-结果信念的3个维度(努力、能力、运气),并且为了与成就目标定向量表的计分方式保持一致,将计分 方式更改为5点计分,从1(完全不准确)到5(完全准确)。
关键词:学校干预,心理发展,家庭社会经济地位,学校投入
1 引言
学校环境因素和个体自身主体因素是影响学生学业成就的两大重要因素,关于主体因 素,特别是心理发展特征的相关因素前面研究已经做了详细论述,并且了解到自身的认知能 力对学业成就有着主要的影响,而认知能力受到成长思维、自我肯定的影响,并且起着不同 的作用。当然,这种作用还需要进一步运用干预实验来验证。在基于个体的干预实验之前, 通过学校干预,考察学校因素对中职生学业成就的影响。
随机对照试验(randomized controlled trial, RCT) 是检验干预是否有效的黄金标准 (Chambless & Hollon, 1998; Rounsaville et al., 2001) 。事实上,大规模学校干预要做到完全随 机几乎是不可能,在实际操作中也没有办法让未进入实验组的学生不在干预学校进行生活学 习。因此,本研究对照组的选取是按照属地原则,找了若干规模、办学水平相近的学校进行 匹配。即使如此,也远远没有达到完全随机带来的协变量均衡或控制。所以,采用倾向得分 匹配(Propensity Score Matching ,PSM)的方法进行“事后随机化” ,控制人口学等协变量, 实现干预组与控制组的可比性。运用倾向得分匹配虽然提升了干预组与对照组可比性,构建 了一个未实施干预的反事实(counter factual)组作为参照系,即控制组(control group), 但没有解决时间效应的影响(ycontrol, after - ycontrol, before),所以,在数据分析时需要使用新的方 法——双重差分法(Fu, Dow, & Liu, 2007)。
双重差分法(Difference-In-Difference Model ,DID)是近些年在经济学领域兴起的新方 法,它解决了很多经济学研究中有关政策实施无法建立一个真实的“反事实”的困境,同时即
通过 PSM 构建一个虚拟“反事实” ,往往跟实验组不在一个基线水平,并且最大的困难是 对时间效应的控制(Ashenfelter, & Card, 1985)。因为很多经济政策、措施的实施是不能做 到随机控制某一部分,如货币政策调整必然影响全局。所以,经济学领域的研究多采用“自 然实验”法,而传统实验室实验采用的是重复测量方差分析,其前提条件是完全随机化分组、 数据正态分布且重复测量数据,且不允许缺失值(沈敏学, 胡明, 曾娜, 孙振球, 2015)。“自 然实验”很难满足上述条件,而双重差分法能够解决上述难题。双重差分法其本质就是实验 组与控制组的效应减去时间效应才是“干净的”实验效果的影响(如图 1)。

图 1 双重方差(DID)示意图
其中,t = 1 表示干预前(before),而 t = 2 表示干预后(after) 。yc1 和 yc2是控制组 在 t1 、t2 两个时间点的效应,yt1 和 yt2 是实验组在 t1 、t2 两个时间点的效应;所以,干预的处 理效应(treatment effect),即 DID 估计值应该是(yt2-yt1)-(yc2-yc1)。值得注意的是,双重 差分法处理效应估计的假设前提是实验组若没有被干预,将与控制组具有一样的时间效应, 即“平行趋势”(parallel trend)或“共同趋势”(common trend)假定,也就是说干预之外的因 素对实验组和对照组影响相同。DID 的优点是既适用于重复测量的追踪数据,也适用于混合 横断面数据(沈敏学等, 2015)。
事实上,心理学、教育学的大量干预研究也是一种“自然实验” ,如果使用重复测量方差 分析就会忽略时间效应的影响,而得出的结论可靠性较差,基于此,本研究在 PSM 基础上 采用双重差分法对实验组(干预组)与控制组(对照组)的数据进行分析。但是本研究面临 的一个局限是只有干预后的横断面数据。横断面数据,又称截面数据(cross-section data) 是不同个体在同一时间点或同一时间段的数据,也称静态数据,是样本数据中的常见类型之 一。双重差分法适用于截面数据,但需要找到恰当的时间分组。本研究借鉴了著名经济学家、 麻省理工学院讲座教授Duflo(2003)的研究方法。
Duflo (2003) 开展了一项针对南非养老金计划项目(South African Old-Age Pension Program1)对学前儿童健康影响的研究,但只有一年的截面数据。她使用是否参与养老金计 划项目作为干预组(参与)与对照组(不参与);而时间分组采用项目实施前出生(基线) 与项目实施后出生(追踪)。项目后出生的孩子整个成长阶段都在项目影响之下,而项目前 出生的孩子仅有后一阶段的成长在项目影响之下。这样就构建了一个可以进行 DID 分析的 模型,以此估计养老金计划项目对儿童健康的影响效应。Duflo 的 DID 分析思路为没有基线 数据的情况下进行影响评估提供了借鉴。
基于此,在本研究中以入学时间为节点,分为干预后入校(2016 年 9 月入校,基线) 与干预前入校学生(2015 年 9 月入学,追踪)。由此构建了项目校(干预组)与对照校(控制组),并建立 DID 模型。
2 研究方法
2.1 研究对象
采用整群随机抽样的方式(在广东、四川、贵州三个地区内部中职学校数的 2%随机抽 取学校) 抽取了 45 所中等职业学校 64173 名中职生(男生占 59.1%) ,年龄 13-19 岁 (M±SD= 16.85 ± 0.78),农业户口占 66. 1% 。调查内容包括背景变量(年龄、性别、户 口、 是否留守经历、是否单亲家庭)家庭 SES(家庭年收入、父母受教育水平)、心理发展特征 变量、学业成就、成长思维和自我肯定等。
2.2 研究工具
2.2.1 学业成就
本研究学业成就主要由阅读能力、考试成绩来代表。此外,考虑到普通高中课程设置与 中职学校差异巨大,考试成绩不具有可比性,在进行中职生与普通高中生学业成就比较时使 用中考成绩代表。
(1)阅读能力。阅读能力测验采用中国儿童青少年心理发育特征调查全国项目组(简 称“发育项目组”)编制的中国儿童青少年语文成就测验 7~9 年级学段中的阅读部分(董奇, 林崇德,2011)。在全国样本使用中,语文阅读测验具有良好信效度,各题本的内部一致性 系数(Cronbach’s α) 在 0.72~0.94 之间(陶沙等,2016)。
(2)考试成绩。考试成绩是在征得学校、学生同意后,从各个学校教务部门获取上一 学年所有文化课和专业课考试成绩。考虑到中职学校课程设置、专业设置差异大,且试卷及 评分标准也不统一。故委托班主任根据班级人数,对每一名中职生文化课、专业课考试成绩 进行排名,然后根据排名分别把文化课、专业课考试成绩转化为等级分数(5=优秀;4=中 等偏上;3=中等;2=中等偏下;1=较差)。最后把文化课成绩等级与专业课成绩等级相加, 并进行标准化(Z 分数), 由此构成中职生学业成就的一部分。
2.2.2 家庭社会经济地位
家庭社会经济地位分别考察家庭收入、父亲受教育年限、母亲受教育年限。其中,家庭 收入 的 调查题 目 为 “ 你 家 最近 一年 的 总 收入 是: 1=3000 元 以 下 , 2=3001~6000 元 , 3=6001~ 10000 元 , 4= 10001~30000 元 , 5=30001~50000 元 , 6=50001~ 100000 元 , 7= 100001~ 150000 元,8= 150001~200000 元,9=200001 元以上”。
父母受教育年限的调查题目为“你父亲/母亲的受教育水平是:1=没有上过学,2=小学, 3=初中,4=高中(包括职高、技校、中专),5=大专,6=本科,7=研究生及以上” ,然后根 据结果转化为受教育年限(董奇,林崇德,2011)。
2.2.3 认知能力测验
由中国儿童青少年心理发育特征调查全国项目组研制,包括注意、视知觉-空间、记忆 与推理能力四方面,用时 90 分钟(董奇,林崇德,2011) 。本次研究采用了注意和推理能 力两个方面的测试内容。注意能力测验通过划消任务进行测查的;推理能力测验由类比推理 能力分测验和归纳推理能力分测验构成。认知能力测验信效度良好,各分测验及总体内部一 致性信度 0.74~0.94 ,间隔一个月再测信度 0.53~0.90 ,与韦氏测验(第四版中国修订版)相 关 0.61~0.72(陶沙等,2015)。
2.2.4 学校心理环境问卷
学校心理环境问卷(陶沙等,2015)包含安全与秩序(Safety and Order) 、接纳与支持 (Support and Acceptance) 、公平与公正(Equality and Fairness)和鼓励自主与合作(Encouraging Autonomy and Cooperation)等 4 个维度(周翠敏等,2016),每个维度 9 个题目,选项为 Likert 式 4 点计分(从不、很少、有时候、总是,分别计 1~4 分)。本研究中,学生自我报告学校心理环境的安全与秩序、接纳与支持、公平与公正和鼓励自主与合作等 4 个维度的内部一 致性系数分别为 0.80 、0.81 、0.88 、0.90。
2.2.5 自我悦纳量表
自我悦纳量表源于中国儿童青少年心理发育特征调查项目组完成(董奇,林崇德,2011) 编制的生活满意度量表的自我满意度的分量表。量表由“我是一个不错的人”“大多数人都喜 欢我”“跟我在一起很有趣”“我觉得自己长得不错”“我喜欢我自己”等5个问题构成,采取4点 计分(很不同意、不太同意、基本同意、很同意,分别计1~4分),总分越高代表学生自我 悦纳程度越高。量表的内部一致性系数为0.74 ,重测信度为0.54。
2.2.6 内在—外在心理控制源量表
该量表含 23 个项目和6 个插入题。每个项目均为一组内控性陈述和外控性陈述,要求 被试必须从中选择一个,对外控性选择记分,得分范围在 0(极端内控)到 23(极端外控) 之间。该量表为自评式量表,量表内部一致性系数为 0.70(Rotter ,1966)间隔一个月的重 测信度r=0.72 ,两个月的重测信度r=0.55 。与 Marhowe-Crowne 社会性期望量表的相关性在 -0.07 至-0.35 之间,与智力测验的相关性在 0.03 至-0.22 间(汪向东,王希林,马弘,1999)。
2.2.7 控制圈-个人实力量表
控制圈量表(Spheres of Control ,SOC)是由 Paulhus(1983)编制,包括个人成就控制 感(个人实力)、人际控制感与社会政治控制感三个维度。内部一致性系数分别为 0.78、0.77、 0.81 。间隔 1 个月的重测信度大于 0.90 ,间隔 6 个月重测信度大于 0.70 。本研究仅仅选取了 个人成就控制感分量表,该分量表由 10 个题目构成,评分采用 Likeert 7 分制,从不同意至 同意。得分越高说明个人成就控制感越强(汪向东,王希林,马弘,1999)。
2.2.8 孤独量表
儿童孤独感量表(Children’s Loneliness Scale, CLS)由Asher等(1984)编制。中国儿童 青少年心理发育特征调查项目组完成(董奇,林崇德,2011)在此基础上对儿童孤独感量表 进行了修订,形成儿童青少年孤独感量表中文版,并对全国24013个样本进行测查,建立了 常模。修订后孤独感量表为学生自评量表,共16题,是单维量表。该量表采取4点计分,每 个项目从“很不符合、不太符合、基本符合、很符合”分别计为“1 、2 、3 、4” 。将所有题目得 分相加即为被试孤独感的得分,得分范围为16~64分,得分越高代表该被试孤独感越强。量 表的内部一致性系数为 0.89。
2.2.9 流调中心用抑郁量表
流调中心用抑郁量表(Center for Epidemiologic Studies Depression Scale ,CES-D)共有 20 个条目,包含 4 个因素:抑郁情绪(Depressed affect)、积极情绪、(Positive affect)、 躯体症状与活动迟滞(Somatic and retarded activity)、人际(Interpersonal)。回答问题时要 求受试者说明最近一周内症状出现的频度。答案包括:“偶尔或无(少于一天)ℽ ; ℼ有时(1-2 天)”;“经常或一半时间(3-4 天)”;“大部分时间或持续(5-7 天)” ,每个频度的赋值为 0-3 。总 分范围为 0-60 ,分数越高抑郁出现频度越高。该量表的分半相关系数为 0.85 ,内部一致性α 系数为 0.90;4 周后重测信度为 0.67(汪向东,王希林,马弘,1999);CES-D 中国青少年 样本的内部一致性系数为 0.88(陈祉妍,杨小冬,李新影,2009)。
2.2.10 长处和困难问卷
长处和困难问卷(strength anddifficulty questionnaire, SDQ)是由Goodman (1997)编制,主 要用于筛查儿童和青少年的心理和行为问题的简短问卷。 问卷测量包括四个困难分量表 ——情绪症状(Emotional symptoms) 、行为问题(Conduct problems) 、多动-注意缺陷 (Hyperactivity)、同伴关系问题(Peer problems)和一个长处分量表——亲社会行为(Prosocial behaviors),共25个题目,3 点计分,其中扩展版SDQ增加了一个询问家庭不良影响附加题 和补充问题。SDQ内部一致性系数为0.81;各因子α系数在 0.48~0.88 之间;重测信度为0.72;五个分量表的条目与相应的因子分相关系数在0.47到0.75之间(章晨晨, 2009)。总体困难分 数(SDQ总分) 由情绪症状、行为问题、多动-注意缺陷和同伴关系问题4个维度求和组成。
2.2.11 主观健康自评量表
主观健康自评量表(Subjective health complaints ,SHC)适用于学生对自身健康状况的主 观评估,包括头痛、 胃痛、腰痛、郁闷、易怒或脾气暴躁、感到紧张、感觉头晕 (Haugland & Wold, 2001) 。按照过去 6 个月发生上述症状频率分为 5 个等级(1-5 分,每天、每周超过 1 次、每周 1 次、每月 1 次、很少或从不)进行评估,总分在 7-35 之间,分数越高说明主 观自评健康越满意 (Haugland et al., 2001) 。本次研究的α系数为 0.81。
2.2.12 生活满意度量表
生活满意度量表(Satisfaction with Life Scale ,SWLS)是单维度量表,主要是测评个体 对当前生活的满意程度。量表共有 5 个题目。选项包括非常不同意到非常同意,共 7 个等级 (1-7) 。有研究者将中文版生活满意度量表应用到香港大学生中,其内部一致性系数α为 0.78 ,分半信度为 0.70 。本次研究的α系数为 0.90。
2.2.13 同伴关系满意度量表
同伴关系满意度量表源于中国儿童青少年心理发育特征调查项目组完成(董奇,林崇德, 2011)编制的生活满意度量表的同伴关系满意度的分量表。量表由“如果我需要帮助,朋友 一定会帮我”“我的朋友都很棒”“我的朋友对我很友好”“和朋友在一起我有很多乐趣”等4个 问题构成,采取4点计分,每个项目从“很不同意、不太同意、基本同意、很同意”采取“1、2、 3 、4”四级评分,总分越高代表学生同伴关系满意程度越高。量表的内部一致性系数为0.78, 重测信度为0.55。
2.2.14 专业/职业认同问卷
学生专业/职业认同感问卷为自编问卷,共包含专业/职业自尊感(如“我喜欢我所学的专 业或即将从事的职业”等)、专业/职业归属感(如,“我乐意与别人谈论我现在从事的职业 或所学习的专业”)、专业/职业价值感(如,“在我从事的职业或所学习的专业中成为优秀 者,是我的人生目标”)等三个维度,每个维度 3 个题目,共 9 个题目。每个题目选项为 Likert 式 5 点计分(完全不符合到完全符合,1~5 分)。本次测试中专业/职业自尊感、专业/职业 归属感、专业/职业价值感的α系数分别为 0.94 、0.90 、0.95。
2.2.15 成就目标定向量表
本研 究采用 的 是Niemivirta (2002 ) 编制 的成就 目标定 向量表(Achievement goal orientations) 。该量表共有五个维度,分别包括内在型-掌握目标,如,“对我来说,我学习 的一个重要目标是为了获得新知识”;外在型-掌握目标,如,“我的一个重要目标是学习好。”; 趋向型-成绩目标,如,“如果我想办法向别人展示出我有能力,那我就感觉好”; 回避型-成 绩目标,如,“我尽力回避我可能显得笨或没能力的情境” ,再加上回避定向,如“如果我不 用在功课上大费功夫,那我特别满意” 。每个维度有3个题目,使用5点Likert型量表评分,从 1(完全不准确)到5(完全准确) 。每个维度计算3个题目得分的总分,得分越高该维度表 现越好。
2.2.16 控制信念量表
控制信念(control beliefs)或者控制感是人们对生活中各种行为的因果关系的概括与理解 (Skinner, Chapman, & Baltes, 1988)。Little ,Oettingen和Baltes(1995)在Skinner编制的80 题控制信念量表(Control, agency, and means-ends interview ,CAMI)基础上,进行了量表的 修订和简化。修订后量表为58题,共有三个不同信念子系统,分为10个维度,分别是控制期 望1个维度,主体信念4个维度(努力、能力、运气和教师),手段-结果信念5个维度(努力、 能力、运气、教师以及未知因素)。使用4点计分,从1(完全不准确)到4(完全准确)(Little et al., 1995)。本研究使用时选取了主体信念的2个维度(努力、能力)、手段-结果信念的3个维度(努力、能力、运气),并且为了与成就目标定向量表的计分方式保持一致,将计分 方式更改为5点计分,从1(完全不准确)到5(完全准确)。
2.2.17 思维倾向量表
思维倾向量表(Mindsets Scale)是由心理学家 Dweck(2006)编制,考察人们理解世 界和看待自身能力的认知框架类型, 由固着型思维(fixed mindset)和成长型思维(growth mindset)两个维度构成。固着型思维与成长型思维各有 10 个题目。所有选项为 Likert 式 4 点计分(非常不同意、不同意、同意、非常同意,分别计0~3 分)。固着型思维、成长型 思维得分越高越倾向该思维类型。计算成长思维总分时将固着型思维题目反向计分,加上成 长型思维得分,得分越高越偏向成长型思维,反之,越接近固着型思维。成长思维二分变量 是根据总分划分,在 60~34 之间为成长型思维,在 33~0 之间为固着型思维(Mora, 2015)。 本研究中,固着型思维与成长型思维的内部一致性系数均为 0.93,总量表的内部一致性系数 均为 0.80。
2.2.18 自我肯定量表
自我肯定(Self affirm scale)是自尊量表(Self esteem scale)的分量表。 自尊量表最初 由 Rosenberg(1985)编制。中文修订版由中国儿童青少年心理发育特征调查项目组完成(董 奇,林崇德,2011)。自我肯定量表共有 5 道题目(项目 1 ,2 ,4 ,6 ,7),采用 4 点计分, 每个项目从“很不符合、不太符合、基本符合、很符合”采取“1 、2 、3 、4”四级评分。每道题 分数相加得维度分数,得分越高表明自我肯定水平越高。对全国 23971 名被试的测量结果表 明, 自我肯定维度的内部一致性系数为 0.76。
2.2.19 背景问卷
背景问卷让被试报告出生年月、家庭结构(父母双方是否生活在一起,以及原因等)、 留守经历(是否经历过父母一方或双方外出务工或其他原因离家达 6 个月以上)、户口性质 (农业与非农业)、性别、是否独生子女等人口学基本信息等(王道阳,陆祥,殷欣,2017)。
2.3 干预设计
在本研究中以入学时间为节点,分为干预后入校(2016 年 9 月入校,基线)与干预前 入校学生(2015 年 9 月入学,追踪) 。因为对学校的干预是 2015 年 10 月开始正式启动, 数据采集是在 2017 年 3-6 月,那么,对于 2015 年 9 月入学的学生来说,几乎是入校后全程 暴露在干预影响下,而 2016 年 9 月入学的学生仅仅是近 6 个月在干预影响下,正好能契合 DID 分析的要求。由此构建了 DID 模型:(yt2-yt1) – (yc2-y c1) ,其中(yt2-yt1)是项目校(干预组) 2015 年 9 月入学学生的效应减去 2016 年 9 月入学学生的效应,(yc2-y c1)是对照校(控制组) 2015 年 9 月入学学生的效应减去 2016 年 9 月入学学生的效应,两者的差才是干预的效果[(yt2 -yt1 )-(yc2-yc1)] ,见表 2。
表 2 学校干预分组情况
中职项目校和对照校选取是按照各地区教育行政部门提供的候选学校随机抽取,其中项 目校 30 所(参与测评学生数 47993 人),对照校 19 所(原来选取 20 所,其中 1 所中途退 出,参与测评学生数 16180 人)。中职项目校(干预组)由中国发展研究基金会负责校长培 训、高级技师进课堂、校园文化活动、设立发展奖学金和奖教金、开展创业培训等社会试验 项目以及建设“赢未来”网络平台等。中职对照校(控制组)仅仅给予测试组织相关学校教师 一定的劳务补助,具体额度根据参与学生数按照一定比例计算。
思维倾向量表(Mindsets Scale)是由心理学家 Dweck(2006)编制,考察人们理解世 界和看待自身能力的认知框架类型, 由固着型思维(fixed mindset)和成长型思维(growth mindset)两个维度构成。固着型思维与成长型思维各有 10 个题目。所有选项为 Likert 式 4 点计分(非常不同意、不同意、同意、非常同意,分别计0~3 分)。固着型思维、成长型 思维得分越高越倾向该思维类型。计算成长思维总分时将固着型思维题目反向计分,加上成 长型思维得分,得分越高越偏向成长型思维,反之,越接近固着型思维。成长思维二分变量 是根据总分划分,在 60~34 之间为成长型思维,在 33~0 之间为固着型思维(Mora, 2015)。 本研究中,固着型思维与成长型思维的内部一致性系数均为 0.93,总量表的内部一致性系数 均为 0.80。
2.2.18 自我肯定量表
自我肯定(Self affirm scale)是自尊量表(Self esteem scale)的分量表。 自尊量表最初 由 Rosenberg(1985)编制。中文修订版由中国儿童青少年心理发育特征调查项目组完成(董 奇,林崇德,2011)。自我肯定量表共有 5 道题目(项目 1 ,2 ,4 ,6 ,7),采用 4 点计分, 每个项目从“很不符合、不太符合、基本符合、很符合”采取“1 、2 、3 、4”四级评分。每道题 分数相加得维度分数,得分越高表明自我肯定水平越高。对全国 23971 名被试的测量结果表 明, 自我肯定维度的内部一致性系数为 0.76。
2.2.19 背景问卷
背景问卷让被试报告出生年月、家庭结构(父母双方是否生活在一起,以及原因等)、 留守经历(是否经历过父母一方或双方外出务工或其他原因离家达 6 个月以上)、户口性质 (农业与非农业)、性别、是否独生子女等人口学基本信息等(王道阳,陆祥,殷欣,2017)。
2.3 干预设计
在本研究中以入学时间为节点,分为干预后入校(2016 年 9 月入校,基线)与干预前 入校学生(2015 年 9 月入学,追踪) 。因为对学校的干预是 2015 年 10 月开始正式启动, 数据采集是在 2017 年 3-6 月,那么,对于 2015 年 9 月入学的学生来说,几乎是入校后全程 暴露在干预影响下,而 2016 年 9 月入学的学生仅仅是近 6 个月在干预影响下,正好能契合 DID 分析的要求。由此构建了 DID 模型:(yt2-yt1) – (yc2-y c1) ,其中(yt2-yt1)是项目校(干预组) 2015 年 9 月入学学生的效应减去 2016 年 9 月入学学生的效应,(yc2-y c1)是对照校(控制组) 2015 年 9 月入学学生的效应减去 2016 年 9 月入学学生的效应,两者的差才是干预的效果[(yt2 -yt1 )-(yc2-yc1)] ,见表 2。
表 2 学校干预分组情况
前后测\分组 | 干预组 N=8090 | 对照组 N=8090 |
前测(T1) :2016 年入学中职生 | yt1 | yc1 |
后测(T2) :2015 年入学中职生 | yt2 | yc2 |
中职项目校和对照校选取是按照各地区教育行政部门提供的候选学校随机抽取,其中项 目校 30 所(参与测评学生数 47993 人),对照校 19 所(原来选取 20 所,其中 1 所中途退 出,参与测评学生数 16180 人)。中职项目校(干预组)由中国发展研究基金会负责校长培 训、高级技师进课堂、校园文化活动、设立发展奖学金和奖教金、开展创业培训等社会试验 项目以及建设“赢未来”网络平台等。中职对照校(控制组)仅仅给予测试组织相关学校教师 一定的劳务补助,具体额度根据参与学生数按照一定比例计算。
2.4 数据处理
2.4.1 倾向得分匹配
本研究干预组学生(n=47993)和控制组(n=16180)学生样本数量差距不是很大,虽 然可以勉强进行了倾向得分匹配(Propensity Score Matching ,PSM),但是本研究需要控制 的协变量较多(如性别、户 口、民族、年龄、是否单亲家庭、是否有留守经历、家庭 SES 等),为了使干预组有更多选择性,增加匹配后协变量的均衡。本研究运用计算机软件(SPSS 23.0)从控制组(n=16180)完全随机取 50%样本(n=8090)与干预组(n=47993)进行 PSM。
具体操作是通过 logistic 回归的方法估计出被试的倾向分数,按照近邻法(nearest neighbor)1:1 对控制组学生与干预组学生进行匹配。具体做法是假设二元处理变量 Di 将本 研究中的被试分为两组:干预组学生(实验组,Di=0),控制组学生(控制组,Di=1) 。 对于学生个体 i ,其潜在的结果变量学业成就和认知能力得分被定义为 Yi(Di) ,其中 i=1,2,3… ,N ,N 为学生总数。学生背景变量(年龄、性别、户 口、留守经历、单亲家庭、是 否独生子女以及家庭年收入、父母受教育水平等变量)对学业成就、主要心理发展特征变量 的平均处理效应(ATT)应为干预组学生 i 的实际结果值 E[Y( 1)|D = 1]和假设其为控制组学 生时结果值的差值,表示为下式:τATT= E(τ|D = 1) = E[Y( 1)|D = 1] - E[ Y(0)|D = 1]。通过 logistic 回归的方法估计出被试的倾向分数,控制组学生与干预组学生结果均值的加权差异(ATT)的 倾向得分估计值可以表示为:τPSMATT = EP(X)|D = 1 {E[Y( 1)|D = 1, P(X)] - E[Y(0)|D = 0, P(X)]} 。再 通过τPSMATT 按照近邻法(nearest neighbor) 1:1 对控制组学生与干预组学生进行匹配。最后 得到控制组学生、干预组学生各 8090 人,实现了对可能影响结果变量的协变量进行匹配, 保证这些变量、分组安排独立性(Holland, 1986)。
2.4.2 双重差分分析模型
本研究采用固定效应估计方法,DID 模型的基本假设为:
yit = β0 + β1Di + β2Tt+ β3Di ×Tt + εit (1)
其中,下标 i 和 t 分别代表个体和时间;D 是组别,i 等于 0(控制组,本研究中是对 照校中职生)或 1(干预组,本研究中是项目校中职生);T 是时间,t 等于 0(前测或基线 测评,本研究中是 2016 年入学的中职生)或 1(后测或追踪测评,本研究中是 2015 年入学 的中职生);y 是结果变量,在本研究中是学业成就、中职生的主要心理发展特征变量等。 使用最小二乘法估计(1)式,计算 D 和 T 的系数β1 和β2 ,以及 D 和 T 的交叉项 D×T 的系 数β3 ;其中,β1 是组别效果,β2 是时间效果,而β3 是干预效果,即 DID 估计值(齐良书, 赵 俊超, 2012)。
2.4.3 数据分析
数据分析基于 SPSS 24.0 、Mplus 7.4 以及 R 3. 1.0 统计软件。本研究数据符合正态分布, 计量资料采用均数±标准差表示,组间比较采用 t 检验,t 检验效果大小用Cohen's d 值表示, 效应值 0.2 为小效应,0.5 为中等效应,0.8 为大效应(胡竹菁, 2010;Cohen, 1988)。
3 结果与分析
3.1 PSM 前后干预组与控制组控制变量差异
由表 3 可知,在 PSM 前干预组与控制组的中职生在性别、户口、是否独生子女、是否 单亲家庭、是否有留守经历上均有显著差异 (χ2 = 12.30 ~ 211. 14 ,φ=0.095 ~ 0.258);在年 龄、家庭年收入、父母受教育水平上也有差异但效应较小( t =4.55~ 20.66 ,d < 0.20) 。而 PSM 后干预组与控制组在年龄、性别、户口性质、是否独生子女、是否有留守经历等人口 学变量上,以及年龄、家庭年收入、母亲受教育水平差异均不显著,虽然在是否单亲家庭、 父亲受教育水平差异显著,但效应值都偏小,说明PSM 后上述背景变量控制能够接受。
表 3 PSM 前后干预组与控制组控制变量差异比较
变量 分类 | PSM 前 | χ2 |
PSM 后 | |||||||
![]() N % |
控制组 n=16180 | ![]() N % |
控制组 n=8090 | χ2 | ||||||
N % | N % | |||||||||
性别 男 | 28618 | 59.70% | 9299 | 57.50% | 24.63*** | 4605 | 56.90% | 4595 | 56.80% | 0.025 |
女 | 19326 | 40.30% | 6881 | 42.50% | 3485 | 43.10% | 3495 | 43.20% | ||
民族 汉族 | 43070 | 89.80% | 15319 | 94.70% | 348.65*** | 7696 | 95.10% | 7659 | 94.70% | 1.75 |
少数民族 | 4874 | 10.20% | 861 | 5.30% | 394 | 4.90% | 431 | 5.30% | ||
户口 农业 | 31383 | 65.50% | 11057 | 68.30% | 44.83*** | 5640 | 69.70% | 5557 | 68.70% | 2.00 |
非农业 | 16561 | 34.50% | 5123 | 31.70% | 2450 | 30.30% | 2533 | 31.30% | ||
留守经历 是 | 28145 | 58.70% | 10174 | 62.90% | 87.64*** | 5091 | 62.90% | 5055 | 62.50% | 0.34 |
否 | 19799 | 41.30% | 6006 | 37.10% | 2999 | 37.10% | 3035 | 37.50% | ||
单亲家庭 是 | 7768 | 16.20% | 2813 | 17.40% | 12.30*** | 1212 | 15.00% | 1420 | 17.60% | 19.63*** |
否 | 40176 | 83.80% | 13367 | 82.60% | 6878 | 85.00% | 6670 | 82.40% | ||
独生子女 是 | 14059 | 29.30% | 5732 | 35.40% | 211. 14*** | 2815 | 34.80% | 2817 | 34.80% | 0.01 |
否 | 33885 | 70.70% | 10448 | 64.60% | 5275 | 65.20% | 5273 | 65.20% | ||
年龄 | M | SD | M | SD | t Cohen's d | M | SD | M | SD | t Cohen's d |
16.89 | 0.73 | 16.75 | 0.73 | 20.66*** 0.188 | 16.75 | 0.74 | 16.74 | 0.74 | 0.58 — | |
家庭年收入 | 3.76 | 2.22 | 3.85 | 2.21 | -4.55*** -0.041 | 3.81 | 2.18 | 3.83 | 2.21 | -0.60 — |
父亲受教育年限 | 8.29 | 3.22 | 8.57 | 3.18 | -9.64*** -0.088 | 8.45 | 3.08 | 8.54 | 3.15 | -2.00* -0.031 |
母亲受教育年限 | 7.51 | 3.63 | 8.04 | 3.35 | -16.25*** -0.148 | 8.01 | 3.34 | 8.05 | 3.33 | -0.73 — |
3.2 主要变量的描述性分析
表 4 中职生干预组与控制组主要变量的描述性分析
变量 | 前测(T1) M ± SD | 后测(T2) M ± SD | ||||||
干预组 | 控制组 | 干预组 | 控制组 | |||||
学业成就 | ||||||||
阅读能力 | 0.23 | 1.11 | -0.23 | 0.78 | 0.05 | 1.04 | -0.26 | 0.77 |
考试成绩 | 0.10 | 1.01 | 0.04 | 1.01 | -0.05 | 0.97 | -0.05 | 1.00 |
自我及心理健康 | ||||||||
自我悦纳 | 15.53 | 3.14 | 15.57 | 3.37 | 15.27 | 3.24 | 15.34 | 3.39 |
内外控 | 10.32 | 3.10 | 10.74 | 2.65 | 10.36 | 2.99 | 10.71 | 2.70 |
控制圈-个人实力 | 44.22 | 6.60 | 42.81 | 5.49 | 43.62 | 6.22 | 42.79 | 5.61 |
孤独感 | 35.76 | 8.06 | 38.79 | 6.93 | 36.92 | 7.75 | 38.93 | 6.80 |
抑郁(CES-D) | 21.21 | 13.55 | 24.85 | 14.07 | 22.85 | 13.45 | 26.35 | 13.84 |
总体困难(SDQ) | 12.07 | 5.49 | 12.77 | 5.78 | 12.78 | 5.47 | 13.24 | 5.67 |
主观健康 | 29.70 | 6.25 | 29.25 | 7.02 | 28.92 | 6.70 | 28.58 | 7.27 |
生活满意度 | 22.10 | 7.18 | 23.15 | 7.45 | 22.21 | 7.03 | 23.02 | 7.45 |
同伴关系 学校心理环境 | 12.73 | 2.42 | 12.63 | 2.67 | 12.58 | 2.53 | 12.69 | 2.65 |
安全与秩序 | 24.92 | 4.14 | 24.06 | 3.83 | 24.94 | 4.21 | 24.24 | 3.83 |
接纳与支持 | 25.98 | 4.16 | 25.39 | 4.20 | 26.07 | 4.12 | 25.65 | 4.13 |
公平与公正 | 26.09 | 4.63 | 25.36 | 4.47 | 26.25 | 4.56 | 25.61 | 4.44 |
鼓励自主与合作 学习相关变量 | 27.39 | 5.10 | 26.65 | 5.25 | 27.50 | 5.05 | 26.93 | 5.18 |
专业/职业认同 | 31.97 | 7.71 | 32.17 | 8.44 | 32.43 | 7.83 | 32.51 | 8.38 |
内在型-掌握目标 | 10.96 | 2.61 | 10.99 | 2.82 | 10.86 | 2.65 | 11.00 | 2.86 |
外在型-掌握目标 | 10.65 | 2.59 | 10.80 | 2.84 | 10.71 | 2.62 | 10.85 | 2.85 |
趋向型-成绩目标 | 10.57 | 2.53 | 10.80 | 2.78 | 10.57 | 2.61 | 10.83 | 2.82 |
回避型-成绩目标 | 10.06 | 2.69 | 10.57 | 2.88 | 10.23 | 2.72 | 10.61 | 2.90 |
回避定向 | 9.70 | 2.83 | 10.42 | 2.96 | 9.86 | 2.88 | 10.46 | 3.02 |
主体信念 | 20.28 | 4.76 | 21.22 | 5.42 | 20.47 | 4.94 | 21.30 | 5.50 |
手段-结果信念 | 29.56 | 7.52 | 31.49 | 8.30 | 30.10 | 7.77 | 31.65 | 8.41 |
推理能力 | 0.25 | 1.06 | -0.17 | 0.89 | 0.02 | 1.00 | -0.27 | 0.86 |
注意能力 | 0.17 | 0.94 | -0. 14 | 1.08 | -0.01 | 0.98 | -0.17 | 1.05 |
成长思维 | 33.01 | 4.51 | 31.71 | 3.68 | 32.52 | 4.22 | 31.72 | 3.78 |
自我肯定 | 15.35 | 3.00 | 15.41 | 3.29 | 15.18 | 3.10 | 15.25 | 3.28 |
中职生干预组与控制组主要变量的均值与标准差结果见表 4 ,初步来看,在 2016 年入学 (基线)的干预组与控制组在学业成就及主要心理发展变量上得分相近,而在 2015 年入学(追 踪)的干预组与控制组在学业成就及主要心理发展变量上得分有差异,且大多数情况下干预 组得分要高。上述差距是否显著,且在排除 2016 年入学(基线)差距影响后是否还有差异? 这都需要进一步进行双重差分分析。
3.3 干预组与控制组的双重差分结果
干预组与控制组的双重差分结果见表 5 。结果显示,学校干预对中职生阅读能力有显著 的提高 (β =0.154,p < 0.001 ,R2 =0.024),对考试成绩提升不显著 (β =0.024,p > 0.05); 对推理能力和注意能力都有显著的提高(β推理能力 = 0.160,p < 0.001,R2 =0.026;β注意能力 = 0.108, p < 0.001 ,R2 = 0.012),对成长思维也有显著提高 (β =0.099,p < 0.001 ,R2 =0.010),而对 自我肯定提升不显著 (β =0.011,p > 0.05)。
学校干预对自我及心理健康也有着不同程度的影响,具体表现为对控制圈-个人实力、主 观健康有显著的提高 (β控制圈 = 0.075,p < 0.001 ,R2 =0.006;β主观健康 = 0.048,p < 0.001 ,R2 =

学校干预对学校心理环境也有着显著的提升,如对安全与秩序、接纳与支持、公平与公 正、鼓励自主与合作均有着显著的提升(β安全与秩序 = 0.047,p < 0.001,R2 =0.002;β接纳与支持 = 0.024, p < 0.01 ,R2 = 0.001;β公平与公正 = 0.028,p < 0.01 ,R2 =0.001;β鼓励自主与合作 = 0.026,p < 0.01 ,R2 = 0.001)。
学校干预对学习相关变量也有着不同程度的影响,具体表现为趋向型-成绩目标、回避型 -成绩目标、回避定向、主体信念、手段-结果信念有着显著的减弱(β = -0.023 ~ -0.074,p < 0.01, R2 =0.001 ~ 0.005)。此外,虽然对专业/职业认同、外在型-掌握目标也有所影响 (β =-0.021, p < 0.05),但效应值很小(R2 < 0.001)。
表 5 中职学校干预组与控制组的双重差分分析结果
组别(干预组=1 ,控制组=0) | 时间(后测=1 ,前测=0) | 双重差分(DID) | ΔR2 | ΔF | |||||||
B | SE | β1 | B | SE | β2 | B | SE | β3 | |||
学业成就 | |||||||||||
阅读能力 | 0.370 | 0.015 | 0. 194*** | 0.096 | 0.015 | 0.049*** | 0.364 | 0.018 | 0. 154*** | 0.024 | 393.46*** |
考试成绩 | 0.058 | 0.016 | 0.011 | 0.126 | 0.016 | 0.063*** | 0.058 | 0.032 | 0.024 | 0.0001 | 3.40 |
自我及心理健康 | |||||||||||
自我悦纳 | -0.06 | 0.053 | -0.009 | 0.246 | 0.053 | 0.037*** | 0.155 | 0.065 | 0.019* | 0.0001 | 5.74*** |
内外控 | -0.381 | 0.046 | -0.066*** | 0.003 | 0.046 | 0.001 | -0.27 | 0.056 | -0.038*** | 0.001 | 23.04*** |
控制圈-个人实力 | 1.068 | 0.097 | 0.089*** | 0.283 | 0.099 | 0.023** | 1.106 | 0.119 | 0.075*** | 0.006 | 85.98*** |
孤独感 | -2.429 | 0. 121 | -0. 162*** | -0.587 | 0.123 | -0.039*** | -2.368 | 0.148 | -0. 129*** | 0.017 | 255.53*** |
抑郁(CES-D) | -3.516 | 0.223 | -0. 127*** | -1.472 | 0.227 | -0.053*** | -3.402 | 0.274 | -0. 100*** | 0.010 | 154.04*** |
总体困难(SDQ) | -0.550 | 0.088 | -0.049*** | -0.587 | 0.089 | -0.052*** | -0.879 | 0.109 | -0.063*** | 0.004 | 65.28*** |
主观健康 | 0.370 | 0.109 | 0.027** | 0.716 | 0.110 | 0.052*** | 0.812 | 0.134 | 0.048*** | 0.002 | 36.47*** |
生活满意度 | -0.912 | 0.116 | -0.063*** | 0.033 | 0.118 | 0.002 | -0.650 | 0.143 | -0.036*** | 0.001 | 20.71*** |
同伴关系 学校心理环境 | -0.017 | 0.042 | -0.003 | 0.049 | 0.042 | 0.009 | 0.103 | 0.051 | 0.016* | 0.0001 | 4.02*** |
安全与秩序 | 0.764 | 0.064 | 0.095*** | -0. 114 | 0.065 | -0.014 | 0.466 | 0.079 | 0.047*** | 0.002 | 34.90*** |
接纳与支持 | 0.497 | 0.066 | 0.06*** | -0.190 | 0.067 | -0.023** | 0.242 | 0.082 | 0.024** | 0.001 | 8.83*** |
公平与公正 | 0.680 | 0.072 | 0.075*** | -0.221 | 0.073 | -0.024** | 0.309 | 0.089 | 0.028** | 0.001 | 12.04*** |
鼓励自主与合作 | 0.653 | 0.082 | 0.063*** | -0.207 | 0.083 | -0.020* | 0.328 | 0.101 | 0.026** | 0.001 | 10.54*** |
(续上表)
注:*p < 0.05;**p < 0.01;*** p < 0.001
组别(干预组=1 ,控制组=0) | 时间(后测=1 ,前测=0) | 双重差分(DID) | ΔR2 | ΔF | |||||||
B | SE | β1 | B | SE | β2 | B | SE | β3 | |||
学习相关变量 | |||||||||||
专业/职业认同 | -0.118 | 0.131 | -0.007 | -0.399 | 0.133 | -0.024** | -0.416 | 0.161 | -0.021* | 0.0001 | 6.68*** |
内在型-掌握目标 | -0.094 | 0.044 | -0.017* | 0.045 | 0.045 | 0.008 | 0.017 | 0.054 | 0.002 | 0.000 | 0.09 |
外在型-掌握目标 | -0.146 | 0.044 | -0.027** | -0.050 | 0.045 | -0.009 | -0.138 | 0.054 | -0.021* | 0.0001 | 6.47*** |
趋向型-成绩目标 | -0.244 | 0.044 | -0.045*** | -0.004 | 0.044 | -0.001*** | -0.151 | 0.054 | -0.023** | 0.001 | 7.92*** |
回避型-成绩目标 | -0.430 | 0.046 | -0.077*** | -0.095 | 0.046 | -0.017* | -0.398 | 0.056 | -0.058*** | 0.003 | 50.94*** |
回避定向 | -0.649 | 0.048 | -0. 110*** | -0.082 | 0.048 | -0.014 | -0.52 | 0.058 | -0.072*** | 0.005 | 79.32*** |
主体信念 | -0.870 | 0.084 | -0.084*** | -0.116 | 0.085 | -0.011 | -0.681 | 0.103 | -0.054*** | 0.003 | 43.76*** |
手段-结果信念 | -1.706 | 0.130 | -0. 106*** | -0.307 | 0.132 | -0.019* | -1.462 | 0.160 | -0.074*** | 0.005 | 83.60*** |
推理能力 | 0.343 | 0.015 | 0. 177*** | 0.157 | 0.016 | 0.080*** | 0.384 | 0.019 | 0. 160*** | 0.026 | 419.81*** |
注意能力 | 0.223 | 0.016 | 0. 109*** | 0.099 | 0.016 | 0.048*** | 0.271 | 0.020 | 0. 108*** | 0.012 | 186.99*** |
成长思维 | 1.012 | 0.065 | 0. 124*** | 0.216 | 0.066 | 0.026** | 0.994 | 0.080 | 0.099*** | 0.010 | 154.93*** |
自我肯定 | -0.068 | 0.051 | -0.011 | 0.165 | 0.051 | 0.026** | 0.085 | 0.062 | 0.011 | 0.0001 | 1.85 |
4 讨论
总体上看,研究结果表明,学校干预几乎在所有心理发展特征变量上(内在型-掌握目 标、自我肯定除外)都有显著变化,并且是提升了积极心理发展特征,减弱了消极心理发展 特征。也就是说,学校干预取得了提升中职生积极心理发展,减弱了消极心理发展。同时学 校干预显著改善了中职生的阅读能力,而对考试成绩改善不显著。
本研究结果表明,学校干预对中职生推理能力、注意能力以及阅读能力均有显著的提高。 Wilson(2016)关于勇气干预、成长思维干预及其联合干预的混合研究发现,三组对阅读能 力均有显著提升。还有研究针对孩子的父母进行成长思维干预,结果表明干预后孩子阅读水 平提升了 0.3 个标准差,相当于 2.4 个月阅读水平的提升(Andersen & Nielsen ,2016)。
研究结果还表明,学校干预对自我及心理健康也有着不同程度的影响,具体表现为对控 制圈-个人实力、主观健康有显著的提高,对内外控、孤独感、抑郁(CES-D)、总体困难(SDQ) 也有着显著的减弱。学校干预对学校心理环境也有着显著的提升,如对安全与秩序、接纳与 支持、公平与公正、鼓励自主与合作均有着显著的提升。学校干预对学习相关变量也有着不 同程度的影响,具体表现为趋向型-成绩目标、回避型-成绩目标、回避定向、主体信念、手 段-结果信念有着显著的减弱。也有研究表明,基于学校积极行为的干预后学生的积极情感 体验、学校满意度以及学业成就都有显著提升,而不良行为有显著降低(Childs, Kincaid, George, & Gage, 2016)。
本研究结果还显示,学校干预后中职生成长思维有显著提高,而对自我肯定提升不显著。 也就是说通过学校经费投入、学生活动增加,增加奖学金等奖励措施对中职生成长思维是有 提升,而对于中职生自我肯定则改变不大。事实上,有一项基于计算机程序的学校干预也发 现对成长思维有促进作用(Barron, Hulleman, Hartka, & Inouye, 2017) 。该研究以 PDSA 循 环(plan-do-study-act cycle)为理论基础把社会心理干预融入学生实践活动中,对初二学生进行 20 分钟左右的干预,结果表明,干预后成长思维上升的学生比例在 48%到59%之间。另一 项研究表明,奖励配合成长思维干预更加有效(Chao, Visaria, Mukhopadhyay, & Dehejia, 2017),因为当奖励使学生如何提高或改变自己的能力时,正好能激发学生的内部动机,促 进学生成长思维的提高(Rattan, Savani, Chugh, & Dweck, 2015)。而本研究的学校干预也正 是增加了奖学金,文体活动的各项评比等奖励。
对于本研究的学校干预来说还需要进一步改进。Blackwell(2012)认为只有从共同领导 (shared leadership)、开放沟通(open communication)、专业协作(professional collaboration)、 目标清晰(clear goals)、学校规划(school plan)、对所有学生成长学习都非常支持和信任 几个层面营造学校文化才能提升学校成长思维。而一个学校成长思维的测量工具就明确把学 校成长思维分为协同规划(Collaborative Planning)、共同领导(Shared Leadership)、开放 沟通和支持(Open Communication and Support)三个维度(Hanson, Bangert, & Ruff, 2016)。 因此,学校干预还需要基于学校成长思维文化的营造,改善学生成长思维的同时,也改善教 师自身成长思维以及对学生成长思维的正确认知。
此外,值得注意的是,学校干预是针对整个学校多层次、多渠道的干预,对于个体的影 响更多是通过环境的改变来实现环境影响个体的目标,然而,学校干预很难做到每所学校的 一致性,因为学校干预都是基于每所学校已有的基础,依赖干预学校来组织实施,具有一定 程度的不可控性。因此,需要进一步探讨基于个体,进行可控性强的社会干预来检验成长思 维、 自我肯定在中职生心理发展特征对学业成就影响机制中的作用。
5 结论
(1)学校干预能够显著提升中职生成长思维,但对自我肯定影响不显著。
(2)学校干预能够显著改善中职生心理发展特征,如对自我及心理健康、个体感知的 学校心理环境、学习相关变量都有不同程度的影响。
(3)学校干预能够显著提高中职生推理能力、注意能力以及阅读能力,但对考试成绩 影响不显著。
参考文献 略