线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

考试质量分析总结8篇

时间:2023-03-14 15:05:07

考试质量分析总结

考试质量分析总结篇1

一、试卷的总体评价

1.试卷的总体特点

试卷的总体特点可从以下方面阐述:

(1)试题是否依据课标和考试大纲、是否体现课程理念,对提高教学质量起到导向作用

(2)知识点是否覆盖全面,是否突出对核心内容的考查

(3)分析对实验考查和化学用语考查的比例,能否体现化学的学科特点和学科思想,为学生参加进一步深造学习奠定了坚实的基础

(4)试题所选材料是否贴近生活和生产实际、试题设置是否具有较强的情境性

(5)试题是否突出对思维能力和科学素养的考查

2.试卷结构分析

(1)题型结构分析

试卷的题型结构,主要取决于考试的性质和相应的考试大纲或考试说明的要求。因此,我们评价试卷题型结构的合理性,是判断试卷题型结构是否符合考试大纲或考试说明。

(2)能力层次结构分析

试卷能力层次是依据考试大纲或考试说明确定的,不同性质的考试,能力层次的要求和结构有所不同,如高中学业水平考试能力层次从低到高,依次为识记、理解、简单应用和综合应用四个层次,高考能力层次依次为了解、理解、综合应用。因此在试卷能力层次的评价中,需要分析试题的能力层次和考试大纲或考试说明的一致性。

二、试卷的质量评价

1.试题质量的初步评价

(1)测验分数的分布状态

我们对测验分数初步整理,以横坐标表示分数,纵坐标表示频数(每个分数段所含分数的次数),制作学生成绩次数分布曲线,根据正态分布、正偏态分布、负偏态分布、双峰形分布、平坡形分布和陡峭形分布六种分数分布状态,可以判断出不同难度试题所占的大概比例。

(2)平均分

根据平均分的数值,可以直接判断试题的平均难度。平均分过高或过低,说明试题容易或过难,不适应被测学生的实际水平;只有当平均分值与预期吻合或相当接近时,测量目的才有可能实现,这样试题质量才可能符合测试目的的要求。

(3)标准差

利用标准差数据对试题质量做出初步评价时,主要看学生测验分数的离散情况是否与学生学习成绩的实际分布一致。如果测验分数的标准差小,说明分数分布相对集中,被测群体的整体情况较好;相反,说明分数分布相对离散,被测群体的学习成绩参差不齐。

2.信度

信度是指测得结果的一致性或稳定性,稳定性越大,意味着测评结果越可靠。信度通常以两次测评结果的相关系数来表示。相关系数为1,表明测评工具如试卷完全可靠;相关系数为0,则表明该试卷完全不可靠。一般来说,要求信度在0.7以上。

3.效度

效度是一个测试能够测出它所要测量的特性或功能的程度,即测试结果与测试目标的符合程度。在评价化学试卷时,分析试题,制作双向细目表,分析试题考查内容代表课程标准、考试大纲或考试说明所规定的教学内容的程度,判断试题的内容效度。

4.逐题分析

我们对试题逐题分析时,主要从解答分析和考查意图两个方面进行分析,达到对每道试题的全面了解,为后面提出建议奠定坚实的基础。

三、答卷评价

试题的答卷评价主要从试题的难度和区分度两个方面进行分析。根据试卷抽样统计数据及答题情况,分别制作关于题型、平均分、标准偏差、难度和信度的统计数据表,选择题和非选择题答题情况统计表,以对学生的答卷情况进行评价。

四、建议

我们通过对试卷的定量统计与定性分析,一方面对该课程教与学的效果进行分析和判断,发现“教”与“学”方面存在的问题;另一方面对试卷质量做出科学鉴定和总结,检测试卷能否真正达到考核的目的。进而提出改进教学、命题的意见和建议,不断提高命题和教学质量。

1.对命题的建议

对试题好的方面(如科学性、生活性、开放性),建议继续保持,对于不好的方面(难度、区分度、效度),建议加强。

2.对教学的建议

依据试题分析,提出可行性的教学建议,供教师和教育部门参考,更好地促进教学质量的提高。教学建议可从以下几个方面提出:(1)教学内容的深广度;(2)主干知识、基础知识和基本技能;(3)实验教学;(4)化学用语的教学;(5)教学方法等。

3.对学生的建议

根据学生的答卷情况以及试题的命题方向,对学生提出行之有效的建议,帮助学生认识自己的不足和命题的方向,以促进学生准确把握学习和备考方向,不断提高学习成绩。学生建议可从以下几方面提出:基础知识、基本技能、答题格式、学习习惯、STSE中的化学问题和心理素质等。

参考文献:

考试质量分析总结篇2

【关键词】医学微生物学 试卷分析 教学改革

《医学微生物学》是临床学专业的重要专业基础课之一,对考试试卷和考试成绩进行全面的分析,能较好地反映学生的真实水平以及对知识掌握的情况,可以帮助教师发现教学中存在的具体问题,改革教学方法,提高教学质量及教学效果。因此,对包头医学2011 级200名临床学生的医学微生物学试卷进行比较分析。

1对象与方法

1.1研究对象

资料来源包头医学院五年制本科2011级临床医学专业549名学生及随机抽取的 200 名学生(占总人数36.42%)的医学微生物学期末考试的试卷及成绩进行了综合分析。本次考试在教务处统一组织、安排下进行,教研室主任或由教研室主任指派具有丰富教学经验的高年资、高职称教师于考前三天到教务处抽题、审题(考教分离)。试卷的评判是根据提前制定的评卷标准和答案,按照《包头医学院考试阅卷及成绩传输管理办法》流水方式进行阅卷及成绩输入,主观题由高年资、高职称教师评阅,减小阅卷个体差异。

1.2研究方法

本次医学微生物学试卷总题目为 63 道,其中客观题单项选择题、多项选择题、填空题主观题(名词解释、简单题),满分100 分。试卷各题型数量及所占比例见表1。本文将200 名学生的每道试题的得分情况输入计算机,建立数据库,使用Excel2003以及SPSS13.0 软件分析数据。主要以学生总成绩的分布状况、试题的难度、标准差、区分度等作为试卷分析的评价指标,研究学生的学习情况及教学效果。

2结果

2.1 试卷成绩分析

本次试卷满分100分,200 名学生的平均成绩为78.9分,标准差为12.46,最高分为100分,最低分为 39 分。学生成绩的各分数段频数分布见表2,峰值在70~90 分之间,该试卷总体上成绩分布呈正态。各题型得分率情况见表3,得分率有高到低依次为单选题、名词解释、问答题、填空题、多选题。

2.2 试卷质量分析:

(1)难度:试题的难度是指学生对某一试题作出正确回答的百分率,是反映试题难易程度的指标,取值范围在0~ 1之间。难度指数公式:P=X/W(X 为平均分,W 为满分),难度值越大, 说明试题难度越低,一般以0.6-0.8为宜[2]。本次医学微生物学试卷总难度系数及每道题的难易程度见表4,试卷总难度系数为 0.79,总体试题难度适中。各个题型难度:单选题(P=0.89)、名词解释(P=0.88)难度较容易;填空题(P=0.71)问答题(P=0.75)难度适宜;多项选择题(P=0.57)难度偏难。

(2)区分度:指试题对被试者情况的分辨能力的大小,是判断试题质量的另一个重要指标。根据计算公示D区分度= 2 ( 高分组总―低分组总分) / 两组考生总人数×试题满分值,算出每小题区分度及试卷总区分度[3]。表4显示医学微生物试卷整体区分度为0.3,属于良好试题,能较好的把低、中、高水平的学生成绩区分开(一般认为区分度值0.3 ~0.4属于良好[3])。单选题区分度为0.18属于较差区分题;名词解释、填空题区分度分别为0.26、0.23属低等区分题;多项选择题区分度0.33属于良好区分题;问答题区分度0.49属于高度区分题。

(3) 信度:反映考试稳定性和可靠性的指标,信度高的试题很少受偶然因素的影响,对任何学生的多次测定,都会产生比较稳定的、前后一致的结果。表4显示医学微生物试卷的总信度为 0.77,一般试卷信度要求在 0.5 以上[4],故认为本次医学微生物学试卷结果可靠。

3讨论

学生的考试成绩是评定教学质量的重要指标,通过对试卷质量分析,可以不断完善命题工作,对今后的命题工作提供宝贵的经验;试卷质量分析的结果还可以第一时间反映出学生对教学内容的掌握程度,就能使考试在教学过程中发挥积极的作用。

3.1 本套试卷质量分析情况

本次医学微生物试题符合教学大纲精神,整体设计合理、知识点覆盖率较高。综合试卷质量分析的各项评价指标试卷平均难度系数为0.79,试题难度适中,属于优良试卷,试卷总体上成绩分布呈正态;学生成绩80~90分段人数居多占28.5%,可以看出学生学习的积极性和主动性较好,成绩总体令人满意,学生能熟练运用基本理论、基础知识和基本技能,达到大纲要求。本次考试平均区分度为0.3,说明试题区分良好,能较好的把低、中、高水平的学生成绩区分开。试卷信度为0.77,表明可信度较好。但仍有7.5% 学生不及格,提醒授课教师认真对待教学过程中的每一个环节,坚持从严治学的同时,提高课堂渲染力,激发学生的求知欲,在提高教学效果和教学质量上狠下功夫,使学生的学习真正做到扎扎实实,以便为从事临床工作奠定必要的基础。

3.2 本套试卷存在问题

同时,本试卷质量分析结果暴露一些问题,值得我们注意和思考。1. 客观题主要考核学生对基本理论及基本知识的掌握与理解的程度,而主观题则是考核学生归纳总结、分析、理解和应用医学微生物学知识的能力。本套试卷客观题与主观题比例为4.6∶ 5.4,应该适当增加主观题比例,减少部分客观题,才能更好利于临床学生对医学微生物学知识的理解以及分析解决问题的能力。2. 本套试卷出现了满分即100分的学生,说明本套试卷缺少综合性有深度的难题,在保证基础知识点不遗漏的前提下,应该适当出现1-2道综合性难题,例如医学微生物学有关的病例分析,目的是培养学生的综合思维能力及综合素质的提高。3. 单选题总分30分,平均分高达26.79分,难度系数为0.89,区分度较差仅为0.18,今后我们要适当增加单选题的难度,对单选题的区分度还需要进一步整改。

3.3 对今后命题工作指导与教学改革的思考

通过试卷分析, 我们获得了准确、客观的反馈信息。今后的命题工作中, 命题者在把握好试题的难度的前提下,可以适当增加创新性、有深度的综合性试题,注意主观题与客观题的比例,各种题型的难度及区分度要合理,不断提高试题编制能力,使试题更加科学、合理、客观。在今后的教学实践和教学改革过程中, 应重点解决如何激发学生学习兴趣、如何使学生真正理解和掌握医学微生物学理论。 教师授课时,应该充分调动学生积极性,培养学生真正热爱课堂,喜欢听课,而不是被动上课,真正提高学生学习兴趣,同时还应着重提高学生分析解决实际问题的能力;教师应该严格要求自己,改革现有的教学方法,要不断提高授课技巧,增加课堂渲染力,提高自身业务素质,这样不仅能提高教学质量和教学效果,也有助于教师科研水平的提高。

【参考文献】

[1]张淑杰,熊亚南,王梅梅. 《医学微生物学》期末考试试卷成绩分析与评价[J]. 华北煤炭医学院学报,2008,10(6):883-884.

[2]张旭东,贾书花,李凯平等. 组织与胚胎学课程期末考试试卷分析与评价[J]. 医学教育探索,2009,8(9):1166-1169.

考试质量分析总结篇3

一、引言

考核是检验教学质量最重要的手段之一,试卷的质量和学生考试成绩是衡量教学质量的主要方法。通过对试卷分析,可以反馈学生学习情况,评估教学效果,为进一步推进教学改革、提高教学质量提供参考。[1]

虽然目前许多高校在教学评价方面都呼吁评价形式的多样化,但试卷测试仍然是最主要的方法,因此试卷质量分析成为高校教师教学过程中的一个必备环节。目前多数学科如数学和医学专业已经重视试卷成绩和试题质量分析,[2-7]]对世界自然地理的课程与教学改革方面进行研究较少,[8-10]贺丹君等从评价体系上对地理课程进行定性分析和评价,未对试卷质量进行定量分析。[11]然而,《世界自然地理》是高等院校地理专业的必修课程之一,它最能体现地理学的综合性、区域性和人地相关性,具有其它地理学分支学科不可比拟的优势,所以对《世界自然地理》试卷成绩进行定量分析,评价试卷的优劣是很有必要的。本文对2007级地理科学专业57名学生的世界自然地理期末考试成绩进行分析,评判试卷对学生学习情况的反映能力,旨在为今后的考试命题和教学改革提供参考依据。

二、数据来源与研究方法

1. 数据来源

2007级地理科学本文由收集整理专业的本科生共57名学生的世界自然地理期末考试试卷。试卷由任课教师命题,试卷评判严格按照评分标准和标准答案进行,由任课教师评分。试卷卷面分值满分为100分,包括4种题型,26道小题:第一题单项选择题包含15道小题,占总题目数的57.69%,共15分;第二题简答题包含5道小题,占总题目数的19.23%,共40分;第三题填图题包含4道小题,40个空,占总题目数的15.38%,共20分;第四题论述题包含2道小题,占总题目数的7.69%,共25分。

2. 方法

试卷分析主要是指通过收集一定量的原始数据,按照设定的评价指标,运用测量学和统计学的理论,通过计算各种统计量数和绘制统计图表,对试卷进行定量分析和评价。[12]可以针对某一门课程,比较学生各成绩段的比例,分析学生成绩的分布是否合理,与试卷内容是否相关等。评价指标可以从教学大纲、命题、试题数量比例等方面来设定。

试卷质量的统计分析是运用数理统计描述和统计推断的方法,对试卷的数量特征和数量关系进行分析和判断。[12]根据《教育测量学》的介绍,[13]本文主要选取难度、区分度两个指标对试卷质量进行统计分析。

(1)难度。试题的难度是衡量试题难易程度的指标。[13]

在编制试题时,难度分布从易到难,逐步增加难度,这样有利于考生水平的正常发挥。试题的难度即考生对该题的通过率或得分率,对于答对得1分、答错或不答得0分的试题,难度(p)就是答对(或通过)试题的人数与考生总数之比:

(1)

式中,r为答对该题的人数,n为考生总数。

对于满分量大于1分的试题,难度则是考生对该题的平均得分与该题的满分之比:

(2)

式中, 为考生对该题的平均得分, 为该题的满分。p值越大,试题越容易。因为百分制以60分为及格,通常情况下,把平均难度控制在0.45~0.75之间比较合适。[13]试题难度的评价标准见表1。

表1 试题难度的评价标准

(2)区分度。题目区分度是指检验题目对其学业水平不同的考生的区分程度或鉴别能力,它是学生掌握知识水平和能力差异的指标。[14]通过考试,学习好的学生得到高分,学习差的学生得到低分,则说明试题的区分度高;如果学生中好、中、差三个层次的考试成绩处于同一个分数段中,就反映不出学生学习水平,那么这样的试题区分度就低。所以一般采用比较方便的两端分组法来计算试题的区分度。所谓两端分组法,即当测试成绩成正态分布时,将考试总分进行排序,然后选出得分最高的27%列为高分组,将得分最低的27%列为低分组。区分度计算公式如下:

,其中i=1,2,3,……n (3)

式中, 和 分别表示全体考生中的高分组和低分组中第i题的平均分; 表示第i 题的满分值。d≥0.40为优秀;0.30≤d<0.40为良好;0.20≤d<0.30为尚可,需改进;d<0.20为劣,需淘汰或修改。[15]试题区分度的评价标准具体见表2。

表2 试题区分度的评价标准

3. 结果分析

从2007级地理科学专业世界自然地理期末考试的成绩分布来看,试卷满分为100分,客观题总分为35,主观题总分为65,学生考试的平均成绩为68.35,最高分为91,最低分40.5,标准差10.10,及格率为80.7%,不及格率为19.3%。

一是课程成绩分布情况分析。

(1)试卷总成绩分布:2007级地理科学班的57名学生,有39名学生成绩分布在60~79分内,占68.42%;有6名学生成绩分布在80~89分内,占10.53%;有10名学生成绩分布在50~59分内,占17.54%;仅1名学生成绩高于90分和低于40分,各占1.75%,见表3。通过绘制成绩分布直方图可以看出,该班期末成绩总体呈正态分布,见图1。教育统计学统计规律表明:学生的智力水平,包括学习能力,实际动手能力等呈正态分布。考试成绩分布应基本服从正态分布,这样才能真实反映学生的实际,也能够说明试卷设计是合理和具有科学依据和实际意义的。[15]本试卷总成绩呈正态分布,说明试卷总体设计合理、可靠、科学。

转贴于

表3 《世界自然地理》期末考试总成绩分布情况

图1 《世界自然地理》期末考试成绩分布图

(2)试卷各大题成绩分布。该试卷共四个大题,因为各题总分不一样,所以把各大题以100分为基准,对分数段进行折合计算,具体各分数段的人数和比例见表4。通过对各大题绘制直方图可以看出,单选题、填图题成绩分布呈偏正态分布,简答题成绩呈偏态分布,但是没有单选题和填图题严重,大体还呈正态分布,这看出就大题而言,单选和填图题设计过于简单,不能很好反应学生的学习能力,但是单选和填图属于识记类知识类型,本来就不好区分学生层次,所以总体看来还是符合实际的;简答和论述题成绩大致呈正态分布,能较好地体现学生学习效果的差异和智力水平,设计很好,见图2。

二是难度、区分度分析。从总成绩看,试卷难度为0.680,试卷区分度为0.402,表明整卷难度适中,区分度好,总体来说试卷质量优良。在各大题中,难度都适中,区分度除了单项选择题为0.29,试题尚可,须进一步改进外,其它三道大题都为优良。结合2007级地理专业的学生为理科生的专业背景,地理基础知识相对薄弱的实际情况,可以看出该试卷的论述题等反映综合能力的试题偏难,但区分度较好,适合考核学生的实际学习水平,有利于提高学生考试的有效性程度,见表5。

三、结论及建议

通过结果分析可以看出,该试卷整体的命题结构好,学生总成绩和大部分大题成绩呈正态分布,试题难度适中,除了选择题之外,其他题型区分度很好。建议以后命题要严格按照教学文件规定的要求,不断完善命题工作,特别是选择题的要加强命题的难度和区分度,同时应该从新课改的理念出发,不断改进命题工作,让考试在教学过程中发挥其应有的积极作用。

1. 试卷构成

整卷共四道大题,26道小题,客观题和主观题的比例为7:13;客观题主要考核学生对世界自然地理的基本概念及基本知识的掌握与理解的程度,而主观题则是考核学生归纳总结、分析、理解和应用知识的能力。本试卷考试内容覆盖面较广,基本涵盖教学大纲要求的大部分教学知识点,符合教学大纲的要求。该试卷试题综合了教学大纲的多个知识点,适当增加了一定的难度和深度。试卷结构记忆类占20%,理解类占40%,简单类占15%,综合应用类占25%;试卷各类题型所占的比例均符合教学要求,难度适中则反映出本课程的基本知识点、重点和难点。

2. 考试成绩分布

由于2007地科班属于理科生,没有高中地理知识的基础,所以本次试卷的命题不但注重学生综合分析能力的提升,同时也关注学生的地理基础知识,因此试题大约有70%是考察学生综合思维能力和分析能力的,涉及知识范围较广,其目的是提高学生对所学课堂内容进行总结提炼及实际应用,也设计有30%左右的基本知识题,如选择和填图题。从总成绩来看,该卷的成绩分布是呈正态分布,反映出绝大多数学生对考查综合能力的试题还是比较适应的,其分值大部分集中在60~80分,见图1;从各大题成绩来看,简答和论述题成绩基本呈正态分布,试卷能很好区分学生层次和体现他们各自的能力水平,能很好达到测验目的,但是单选、填图题的成绩分布呈偏正态,虽然这两大题属于识记型,但是作为试卷设计,还是应该从科学性测验出发,更好体现学生水平为原则,所以在以后的命题中,会更加注重这两部分题目的科学性和实践性。综合以上分析表明,本次考试基本反映出学生对世界自然地理知识学习的实际水平,同时也说明命题者对试题难度等因素掌握得较好。

3. 试题的难度与区分度

难度和区分度都是判断试题质量的重要指标,用于衡量考生能力的程度。通过一次考试将不同程度和不同能力的学生区别开来。难度系数(p)是反映试题难易程度的重要参数,难度系数越小,说明试题难度越大。一般认为试题的难度系数应控制在0.45~0.75之间比较合适。[10]本次试卷的平均难度系数为0.68,四个大题的难度分别为(单选题0.72,简答题0.70,填图题0.71,论述题0.62),不管是从整个试卷来看还是从各大题来看,本套考卷所有类型试题的难度系数在0.62~0.72之间,根据表1(试题难度的评价标准)来看,试题难易程度适中,比较合理,能区分学生能力。

区分度(d)是衡量试题质量的另一重要因素,是评价试题质量、筛选试题的主要指标,d值越大,区分效果越好。一般认为,d≥0.4,区分度极好;0.3≤d≤0.39,区分度良好;d≤0.19,区分度极差;所以试题区分度≥0.20即为可用试题,而区分度≤0.19的试题应该被淘汰。世界自然地理是地理学的一门基础主干课程,有其特殊性,概念多,需要记忆的知识多,尤其记忆各大洲的山脉、河流、湖泊容易记错,各周的地理位置不易描述,而且该级的学生是理科生出生,地理基础知识掌握有待提高,诸多因素使命题者难以把握试卷的难易程度及区分度。在本试卷中,整卷区分度为0.402,各大题中,除了单选题的区分度<0.30(为0.29)外,简答题、填图题和论述题的区分度均>0.40(分别为0.53、0.48和0.52),而且简答题、论述题的区分度非常好(d>0.5)。通过试卷分析表明,本套试题的区分度、易难度良好,其分析结果为命题者今后的命题工作提供了参考依据。但今后对单选题和绘图题的区分度还需要进一步加以改进,判断题应淘汰或注意完善该题型的区分度。

4. 今后命题工作的导向

考试质量分析总结篇4

关键词:药物应用护理;试卷分析;试卷质量;教学思考药物应用

护理是在药理学基本理论指导下进行用药护理的综合性专业技能课,是护理专业必修的一门重要桥梁课程,课程的任务是使学生掌握各类代表药物应用的基本知识、主要不良反应和用药注意事项,具备药物应用护理的基本技能[1-3]。考试能检查和评估学生对知识和技能的掌握程度,通过试卷分析能发现教学中存在的问题[4-5]。本文通过对重庆市某卫生学校2015级护理专业《药物应用护理》期末考试成绩进行回顾性统计分析,以评价试卷质量发现教学过程中存在的不足,为改进教学方法、提高教学质量作参考。

1材料与方法

1.1资料来源

重庆市某卫生学校2015级护理专业1班—4班《药物应用护理》期末考试试卷共239份,以姚宏主编的《药物应用护理》(第2版)为教材,共72学时。考试时间为2016年6月。

1.2命题与考试

授课教师严格按照教学大纲命题,共两套试卷,分别为A、B卷,考前由教务科随机抽取其中一套作为期末考试试卷,考试形式为闭卷笔试,考试时间90min,满分100分。考试题型分为主观题和客观题,共50题,具体题型数量及所占比例见表1.1.3方法试卷的评判依据考前制订的标准答案和评卷标准进行,由高年资授课教师以流水作业方式集体进行,阅卷后由专人复查、登分。阅卷完成后,用Excel2013和SPSS22.0软件进行数据处理、统计分析,算出平均分、标准差、难度系数、区分度、信度等试卷质量指标。

2结果

2.1成绩分数分布

有效试卷共239份,最高分97.0分,最低分44.0分,全距53.0分,平均分71.1分,标准差12.46,成绩近似正态分布,各分数段频数分布见表2.

2.2试卷质量评价

本套试卷总难度系数为0.71,总区分度为0.30,信度为0.79,各项试卷质量指标评价结果见表3~表4。

2.3考生失分情况分析

试卷根据《药物应用护理》教学大纲进行命题,此次考试学生失分情况中主观题高于客观题,具体由高到低为:分析题、名词解释、简答题、填空题、单选题和判断题,见表5

3讨论

3.1题型分布及成绩分析

本套试卷客观题与主观题所占分值比例为7:3,题量比约为5.3:1。客观题主要考查学生理解和掌握基础知识的程度,主观题主要考查学生归纳总结、灵活运用所学知识的能力。药物应用护理基本知识和相关概念多,涉及面广,作为对学生课程结束总结性考试,因而客观题量稍高。成绩分析结果显示,分数主要集中在60.0~89.0,良好率24.27%,及格率83.68%,成绩近似正态分布,一方面有利于选拔优秀,甄别落后,另一方面也可借此激发学生积极性,提升其学习成就感。

3.2试卷质量分析

3.2.1难度难度分析通过难度系数(P)来评价,其由该题通过率来计算,P=X/W(X为该题的平均得分,W为该题的满分值),反映大部分学生对该考查知识点的掌握度。一般认为,P<0.6为难,0.6≤P<0.8为适中,P≥0.8为容易。平均难度是衡量试卷难度的重要指标,通常平均难度在0.7~0.8。良好试卷难度应合理分配,难、中、易的题目比2:6:2[6-8]。本试卷小题型中,难、适中、易小题各占12%、38%、50%,容易题过多,适中题偏少,特别是考查学生记忆为主、基础知识的单选、判断题容易题较多,一方面说明学生基本知识掌握较好,另一方面在今后的出题中应该适当增加试题难度;各大题型难度系数P介于0.6~0.8,全卷难度0.71,总体难度适中,基本达到了本次考核目的。3.2.2区分度区分度(D)是指试题对学生实际水平的鉴别能力,是作为评价试卷质指标,筛选试题的主要依据,它是依据高分组和低分组学生对某题的难度系数,通过区分度计算公式计算出来的;D值越大区分度越好,一般认为,D≥0.3,区分度很好;0.20≤D≤0.29,试题适中;D≤0.19,试题差[9-12]。本试卷的良好题为10道,适中题为13道,差题为27道,分别占总体的20%,26%,54%;各大题型中,主观题区分度优于客观题的,特别是名词解释和分析题较好,判断题和填空题较差。说明学生在最基本的知识方面都能较好掌握,当主观灵活应用方面,相差区别比较明显。结合难度分析,提示成绩较低的学生需要加强学习、增强综合能力应用,与难度分析基本保持一致性。试卷总体区分度为0.30,属于区分度较好的试卷,但选择题、填空题的区分度较差,判断题有待改进。3.2.3信度信度是反映测试内部题目得分一致性的量度,用克伦巴赫Alpha(Cronbach'sα)系数来表示信度系数,可以采用SPSS计算。试卷信度系数α涉及其本身可靠性和评分可靠性,通常应大于0.6。本次考试试卷考查面广、方式丰富,评分标准客观、准确,统一阅卷,专人复核和统分,总体信度系数α为0.79,说明试卷信度较高,较真实地反映了学生学习状况、实际水平。

3.3教学思考

考试质量分析总结篇5

内经选读课程是培养中医药专门人才,提高中医药文化素质的重要课程,是中医学专业本科的必修课程,也是最重要的基础课程。学生对《内经选读》这门课程的掌握程度直接关系到中医学人才培养的质量。高等医学院校必修课程的考试是对学生知识的理解和掌握程度重要测评工具,试卷质量和学生的考试成绩是衡量教与学质量的主要手段和方法。通过对内经选读试卷进行质量分析,不仅可以反映学生对这门课程掌握的真实水平,还可以评价试题质量、发现教学中存在的问题,为完善试题库建设、改进教学方式、提高教学水平提供指导。

1资料与方法

1.1一般资料 采用中国中医药出版社出版的全国中医药行业高等教育“十二五”规划教材(第九版),选取我校中医学专业2012级中医3班内经选读期末考试试卷为研究对象。参加考试人数60人,共60份有效试卷,考试采用的是终结性评价。试卷包括5类题型,试卷结构如表1。试题由专业授课教师根据学科培养方案、课程教学大纲命题。试卷的评判依据命题教师制定的标准答案及评分标准,严格按照标准完成阅卷。

1.2统计学方法 利用EXCEL2003将60份试卷按每个学生的学号、姓名、各题的得分及总分情况双份输入,并经仔细核查与修订。然后将表格中数据导入到SPSS19.0软件,在数据视图中定义变量名分别为学号、姓名、单选题、多选题、填空题、默写原文题、论述题、总分,在变量视图中检查数据类型,学号和姓名定义为字符型,长度为8;各题得分和总分定义为数值型,长度为8,小数点后长度为0。然后进行统计描述和统计推断,通过计算难度、区分度和信度进行试卷质量分析。

2结果

2.1成绩基本统计描述 考试成绩的基本统计描述指标选择均值、中值、标准差、偏度、峰度、极大值和极小值等统计量。输出描述统计结果如表2和图1。平均分为72.8,标准差为13.173,标准差值较大,说明学生个体之间存在较大的差异。

2.2正态检验 考试成绩一般要求符合正态分布,若不符合正态分布,说明考试结果不理想,出现低分数段人数太多(正偏态分布〉或高分数段人数太多(负偏态分布)两种情况。从成绩分布的直方图可以初步判断,学生的考试成绩近似服从正态分布,进一步用单样本K-S检验来判断,检验结果显示sig值为0.796,大于0.05,可以认为学生成绩呈正态分布。

2.3难度分析 难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数。计算公式为P=1—x/w(P为难度系数,x为某题得分的平均分数均值,w为该题的满分。难度系数P值越小表明试题越容易,难度系数P值越大表明试题越难,最小值为最大值为1。一般认为,试题的难度系数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右。在数据视图中,将表1中各类型试题的满分、总分和表2中各类型试题的均值、总分的均值直接录入,并定义变量名为“满分”和“均值”。然后点击转换-变量计算,在目标变量中输入难度系数P,在数学表达式中输入公式1-均值/满分,计算出各个试题和试卷的难度系数。结果如表3。

由表3可以看出,多选题难度系数最大,为最难题型;默写原文题难度系数最小,为最易题型。整个试卷难度系数为0.27<0.3,说明难度偏小,试题较易。提示应该适当增加试题难度,特别是单选题、默写原文题和论述题。

2.3区分度分析 区分度(D)是指试题对学生实际水平的鉴别能力,是一种区别学生成绩优劣的统计指标,一般与试题的难度系数一起来分析。对试卷进行区分度分析时,常以考试总分作为学生的实际能力水平,学生在某题的得分与总分的相关系数作为该题的区分度。对于客观题来说,一般使用Spearman相关分析;对于主观题来说,一般使用Pearson相关分析。这些分析在中都有相应菜单命令。整个试卷的区分度由各题的区分度求加权算术均数。一般要求试题的区分度在0.3以上。区分度在-1至1之间。D≥0.4时,说明该题目的区分度很好;D≤0.2时,说明该题目的区分性很差。D值为负数时,说明试题或答案有问题。本次考试的区分度结果如表4。

由表4可以看出,本试卷各题型的区分度较高,整个试卷的区分度为0.636,能区分出学生之间的实际水平差异。结合前面的难度系数分析,提示成绩较低的学生要加强学习的自觉性。

2.5信度分析 信度是指测验结果的一致性、稳定性及可靠性。试卷的信度分析可以反映试卷测试结果是否代表学生的真实水平。信度系数取值范围为0-1,其值越大,信度越高,表示该测验的结果愈一致、稳定与可靠。试卷信度分析可以采用SPSS中的可靠性分析,选用ɑ模型。本次考试的试卷信度为0.734,说明试卷的信度较高,较真实的反映了该班学生的学习状况和实际水平。

3结论与建议

考试质量分析总结篇6

[关键词] 助理全科医师;试卷分析;信度;难度系数;区别度

[中图分类号] R-4 [文献标识码] C [文章编号] 1673-9701(2017)02-0125-03

Brief introduction to commonly used indicators of assistant general practitioner's examination paper

ZHANG Donghai1 ZHAO Liuzhuang2 GANG Jun3 XU Deying4 LIU Shuang3 MA Xiuhua2

1.Department of Gastroenterology, Daxing Hospital, Capital Medical University, Beijing 102600, China; 2.Office of Hospital, Daxing Hospital, Capital Medical University, Beijing 102600, China; 3.Department of Science and Education, Daxing Hospital, Capital Medical University, Beijing 102600, China; 4.General Practice and Continuing Education of Capital Medical Unicersity School, Beijing 100069, China

[Abstract] Eight indicators are used in evaluating examination quality, including reliability, validity, difficulty, discrimination testing and average marks, standard deviation, score distribution, grade. Commonly used methods for the above indexes which are suitable for general graduation examination paper analysis would be introduced briefly.

[Key words] Assistant general practitioners; Examination paper analysis; Reliability; Difficulty coefficient; Difference degree

试卷分析是针对大量的成绩数据进行统计、计算、分析,进而得出科学结论的过程。试卷分析属于“教育测量学”的范畴。通过试卷分析可能提炼出诸多对考试质量进行评价的数据,此时试卷就不是单纯地“考试”,而是变(升华)为“试卷分析”。通过试卷分析所得到的比较科学的分析结果,可以进一步展开对教学活动评价,了解教学质量以及学生的学习质量(如对知识的掌握程度)等[1-7]。评价考试质量常用8个指标,包括涉及试卷的信度以及效度、难度、区分度,还包括平均分数以及标准差、分数分布状态、成绩[8-10]。对于上述指标进行分析的方法学较多、有的较为繁杂。我们曾做过相应试卷分析工作[11,12],现结合工作体会将适合结业试卷分析的一般常用方法做一简介。

1 主要涉及试卷质量指标(信度、效度、难度、区分度)的一般分析方法[8,13-14]

1.1 试卷试题难度分析的常用具体方法

难度系数(P)通常是指试卷以及试题的难易程度,可以反映或评价大部分学生对该试题或试卷知识点的掌握程度。难度系数分析应该包括试题难度系数与试卷难度系数两部分,仅进行试卷难度系数分析不易找出具体问题(即总成绩可能掩盖具体得分点)。

1.1.1 试卷总体难度分析的常用方法 试卷整体难度一般以0.6~0.8为宜。方法1:难度系数(P)=试卷的平均得分÷该试卷的满分值。如:试卷平均分为75分,该试卷满分为100分,则P=0.75。该方法较为粗糙,故较少采用。方法2:试卷难度系数(P)=(考试成绩前27%学生的得分之和+考试成绩后27%学生的得分之和)/两组总人数满分之和(考试成绩前27%学生指考试成绩排名在前27%的学生,将这些学生的成绩相加即为得分之和;考试成绩排名在后27%的学员以此类推)。

1.1.2 试题难度系数(P)常用计算公式 方法1:难度系数=试题的平均得分÷该题的满分值。方法2:难度系数=该题的总得分÷该题的满分值。满分值是指:参加考试人数×该题卷面的分值。如果所有试题均采用1分制(即:满分100分,试题100道,每道1分;不采用扣分制),则该题得满分值就是参考人数。所得结果也是该题的答题正确率。此时用方法2就较为方便。

1.2 区别度分析的具体方法学

区别度(D)是指能够区分考试(测验)成绩好的学生和考试(测验)成绩差的学生的指标,一般通过计算高分数段和低分数段学生的难度系数而得出。要同时分析试题区别度数与试卷区别度,单独分析试卷区别度易于掩盖试题的区别指数,误导选用试题。区别度越高,区分能力越强。但是,在结业考试中允许D=0的试题出现。一般以

1.3 试卷信度分析的具体方法学

试卷信度(α)评价该试卷检测结果的可靠程度、可重复性的指标,即为评价被测者在测试中的实际测量值与真实能力是否一致性的指标。最好的试卷信度应该在0.9以上,若低于0.7以下则不甚可靠。计算方法如下。

1.3.1 克朗巴赫公式[Cronbach系数(α)] (α)= 试题数/试题数-1×[(所有被测者第i题的方差-所有被测者总分的方差)/所有被测者第i题的方差]。该方法适用于非选择题以及多值计分题(即:试卷试题的类型较多、各题分值不同,如包括多选题、是非题、问答题等)。计算过程较为复杂,需要每道试题计算后得出结果,该方法应用较多。

1.3.2 库德-理查逊信度(简化)公式 适合用于每题1分的选择题(即试题计分为1分或0分的试题)。信度系数=[n(s-1)2-X(n-X)]/[(n-1)s2](计算较为简单)。(n为卷面满分成绩,X为平均总分,s为标准差)[11]。该方法最大的好处是不需要逐题计算通过率。

1.3.3 库德-理查逊信度(简化)公式的进一步简化 计算较为简单。此公式适用于所有试题为每题1分选择题的试卷。信度系数=[K/(K-1)]{1-[X(K-X)/Ks2]}。K为测题的数目,X为平均总分,s为标准差)[5]。

1.3.4 相关系数(R)计算[10] 该方法计算较为复杂。具体公式可以参考相关文献。

1.4 试卷效度分析

效度用于评判测量的正确性、有效性(反映测量到的与所要测量的二者之间的符合程度)[5,6,8,14-15]。如果将测验总分看作是内部效标,则该测题的区分度也就是该测题的效度(即内部效标的效度)[5,6,8,14]。所以,如果仅分析试卷本身只要有区别度即可。因此,在多数的研究中没有计算“效度”[1,3,7,11]。其他获得效度的方法如下。

1.4.1 相关系数(R)计算 基本方法是通过计算两门性质相近学科、或同一学科前后两次考试成绩的相关系数(R)来评价此次考试成绩的有效性。

1.4.2 百分一致法 按考试成绩将学生分为高、中、低3组,用各个试题中高、低分组之差除以相应的满分,即可得出此题的效度值。这实际上雷同于“区分度计算”方式,仅适应于本试卷的检测[16]。

1.5 试题难度系数(P)与区别度(D)之间的关系

P值越大则说明试题难度越小(内容为多数学生掌握),P值越小说明试题难度越大(多数学生未掌握),此两种情况试卷或试题的区别度均较差;要有较好的区别度,试题难度应适中。

较易试题的难度系数≥0.7;0.4

2 主要体现学生成绩的分析指标(成绩、平均分数、标准差、分布状态)[5,6,10,13,14]

2.1 成绩

即考生试卷的总得分。这是基本原始数据,是所有数据分析的基础数据,必须仔细输入。

2.2 平均分数

是最直观的集中量数。一般认为平均分数的最佳数值为75(百分制)。

2.3 标准差(s)

例如,甲班与乙班的考试平均分数相近但分数分布差异明显,则不能说两个班级的成绩相近。此时不仅要考虑到平均分数,还要计算分数的离散程度(简单可以理解为“分数分布情况”,学术名称――差异量数)。常用的差异量数有多种,经常采用的差异量数是标准差。计算公式可以在统计学教材查找到。计算标准差,理论上讲学生人数越多越好。一般认为:标准差≤10即能符合要求。标准差过大说明全班分数差异过大,需要教师予以注意;但过小则信度下降,区别度下降,标准差也可用于信度计算。

2.4 分布状态

简单理解就是看整个班级(年级)学生的成绩分布情况。一般要求是正态分布,结业考试可以允许一定的正偏态分布,但绝不能完全一边倒。一般习惯是利用成绩分布曲线分析学生的考试成绩(纵坐标为学生人数,横坐标为分数),可以直观的下结论(定性分析);如果要进行定量分析,则需进一步计算偏态量数及峰态量数[10]。

试卷分析的方法学较多,本文仅介绍较为简单、易于掌握的部分。利用试卷分析结果,可以评价教学效果,但其评价的基础是要有高质量的“试卷”(难易程度适当、知识点掌握的较好),这同样涉及教与学两方面的努力。试卷分析仅仅是手段而已,也可称为是教育测量的工具。在进行试卷分析的准备过程中,首先要编制适合测试对象的“试卷”:编制试卷则要根据测验目的进行,最基本的是要依据测验功能决定是进行能力倾向测验(学生的潜在能力如何?)是学业成绩测验(考察学生经过教育教学过程后学业成绩的掌握情况,也称“考试”)。进一步,则要根据培养目标进行分数解释,如果是“目标参照性测验”则其及格就是最基本的教学要求水平参照点,分数愈高说明达标的完满程度愈高;如果是“常模参照性测验”,即测验目的是鉴别性测验(优选,如高考),则测验的难度就要适当增加以利于选拔。结业测验一般是“目标参照性测验”,本文介绍的简便方法学适用于“目标参照性测验”。

研究结业考核标准与模式是不断探讨的课题[17],结业试卷分析不仅可以评价本次考核内容的学生掌握情况、教师教学效果,同时也可以评价不同教学单位在教授同一课程时其间教学效果的差异性[18]。“3+2”助理全科医师培训[19-21]是一项新的工作,我们在其中的《临床综合课程》教学实践、教学管理中,纳入试卷分析体系作为评价整体教学水平、发现不同教学单位教学差异点的手段之一[8,9],取得了较好的效果,不仅了解了教学效果,同时也为提出新的教学思路提供启发点,为集体备课提供了具体依据。因此,掌握试卷分析方法学,既是教师的基本功(特别是高校教师),也是教学管理部门应该熟悉的管理内容与管理技术。

[参考文献]

[1] 张正祥,刘国庆,王廷慧,等. 延安大学医学院药理学试卷分析[J]. 中华医学教育杂志,2008,28(4):120-122.

[2] 孙敏,王锦帆,祖勤,等. 医学生学习中期评估测试实效分析[J]. 中华医学教育杂志,2013,33(4):617-620.

[3] 卢燕,王培玉,刘宝花. 北京大学医学部八年制疾病预防医学期末考试试卷分析[J]. 中华医学教育杂志,2013, 33(5):791-793.

[4] 和永祥,王渊,徐俊丽,等. 内科学考试试卷分析与评价[J].西北医学教育,2006,14(3):304-305.

[5] 王孝玲,教育测量(高等师范院校教材)(第2版)[M]. 上海:华东师范大学出版社,2005:1-188.

[6] 黄颖,林端宜. 试卷分析研究现状综述[J]. 西北医学教育,2005,13(1):39-40.

[7] 宋青,蔡景一. 试卷考核质量评价[J]. 中国高等医学教育,2006,(11):30-31.

[8] 高卫红,任俊峰. 利用教育统计学原理进行考试质量分析方法初探[J]. 武警医学院学报,2004,13(3):214-218.

[9] 田考聪,彭斌. 试卷质量定量分析系统中的几个参数及其应用[J]. 医学教育探索,2004,3(4):52-54.

[10] 张玲玲,梅忠义. 对学生成绩评价指标体系中一些问题的思考,合肥工业大学学报(社会科学版),2006,20(2):19-21.

[11] 马秀华,张东海,黄东明,等. “3+2”助理全科医师培训《临床综合课程》结业试卷评价及相关因素分析[J]. 中国医学教育技术,2015,29(2):213-217.

[12] 马秀华,张东海,徐德颖,等. “3+2”助理全科医师培训中《临床综合课程》结业试卷分析评价[J]. 中华医学教育探索杂志,2016,15(5):445-450.

[13] 彭斌. 试卷质量定量分析系统中的几个参数及其应用[J].中华医学教育探索,2004,3(4):52-54.

[14] 刘新平,刘存侠. 教育统计与测评导论(第1版)[M]. 北京:科学出版社,2003:133-156.

[15] 史宏灿,龚卫娟,郑英,等. 以国家执业医师资格考试为参照的临床医学教学改革思考[J]. 中华医学教育探索杂志,2016,15(5):459-464.

[16] 陈欣,戴社教,赵暹,等. 不同类型试题对医学影像学考试评价的效能分析[J]. 中华医学教育探索杂志,2016, 15(5):455-458.

[17] 赵丽莉,李崭,黄艳. “3+2”培训项目结业考核标准与模式的研究[J]. 继续医学教育,2015,29(11):4-5.

[18] 张东海,马秀华,赵留庄,等. 通过临床综合课程结业试卷分析不同教学单位教学效果的差异[J]. 卫生职业教育,2016,34(12):101-103.

[19] 黄艳,线福华,赵丽莉,等. “3+2”助理全科医师培养模式的探索与实践[J]. 中华医学教育杂志,2014,34(2):31-33.

[20] 张东海,马秀华,黄东明,等. “3+2”助理全科医师培训首轮课程施后的思考[J]. 中华医学教育探索杂志,2015,14(8):837-840.

考试质量分析总结篇7

关键词: 命题质量 定量分析 质量评价

一、命题定量分析的准备工作

启动SPSS19.0中文版,选择“变量视图”中,在名称下输入学号、题目1―12、总分等命题基本情况项目。在类型标记中,将学号定义为名义,将题目1―12定义为度量,小数根据实际情况设定,其他项保留默认设置。选择“数据视图”标签,在各行内输入学生的各题得分和总分数据(图2)。

图1 定义变量设定图

图2 数据输入图

二、命题的定量分析

(一)描述性统计量分析

用以描述考试总体情况的各分数统称为描述性统计量。在SPSS中,点击“分析―描述分析―频率”。将“总分”等变量名称选入待计算变量框中,在“统计”中选择要计算的统计量,选中均值、极值、标准差、中位数等项,最后输出结果(表3)。

表3 有效数据的得分描述性统计

(二)试题的正态分布预期

在学生群体足够大时,学生的能力呈正态分布。处于能力尖端和尾端的学生数量少,处于能力中端的学生数量多。在考试命题适宜,教学状况正常,学生水平相当,试卷评阅严谨的前提下,一份合格的试题,所反映出的学生成绩应呈现正态分布的特点。为研究试题能否体现学生能力的正态分布,可在SPSS软件中点击“分析―描述分析―频率”,在“频率”对话框中选择“图表”,点选绘制“总分”的直方图并标变化曲线(图4)。

图4 学生总分的直方―变化曲线图

若学生总分的直方―变化曲线图能呈现正态分布,那么,可进一步探究命制试题的正态分布预期。可利用单个样本K-S校验测查给定数据与正态分布间的显著差异。在SPSS中,点击“分析―非参数检验”,对“总分”进行单个样本K-S检验(表5)。

表5 试题总分的单样本Kolmogorov-Smirnov检验

(三)难度

试题的难度(P)是测验题目难易程度的统计量。试卷难度等于试卷内各题的平均难度。要观测命题试卷难度,应先测量命题试卷内各题难度。试题计分方法不同,难度计算方法不同。

二分法计分(选择题、判断题)题目的难度统计。对于二分法计分的题目,答案只有对与错两种可能的结果(即答对得分,答错不得分)。此类题目难度通常用通过率(P)表示。其中,P=1―R/N(其中R为答对该题的人数,N为答题总人数)。由此,可在SPSS中,运用“转换―计算变量”方法,在“计算变量”对话框中输入公式,直接算出二分法题目难度(表6)。

表6 二分法计分题目难度值

非二分法计分(主观题、论述题)题目的难度统计。对于非二分法计分的题目,难度(P)可以通过公式P=1―X/W(X为该题目均分值,W为该题满分值)计算。可采用“计算变量”方法直接输入公式,算出非二分法题目难度(表7)。

表7 非二分法题目难度值

全卷难度值(P)等于卷内各题难度平均值,采用SPSS“计算变量”可得p=0.4。

(四)区分度

区分度是反映试题区别学生水平和能力的统计量。在实际统计时,常以考试总分作为考生的实际水平,而把某题的得分与学生总分之间的相关系数作为该题的区分度。

客观题的区分度统计,可把客观题得分视为等间距测度的连续变量,采用Spearman等级相关分析统计区分度。主观题的区分度统计,可把主观题成绩视为非等间距测度的连续变量,采用Pearson相关分析。在SPSS中,点击“分析―相关―双相关”。先选择客观题各题分数和总分采用Pearson相关分析(1-6),再选择主观题(7-12(2))各题分数和总分采用Spearman相关系数分析,得到结果合成(表8)。

表8 各题区分度汇总表

(五)信度

信度是衡量一次考试可靠性、稳定性的统计量。信度代表着试题的可靠性,其取值在0至1之间。信度越高,可靠性越好,但容易造成成绩标准差过大。一般采用SPSS中克伦巴赫系数(Alpha模型)计算命题试卷一致性信度系数。在SPSS中,点击“分析―度量―可靠性分析”。在可靠性分析对话框中,选择试卷各题得分数据。点击“统计量”,选择“如果项已删除则进行度量”,结果如下(表9-10):

表9 信度统计值表

表10 删除变量后项目统计值表

(六)效度

效度是指测试结果的准确性与有效性程度的统计量,即一个测验能够测量学生水平的程度[2]。可采用效标效度法测量试题的效度。将学生的平时成绩作为效度分析的校标,利用皮尔森相关系数法计算命题测试分数与校标之间的相关系数,结果即为试题效度(表11)。

图表11 命制试题得分与平时成绩间皮尔逊相关系数分析

三、命题质量评价

第一,描述性统计量分析。由表3可知,命题平均成绩为32.54分(满分49分),最高分45分,最低分12分,标准差为6.94。平均分、标准差数值适当,极值差距较大,体现了学生个体之间对题目的理解差异大。由此可见,试卷命题中,部分题目可能表意不清,引发部分学生无从下手作答的情况。此卷应注意题干的表达,使学生清晰了解题目意图。

第二,正态分布预期分析。由图4可知,学生总分变化曲线呈正态分布曲线样式,因而命制试题具有正态分布预期。由表5进一步分析K-S检验中的各数值可知,Z值为0.493,sig(双侧P值)=0.851>0.05,由sig(渐进显著性)>0.05,可得给定数据与正态分布没有显著性差异,即总分数据符合正态分布要求。

第二,试题难度分析。一般认为,命题难度在0.4至0.7之间为宜,难度值小于0.4的题目难度较小,难度值大于0.7的题目较大。一般认为,最好的试题难度应接近于中等难度(即p=0.5)。因此,本命制试题全试卷具有中等偏下的难度(p=0.4)。这份命制试题如果运用在终结性考核中,用以检测学生在群体中知识掌握水平,作为合格水平测验,则效果较好。但作为过程性考核,则其难度水平较低,需适当加大难度。由表6、7可知,T9、T1难度过小,建议予以删改。T6、T3难度过大,应进一步结合课程评价标准加以研究,检验是否超纲。

第三,区分度分析。一般认为区分度在0.4以上的题目,鉴别能力优秀;区分度在0.3至0.39间的题目,鉴别能力良好;区分度在0.39以下的题目,应进行删改。由表8可知,全卷区分度总体水平适宜,能够区分学生掌握知识程度的优劣。但T1、T3、T4、T6四题区分度较低(

第四,信度分析。从表9可知,本次考试的信度为0.455。普遍而言,学校测验采用试卷信度应达到0.5以上。本命题试卷达不到可信要求,为提高本卷信度,本卷应进行修改。从表10可知,删除T1后全卷信度提升至5.0,故可考虑对T1进行替换。同时,目前本卷题量共12题,题目数量较少,可考虑通过适当增加题量的方法,提高全卷信度。

第五,效度分析。从表11可知,全卷效度值为0.837,在0.01的显著性水平下,sig.值(显著性)为0.000,表明学生完成命制试题的得分与学生平时的成绩两者间呈显著的相关关系。命制试题具有较高的效度。

参考文献:

考试质量分析总结篇8

关键词: 医学免疫学 成绩分析 试卷评价

一直以来,期末考试是终结性评价的重要手段之一,也是教学过程中极其重要的一环。它不仅能衡量学生学得如何,而且能反映教师教得怎样。但是传统考试往往只关心最后的结果即考试分数,评分结束后所有工作就随之结束,并未进行有效和科学的试卷质量分析。实际上,通过对试卷进行质量分析可以得到许多宝贵信息,从某种意义上说这些信息比考试成绩更重要,因此开展试卷质量分析工作具有非常重要的意义。首先,进行科学的试卷质量分析能够帮助我们评价考试的质量,检验考试的可靠性和有效性,尤其是一些比较重要的考试之后,要对考试结果进行分析,以判断此次考试的质量,只有有效的、可靠的考试结果才能作为评价教学质量、衡量学生学习情况的依据。其次,进行试卷质量分析可以帮助我们提高试卷编制水平,改进考试工作。考试后用具体的量化数据反映出试卷存在的问题,可以减少教师凭经验出题所带来的主观随意性,对于改进今后的工作大有裨益。最后,通过分析考生答题的情况,教师从中发现教学存在的问题,获得教学效果的反馈信息,有助于在今后的工作中有针对性地采取有效措施,促进教学效果的增强。

我们以武汉某大学医学院2012级临床医学专业2014年期末考试试卷质量分析的情况说明进行试卷质量分析对改进教学活动、提高试卷编制质量的重要作用。

1.数据来源

授课人员为两名具有5年以上教学经验的医学院副教授,教材使用龚非力主编的第3版《医学免疫学》教材。授课对象为2012级72名学生。考试方式为闭卷考试,考试时间为120分钟,考试过程中没有发生违反考场纪律的现象。试卷评判由相关任课老师负责,评卷过程尽量做到公平公正,力求试卷成绩的客观性,使试卷可以反映学生的真实水平。此次考试成绩作为医学免疫学试卷统计分析的依据。

2.试卷组成及得分情况

试题覆盖医学免疫学教科书各部分知识。整张试卷由5个部分组成:选择题、填空题、名词解释、简答题和论述题。考题基本按照由易到难的程度进行编排,这种编排方式可以稳定考生在考试时可能产生的紧张情绪,使考生沉着答题。试卷考试题组成及其学生得分情况见表1,发现整体得分率较高,除了第一种题型选择题外,其他题型都有满分出现。

表1 试卷分数组成及学生得分情况

3.试卷质量检验标准的数学描述

试卷质量的主要检验标准可以通过难度、信度、效度、区分度表现出来,这四个“度”不仅可以用来判断学业成绩评定的公正与否,而且可以帮助教师提高命题水平,获取教学效果的反馈信息[1]。为了表述方便,将待测试卷题目的个数设为n,每个题目的满分值分别为

区分度在0.4以上为最佳,在0.2~0.39之间为较好,低于0.2表示区分度很差[3]。

4.试卷质量的分析及讨论

4.1学生成绩频数分布:从考试分数的统计结果看,此次考试的分数总体比较高,临床医学专业72名学生,学生成绩频数分布见下图。此次考试中有1名学生不及格,最低分为54,最高分为98,相差44分,平均分为85.21,标准差10.5。考试成绩经正态性检验符合负偏态分布,分数主要集中在90分~94分之间,说明试题较易,平均分数较高,这说明绝大多数学生较好地掌握了所要测试的内容。

图 学生成绩频数分布

4.2试卷质量的讨论:本次试题基本涵盖医学免疫学教材的所有内容,紧扣教学大纲的要求,极少部分试题为非授课内容,要求学生自学掌握。本次试题既注重学生对基础知识的掌握,又关注学生对于免疫学知识的形成过程、各知识点之间的联系及基础知识与各种现象之间的联系。试题数量充足,考查了学生对于医学免疫学的了解及一定分析应用能力。从考试情况看,所有学生均按时交卷,没有出现时间不够的情况,而个别学生还出现提前交卷的情况,这说明试题量虽然较多,但是试题偏易,在今后的试卷中这一问题需要引起关注。

在这次考试中,学生的成绩分数较高,考试平均成绩为85.21分。一般认为,设计合理的试卷成绩分布应当呈现正态分布或近似正态分布,而不应当呈现正偏态或负偏态分布[4]。但是,这要具体分析,成绩分布模型与许多因素密切相关,比如学生群体的大小和抽样误差;学生的整体素质、学习认真刻苦和教师的积极施教;教师评定成绩的标准[5]。本次考试的试题难度P为0.45,属中等难度,而学生成绩稍微偏向高分段,分数分布呈现负偏态分布,这说明学生整体掌握知识的程度很好。经过计算本次考试的信度为0.85,基本符合教育统计与测量中对信度的要求。本次考试的效度为0.23,区分度为0.24,属中度,一般认为区分度大于0.4的试题较好,在0.2~0.39之间的试题属中等区分度,而小于0.15则说明试题区分度较差[6]。

通过计算我们得出结论,本次医学免疫学测试中试题难度中等,而学生掌握知识比较好,因此整体分数较高。另外,本次考试的效度和信度适中,说明试题覆盖了各章节的教学内容,重点突出,所以本次考试是一次对教学结果的有效测试。考试是一种终极评价方法,它是教学过程中的一个极其重要的环节,一方面可以衡量学生理解和掌握知识的范围和程度,另一方面可以反映教学质量和存在的问题。在期末考试中,命题时首先要考虑的问题是如何筛选在学习过程中学生对免疫学大纲中的知识点的掌握情况,这样优秀的学生与掌握情况不好的学生能在考试成绩上得以具体的区分体现。另外要求大多数学生在考试中可以通过测试。

对于今后的课程期末考试的命题与组卷,我们应该牢记:试题的范围和内容必须符合教学大纲,试题应着重考查学生对课程基础知识、基本概念和基本方法的理解和掌握[7],这样才能使试卷的总体分量和难度与老师的教学水平和学生的实际状况相适应,这样的考试成绩才更具有价值,更能帮助教师反思教学工作中存在的问题,促进今后教学水平的提高。今后还要长期坚持试卷统计与分析,努力减少试题的分析偏差,为试题建设反馈信息,逐步提高试卷的出题质量,更新教学内容,改进教学方法,最终实现教学质量的不断提高。

参考文献:

[1]戴洪萍.高校专业课程考试质量的分析与探讨[J].南通大学学报(教育科学版),2007,23(2):86-89.

[2]牛惠芳,吕文峰,王淑玉.期末考试试卷质量分析[J].洛阳师范学院学报,2007,2:111-113.

[3]田考聪,彭斌.试卷质量定量分析系统中的几个参数及其应用[J].医学教育探索,2004,3(4):52-54.

[4]张国才.学生学习成绩负偏态分布的合理性[J].江苏高教,2002(2):59-61.

[5]饶国辉,李洁明,,等.核医学考试成绩分析与评价[J].医学教育探索,2007,6(12):1124-1125.

[6]文民刚,张立力,胡桂,等.对教育测量学中几个重要评价指标的再认识[J].中国高等医学教育,2002,2:5,33.

推荐期刊