线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

统计学的标准差8篇

时间:2023-08-29 09:18:01

统计学的标准差

统计学的标准差篇1

【关键词】会计专业 统计学教学 审计 财务管理 管理会计

统计学原理是高等院校经济类和管理类专业(以下简称经管专业)的一门核心课程。大统计学是一门搜集、整理和分析统计数据的方法论科学,其目的是探索数据的内在数量规律性。统计学广泛应用于各学科中,在商业以及工业中,统计被用来了解与测量系统变异性,程序控制,对决策提供数据支持;在第一产业方面,可运用统计计算出各种农产品的需求情况及价格分布,从而指导生产;在生产行业中,统计学可以运用在产品开发、营销、财务管理等方面,从而提高企业的营运能力;在服务行业中,例如在金融行业中,运用统计技术将各种交易资料加以分类、整理,从而得到如客户贡献度、客户偏好、存款变动趋势、产品分析、行业发展等数据,从而为管理层提供决策依据,等等。特别是在会计专业中,统计学更是发挥了不可估量的贡献。在对会计专业学生的统计学教学中,大致可以从审计学、财务管理和管理会计几方面入手,将统计学教学与会计专业有机结合。笔者经过了多年的统计学专业学习,并经过了长时间的高校会计专业学生的实践教学,对统计学教学过程有了更深刻的感受,在这里本人谈谈对会计专业统计学教学的一些改革创新思路。

一 审计学——审计统计抽样

审计抽样是指审计人员在实施审计测试时,从被审总体中选取一定数量的样本进行审查,通过样本的审查结果来推断被审总体特征的一种审计技术方法,审计统计抽样是审计抽样的一种方法,它是相对于非统计抽样而言的。统计抽样是指在审计抽样中,审计人员根据概率论和数理统计的原理,按照一定方法确定样本数量,并以样本审查结果推断评估总体的审计抽样技术。它运用的数学运算包括两个过程:样本规模和推算总体。统计抽样的思想方法是以假设检验为前提,设定抽样参数,确定抽样规模,无人为偏见的随机抽取样本进行审核,根据需要扩大样本,逐次逼近总体特征,根据样本特征经计算推导,得出总体结论。根据抽样测试的目标不同,统计抽样方法可分为3 大类:用于符合性测试的属性抽样和用于实质性测试的变量抽样以及货币单位抽样。审计中常用的统计抽样技术有属性抽样(包括固定样本量抽样、停—走抽样、发现抽样)、变量抽样(包括单位平均数估计抽样、差额估计抽样、比率估计抽样、分层抽样)、货币单位抽样等。统计抽样的方法很多,每一种方法都有其特定的优点和局限,既没有某一种方法一无是处,也没有哪一种方法在任何情况下都是最优的。因此依照何种标准来选择适当的统计抽样方法很重要,应重点考虑审计目标、审计效果、审计效率、审计成本等因素。要确定哪种统计抽样方法最为适宜是不容易的,这要求审计人员对每一种可供选择的统计抽样方法都要有所了解,掌握它们各自的优点和运用条件,充分了解实际情况,再与丰富的审计实践经验相结合,才能做出正确的选择。

二 财务管理——收益和风险

财务管理中的收益和风险,在统计学中即表现为描述统计中的算术平均数和标准差(标准差系数)。例如:期望现金流量的计算方法中,如果影响资产未来现金流量的因素较多,不确定性较大,使用单一的现金流量可能并不能如实反映资产创造现金流量的实际情况。在这种情况下,采用期望现金流量法更为合理的,企业应当采用期望现金流量法预计资产未来现金流量。在期望现金流量法下,资产未来每期现金流量应当根据每期可能发生情况的概率及其相应的现金流量加权计算求得,此种方法即加权算术平均数的计算方法;货币时间价值的计算是假定没有风险和通货膨胀,但在财务活动中,经营风险带来的财务风险是客观存在的,而且风险和收益密切相关,所以财务管理者必须研究风险和收益。如果不考虑收益的前提下,可以直接用标准差来衡量财务活动中的风险,若考虑收益,则不能直接用标准差,需要用标准差系数来衡量风险,即用标准差与收益的比值来衡量。

除此之外,在财务管理中,需要对资金需要量等指标进行预测,为统计学中的预测方法提供了多种思路。

可以按照时间序列的组成因素,可以选择平滑法预测、回归法预测等,这些方法都是会计专业中常用的预测方法。例如,在财务预测中,资金需要量预测的主要方法有销售百分比法、线性回归分析法和预计资产负债表法。线性回归分析法是假定资金需要量与业务量之间存在线性关系并建立数学模型,然后根据历史有关资料,确定参数从而用回归直线预测资金需要量的一种方法。其预测的数学模型为y=a+bx,式中y 为资金需要量;a 为不变资金;b 为单位业务量所需要的变动资金;x 为业务量。不变资金是指在一定的营业规模内,不随业务量增减的资金。变动资金是指随营业业务量变动而同比例变动的资金。根据企业历史资料,运用线性模型,在确定a、b 数值的基础上,即可预测一定业务量x 所需的资金量y。用于销售预测的常用方法有判断分析法、趋势外推分析法、因果预测分析法和产品寿命周期推断法等。趋势外推分析法在销售量预测中的应用较为普遍,其具体应用形式包括平均法(简均法、移动平均法和趋势平均法)和修正的时间序列回归法。

三 管理会计

按成本性态可以将企业的全部成本分为固定成本和变动成本。固定成本与变动成本只是经济生活中诸多成本性态的两种极端类型,多数成本是以混合成本的形式存在的。混合成本是指那些“混合”了固定成本和变动成本两种不同性质的成本,对混合成本的分解方法有历史成本法、账户分析法和工程分析法。历史成本法的基本做法就是根据以往若干时期(若干月或若干年)的数据所表现出来的实际成本与业务量之间的依存关系来描述成本的性态,并以此来确定决策所需要的未来成本数据。历史成本法通常分为高低点法、散布图法和回归直线法3 种。回归直线法运用最小二乘法的原理,对所观测到的全部数据加以计算,从而勾画出最能代表平均成本水平的直线y=a+bx,这条通过回归分析而得到的直线就称为回归直线,它的截距就是固定成本a,斜率就是单位变动成本b,这种分解方法也称作回归直线法。又因为回归直线可以使各观测点的数据与直线相应各点误差的平方和最小,所以这种分解方法又称为最小二乘法。

管理会计中的标准成本法是指通过制定标准成本,将标准成本与实际成本进行比较获得成本差异,并对成本差异进行因素分析,据以加强成本控制的一种会计信息系统和成本控制系统。标准成本法便于企业编制预算和进行预算控制;可以有效地控制成本支出;可以为企业的例外管理提供数据;可以帮助企业进行产品的价格决策和预测;可以简化存货的计价以及成本核算的账务处理工作。标准成本是在正常生产经营条件下应该实现的,可以作为控制成本开支,评价实际成本、衡量工作效率的依据和尺度的一种目标成本。可分为理想标准成本、正常标准成本和现实标准成本。成本差异是指实际成本与标准成本之间的差额,也称标准差异。按成本的构成分为直接材料成本差异、直接人工成本差异和制造费用差异。直接材料成本差异、直接人工成本差异和变动制造费用差异都属于变动成本,决定变动成本数额的因素是价格和耗用数量。制造费用差异(即间接制造费用差异)按其形成的原因和分析方法的不同又可分为变动制造费用差异和固定制造费用差异两部分。例如:直接材料成本差异是指一定产量产品的直接材料实际成本与直接材料标准成本之间的差异。直接材料成本差异=直接材料实际成本-直接材料标准成本。直接材料成本是变动成本,其成本差异形成的原因包括价格差异和数量差异。价格差异是实际价格脱离标准价格所产生的差异。数量差异是单位实际材料耗用量脱离单位标准材料耗用量所产生的差异。计算公式如下:材料价格差异=(实际价格-标准价格)×实际用量;材料数量差异=(材料单位实际耗用量-材料单位标准耗用量)×标准价格;直接材料成本差异=材料价格差异+材料数量差异。此种计算方法是统计学中加权综合指数体系中的相对数形式和绝对数形式。在学习和工作中比较常用的是基期权数加权的数量指数和报告期权数加权的质量指数形成的指数体系。

综上,会计专业中的统计学教学应结合自身特点,注重对统计思想的挖掘和传递,注重对学生统计思维能力的培养和塑造,以培养应用能力为主线,与会计专业老师深入沟通,对现有统计学教材的课程设置及传统的教学手段进行大胆改革,从而使会计专业的学生增强学习统计知识的兴趣,真正认识到统计学的重要性,学到真正能指导实践的现代化统计知识。通过一段时间的实践,会计专业学生对统计学和会计学科的关系有了深刻的认识,增加了学习统计学的主动性,并对会计专业课程有了不同角度的解读。

参考文献

〔1〕白日荣、苏永明.非统计专业统计学教学的改革与创新〔j〕.统计教育,2007(12)

〔2〕杨绪忠.财经类非统计学专业的统计学课程教学探讨〔j〕.统计与决策,2002(05)

统计学的标准差篇2

【摘要】  目的:探讨医学 研究 中方差 分析 常用的效应量标准均数差的 计算 方法 . 方法:针对不同的实验设计类型,给出标准均数差的计算方法. 结果:不同设计的研究间,相同干预的标准均数差具有可比性. 结论:生物医学论文报道效应量是未来的 发展 趋势,研究者应正确计算和解释标准均数差,避免和减少效应量的误用.

【关键词】  方差分析;效应量;标准均数差;假设检验

     0引言

    效应量(effect size)是一类用来描述处理效应的统计量. 在20世纪60年代,生物统计学家(cohen, 1965; hays,1963)就强调效应量的 应用 ,认为效应量是假设检验的补充[1]. 然而医学领域的绝大多数的研究者在报道结果时,往往仅提供假设检验的p值[2-3]. 1996年美国心 理学 会(apa)的统计推断机构tfsi建议报道研究结果时应同时提供处理效应的方向、大小及其的可信区间[4]. 1998年wilkinson和tfsi 建议对于主要结果必须报道效应量,即报道p值时同时应报道效应量[5]. 2001年美国心理学会(apa)科研手册上规定:论文的结果部分必须报道效应量[6]. 至今已有24种心理学、医学期刊要求研究者投稿时报道效应量[7]. 国内教科书对meta分析所涉及的效应量作了简单介绍,但对效应量的系统研究很少. 依资料类型和研究设计的不同,效应量又有很多种类,我们主要研究方差分析(anova)模型中常用的一类效应量-标准均数差(standardized mean difference).

    1材料和方法

    1.1材料为研究不同的实验设计类型的标准均数差的计算方法,我们采用了bauman等[1]人的实验数据(表1). 该实验采用前后测量设计研究了66名四年级学生不同阅读习惯对理解能力的 影响 . 阅读习惯(研究干预)分为:单纯朗读(ta),阅读并积极思考(drta),阅读(dra),其中dra为对照组. 理解能力用错误检测任务(edt)的得分表示,干预前后两次测量结果用edt1, edt2表示. 该研究考虑了一个控制因素(即研究前的理解能力):各组前两列的学生研究前理解能力较低,后两列理解能力较高.

    1.2方法在统计分析中,需要解决均数的对比(contrast) 问题 ,即一个研究有j个处理组,则均数的对比可以表示为:

    ψ=c1μ1+c2μ2+…+cjμj(1)

    其中, c1+c2+…+cj=0. ψ=μi-μj是最常见的对比. 对比含有量纲,与反应变量的量纲相同,不能直接用于不同研究间比较;而标准均数差无量纲,可用于不同研究间比较的效应量. 按反应变量的不同,可将标准均数差分为单变量和多变量标准均数差. 不同设计标准均数差计算方法如下:表166名四年级学生接受不同干预后edt得分情况

    1.2.1单变量标准均数差

    1.2.1.1单因素完全随机设计该设计的处理因素有j个水平,实验拟研究的问题可表示为对比(1),其标准均数差为:

    δ=ψ〖〗σ(2)

    总体参数δ的估计方法:用样本均数x估计总体均数μ, σ可以用准则一中的一种方法进行估计. 准则一:a设计中的某个处理组的标准差,常用对照组的标准差;b对比中所有处理组的合并标准差;c设计中所有处理组的合并标准差.

    当对比中包含所有的处理组时,b, c得到的σ估计值相同,并与anova分析中误差均方(mse)正的平方根相等. 当所有处理组满足方差齐性条件时,c法是估计σ的最佳方法;当不满足时,用a法估计. hedges指出按照准则一估计的标准均数差是δ的有偏估计,需要乘以系数1-3/(4df-1)进行校正,其中df为用于估计σ的标准差或合并标准差的自由度[8].

    1.2.1.2多因素设计该设计的因素可为干预因素(处理因素)和控制因素(非研究因素、混杂因素). 当所有因素均为干预因素时,标准均数差的计算与单因素完全随机设计相同. 多因素实验中若含有控制因素,如将控制因素与干预因素不加区别,按照准则一计算标准均数差时,会出现相同干预的效应量在不同实验设计间不可比的问题[1]. 根据所研究对比的特征,标准均数差的计算方法不同,如以2×2析因设计为例,见表2. 设实验含有:处理因素a(a1,a2),控制因素b(b1,b2).

    表2含有控制因素的多因素设计标准均数差的计算方法

    分析目的〖〗对比〖〗标准均数差的计算方法干预因素a的主效应〖〗ψ=1〖〗2(μa1,b1+μa1,b2)-1〖〗2(μa2,b1+μa2,b2)〖〗准则二:a. 按照干预因素分组,计算各组的标准差;b. 用准则一中的一种方法估计σ.干预因素a在b1水平

    的单独效应〖〗ψ=μa1,b1-μa2,b1〖〗同准则二.因素a与b的交互作用〖〗ψ=(μa1,b1-μa2,b1)-(μa1,b2-μa2,b2)〖〗同准则二.控制因素b的主效应〖〗ψ=1〖〗2(μa1,b1+μa2,b1)-1〖〗2(μa1,b2+μa2,b2)〖〗准则三:a. 按照干预因素及对比中含有的控制因素分组,计算各组的标准差;b. 用准则一中的一种方法估计σ. 控制因素b在a1水平的

    单独效应〖〗ψ=μa1,b1-μa1,b2〖〗同准则三.

    多因素实验研究的对比可能仅含有控制因素,不含有处理因素,如在2×2×2析因设计中,对比为:

    ψ=1〖〗2(μb1,c1+μb1,c2)-1〖〗2(μb2,c1+μb2,c2)(3)

    其中,a为处理因素,b, c为控制因素. 仅含有控制因素对比的标准均数差计算方法:a按照实验研究的控制因素分组,计算各组的标准差,在对比(3)中,按照因素b分组;b用准则一估计σ.

    1.2.1.3含有协变量的多因素设计协方差分析(anocva)通过建立协变量与反应变量的线性回归关系,对各组的反应变量的均数进行校正后,再进行假设检验. anocva标准均数差的计算方法为:用样本校正均数xc估计总体均数μ,将协变量作为控制因素,按照准则二来估计σ.

    1.2.1.4含有重复测量因素的多因素设计含有重复测量因素的设计可分为:①仅含有1个或多个重复测量因素的设计;②含有重复测量因素和观测间因素的设计. 因为重复测量因素为处理因素,所以①中不存在控制因素引起的相同处理的效应量在不同实验设计间不可比的问题,标准均数差的计算方法,与因素为处理因素的设计相同. 含有重复测量因素和观测间因素的设计计算标准均数差时,将重复测量因素作为处理因素,如观测间因素含有控制因素按照表2中准则二或三计算.

    1.2.2多变量标准均数差马氏距离在多元方差分析中即是一种多变量标准均数差. 马氏距离公式为:

    d=d′r-1d

    其中,d为单变量标准均数差向量,r为合并的组内相关矩阵. 实际计算中,马氏距离可以由多元检验统计量wilkss λ计算得到:

    d=df(1-λ)σk〖〗i=1c2i/ni〖〗λ(4)

    其中:k为处理组数, ci, ni分别为i组对比系数和样本量. df的计算公式为:df=σni-k.

    1.2.3标准均数差的解释标准均数差的解释准则不多,因为医学 研究 领域所涉及的 内容 很广泛,想给出普遍适用的准则,需要冒很大风险. cohen建议标准均数差为0.2时,效应为小,0.5为中等,0.8为大. 如果样本满足正态分布,总体间重叠的比例(percent of overlap, ol%),有助于标准均数差的解释. 若处理组与对照组的标准均数差为0.70,那么可认为处理组50%的研究对象反应变量值大于对照组76%的研究对象的值(图1).

    图1标准均数差与ol%示意图

    2结果

    bauman等人的研究关心阅读 方法 ta和drta的平均效应与dra的差别(对比ψ1)以及阅读方法ta与drta的差别(对比ψ2).

    ψ1=1〖〗2(μta+μdrta)-μdra, ψ2=μdrta-μta.

    若仅考虑edt2和干预因素(阅读习惯),本例的研究设计为单因素完全随机设计. 表3为各组的均数和标准差,表4为对比ψ1, ψ2的标准均数差. 按照cohen准则,两对比均为中等效应. 校正后ψ2的效应量为0.697,可认为50%阅读并积极思考的学生的edt成绩高于76%的单纯朗读的学生成绩.表3各组edt1, edt2成绩表4单因素完全随机设计标准均数差

    若将edt2作为研究的反应变量,考虑干预因素a和控制因素b(阅读能力),本例为析因设计. 为了便于公式的演算,假设干预因素为两水平(ta, drta),本例研究干预因素、控制因素的主效应、单独效应及两因素的交互作用. 这些效应的可以用表2中相应的对比表示,其标准均数差的 计算 见表5.表5多因素设计各组edt2成绩及标准均数差

    若将edt2作为研究的反应变量,考虑干预因素,并将干预前的测量结果edt1作为协变量,本例为含有协变量的单因素设计(协方差设计). 通过协方差 分析 ,各组校正后的均数见表6. 按照校正均数计算对比ψ1, ψ2的标准均数差,见表6.

    将edt作为研究的反应变量,考虑干预因素和重复测量因素,干预前后edt做了两次,重复测量因素有两水平,本例为含有1个重复测量因素的两因素设计. 不同阅读方式的效 应用 两次测量的差值表示,两对比ψ1, ψ2可以表示为:表6各组edt2成绩及标准均数差

    ψ1=1〖〗2(μedt2,ta-μedt1,ta)+1〖〗2(μedt2,drta-μedt1,drta)-(μedt2,dra-μedt1,dra),

    ψ2=(μedt2,drta-μedt1,drta)-(μedt2,ta-μedt1,ta).

    根据表3,可计算对比ψ1, ψ2的标准均数差分别为1.018, 0.439.

    将edt1, edt2作为研究的反应变量,考虑干预因素,本例为多元单因素完全随机设计. 对比ψ1,ψ2中的μ为均数向量,检验统计量wilkss λ,可以用sas/glm contrast计算得到[9]. 由公式(4)可计算对比ψ1,ψ2的多元标准均数差d分别为1.228, 0.689.

    3讨论

    标准均数差是方差分析模型中常用的一类效应量,也是 目前 心 理学 、医学研究领域和meta分析中最常用到的效应量. 本文按照不同的实验设计,考虑相同干预不同设计间效应量的可比性,介绍了标准均数差的计算方法, 总结 给出了相应的计算准则,并给出了实例. meta分析常遇到研究干预相同、研究设计不同的情况下,效应量的计算 问题 . 本文介绍的标准均数差的计算方法可以很好的解决这一问题. 另外,本文介绍的标准均数差的计算可适用于两组和多分组的情况,有些资料和 文献 上针对两组资料的比较对标准均数差进行介绍. 专用于两组比较的标准均数差有:cohens d,glasss δ,hedgess g和cohens f2 [10].

    尽管apa和24种期刊要求研究者进行假设检验时,必须报道一种或多种效应量作为其补充,但是对效应量能否帮助研究者或读者提供有关干预效应有无实际意义的信息,也有统计学家提出疑问[1]. cohen对标准均数差解释制定的准则,能否适用医学研究领域,也存在争议. cohen也建议统计学者制定其他的准则来解释标准均数差. 目前,国内的生物医学期刊还未要求报道效应量,国外对效应量的研究和报道较多,尤其是在心理测量领域的研究,并有关于效应量误用的分析报道,因此我国生物医学论文要求报道效应量是未来的 发展 趋势.

【 参考 文献】

  [1] olejnik s, algina j. measures of effect size for comparative studies: applications, interpretations, and limitations[j]. contemp educ psychol, 2000,25(3):241-286.

[2] glaser dn. the controversy of significance testing: misconceptions and alternatives[j]. am j crit care, 1999,8(5):291-296.

[3] cohen j. the earth is round (p<0.05) [j]. am psychol, 1994,49(12):997-1003.

[4] /science/tfsi.html.

[5] wilkinson l. task force on statistical inference apa board of scientific affairs. statistical methods in psychology journals: guidelines and explanations[j]. am psychol, 1999,54(8):594-604.

[6] american psychological association. publication manual of the american psychological association[m]. 5th ed. washington: american psychological association press,2001:1-5.

统计学的标准差篇3

【摘要】 目的:探讨医学研究中方差分析常用的效应量标准均数差的计算方法. 方法:针对不同的实验设计类型,给出标准均数差的计算方法. 结果:不同设计的研究间,相同干预的标准均数差具有可比性. 结论:生物医学论文报道效应量是未来的发展趋势,研究者应正确计算和解释标准均数差,避免和减少效应量的误用.

【关键词】 方差分析;效应量;标准均数差;假设检验

0引言

效应量(effect size)是一类用来描述处理效应的统计量. 在20世纪60年代,生物统计学家(Cohen, 1965; Hays,1963)就强调效应量的应用,认为效应量是假设检验的补充[1]. 然而医学领域的绝大多数的研究者在报道结果时,往往仅提供假设检验的P值[2-3]. 1996年美国心理学会(APA)的统计推断机构TFSI建议报道研究结果时应同时提供处理效应的方向、大小及其的可信区间[4]. 1998年Wilkinson和TFSI 建议对于主要结果必须报道效应量,即报道P值时同时应报道效应量[5]. 2001年美国心理学会(APA)科研手册上规定:论文的结果部分必须报道效应量[6]. 至今已有24种心理学、医学期刊要求研究者投稿时报道效应量[7]. 国内教科书对Meta分析所涉及的效应量作了简单介绍,但对效应量的系统研究很少. 依资料类型和研究设计的不同,效应量又有很多种类,我们主要研究方差分析(ANOVA)模型中常用的一类效应量-标准均数差(standardized mean difference).

1材料和方法

1.1材料为研究不同的实验设计类型的标准均数差的计算方法,我们采用了Bauman等[1]人的实验数据(表1). 该实验采用前后测量设计研究了66名四年级学生不同阅读习惯对理解能力的影响. 阅读习惯(研究干预)分为:单纯朗读(TA),阅读并积极思考(DRTA),阅读(DRA),其中DRA为对照组. 理解能力用错误检测任务(EDT)的得分表示,干预前后两次测量结果用EDT1, EDT2表示. 该研究考虑了一个控制因素(即研究前的理解能力):各组前两列的学生研究前理解能力较低,后两列理解能力较高.

1.2方法在统计分析中,需要解决均数的对比(contrast)问题,即一个研究有J个处理组,则均数的对比可以表示为:

Ψ=c1μ1+c2μ2+…+cJμJ(1)

其中, c1+c2+…+cJ=0. Ψ=μi-μj是最常见的对比. 对比含有量纲,与反应变量的量纲相同,不能直接用于不同研究间比较;而标准均数差无量纲,可用于不同研究间比较的效应量. 按反应变量的不同,可将标准均数差分为单变量和多变量标准均数差. 不同设计标准均数差计算方法如下:表166名四年级学生接受不同干预后EDT得分情况

1.2.1单变量标准均数差

1.2.1.1单因素完全随机设计该设计的处理因素有J个水平,实验拟研究的问题可表示为对比(1),其标准均数差为:

δ=Ψ〖〗σ(2)

总体参数δ的估计方法:用样本均数x估计总体均数μ, σ可以用准则一中的一种方法进行估计. 准则一:a设计中的某个处理组的标准差,常用对照组的标准差;b对比中所有处理组的合并标准差;c设计中所有处理组的合并标准差.

当对比中包含所有的处理组时,b, c得到的σ估计值相同,并与ANOVA分析中误差均方(MSE)正的平方根相等. 当所有处理组满足方差齐性条件时,c法是估计σ的最佳方法;当不满足时,用a法估计. Hedges指出按照准则一估计的标准均数差是δ的有偏估计,需要乘以系数1-3/(4df-1)进行校正,其中df为用于估计σ的标准差或合并标准差的自由度[8].

1.2.1.2多因素设计该设计的因素可为干预因素(处理因素)和控制因素(非研究因素、混杂因素). 当所有因素均为干预因素时,标准均数差的计算与单因素完全随机设计相同. 多因素实验中若含有控制因素,如将控制因素与干预因素不加区别,按照准则一计算标准均数差时,会出现相同干预的效应量在不同实验设计间不可比的问题[1]. 根据所研究对比的特征,标准均数差的计算方法不同,如以2×2析因设计为例,见表2. 设实验含有:处理因素A(a1,a2),控制因素B(b1,b2).

表2含有控制因素的多因素设计标准均数差的计算方法

分析目的〖〗对比〖〗标准均数差的计算方法干预因素A的主效应〖〗Ψ=1〖〗2(μa1,b1+μa1,b2)-1〖〗2(μa2,b1+μa2,b2)〖〗准则二:a. 按照干预因素分组,计算各组的标准差;b. 用准则一中的一种方法估计σ.干预因素A在b1水平

的单独效应〖〗Ψ=μa1,b1-μa2,b1〖〗同准则二.因素A与B的交互作用〖〗Ψ=(μa1,b1-μa2,b1)-(μa1,b2-μa2,b2)〖〗同准则二.控制因素B的主效应〖〗Ψ=1〖〗2(μa1,b1+μa2,b1)-1〖〗2(μa1,b2+μa2,b2)〖〗准则三:a. 按照干预因素及对比中含有的控制因素分组,计算各组的标准差;b. 用准则一中的一种方法估计σ. 控制因素B在a1水平的

单独效应〖〗Ψ=μa1,b1-μa1,b2〖〗同准则三.

多因素实验研究的对比可能仅含有控制因素,不含有处理因素,如在2×2×2析因设计中,对比为:

Ψ=1〖〗2(μb1,c1+μb1,c2)-1〖〗2(μb2,c1+μb2,c2)(3)

其中,A为处理因素,B, C为控制因素. 仅含有控制因素对比的标准均数差计算方法:a按照实验研究的控制因素分组,计算各组的标准差,在对比(3)中,按照因素B分组;b用准则一估计σ.

1.2.1.3含有协变量的多因素设计协方差分析(ANOCVA)通过建立协变量与反应变量的线性回归关系,对各组的反应变量的均数进行校正后,再进行假设检验. ANOCVA标准均数差的计算方法为:用样本校正均数xc估计总体均数μ,将协变量作为控制因素,按照准则二来估计σ.

1.2.1.4含有重复测量因素的多因素设计含有重复测量因素的设计可分为:①仅含有1个或多个重复测量因素的设计;②含有重复测量因素和观测间因素的设计. 因为重复测量因素为处理因素,所以①中不存在控制因素引起的相同处理的效应量在不同实验设计间不可比的问题,标准均数差的计算方法,与因素为处理因素的设计相同. 含有重复测量因素和观测间因素的设计计算标准均数差时,将重复测量因素作为处理因素,如观测间因素含有控制因素按照表2中准则二或三计算.

1.2.2多变量标准均数差马氏距离在多元方差分析中即是一种多变量标准均数差. 马氏距离公式为:

D=d′R-1d

其中,d为单变量标准均数差向量,R为合并的组内相关矩阵. 实际计算中,马氏距离可以由多元检验统计量Wilkss Λ计算得到:

D=df(1-Λ)Σk〖〗i=1c2i/ni〖〗Λ(4)

其中:k为处理组数, ci, ni分别为i组对比系数和样本量. df的计算公式为:df=Σni-k.

1.2.3标准均数差的解释标准均数差的解释准则不多,因为医学研究领域所涉及的内容很广泛,想给出普遍适用的准则,需要冒很大风险. Cohen建议标准均数差为0.2时,效应为小,0.5为中等,0.8为大. 如果样本满足正态分布,总体间重叠的比例(percent of overlap, OL%),有助于标准均数差的解释. 若处理组与对照组的标准均数差为0.70,那么可认为处理组50%的研究对象反应变量值大于对照组76%的研究对象的值(图1).

图1标准均数差与OL%示意图

2结果

Bauman等人的研究关心阅读方法TA和DRTA的平均效应与DRA的差别(对比Ψ1)以及阅读方法TA与DRTA的差别(对比Ψ2).

Ψ1=1〖〗2(μTA+μDRTA)-μDRA, Ψ2=μDRTA-μTA.

若仅考虑EDT2和干预因素(阅读习惯),本例的研究设计为单因素完全随机设计. 表3为各组的均数和标准差,表4为对比Ψ1, Ψ2的标准均数差. 按照Cohen准则,两对比均为中等效应. 校正后Ψ2的效应量为0.697,可认为50%阅读并积极思考的学生的EDT成绩高于76%的单纯朗读的学生成绩.表3各组EDT1, EDT2成绩表4单因素完全随机设计标准均数差

若将EDT2作为研究的反应变量,考虑干预因素A和控制因素B(阅读能力),本例为析因设计. 为了便于公式的演算,假设干预因素为两水平(TA, DRTA),本例研究干预因素、控制因素的主效应、单独效应及两因素的交互作用. 这些效应的可以用表2中相应的对比表示,其标准均数差的计算见表5.表5多因素设计各组EDT2成绩及标准均数差

若将EDT2作为研究的反应变量,考虑干预因素,并将干预前的测量结果EDT1作为协变量,本例为含有协变量的单因素设计(协方差设计). 通过协方差分析,各组校正后的均数见表6. 按照校正均数计算对比Ψ1, Ψ2的标准均数差,见表6.

将EDT作为研究的反应变量,考虑干预因素和重复测量因素,干预前后EDT做了两次,重复测量因素有两水平,本例为含有1个重复测量因素的两因素设计. 不同阅读方式的效应用两次测量的差值表示,两对比Ψ1, Ψ2可以表示为:表6各组EDT2成绩及标准均数差

Ψ1=1〖〗2(μEDT2,TA-μEDT1,TA)+1〖〗2(μEDT2,DRTA-μEDT1,DRTA)-(μEDT2,DRA-μEDT1,DRA),

Ψ2=(μEDT2,DRTA-μEDT1,DRTA)-(μEDT2,TA-μEDT1,TA).

根据表3,可计算对比Ψ1, Ψ2的标准均数差分别为1.018, 0.439.

将EDT1, EDT2作为研究的反应变量,考虑干预因素,本例为多元单因素完全随机设计. 对比Ψ1,Ψ2中的μ为均数向量,检验统计量Wilkss Λ,可以用SAS/GLM CONTRAST计算得到[9]. 由公式(4)可计算对比Ψ1,Ψ2的多元标准均数差D分别为1.228, 0.689.

3讨论

标准均数差是方差分析模型中常用的一类效应量,也是目前心理学、医学研究领域和Meta分析中最常用到的效应量. 本文按照不同的实验设计,考虑相同干预不同设计间效应量的可比性,介绍了标准均数差的计算方法,总结给出了相应的计算准则,并给出了实例. Meta分析常遇到研究干预相同、研究设计不同的情况下,效应量的计算问题. 本文介绍的标准均数差的计算方法可以很好的解决这一问题. 另外,本文介绍的标准均数差的计算可适用于两组和多分组的情况,有些资料和文献上针对两组资料的比较对标准均数差进行介绍. 专用于两组比较的标准均数差有:Cohens d,Glasss Δ,Hedgess g和Cohens f2 [10].

尽管APA和24种期刊要求研究者进行假设检验时,必须报道一种或多种效应量作为其补充,但是对效应量能否帮助研究者或读者提供有关干预效应有无实际意义的信息,也有统计学家提出疑问[1]. Cohen对标准均数差解释制定的准则,能否适用医学研究领域,也存在争议. Cohen也建议统计学者制定其他的准则来解释标准均数差. 目前,国内的生物医学期刊还未要求报道效应量,国外对效应量的研究和报道较多,尤其是在心理测量领域的研究,并有关于效应量误用的分析报道,因此我国生物医学论文要求报道效应量是未来的发展趋势.

【参考文献】

[1] Olejnik S, Algina J. Measures of effect size for comparative studies: Applications, interpretations, and limitations[J]. Contemp Educ Psychol, 2000,25(3):241-286.

[2] Glaser DN. The controversy of significance testing: Misconceptions and alternatives[J]. Am J Crit Care, 1999,8(5):291-296.

[3] Cohen J. The earth is round (P

[4] apa.org/science/tfsi.html.

[5] Wilkinson L. Task force on statistical inference APA board of scientific affairs. Statistical methods in psychology journals: Guidelines and Explanations[J]. Am Psychol, 1999,54(8):594-604.

[6] American Psychological Association. Publication manual of the American Psychological Association[M]. 5th ed. Washington: American Psychological Association Press,2001:1-5.

[7] coe.tamu.edu/bthompson.

[8] Hedges LV. Distributional theory for Glasss estimator of effect size and related estimators[J]. J Educ Stat, 1981,(6):107-128.

统计学的标准差篇4

关键词:独立样本;差异;显著性检验;统计决断

相关关系是日常生活和生产实际中经常存在的变量之间的关系。在对相关关系的有关研究中,对同一组被试对象在试验前后进行同一测验,有时会产生两次测验结果,将测验的结果进行平均,并对总体均数差异的显著性进行检验。在实际应用中,经常利用独立样本对总体平均数的差异进行检验。

所谓独立样本是指两个样本内的个体是随机抽取它们之间不存在一一对应关系(是一种非确定性关系),这样的两个样本称为独立样本。两个独立样本平均数之间差异的显著性检验可以分独立大样本和独立小样本两种情况进行。

一、独立大样本平均数差异的显著性检验

独立样本容量n1都n2大于30的独立样本称为独立大样本。

(一)两个独立大样本平均数之差的标准误

1、两个独立大样本平均数之差的标准误,在两个相应总体标准差已知时,用下列公式估计:

其中σ12,σ22表示第一个与第二个变量的总体方差,n1,n2表示第一个与第二个样本的容量。

2、两个独立大样本平均数之差的标准误,在两个相应总体标准差未知时,用下列公式估计:

其中,σ2X1,σ2X2分别表示第一个与第二个样本的方差,n1,n2表示第一个与第二个样本的容量。

(二)显著性检验步骤

独立大样本平均数差异的显著性检验可不作方差的齐性检验。即:虽然两个总体方差未知,但因相关样本是成对数据,每对数据都可求出差数,可将平均数差异显著性检验转化成差数的显著性检验,不需汇合方差,所以就不需用方差齐性检验来考察两个总体方差是否相等。

1、提出假设

H0:μ1=μ2

H1:μ1≠μ2

2、构造统计量Z并计算

3、确定检验形式

根据所给数据确定采取双侧还是单侧进行检验。

(1)双侧检验。双侧检验备择假设为μ1≠μ2。

检验时相互比较的总体均数μ1与μ2没有一方不可能大于(不可能小于)另一方的信息,那么原假设μ1=μ2被否定时,也就是可能是μ1<μ2(μ1>μ2),检验的拒绝会分布在两侧,此时就需计算两侧的概率,称为双侧检验。

(2)单侧检验。单侧检验备择假设为μ1<μ2(μ1>μ2)。

根据已有资料和信息,相互比较的总体均数μ1不可能大于μ2,那么在总体均数相同的原假设μ1=μ2被否定时,只能μ1<μ2,统计量只可能出现在分布的一侧,检测的拒绝区域也只可能在分布的一侧,此时只需计算一侧概率,称为单侧检验。

4、统计决断

(1)双侧检验统计决断

表1各项指标的具体含义:如果实际算出的|Z|<1.96,表明样本统计量的值未落入拒绝区域,就是等于或大于样本统计量的概率大于0.05,P>0.05,检验结果接受H0拒绝H1,指样本所属的总体平均数与假设的总体平均数无显著性差异;如果实际算出的Z0.05=1.96≤|Z|<2.58=Z0.01,表明样本统计的值在0.05显著性水平上落入了拒绝区域,而在0.01显著性水平上未落入拒绝区域,就是等于或大于样本统计量的概率等于或小于0.05,而大于0.01,0.01<P≤0.05,其检验结果是在0.05显著性水平上拒绝H0而接受H1,指样本所属的总体平均数与假设的总体平均数有显著性差异,可靠度95%,在Z值右上角用“*”表示;如果实际算出的|Z|≥2.58=Z0.01,表明样本统计量的值在0.01显著性水平上落入拒绝区域,就是等于或大于样本统计量的概率等于或小于0.01,P≤0.01,其检验结果是在0.01显著性水平上拒绝H0而接受H1,指样本所属的总体平均数与假设的总体平均数有极其显著性差异,可靠度99%,在Z值右上角用 “**”表示。

(2)单侧检验统计决断

表2各项指标的具体含义与双侧决断解释相仿。

二、独立小样本平均数差异的显著性检验

独立样本容量n1和n2都小于30,或者其中一个小于30的独立样本称为独立小样本。

(一)两个独立小样本平均数之差的标准误

由公式①知,两个总样本标准差已知,且σ12=σ22时,得两个独立样本平均数之差标准误公式为:

若σ2未知,此时用S12或S22都可以分别作为它的无偏估计量。若用加权平均法将S12及S22合起来共同求它的估计量S2(称为汇合方差)为最佳,汇合方差计算公式为:

上式含义就是两个样本方差中的离差平方和除以两个样本方差中的自由度之和。

由公式⑤与公式②得两个独立小样本平均数之差的标准误的公式:

利用不同的已知数据有以下三种计算公式:

1、利用原始数据

2、利用总体标准差S

3、利用样本标准差σX

(二)样本平均数差异的显著性检验

1、两个总体方差的齐性检验

汇合方差是以两个相应总体方差相等为前提的,所以在进行独立小样本平均数差异的显著性检验之前,首先要对两个总体方差是否进行齐性检验。

(1)提出假设

H0:σ12=σ22

H1:σ12≠σ22

(2)构造检验统计量F并计算

第一,用原始数据计算

第二,用S计算

第三,用σX计算

(3)统计决断(见表3):

分子自由度df1=n1-1,分母自由度df2=n2-1。

2、样本平均数差异的显著性检验步骤

在上目中讨论中两个总体方差的齐性检验结果是在两个总体方差相等S12=S22条件下

(1)提出假设

H0:μ1≤μ2

H1:μ1≥μ2

第一,用原始数据计算

(3)确定检验形式:根据实际问题和所给数据进行判断进行单侧还是双侧检验。

(4)统计决断(见表4):

自由度df=n1+n2-2

三、样本均数差异的显著性检验应用

综上所述,通过对样本容量在30以上的大独立样本和样本容量在30以下的小独立样本的平均数差异的显著性检验,可以对样本容量不同的试验结果差异的显著性作出结论。下面以实例对其应用加以说明。

测得有A、B两所小学二年级学生身高(厘米)及标准差如表5所示:

对这两所小学二年级的学生平均身高的差异进行显著性检验。

检验步骤:

(一)提出假设

H0:μ1=μ2

H1:μ1≠μ2

(二)构造统计量Z并计算

两所小学学生身高是从两个相应总体随机抽出的独立样本,两个总体标准差未知,两个样本容量较高,即n1=100>30,n2=120>30,是属于独立大样本检验。其统计量Z为:

(三)确定检验形式

因所给资料中不能反映出两所小学二年级学生身高的优劣,故采用双侧检验。

(四)统计决断

根据表1得:|Z|=3.9976>2.58=Z0.01,P<0.01故在0.01水平上拒绝H0,接受H1。即A、B两个小学二年级学生身高有极其显著性差异(**)。

参考文献:

1、欧贵兵,刘清国等.概率统计及其应用[M].科学出版社,2007.

2、梅国平,袁捷敏,毛小兵,李杰等.概率论与数理统计[M].科学出版社,2007.

3、王松桂,陈敏,陈立萍等.线性统计模型[M].高等教育出版社,1999.

4、王孝玲.教育统计学(修订二版)M].华东师范大学出版社,2001.

5、郑凯,张路等.体育应用统计基础[M].沈阳出版社,2004.

6、箫亮壮,谭锐先等.概率论与数理统计[M].国防工业出版社,1980.

统计学的标准差篇5

(一)培养学生的兴趣职业教育的目的是培养高素质、技能型专门人才。所以,在统计教学中,要考虑理论知识的适度、够用,而不刻意追求理论体系的完整。要强调统计基础知识的掌握和统计基本技能的训练,注重提高学生运用基本理论和方法来分析、解决实际问题的能力。在语言表述上,力求简明、通俗、易懂,把概念表述准确、完整,便于学生理解、掌握。同时,将统计知识与计算机知识融为一体,让复杂难懂的统计理论和方法变得简单、快速、准确。将反映国计民生的最新统计数字放在恰当的地方与教材内容紧密结合,让学生感受我国社会经济的高速发展,人民生活的丰富多彩,国家变化的日新月异。这也能提高学生的学习兴趣。

(二)科学设置教学内容统计的目的是认识社会经济现象总体的数量方面,从中发现带有规律性的东西。为了达到这个目的,统计需要做一系列的工作。统计课的教学内容就是按照统计工作过程的每个阶段来安排的:统计设计、统计调查、统计整理、统计描述、统计推断、统计分析和数据积累。其中,统计设计和统计数据积累理论性较强,原则上让学生知道“是什么”、“怎么做”就行了。而对于统计调查、统计整理这两部分,内容虽然多,但容易理解,可以简单讲解,让学生多看,借此培养学生的自我学习能力。统计描述、统计推断、分析这几部分内容,要在学生对统计基本概念准确理解的基础上进行系统讲解。搜集统计数据的过程又称为统计调查,就是围绕统计指标及其体系搜集统计数据,特别是原始数据。主要方法包括直接观察法、报告法、采访法、邮寄法和实验设计调查法。统计整理,即对调查资料进行加工汇总。统计调查所获得的资料往往是分散的、不系统的原始资料,这就要求我们必须对统计调查所获得的资料进行科学的整理,并通过合适的形式把这些整理结果表述出来。具体来说,统计整理是根据统计研究的目的和要求,对统计调查所得到的原始资料进行科学分类、汇总,或对已初步加工的资料进行再加工,使之系统化、条理化,成为能够反映现象总体特征的综合资料的工作过程。统计整理主要讲方法,包括分组、汇总和编制统计表和绘制统计图。统计课的主要内容包括:统计描述(综合指标)、抽样推断、统计指数、时间数列(动态分析)和相关与回归分析。这也是重点和难点。

(三)注重学科知识的系统性统计各章节内容的安排是有逻辑性的,前面内容往往是后面内容的基础。学习过程环环相扣,不能跳越某一章节而直接进入后面的章节。总论部分是对统计课程教学内容的概括描述,通过学习,使学生了解统计学的基本框架体系,把握统计学的涵义、研究对象、研究方法及统计活动的过程,尤其要准确理解统计学的基本范畴(基本概念)。统计学基本范畴包括:总体、总体单位、标志、统计指标以及延伸出的小概念。如果把统计课的学习比喻为盖高楼大厦,那么这些基本范畴就是地基或基石。深刻理解领会这些基本概念的含义,准确把握基本概念之间的区别与联系,并能正确运用,就为这座高楼大厦夯实了地基、稳固了基石。教师讲解这些概念时,可结合生活中学生熟悉的例子深入浅出地讲解,课下布置练习进行巩固。

二、统计课重点、难点内容解析

(一)统计学的基本概念最基本的概念包括:总体、总体单位、标志、统计指标。如上所述,这是学好统计课的基础。例如,“总体”这个概念。毫不夸张地说,统计所有章节的内容都是围绕“总体”展开的。统计学的研究对象是大量的客观现象,特别是社会经济现象的数量方面,包括数量特征、数量关系和数量界限,目的是认识社会经济现象发展变化的规律性。而社会经济现象包罗万象,种类繁杂,包括社会的政治、经济、文化、人民生活等领域的各种现象。统计研究时需要分门别类,把他们界定为一个个客观存在的、具有某种共同性质的许多个别现象或事物组成的集合体,即统计总体。个别现象或事物就是总体单位。总体具有大量性、同质性、差异性三大特征。大量性即总体是由许多单位组成的,一个或少数单位不能形成总体,因为统计研究的目的是要揭示大量事物的普遍规律性,所以,统计研究的对象必须包括足够多的个体。同质性即构成总体的各单位必须具有某种共同性质,这是形成总体的客观依据,也是我们确定总体范围的标准。差异性即总体的各单位除了某些方面的共同性外,在其他方面必须有差异,这些差异是统计研究的基础和前提。如果学生不理解“总体”这个概念,就不能在特定的统计研究目的下,准确地界定总体的范围,描述总体的总量指标、相对指标、平均指标就无从理解和计算,更谈不上利用这些指标进行统计推断和统计分析。

(二)平均指标这是统计课中最重要的基础性指标。平均指标用以反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的一般水平的综合指标。它反映总体分布的集中趋势。其中,算术平均数是基础的、最重要一种。明确它的计算原理和含义,就能顺理成章地掌握变异指标、抽样推断、时间数列分析、指数分析中各类指标的计算和应用。平均数的计算学生并不陌生,在小学或者初中都学过。这是学习统计平均指标的基础。但要让学生明白,他们以前学的平均数是一个抽象的量,而这里的平均数是有特定经济内容的,是具体的有空间范围、时间限制的量。学习平均指标首先要搞清分类。平均数分为两大类:静态平均数和动态平均数,这跟时间有无变化有关。计算静态平均数的每个数值都是同一时间点上的,它表示每个总体单位在某一数量标志上的平均水平。计算动态平均数的每个数值是某一个统计指标在不同时间上的取值,是表示该指标在每个时间单位上的平均水平。最常用的平均数是算术平均数,其基本公式为:算术平均数=总体标志总量总体单位总量这个指标的含义、计算原理、四个计算公式以及应用都要讲透,特别是加权算术平均数的计算和应用,对学生的要求不能停留在“会就给定的资料计算出算术平均数”这个层面,而要让学生透彻理解掌握其计算原理,并把它运用到复杂的领域。因为标准差、抽样平均误差、平均发展水平、综合指数、平均数指数、相关系数、回归分析等有关指标的计算都是以算术平均数的计算原理为基础的。

统计学的标准差篇6

[摘要]目的通过方法学比较和偏倚评估探讨不同检测系统对总蛋白(TP)和白蛋白(Alb)的检测结果是否具有可比性。方法根据EP-9A文件,取朗道水平2和水平3质控物以及54份不同浓度的患者新鲜血清,在3个不同的生化检测系统(系统1:日立7170生化分析仪,Roche试剂、c.f.a.s校准品和质控品;系统2:岛津CL7200生化分析仪,中生试剂、校准品,德灵质控品;系统3:日立7170生化分析仪,中生试剂、校准品,朗道质控品)上检测TP和Alb,并对数据进行统计学分析。以美国临床实验室修正法规(cLIA’88)规定的室间质量评价允许误差范围的1/2为临床接受范围,判断不同检测系统的可比性。结果朗道质控物和新鲜血清标本中TP和Alb测定结果经随机区组设计资料的方差分析,各检测系统间的总体差异均有统计学意义(P

[关键词]总蛋白;白蛋白;检测;偏倚

检测系统是指完成一个检验项目所涉及的仪器、试剂、校准品、检验程序、保养计划等的组合。当前,一个医院对同一项目有多个检测系统已是相当普遍的现象。然而,比对试验如何进行,如何判断不同检测系统检测结果的可比性,如何评价其临床接受性能等问题随之产生。本实验参考美国临床实验室标准化委员会(NccLS)的EP9-A文件,对我院总院和两个分院的3个不同检测系统总蛋白(TP)和白蛋白(Alb)的测定结果进行方法学比较和偏倚评估,现报道如下。

1 材料与方法

1.1 材料

1.1.1 检测系统的组成根据实验室使用的仪器、试剂、校准品、质控品的不同分为以下3个检测系统。(1)检测系统1:日立7170生化分析仪,R0che试剂、c.f.a.s校准品和质控品;(2)检测系统2:岛津CL7200生化分析仪,中生试剂、校准品,德灵质控品;(3)检测系统3:日立7170生化分析仪,中生试剂、校准品,朗道质控品。

1.1.2 盲样制备每日常规工作后收集新鲜血清若干份,制备成1-3份不同浓度的混合血清,分装于带盖的清洁试管内,共54份。同时选用同一批号的RAND0x水平2和水平3质控血清,按说明书要求复溶,分装于带盖的清洁试管内。质控样本和血清样本随机编号,由专人分发给不同检测系统,置于当天常规工作中进行测定,连续20个工作日。

1.2 方法

总蛋白测定均采用双缩脲法,白蛋白测定均采用溴甲酚绿法。因检测系统精密度最好,参加室间质评成绩优秀,定期校准且测定结果准确,已通过ISO/IECl7025和IS015189实验室认可,故以检测系统1作为目标检测系统比较方法(x),其余各检测系统为实验方法(Y),进行方法间TP、Alb测定结果的比对试验。实验前对仪器进行常规维护与保养,各实验室按常规方法进行质控,质控结果在控时进行双盲盲样测定。每个项目的检测严格按厂商试剂盒的说明书进行。各实验室收到盲样后2h内测定完毕,每份样本只测定1次。

1.3 数据收集与处理

剔除已明确有人为误差的结果,按EP9-A文件进行方法间离群值检查。x的分布范围是否合适可用相关系数(r)作粗略估计,如rI>0.975或r>0.95,则认为x范围合适,直线回归统计的斜率和截距可靠;如r

计算线性回归方程:y=bz+a。计算方法间的系统误差:根据临床使用要求,将各个项目给定的医学决定水平浓度xe代人回归方程,计算实验方法(Y)与比较方法(X)之间的系统误差(SE),SE=|Yc―xc|,系统误差率(sE%)=SE/Xc×100%。

1.4 临床判断标准

美国临床实验室修正法规(CLIA’88)规定,TP测定结果的允许误差为T±10%,Alb.的允许误差为T±10%,以系统误差率(SE%)小于CLIA’88室间质量评价标准规定的允许误差的1/2为临床接受标准;以医学决定水平处的系统误差来判断检测系统间是否可以接受。

1.5 统计学处理

不同检测系统质控物结果采用随机区组设计资料的方差分析;不同检测系统新鲜血清测定结果采用随机区组设计资料的方差分析、可靠性分析、相关分析和回归分析。所有数据均在Excel2000和SPSSl1.0软件包上进行。

2 结果

2.1 不同检测系统的精密度评价

根据朗道水平2和水平3质控品连续20次的盲测结果,通过计算均值、标准差(s)和变异系数(cV)来评价不同检测系统的精密度,水平2和水平3测定结果方差齐,经随机区组设计资料的方差分析,TP、Alb均数总体差异均有统计学意义(P

2.2 不同检测系统新鲜血清TP、Alb的测定结果

3个检测系统TP、Alb测定结果方差均齐(P>0.05),经随机区组设计资料的方差分析,各检测系统间的均数总体差异均有统计学意义(P0.975。

2.3 各检测系统临床接受性能评价

以检测系统1作目标检测系统,将TP、Alb的医学决定水平浓度代人各自相应的回归方程,以判断各检测系统的临床接受性能。

3 讨论

血清蛋白测定结果对疾病的诊断没有特异性,但结合临床资料可以用来判断疾病的严重程度,另外,总蛋白、白蛋白还是肝病预后好坏的指标。保证不同实验室、不同检测系统检测结果的一致性和可比性是目前各中、大型医院检验科追求的目标。我国临床实验室都很重视检验结果的准确性,一般都参加全国或全省的室间质量评价活动,并每天进行室内质量控制,但这些并不能完全解决不同系统的偏差问题,必须进行系统问的比对实验。

本研究结果显示,3个检测系统间新鲜血清中Tb、Alb测定结果经二因素混合模型进行可靠性分析,可靠性系数α接近1,表明测定结果稳定性好,受随机误差影响程度小,稳定性临床可以接受。3个实验室的3个检测系统TP、Alb的正常值、异常值质控物的日间变异系数及总变异系数均小于3%,表明各检测系统测定TP、Alb的精密度均符合临床要求。临床精密度要求和统计结果相矛盾,各检测系统临床接受性能评价与统计学结果不一致,这是从统计学和临床判断标准两个方面去分析数据,避免了传统的比对实验差异有统计学意义就得出不可比的结论。采用国际通用的Hor-witz方程评定比对实验结果,可把检测允许误差与待测组份的浓度直接用函数式表示,用来评判比对实验的结果较客观、准确,克服了以前用绝对误差和相对误差评判的主观性和经验性。但此法仍然是从统计学上出发,并未考虑临床的接受性,因此,我们认为此法用在临床上仍然不如使用CLIA’88的允许范围评价比对试验结果更客观。

统计学的标准差篇7

【关键词】考试成绩;统计分析;评价

0 引言

高等学校英语应用能力考试是高职高专公共英语唯一的全国性考试,其前身是普通高等专科英语考试,是国家为检测和提高普通高等专科英语课程教学质量而建立的,1997年开始试运行,1998年正式投入使用,距今已有16年。高等学校英语应用能力考试现已被高职院校普遍采用作为评价师生教学效果的手段。考试的结果通常以考试成绩暨分数体现。在高职公共英语课程教学研究中,对考试成绩进行统计分析已有涉及,但更多的也只涉及到某一方面,如求出平均分。这些分析不能准确全面的反映学生的考试情况,也就不能公正对师生的教学效果进行评价,这就需要我们对考试成绩科学的统计分析。本文将使用统计学中的集中量数、差异量数及标准分对我校学生高等学校英语应用能力考试测试成绩进行统计分析,以期通过学生的测试成绩来全面科学的了解测试结果,给教师的教学效果和学生的学习效果做出公正的评价。

1 集中量数

集中量数是代表一组数据典型水平或集中趋势的量(王孝玲,2001)。它主要有两个作用:第一,它是一组数据的代表值,用来表示这组数据的典型情况。第二,组间的集中量数是可以比较的,通过比较可以判断组间数据的差别。集中量数主要三种形式,它们分别是平均数、中数和众数。平均数是教师对考试成绩普遍采用的一种统计分析方法。平均数最严密也最易于理解,因此应用也最广。但平均数存在着很多的不足,比如:平均数的典型性容易受极端数据的影响。如果一个班的分数之间差距很大,有的分数很高有的分数很低,这种情况下算出的平均数就不具有典型性。基于此,我们需要采用其它的统计方法,这就是中数和众数。中数又名中位数,是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。众数是一组数据中出现次数最多的数。通过平均数、中数和众数的三者结合,可以为我们的考试成绩提供更全面的信息。

表1

从表1我们可以看出供电1和供电2两个班的高等学校英语应用能力考试成绩平均分都是73。如果仅从平均分这个角度来比较两个班的考试成绩,我们就会得出两个班的考试成绩的集中趋势的量是一样的。但我们通过统计分析发现供电1和供电2考试成绩的中数和众数是不一样的。之前我们讲了,平均数是容易受极端数据的影响,但是中数是不会受到极端数据的影响。从表1我们可以看出供电1有两位学生的考试成绩低于45,属于极端数据,所以此组的集中趋势的量应该用中数来表示即76,供电2组的集中趋势的量可以用平均数来表示即73。

相对而言,平均数、中数和众数是三个较为常见的集中量数,都能在一定程度上反映数据的集中趋势,所以具有内在的关联性。当平均数、中数和众数三者相等时,这组数据即成正态分布,数据的次数分布图就会完全对称,三个数数轴上重合为一点。当平均数、中数和众数三者不相等时,具体地说,当平均数>中数>众数,叫作正偏态。当考试成绩出现正偏态时,说明试题太难。当平均数

2 差异量数

描述一组数据的特征仅用集中量数是不够的。我们在研究一组数据的特征时,不但要了解其典型的情况,而且还要了解特殊情况(韩宝成,2000)。例如在比较同一个年级的几个教学班高等学校英语应用能力考试成绩时,只比较集中量数是不够的,还要对它们的分散程度进行比较。在统计学中,我们用差异量数来描述数据分散程度。常用的差异量数包括标准差和全距。标准差是总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个体间的分散程度。标准差的公式如下:

σ=■

表2

从表2中我们可以看出这10个班的高等学校英语应用能力考试成绩平均分比较接近。特别是应电1和供电2,应电2和计算1。它们的平均分依次差0.01、0.18。从平分来看应电1和供电2不分伯仲,应电2要比计算1要稍微好点。但从标准差来看供电2的分散程度要比应电1的小,说明供电2的考试成绩相对集中,故供电2的成绩要比应电1的成绩好。从全距来看,应电1的全距是49,而供电2的全距是36,这也说明供电2的考试成绩相对集中。应电2和计算1的情况也类似。

平均数在一组数据中典型性程度高低也取决于这组数据的标准差和全距,如果标准差和全距小,说平均数的典型性程度高,反之则小。

3 标准分

考生在考试后,按照评分标准对其作答反应直接评出来的分数,叫原始分。原始分反映 了考生答对题目的个数,或作答正确的程度。但是,原始分一般不能直接反映出考生间差异 状况,不能刻划出考生相互比较后所处的地位。标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置的。标准分是以标准差为单位来表示某一分数与平均数的差。标准分的公式是Z=(X-X_bar)/S,式中X为原始分数,X_bar为原始分的平均数,S为原始分的标准差。

表3

将原始分转换成标准分之后,我们就可以很直观的看出某个学生的考试成绩在整个班级中所处的位置。

把原始分转换成标准分之后,标准分成了一个抽象的数据,不受原测量单位的影响(李跃平,2003)。这样我们就可以将某个学生在不同时间参加的考试进比较,不同科目之间的成绩也可以用来进行比较,这是原始分所不能的。

4 结束语

通过把学生的高等学校英语应用能力考试成绩进行统计分析,算出反映数据集中趋势的集中量数、反映数据分散程度的差异量数以及标准分,才能是考试成绩客观全面的反映师生的教学情况,帮助师生改进教学,实现既定教学目标。

【参考文献】

[1]韩宝成.外语教学科研中的统计法[M].北京:外语教学与研究出版社, 2000.

统计学的标准差篇8

关键词:图解法;标准差

中图分类号:G633文献标识码:A 文章编号:1003-2851(2011)07-0-01

在学习统计学过程中,许多学生会觉得很多的统计指标很抽象、很难理解,比如标准差的意义:标准差越大,说明离散程度就越大,均数的代表性就越差;反之,标准差越小,说明离散程度就越小,均数的代表性就越好。很多学生在离散程度大小上感到难以理解。在教学中,我通过图解法,许多学生就觉得标准差的意义好理解,非常的简单。下面我就举例说明如何使用图解法来讲解标准差。

例:有三组资料:

甲组4,5,6,7,8,9,10;

乙组2,3,5,7,9,11,12;

丙组2,4,6,7,8,10,12;

若用均数来描述其集中趋势,均数均等于7,但大家一看就知道,这三组资料的分布并不相同,或者说离散程度不同,这是在分析资料时必须加以考虑的。表示离散程度的指标有:极差、方差、标准差、变异系数等。

极差是观察值中的最大值与最小值之差。极差大,说明离散程度大,极差小,说明离散程度小。=10-4=6,=12-2=10,=12-2=10。<,说明乙组的离散程度大于甲组。但=,能不能就说乙组和丙组的离散程度一样了呢?显然不能,极差只和观察值中的最大值和最小值有关系,跟组内其他数据无关,大家一看就知道,乙组和丙组内部数据分布并不相同。下面我们就画个图(如图1)大家可以看得更清楚。

大家一看图便知,乙组的5和9、3和11比丙组的6和8、4和10离均数7都更远(这两对数据可以用不同颜色的粉笔在黑板上标出来),其他2和12相同。显然乙组内部分布比丙组内部分布的离散程度大。这是极差所不能反映的。也就提醒要考虑组中每一个数与均数的离散程度,也就是可以用离均差表示,

但数理统计可以证明,由于正负号相互抵消,各观察值的离均差之和必等于。

这样还不能反映各个数的离散程度,那我们可以用离均差平方以后再相加,这样负数也变成正数,离均差平方和即可以把乙组和丙组的数据代入计算,得乙组的离均差平方和

=(2-7)2+(3-7)2+(5-7)2+(7-7)2+(9-7)2+(11-7)2+(12-7)2=90

大于丙组的离均差平方和

=(2-7)2+(4-7)2+(6-7)2+(7-7)2+(8-7)2+(10-7)2+(12-7)2=70,

而乙组和丙组的变量个数相同,由此可以得到这样结论,离均差平方和越大,离散程度就越大(这个从图中可以很直观地看出来)。

L(x-e)2=70+(m1-7)+(m2-7)就要大于70了(在离散程度不变的前提下,可以得出m1=7-,m2=7+)。

为了消除变量个数对离均差平方和大小的影响,可以考虑取离均差平方和的均数,得到的是总体方差,如下式所示。

由于各个离均都经过平方,原来的度量单位都变为平方单位了,为了用原来单位表示,可以把总体方差开平方,得到总体标准差,公式如下

由于变异度越大,则离均差平方和越大,标准差就越大,故标准差越大,说明个体变异度越大,则平均数的代表性就越差。

我们再把前面本组数据分别代入公式计算

可得

从乙、丙二组的标准差可以看出,乙组的标准差大于丙组的标准差,可以认为乙组的变异度大于丙组。再结合前面的线段,可以很直观看出乙组的变异度大于丙组。可以认为均数7作为丙组的代表性要好于乙组。

推荐期刊