线上期刊服务咨询,发表咨询:400-808-1701 订阅咨询:400-808-1721

评估制度论文8篇

时间:2023-05-05 08:53:55

评估制度论文

评估制度论文篇1

关键词:个人信用个人信用评估诚信信用中介

随着银行业的发展和人民生活水平的提高,个人和银行业联系越来越紧密,个人通过个人消费贷款和个人信用贷款与银行发生着直接的关系。银行业积极适应变化的市场环境,将零售业务提高到战略高度,个人信用体系的建立势在必行。同时,受金融危机的启示,一个适合的信用评估体系能够有效减少银行风险。

一、我国个人信用制度建立建设的现状

1.个人信用制度建设有比较好的政策环境

中国人民银行于1999年3月颁布了《关于开展个人消费信贷指导意见》,明确提出了“逐步建立个人消费贷款信用中介制度”,“信用制度是个人消费信贷业务发展的重要条件”等建议。2000年4月,我国正式颁布实行了《个人存款账户实名制规定》,该制度的推行成为建立我国个人基本账户和个人信用资料库的基础。

2.初步建立了个人信用中介机构,个人联合征信开始起步

我国已有一些信用中介机构从事个人信用调查、评估业务。2000年7月1日,上海成立了全国第一家专业性个人信用中介机构——上海资信有限公司,并正式开通了个人信用联合征信服务系统。

3.个人资信评估工作逐步开展,开始为银行贷款决策提供参考

各商业银行纷纷利用所掌握的个人资信资料开展个人信用评级,把个人信用能力引入到信贷管理中来。

二、制约我国个人信用制度建设的主要因素

1.个人信用资料不完全,缺乏个人资产评估的基础数据

能否在一个地区开展征信服务,最基本的条件是征信公司能否快速、真实、完整、连续、合法、公开地取得当地个人信用资料,并能够合法向需求者提供对这些数据分析处理的结果。目前我国绝大多数居民能够提供的信用文件主要有:一是身份证和户籍证明;二是所在单位的人事档案;三是个人存单凭证和实物资产证明。这些数字并不能证明个人收入的多少、来源及可靠性,也不能据此计算个人及家庭的总资产。

2.缺乏明确的个人信用记录

个人信用一般是通过连续记录建立起来的,个人信用记录直接记载着个人信用行为的结果,没有记录就无法判别信用的好坏。在我国的经济生活中,居民个人的信用记录普遍缺乏。金融机构、企业、事业单位等没有对居民个人信用行为的系统记载。

3.缺乏法律、法规及配套政策的保障

从个人信用风险管理的法律环境来看,我国现行法律体系涉及个人信用方面的规定较少,没有一部专门法律、法规来调整个人信用活动中的各种利益关系,少数相关的法律,与个人信用衔接不够,针对性不强。另外,对于个人失信行为也没有明确规定具体的惩罚力度和惩罚方式。

三、完善个人信用评估系统

个人信用制度建设是一项错综复杂的系统工程,仅仅依靠市场力量的推动和“提高全民族的诚信道德意识”是远远不够的,它需要政府和社会的,需要制定相关的政策和措施来为其发共同参与展与完善提供相应的制度和组织保障。

1.健全个人信用的法律法规体系

(1)修改现有法律。修改民法通则,对公民隐私权不受侵犯、信用权及债权人权利享受保护作出明确、具体的规定;修改《商业银行法》,对银行个人信息数据开放和保密作出平衡规定,明确可以开放的条件、范围、方式及其它措施;修改行政法规或规章,明确个人信用制度的管理部门,强化职责与权限,消除各自为政、零散分割的不利局面。(2)制定新的法律。主要包括:信息公开法,对个人信用数据公开制定统一的法律,明确公开的范围、程序与对象,确保征信机构能合法、快捷地获得个人的相关数据;个人数据保护法,强化个人隐私权免受非法侵害;公平信用报告法,规范个人资料的收集、利用、传播及权利、义务与责任等等。(3)健全失信惩戒机制。

2.引入科学的个人信用评级指标

个人素质在很大程度上决定着个人信用,能不能还贷是银行能够度量的问题,而是否有还贷意愿相对来说,更难以测度,不过在这里我们可以用个人素质来反映这一变量。

同时还需要考察的指标有个人资产规模和质量,个人偿债能力、个人盈利能力、个人信誉状况。

3.创建必备的外部环境

①大力普及电子化支付手段,推行我国金融电子化建设。提高全社会的信用程度,最大限度地减少社会上的现金流通,就需要大力推行银行卡、电子钱包、个人支票、网上支付等先进的支付手段,完善自助银行、电话银行、网上银行的推广普及,最大限度地提高支付方式的现代化。②建立健全个人有形资产的评估体系。如房地产评估、长期投资评估,包括债券、股票、实物资产的长期投资,以及汽车、高档耐用消费品等,按照有关资产评估的原则、原理、办法进行科学评估。③建立个人破产制度。在个人资产远远小于个人负债、无偿还可能的形势下实施个人破产制度,是对社会经济的有效调整,也是重建个人信用的重要方法和对个人信用制度的必要补充。④建立对违背个人信用制度者的制裁措施。首先进行金融制裁,银行不再继续贷款;其次结合社会信用制裁,降低个人信用等级;再次应采取舆论制裁,使其难以立足;最后对情节严重者动用法律制裁,维护社会信用。

参考文献:

[1]艾洪德、蔡志刚,《个人信用制度:借鉴与完善》,《金融研究》2001,(03).

评估制度论文篇2

(一)政府主导

评估制度在高等教育发展中具有“风向标”和“指示器”的作用,由政府主导的评估对高等学校的发展有很强的规范和导向作用。在我国高等教育评估中,首先,由于从评估工作的统筹到评估人员的选配都被纳入到了政府行政工作体系中,大大加重了政府工作的负担,同时也由于缺乏常态、连续的评估,造成评估工作成本过高。其次,由于政府主推的评估远离教学真实环境、远离市场环境,导致评估活动的信息收集不完整,对市场需求的反映有明显的滞后性。再次,政府集高等教育举办者、管理者和主导评估者三角色于一身,从评估开始到评估结束都有很强的封闭性,缺乏第三方的有效监督,这使评估活动的公正性、科学性和公益性受到社会公众的质疑,政府在办好高等教育和管好高等教育的双重目标下压力越来越大。

(二)未反映社会的利益诉求

社会主体是高等教育的重要利益相关者,高等教育质量的高低对其有深刻的影响。社会希望高等教育能产出更多的科技创新成果,培养更多能适应、推动社会发展的高质量人才。同时,社会希望自身对高等教育提出的更高要求在高等教育评估工作中得到反映,并希望政府主导的评估活动的评估结果能融入到市场“信息流”中,为自己的决策提供依据。不仅如此,社会希望参与到评估中,引导社会资源对高等教育的高效投入,加强与大学的联系,扩大自身在高等教育发展中的影响力,改变社会对高校建设缺少话语权的现状,而上述种种诉求无法直接地在我国现有的评估制度中得到全面反映。

(三)高校参与评估的内动力不强

政府主导的高等教育评估呈现行政检查倾向,并且评估结果与政府的各项资源投入直接挂钩,高校在面对政府的评估时,不得不倾尽全校之力迎合评估标准,甚至不惜弄虚作假。评估一旦结束,学校便懈怠下来,逐渐在各高校间形成政府评估通过便“万事大吉”的消极思想。高校过分依赖政府的外部推动,无法形成参与评估的主体意识,对本应贯穿于日常教学的自我评估的推动意识不强,大大降低了教育评估的成效,影响了“以评促建”的实现。此外,现有的评估制度缺乏教师和学生的主动参与,教师和学生只是被动地接受检查,影响了高校参与评估内动力的提高,客观上也形成了高校评估缺乏基层参与的问题。

二、多元参与的意义

(一)有利于缓解政府在高等教育评估中的合法性危机

合法性是指得到社会大众或各个利益主体的普遍认同与自愿遵从。我国的高等教育评估制度自建立以来就带有明显的政府主导色彩,随着社会主义市场经济的发展和高等教育管理体制改革的深入,高等教育利益格局不断分化,政府主导的一元评估制度,与利益主体多元化的社会环境契合度不断下降,无法实现其他利益主体的参与意愿和利益诉求,自然难以得到其信任和认同,形成合法性危机。高等教育评估在很大程度上影响了高等教育资源的配置,关乎各利益主体的切身利益,因此高等教育评估应有各利益主体的广泛参与。通过高等教育评估多主体参与,拓宽社会和高校参与高等教育管理的渠道,为其提供表达利益诉求的机会,从而使高等教育评估更加民主、科学,提高政府在高等教育评估中的协调能力,保证高等教育评估活动得到广泛认同和信任,缓解政府在高等教育评估中的合法性危机。

(二)有利于政府、社会和高校间的相互认可

随着市场经济和我国高等教育的发展,政府、社会和高校各主体在高等教育的利益逐渐分化,这必然会产生利益的矛盾和教育价值观念的冲突。政府主导的高等教育评估活动因缺乏与社会、高校的沟通互动,评估的认同感下降。高校在政府“一把尺子量到底”的评价标准中呈现趋同态势,培养的学生不能满足社会发展的需求。社会对高校建设的认同感下降,对政府在高等教育事业中的管理能力产生不信任。多元参与是通过利益主体的多元化,权力的多元分配,实现各方利益的最大化。可以通过政府、社会和高校共同参与高等教育评估,重建三方之间的信任关系,强化高等教育质量意识,引导政府、社会和高校各方的独立性,实现政府、社会和高校在高等教育评估中的相互认同。同时,在相互认同的基础上,激发各主体参与高等教育评估的积极性。

三、多元主体参与高等教育评估的策略

(一)政府创造多主体参与的环境

在高等教育评估多主体参与中,政府需要通过宏观上的制度安排和引导来巩固影响力。第一,政府在高等教育评估中职能的转变需要制度的保障。改善评估制度缺失的现状,创新已有的评估制度,加快评估的立法,实现更加合理有效的制度安排,确立社会、高校参与评估的合法性,并对社会、高校参与高等教育评估的方式进行明确的规定,确保社会、高校在参与评估时有法可依。第二,积极培育和发展教育评估市场。引入教育评估服务的竞争机制,运用立法、委托合作和必要的行政手段对评估工作进行宏观管理和协调。第三,建立多样化评估标准。高等教育大众化的发展,需要有多样化培养目标的高校,也需要多样化的评估标准来衡量不同类型高校的质量。通过多样化评估标准的实施给予高校充分的建设空间,以充分发挥高校探索特色发展的创造性,使评估工作真正成为大学自我发展、自我完善、自我约束的动力。

(二)社会提高自身的参与力

随着市场经济的发展,社会在教育市场资源配置中扮演着越来越重要的角色。在教育评估领域,社会需要自主创造参与机会,提高自身的参与能力。第一,政府对公共高等教育经费的减少为社会市场参与高等教育提供了机会。社会可以充分利用自身的资金、信息优势,加大与高校的横向合作,提高社会与高校的密切程度,并运用市场竞争机制的参与,促进高校提高专业设置和学生培养中的成本效益,扩大社会在高校发展中的话语权,进而将这种影响力映射到高等教育评估中。第二,加强与政府的沟通,将自身参与高等教育评估的利益诉求以合理的方式反馈到政府评估的运行中,使这种参与愿望不断以温和的方式得到强化,进而引起政府在评估决策中的考量,为自身参与高等教育评估创造和谐宽松的环境。

(三)高校加强自我评估

高校自我评估更能发现高校自身存在的不足,对高校改进教学工作,提高教育教学质量有更强的推动力。第一,高校需建立一个常设评估小组,小组成员可由专业评估专家、普通教职员工、学生等共同参与。将学生纳入评估小组的目的是拉近教学评估与学生的距离,促进评估的基层参与。第二,高校根据自己的实际情况制定对自身建设有针对性和实效性的评估指标,并不断丰富评估指标体系,使指标体系涵盖学生的输入输出质量、教师绩效、行政管理和校园文化等高校建设的方方面面。通过制定合理的评估指标提高和强化高校进行自我评估的完成度,促使高校不断根据自身情况提高评估标准,提高自我评估的积极性。第三,高校在进行自我评估时要不断丰富评估技术手段,改变过去过分依赖现场抽查、直接面谈的方式,将信息技术运用到评估工作中,充分利用学校校园网、图书馆信息系统等已有数据库中的资源,通过运用大数据分析获得更加客观的信息,以减少参与主体主观因素的影响,提高评估的信度和效度。第四,加强教育评估的理论、技术和方法的研究工作,将教育评估的本质和目的的研究以及科学评估指标体系的研究作为研究的重点,提高我国高等教育评估的理论支持,促进我国高等教育评估的科学发展[2]。

(四)评估中介机构积极参与

评估制度论文篇3

根据工伤保险和劳动保护的内涵界定以及制度发展路径,评估依据的宗旨为:维护劳动者权益,实现公平生存权和发展权;实现安全生产,提高劳动生产率;提高制度运行内部效率,优化自身结构。评估主要依据系统性、重预防重康复、国际化接轨、适度性、管理效益性、动态优化等原则,多层次全方位地对制度的运行和发展做出定量和定性的评价。

二、工伤保险和劳动保护制度评估的指标设计

评估制度发展,不仅要考量制度中总量指标是否增长,还要根据结构和效率指标做出科学判断。工伤保险和劳动保护制度评估指标内容为:

(1)工伤保险覆盖面和享受群体指标,考察参保人群与享受工伤保险待遇人群的变化。

(2)工伤保险待遇水平指标,说明工伤保险待遇水平能否保障伤残劳动者及家属的基本生活。

(3)工伤保险与其他保障项目比较指标,说明工伤保险在社会保障体系中的地位和作用。

(4)工伤保险水平国际比较指标,从开放视角下考察工伤保险和劳动保护制度的国际水平。

(5)工伤保险基金运行统计指标,可以评价工伤保险基金运营情况。

(6)工伤事故认定制度执行指标,从工伤认定程序、规则和发生工伤认定群体的赔付的角度,以及工伤认定制度内部结构进行评估。

(7)工伤保险费率机制指标,可评价保险费率确定的公平性和有效性,看工伤费率是否能够达到促进企业安全生产的目标。

(8)工伤预防康复和劳动保护制度运行绩效指标,用于评价“三位一体”的工伤保险和劳动保护制度的实施状况。

(9)工伤保险和劳动保护制度管理评价指标,考查制度管理体制运行中的诸如管理成本、人员结构以及机构设置的相关指标。在上述9个指标中,指标(1)至(5)侧重基于宏观角度评价工伤保险制度运行发展的水平和效果,即发展水平评估指标;而指标(6)至(9)是基于工伤保险制度自身运行的角度,考察其结构和效率,即制度综合评估指标。在上述指标选取的基础上,本文构建工伤保险和劳动保护评估指标体系。该体系分别由总目标层、主体指标层和分类指标层构成。其中,总目标层为工伤保险和劳动保护评估指标体系,表明评价的总体结果,反映工伤保险和劳动保护制度的总体发展水平;主体指标层由工伤保险和劳动保护制度评估9大指标构成,表明工伤保险和劳动保护子项目的评价结果及发展水平,构成一级子系统;分类指标层由参保人数、工伤保险给付水平、覆盖面比较等29个具体指标构成,表明工伤保险和劳动保护子项目中各分项的发展水平及程度,构成二级子系统。

三、工伤保险和劳动保护制度的定量评估

本文选取1994—2011年的工伤保险样本数据,利用工伤保险覆盖面和享受群体指标以及基金运行等指标进行因子分析,对工伤保险和劳动保护制度的发展水平进行定量评估。经过KMO和巴特利特球度检验得:KMO值为0.716,大于0.6,表明基本适合进行因子分析。巴特利特球度检验统计量的观测值是609.798,对应概率p接近于0,表明适合进行因子分析。各指标数据作因子分析后的因子旋转结果,包含各因子变量的方差贡献率和累计方差贡献率,累计方差贡献率表示前m个因子刻画的总方差占原有变量总方差的比例。从初始解中提取了2个公共因子后,对原变量总体的刻画情况,这是由于分析过程中我们指定了提取方差贡献率大于1的公共因子。可见,如果提取2个公共因子,那么它们可以描述原变量总方差的87.240%,大于85%,可以认为,这2个因子基本反映了原变量的绝大部分信息,缺失信息很小。是按照方差极大法对因子载荷矩阵旋转后的结果,可以得出结论:第一主成分为覆盖面以及待遇水平指标,主要反映工伤保险覆盖情况及基本待遇状况,且在当前经济发展水平下,覆盖面与待遇水平的高低仍是影响工伤保险发展最重要的因素。第二主成分为基金运营指标,基本反映了基金结余、收支增长率等指标。从所提取的2个公共因子,以及各2个公因子对于各项指标的载荷大小来看,工伤保险和劳动保护制度综合评价指标体系的客观指标的设计中,关于各子体系的划分及其相关下层客观指标构成的设计结果与数据分析相互验证,充分表明了该综合评价指标体系构建的合理性。SPSS根据因子得分函数自动计算各样本的2个因子得分,这样就把原来的14个指标浓缩成相互独立的2个公因子,一方面达到了降维的目的,另一方面也排除了指标之间的相关性,为下面综合指数的构建奠定了基础。2个公因子从不同程度上反映了各个指标的信息,2个公因子按照特征根比累计贡献得到公因子系数,并最终计算综合得分N,由N的值可以反映工伤保险与劳动保护的动态时间发展状况或地区间发展水平的差异。本次评估采用的是时间序列数据,若采用省份、城市等数据,可以对区域发展情况进行对比。工伤保险与劳动保护评估综合得分结果表明,中国工伤保险和劳动保护制度改革发展趋势是1999年之前处于下降趋势,1999年下降到历史最低水平,得分仅为-1.06;2000年之后缓慢回升,到2004年达到当期历史最好水平,为0.04分;之后综合得分稳步提高,得分在2011年达1.73。原因是2004年《工伤保险条例》实施后,工伤保险制度取得了全面的发展。从2004—2011年,工伤保险与劳动保护评估综合得分逐年上升,一直保持持续良好的发展态势,制度改革取得了一定的社会和经济效益。但是,我们也需要认识到目前我国工伤保险和劳动保护制度的综合得分仍然不理想,制度的可持续发展仍然存在很多问题。

四、完善工伤保险和劳动保护制度的对策建议

1.继续扩大制度覆盖面,实现全体劳动者享有该基本保障制度

工伤保险制度应该随着经济的发展,不断吸收新的群体,最终让社会全体劳动者都能够受到保护,将从事经济活动和非经济活动的人都包括在整个工伤保险制度之中,例如,奥地利、丹麦、芬兰等,挪威、瑞典、突尼斯等国已经把个体经营者纳入工伤保险制度中[3]。

2.建立集预防、康复和补偿“三位一体”的工伤保险制度

工伤保险制度只有以工伤预防为主,达到工伤预防、康复和补偿三者的有机结合,才能日趋完善。一要牢固树立“安全第一,预防为主”的观念,遵守劳动安全卫生法规制度,严格执行国家劳动安全标准和规程。二要构建科学合理的工伤保险预防费用投入机制。三要强化职工工伤预防培训上岗制度,对企业领导和职工进行系统经常性的工伤预防知识教育。四要积极开展职业伤害康复工作,对具有一定劳动能力并需要通过专门培训恢复或者提高劳动能力的伤残人员进行康复训练。

3.规范和完善工伤保险管理制度

规范和完善工伤保险管理制度,一要不断完善我国工伤保险行业差别费率和浮动费率制度。实行工伤保险行业差别费率每3年调整一次,同时,全面实行工伤保险浮动费率。二要完善工伤保险待遇给付。第一,调整工伤保险待遇结构,逐步提高待遇水平,实行保障基本生活与适当经济补偿相结合;第二,完善工伤待遇合理调整机制,确定工伤保险待遇水平随物价和工资增长做出适当上调。三要增加工伤事故的精神损害赔偿。在伤残补助金之外,还应当根据伤残程度支付一次性精神赔偿费。四要理顺工伤保险管理体制,可以由国家和各省设立独立的事业单位负责基金运作,实行省级统筹,由安全生产监督管理部门负责制定政策和工伤基金的监管,统筹规划,整体推进。

4.完善中国工伤保险制度法规体系

评估制度论文篇4

[论文摘要]政府绩效评估机制作为社会大系统中的一个子系统,和其他系统进行连续不断的能量交换,以保持系统的动态平衡。基于生态环境视角,从经济体制类型和我国的财政状况、政治体制、政治环境以及中国传统文化和“官本位”思想等几个方面进行深入分析,探讨政府绩效评估制度影响和制约效应,为我国政府绩效评估制度的进一步完善寻找理论支撑。

一、引言

生态环境(ecological environment)原来是自然科学术语,主要用来描述任何有机体的生长环境。但在20世纪20年代,以美国芝加哥学派的派克(r·f·park)和蒲基斯(e·w·burgurs)为先锋,借用自然科学中动植物生态学的概念、术语,对人类社会的生存环境进行了系统分析。他们认为:“从功能理论之生态观点而言,任何经济、文化、政治和行政制度等皆为一有生命的个体,是经过一段漫长的成长过程渐渐演进而来的。也就是说在生命的个体之间,以及生物与环境之间都有一种功能的相互依赖关系。”这种与自然环境相对称的社会客观存在被称为社会生态环境,它主要包括三大社会系统:社会经济系统、社会政治系统和社会文化系统。

政府绩效是指政府在社会管理活动中的结果、效益及其管理工作效率、效能,是政府在行使其功能、实现其意志过程中体现出的管理能力;或者说,政府绩效评估是指对政府管理过程中投入、产出、中期成果与最终成果所反映的绩效进行评价和划分等级。政府绩效评估作为改进行政管理的关键一环,成为一项重大的政治活动而蓬勃展开。由此,加强和完善政府绩效评估制度无疑是政府部门职能转变的一个强大而有效的推动力。

正如一切事物都必然生长于特定的生态环境之中一样,政府绩效评估制度也丝毫不能例外。社会生态环境是政府绩效评估制度赖以生存和发展的基础和前提;政府效绩评估制度必然和周围的经济、政治和文化环境存在着一种功能上的依赖关系,但又受到其制约。从一定意义上理解,政府绩效评估制度的发展过程就是一个不断适应和不断克服社会生态环境制约的过程。

二、经济生态环境的制约

经济生态环境是指社会的经济活动方式及其经济力量。经济基础决定上层建筑,经济发展水平决定着一个社会的整体发展程度。作为评估政府管理能力的政府绩效评估制度必然植根于特定的经济基础,并受到生产力发展水平的制约。当前,我国经济生态环境对政府绩效评估制度的制约主要表现为经济体制类型、政府财政和预算体制。

(一)经济体制类型不同决定了政府职能范围不同,从而决定了政府绩效评估标准不同

计划经济体制要求建立起单一的全民所有制,排斥私人资本及其经营;政府对全社会高度集中统一管理,则政府的绩效就由政府对全社会集中统一管理的绩效决定,并由此形成了一整套适应计划经济体制的政府绩效评估体制。我国从计划经济转向社会主义市场经济后,引起了政府规模、结构、职能以及行政原则、行政观念、行政价值、行政信息、行政情感、行政思维和行为方式的一系列变化,而经济模式的转移也带给政府绩效评估体制根本性的冲击。政府绩效评估为适应社会主义市场经济体制,以政府职能转变为中心对原有评估体制进行了改革。但在经济体制转型期我国政府职能还存在着政企不分、政事不分、政社不分的弊端,出现了政府职能的缺位、越位和错位等现象,这给政府部门的绩效考评造成了很大困难。政府到底该管什么、不该管什么,虽然历经数次机构改革,目前仍然没有确定,特别是市县以下政府仍面临部门职能不断调整的不确定环境,在实际考评中仍然沿用计划经济时代的指标,将诸如创卫、综合治理、计划生育、精神文明建设等各种评估或考评与对部门工作业绩的考评混合,以致出现无论考评结果如何好,一票否决的项目都可将其业绩通盘否定的情况。

(二)我国目前的政府财政使绩效评估遭遇内部动力障碍

当前,我国各级政府的财政并不宽裕,评估所需的成本对财政形成新的压力。绩效评估是一个耗费资源的过程,需要投入相当数量的人力、物力、财力和时间;但由于评估工作及其价值尚未引起足够的重视和认同,国家没有单独的评估经费拨款,评估费用大都摊入具体的公共项目中,且许多地方政府部门为了保证其推行的公共项目顺利完成,往往不愿意将有限的资源用于评估工作,致使评估的资金投入不足。这样,由于缺乏充足的财政资金,一些地方政府绩效评估常常难以为继。

另一方面,我国现行的是以分税制为核心的财政体制,即本着一级政府、一级财政以及财权与事权相统一的原则,划分中央政府和地方政府的事权和财政支出范围。但是,我国现行的财政体制与政府体制却并不配套,基层政府没有独立的财政地位,取消农业税后,县乡几乎没有可靠的收人来源;现在国家虽然明显增加了财政转移支付的力度,但许多历史“欠账”却不是马上可以偿清的;没有财政的良好支持,政府无法正常运行;这种事权与财权的不对应引发了多重矛盾,当然也严重影响政府管理目标的实现。如果在现行的财政体制下考评政府绩效,特别是评估基层政府的工作,结果也不可能是科学、合理的。

(三)惩罚节约的预算体制使政府绩效评估流于形式

在我国,财政部门根据各个部门申报的投人以及结合上一年度的拨款使用状况来分配预算。如果当年的拨款用不完,剩余的将会失效,来年的预算将会减少,资金将被分配到其他“需要”的地方去;相反,如果预算超支,下一年度反而会得到更多的财政拨款。节约资金意味着来年的拨款减少,于是很多部门在年度即将结束时,都会陷入“为了花钱而花钱”的疯狂状态。在这种预算体制下,绩效的提高和节约成本不仅不会给他们带来任何收益,反而面临着预算被削减的危险。于是,政府各部门都把办事作为讨价还价的筹码,扩大自己的困难,谁也不愿意少花钱而把事情办好。政府绩效评估旨在提高政府业绩,但如果政府机构不能从重视产出、节约成本、提高业绩中获得利益回报,那么政府绩效评估就会流于形式。

三、政治生态环境的制约

政府绩效评估体制作为政治上层建筑的一部分,它的各项机制的运作和功能的实现最直接地受到政治环境的影响。政治生态环境对政府绩效评估的制约主要表现在以下几个方面:

(一)缺乏相应的法律、法规和相关政策作保障,评估多处于自发状态,没有规划,减弱了政府绩效评估机制的作用

一方面,我国目前还没有政府绩效评估方面的专门立法,相关立法也只是涉及某一具体领域的绩效评估立法。由于没有相应的法律、法规和相关政策作为制度保障,缺乏较具体的、可操作的政策性指导,各地开展的绩效评估工作完全处于一种放任自流的状态,形式五花八门,结果绩效评估工作难以在政府部门全面系统地推进,缺乏整体的战略规划;而且由于绩效评估的实施方法互不统一,难以相互比较和进行经验交流。另一方面,把绩效评估看成是一个短期行为,没有建立长效机制,这就导致了运动式的行政管理,领导者难以把工作重点放在政府绩效的持续改进上。政府绩效评估的非规范化导致评估中的不正之风和腐败行为,许多大检查、大评比不仅没有取得效果,而且使这种检查、评比成为基层政府的一种负担,某些检查团成员索要礼品、收受贿赂的行为更是直接损害政府形象。

(二)评估以官方为主。多是上级对下级的评估,缺乏社会公众和社会评估机构对政府以及政府内部的自身评估

我国现有政府体制层级结构分明,为了同这种层级制相适应,对政府的考评主要实行上级对下级的层层考评。这种自上而下的评估虽然有利于实现一定的引导和监督目的,但在实践过程中却导致了一些地方政府部门只唯上不唯实、“政绩”做给上级看的现象,从而导致了评估结果失真、评估难以达到预期的目的,这不仅无助于政府绩效的提升,相反却损害了政府的形象。由于评估程序公开度不够,缺乏公众和大众媒体的积极介入,就难以形成有效的监督系统,而仅靠政府自我监督则难以达到有效的督促效果,评估的结果往往也是报喜不报忧。

西方发达国家的政府绩效评估往往是由民间自发进行,特别是在一些大的基金会的资助下,由一些大学、研究机构或媒体来组织进行。社会自发成立的评估机构的作用在于:一方面,由于其具有独立性,使得评估的结果更加客观、公正,而客观、公正是评估结果发挥作用的基础;另一方面,由于评估主体多元化的存在,可以弥补单一政府绩效评估的不足,特别是当地方政府绩效评估本身存在较大缺陷的时候。而且,社会评估还具有及时反映公众需要、促进地方政府创新的独特功能。2004年12月18日,我国第一家民间政府绩效评估机构——中国地方政府绩效评价中心在兰州大学成立。这表明中国开始有了独立的、专门的民间评估机构,意味着社会开始更加积极主动地参与对地方政府绩效的评估,参与地方的发展。但从目前情况来看,我国民间评估力量的发展还很不成熟,评估方法和评估指标的科学性还有待进一步提高。

(三)政府机构改革的困境给政府绩效评估带来刚性约束

机构是职能的载体,政府职能不同则所设机构肯定就不同,所以,政府职能转变必然要求机构改革。改革以来的20多年时间里,我国曾进行了多次政府机构改革,但改革的成效却并不明显,主要原因是机构改革总是把解决财政压力放在首位,机构改革的重点也是精简机构和人员,如1998年进行的机构改革甚至明确提出了精简比例。但是,如果从绩效管理的视角看政府机构改革,机构改革就不应该是简单地做“加减法”,而应该立足于整合各个机构的职能。党委、人大、政府等序列机构性质不同。静态看,它们各有职权,分工明确;但在中国特色的政权结构中实际运作却会出现职能重复、交叉的状况,而且越到基层,各机构职能交叉的弊端就越明显。不论行政管理幅度大小、工作多少,都与上级政府设置同样数量的机构,这本身就不是经济的选择。再加上各序列机构的职权边界不清,党政主要领导人的工作作风不同,工作成本就被大大增加了。所以,如果不先整合机构,解决机构重叠的问题,就在现有机构的基础上设计评估指标,那么设计出来的指标体系科学性将难以得到保证,评估的实效性也难以得到体现。只有在减少管理层次、理顺党委、人大、政府、政协等各序列权力机构管理关系的前提下,才能实现真正科学合理、具有实效性的政府绩效评估。“十一五”规划已经对政府机构改革进行了论述,即“深化机构改革,优化组织结构,减少行政层级,理顺职责分工,推进电子政务,提高行政效率,降低行政成本”。

四、文化生态环境的制约

所谓文化生态主要是指一个机构或一项制度所赖以存在的社会思想意识、文化心态和观念形态的总和,它是社会成员在社会化过程中长期积淀而形成的一种较为稳定的价值取向。在现实中,一项改革方案能否顺利实施或取得成效,并不仅仅取决于方案是否完备或是否符合理性的设计,而是取决于方案是否被大多数参与改革者所认同和接受,也就是说深受文化生态的影响和制约。在文化生态的诸要素中,与我国历史发展有密切联系的中国传统文化对政府绩效评估制度的制约最为明显。

(一)中国传统文化中的“人情至上”原则使政府绩效评估制度失灵

中国传统文化看重人性。如孔子讲性相近、孟子讲性善、荀子讲性恶以及《三字经》开始便说“人之初,性本善”等等。但中国人的人性不是偏于理智,而是偏于情感;人性中情是主要的,智是次要的。这种“人情至上”的精神融入到行政中,使政府在管理的诸多环节中注重亲缘血缘关系,讲情面、论义气,将工作关系、契约关系与私人的情谊关系联在一起,因人情破坏原则规范的现象时有发生。很显然,政府绩效评估体系再健全,如果还是以“人情”作为利益分配和调节的工具,终将归于失灵。

(二)中国传统文化重感情、轻理性。重人的德行、轻科学的技术方法,导致政府绩效评估理论不足、评估程序不规范以及评估结果不够科学

中国传统文化的一个典型特点就是在思维上重视感情因素,缺乏纯理性的分析,而重感情、轻理性必然重经验轻理论。中国古代科学技术大多属于对当时生产经验的直接记录和对自然现象的直接描写,极少有科学理论的探索与规律的发现。这种传统文化延续至今,对我们的政府绩效评估同样产生了不良影响,理论界对政府绩效评估的评估理论研究不足,仅一味地引进“先进方法”而忽视对评估理论本身的研究,致使我国的政府绩效评估缺乏理论根基。另外,我国自古就重伦理、重德行,对科学技术重视不足。中国古代科学技术的每一种发明创造都要经过伦理规范的检验,这样,中国古代的这种轻视科学反应在政府绩效评估上,就造成了评估程序不规范,流于形式;评估方法多为定性,较少采取定量方法;评估结果不够科学。

(三)中国传统文化重中庸、轻竞争。重“官本位”思想、轻“民本”思想。造成了政府缺乏竞争意识。导致了政府绩效评估常常忽视人民群众的意愿

源于西方的政府绩效评估追求效率、效益,提倡竞争,充分发挥个人和组织的能力,适者生存。而我国传统的儒家思想崇尚“和”,提倡“和为贵”,避免人与人之间的竞争以维护社会稳定;这一思想与政府绩效评估的目标背道而驰,因为本着“和”的原则,当评估结果有损下属颜面时,领导就大事化小,不将评估结果公布于众,这样评估的反馈作用得不到实现,严重影响了绩效评估的实施。另一方面,我们现有的一些政府官员“官本位”思想严重,可以说某种程度上支配着他们的行为选择,造成了这些政府官员缺少服务于民的意识,这给政府绩效评估的实施带来不少困难。其主要表现在一些政府和部门把引入和实施政府绩效评估作为一种“政绩工程”和“形象工程”,在目标制定中没有把服务于人民群众作为评估的一项重要指标。这种“形象包装”式的政府绩效评估必将会导致形式主义泛滥、公信力下降、作用失效,最终使政府绩效评估演变成劳民伤财的举措。

评估制度论文篇5

【关键词】 内部控制判断一致性; 内部控制评估绩效; 内部控制缺陷认定; 实验研究法; 权变因素

一、引言

1938年美国爆发麦克森·罗宾斯公司破产事件,该事件暴露了制定审计程序的必要性。1939年10月,美国注册会计师协会(AICPA)第一号《审计程序公告》,在这个公告中,首次提出在财务报表审计中进行内部控制评价。1991年,美国国会颁布《联邦储蓄保险公司改善法》,要求资产总额在5亿美元以上的大银行必须评估并报告其内部控制有效性。同时,要求注册会计师对管理层有关内部控制的声明进行验证。1993年,为了规范注册会计师执行内部控制审核业务,AICPA了SSAE No.2《财务报告内部控制的审核》,内部控制评估成为独立的审核业务。2002年,美国国会通过《萨班斯——奥克斯利法案》,美国公众公司会计监督委员会(PCAOB)于2004年3月审计准则第2号《与财务报表审计结合进行的财务报告内部控制审计》(2007年由第5号准则取代第2号准则),内部控制评估成为独立的审计业务。内部控制评估从财务报表审计的一部分,进而成为独立的审核业务,最后发展到独立的审计业务,这是包括美国在内的大多数国家内部控制评估的发展历程。

在内部控制的这个发展过程中,内部控制评估的地位、保证水平甚至评估技术都发生了深刻的变化。然而,职业判断在内部控制评估中的重要地位并没有改变。正如Mautz&Mini(1966)所指出,由于内部控制评估的复杂性,想对这个过程进行标准化是不可能的,但是,提出一些原则性的指导意见是可以的。

正是由于内部控制评估过程中的职业判断成分很多,针对内部控制评估形成了大量的研究文献,这些文献大致分为四个研究主题:内部控制判断的一致性;内部控制评估绩效影响因素;内部控制缺陷认定影响因素;内部控制评估技术。本文对上述文献进行综述,并在此基础上,提出内部控制评估的未来研究方向。

二、内部控制判断的一致性

同样的内部控制状况,不同的评估人员对于其可信赖程度是否会做出一致的判断呢?针对这个问题有不少研究文献。从研究方法来看,基本上都是实验方法;从研究内容来看,有些研究不考虑权变因素,而有些研究则考虑权变因素的影响;从研究结论来看,有两类不同的结论,有些研究的结论是内部控制判断具有一致性,而另外一些研究的结论则是内部控制判断不具有一致性。

(一)不考虑权变因素的影响

不考虑权变因素的影响,这些研究文献有两类不同的结论,有些研究的结论是内部控制判断具有一致性,而另外一些研究的结论则是内部控制判断不具有一致性。

Ashton(1974)用实验方法检验内部控制判断的一致性,这里的一致性包括两个方面:一是不同审计人员对同一内部控制评估结论的一致性;二是同一审计人员在不同时期对同一内部控制评估结论的一致性。实验人员是四个会计师事务所的56名审计人员,评估的内部控制系统是工资支付,评估案例32个。Ashton针对每个案例提出六个问题,并要求根据这六个问题,对每个企业的工资系统内部控制可靠性做出评价。为了检验同一审计人员在不同时期对同一内部控制评估的一致性,Ashton将实验做了两次,相隔时间是6至13周。研究结论是,不同审计人员对同一案例的评估和同一审计人员在不同时期对同一案例的评估具有高度的一致性。后来,一些研究得出的结论是内部控制判断不具有一致性(Joyce,1976;Weber,1978))。为此,Ashton&Brown(1980)对Ashton(1974)的实验研究进行扩展:针对内部控制提出的问题由原来的六个增加到八个,并且改变这些问题的排列顺序;参加实验的审计人员来自于事务所,分布更具有广泛性;案例增加到128个。在这些扩展的基础上,Ashton&Brown的结论仍然是:不同审计人员对同一案例的评估和同一审计人员在不同时期对同一案例的评估具有高度的一致性。

Gaumnitz et al(1982)采用实验方法,以应收账款为对象,从两个角度来研究内部控制判断的一致性,一是审计人员对内部控制的可靠性判断是否具有一致性,二是对完成后续审计所需要的时间决策是否具有一致性。实验人员是35个审计人员,20个案例。要求实验人员对应收账款内部控制可信赖程度做出评估,并对后续实质性测试所需要的时间做出决策。研究结论是,审计人员对内部控制可信赖程度及实质性测试所需要的时间都具有高度的一致性,并且,对内部控制可信赖程度评价越高,决策所需要的实质性测试时间越少。

Tabor(1983)认为,为了与现实相一致,对审计人员内部控制判断一致性的研究要与随后的决策结果一致性联系起来,不能只考虑内部控制判断,一致性的内部控制判断并不能一致性的随后决策。Tabor研究的一致性包括四个方面:内部控制设计可靠性判断,符合性测试样本量选择,在获知符合性测试结果后对内部控制可靠性的判断,实质性测试样本的选择。实验人员共109人,来自大型事务所,对四个企业的案例进行决策。研究结论是,审计人员对内部控制的判断具有高度的一致性,但是对样本量的选择不具有一致性。

高层管理者培训与发展中心(EDP)需要设计一些内部控制措施,Hardy&Reeve(2000)研究管理信息系统(MIS)管理人员和审计人员对不同EDP内部控制措施的重要性认识是否存在差异。他们将EDP内部控制分为组织控制、应用控制、鉴证控制、安全控制和第三方控制五种类型,每种类型下再提出了一些具体措施。以这个内部控制结构为基础,Hardy和Reeve进行问卷调查。结果显示,除对第三方控制的重要性评定具有显著性差异外,其他类型的评定都没有显著性差异,这说明他们的评定具有较高的一致性。

以上研究得出的结论是内部控制判断具有一致性。然而,也有一些研究得出不同的结论(Joyce,1976;Weber,1978;Mock,Turner,1981;Mayper,1982)。例如,Weber(1978)采用实验方法,以存货系统为对象,检验评估人员对内部控制判断的一致性,实验人员是40个审计人员。这里的一致性包括两个方面:一是存货内部控制系统可能的错误金额分布的估计;二是存货错误金额分布对存货内部控制缺陷的敏感性估计。研究结论是评估人员对错误金额分布及其对内部控制缺陷的敏感性估计都不存在一致性。又如,Mayper(1982)根据实验数据分析发现,审计人员判断内部控制缺陷重要程度时考虑的因素及对缺陷的等级评价都表现为中等程度的一致性。

上述这些研究发现,审计人员对同一内部控制的判断结论不同。为什么会不一致呢?Biggs&Mock(1983)希望从审计人员的决策程序方面来寻找原因。他们采用实验方法,让四位高级审计对内部控制和审计抽样做出决策。实验结果发现,四位审计人员的决策模型可以分成三种,这三种模型差别可能解释他们的结论差别。Trotman&Wood(1991)采用事后分析法,利用这些研究项目的资料,重新检验实验人员的评价是否具有一致性。他们检验的结论是,实验人员对内部控制的评价具有高度的一致性。以前的研究之所以得出不同的结论,主要是样本问题。

(二)考虑权变因素的影响

正是由于内部控制判断一致性的研究具有不同的结论,一些研究认为,可能是一些权变的情景因素影响了实验人员的内部控制判断。

Hamilton&Wright(1982)将评估人员本身的工作经验与内部控制判断的一致性结合起来研究评估人员对内部控制判断的一致性,他们认为,随着工作经验的增加,评估内部控制判断的一致性会增加。实验人员是88位审计人员,3年以下和3年以上工作经验的人员各50%,案例是32个工资系统,实验人员对五个内部控制点的可靠性做出判断,并对内部控制整体可靠性做出判断。研究结论是,3年以下审计人员对五个内部控制点的可靠性判断及内部控制整体可靠性判断的一致性要高于3年以上审计人员同类判断的一致性,这个结论与Hamilton&Wright的预期恰恰相反。

Trotmna,Yetton&Zimmer(1983)认为,在实际工作中,审计人员对内部控制的评价一般是2~3人完成,而不是由一个人独立完成,所以,研究审计人员对内部控制判断的一致性不能看单个审计人员判断的一致性,而要看审计小组之间判断的一致性,他们预期,审计小组之间对内部控制判断的一致性要高于单个审计人员判断的一致性。实验人员是105个高级审计课程的学员,实验资料是32个企业的工资系统案例。实验分两步进行,第一步是由审计人员单独工作,第二步是将学员分组。研究结论是,审计小组之间对内部控制整体判断及各个问题权重确定的一致性要显著高于单个审计人员的上述判断。

Meixner&Welker(1988)用实验方法研究发现,随着审计人员在同一小组时间的增长,随着审计人员与其主管共处时间的增长,都会增加审计人员对内部控制判断的一致性。

Libby&Libby(1989)提出,内部控制可靠性决策有两种模型,一是审计人员职业判断;二是审计人员职业判断与统计分析相结合。他们预期,审计人员职业判断与统计分析相结合这种模式的决策质量比审计人员职业判断模式要高,体现在审计人员决策意见的一致性方面,前者要高于后者。参加实验的审计人员分成两个组,一组采用职业判断模式,另一组采用职业判断与统计分析相结合模式,两组采用相同的案例。研究结论是,采用职业判断与统计分析相结合模式的审计人员对内部控制评价的一致性要显著高于采用职业判断模式的审计人员。

Wu(2011)将内部控制评估方式区分为分解方式和非分解方式,评估人员区分为经验较多的和经验较少的人员,根据上述组合进行实验。研究结论是,与非分解方式相比,分解方式下,不同评估人员之间的评估差异较少;当评估人员经验较多时,不同评估人员的评估差异较少。

关于内部控制判断的一致性研究,考虑权变因素应该是一个进步。但是,也存在研究结论不同的问题,例如,Hamilton&Wright(1982)发现,工作经验少的审计人员,其内部控制判断一致性程度高,而Wu(2011)的研究则发现,当评估人员经验较多时,不同评估人员的评估差异较少。

三、内部控制评估绩效影响因素

内部控制评估绩效是评估人员工作的效率和效果。现有文献主要是采用实验方法(个别文献采用档案法),从权变视角研究影响内部控制评估绩效的因素。概括起来,这些权变因素包括:个人特征、评估工作底稿记录方式、认知模式、评估反馈、知识组织方式、知识结构、独立性、评估模式。

(一)个人特征

Nanni(1984)采用实验方法研究内部控制评估人员的个人特征对内部控制评估的影响。实验任务是对15个内部控制案例中所描述的内部控制进行可靠性评价。研究结论是,职位、工作年限、内部控制评估经验对内部控制评估结果都有显著影响。同时还发现,评估人员所属的事务所不同,对内部控制评估结果也有显著影响。

(二)评估工作底稿记录方式

Purvis(1989)指出,内部控制评价包括三个主要步骤:一是信息收集,二是将信息记录于审计工作底稿,三是内部控制评估。信息收集和信息记录是相关的两个步骤,一般是同步完成,主要的方式有问卷式、流程图式和文字叙述式。Purvis用实验方法研究上述三种方式的效果是否有区别。由于现实审计中一般是由低层级的审计人员完成内部控制信息收集和记录工作,所以,Purvis还研究审计人员的经验是否影响信息收集和信息记录的绩效。研究结论是,问卷使用者收集到的信息多于文字叙述方法使用者,而文字叙述方法使用者收集的信息又多于流程图方法使用者;不同记录格式的使用者将只收集该种记录方式倡导的数据;审计人员经验越多,收集的数据越多。

Agoglia,Beaudoin&Tsakumis(2009)研究内部控制评价工作底稿记录方式对内部控制环境评估绩效的影响。他们将工作底稿记录方法区分为三种:一是支持文档式,也就是他们记录支持其内部控制评估的证据;二是平衡式,也就是同时记录关于内部控制正面或负面的证据;三是要素式,也就是记录关于内部控制要素的正面或负面的证据。研究结论是,要素式记录下,控制环境评估质量低于其他两种方式;与特定内部控制相关的经验会调和记录格式对内部控制绩效的影响。

(三)认知模式和评估反馈

Bryant,Murthy&Wheeler(2009)指出,控制环境评估一般使用结构性调查问卷,多数情形下是由经验不多的审计人员完成。他们研究审计人员的认知模式和后续反馈对审计人员评估绩效的影响。关于认知模式,根据实验参与人员对认知模式问卷的回答,这些人员区分为感知型(Sensor)和直觉型(Intuitive)。关于后续反馈,实验分为两个阶段,第一阶段完成之后,一个小组有反馈,另外一个小组没有反馈。研究结论是,认知模式对评估绩效没有显著影响;但是认知模式和反馈联合起来,对评估绩效有显著影响。

(四)知识组织方式、知识结构和独立性

Kopp&O’Donnell(2005)研究内部控制评估知识的不同组织方式对内部控制评估绩效的影响。内部控制评估知识的组织方式有两种,一是按业务流程来组织,二是按控制目标来组织。实验中以不同的方式对新来人员进行内部控制知识培训,然后由这些人员进行内部控制评估。他们发现,采用流程方式组织内部控制知识的人员,对内部控制评估的业绩要好。

Borthick,Curtis&Sriram(2006)采用实验研究评估人员的知识结构是否影响内部控制评估绩效。实验人员是高年级学生,分成两组,一组是接受内部控制相关知识培训,包括业务流程和控制目标;另外一组没有接受这些培训。根据实验数据分析发现,具有内部控制相关知识结构的人员,内部控制评估绩效显著好于未经过相关知识培训的人员。

Bedard&Graham(2011)根据几个大型会计公司的档案材料研究发现,对于同一公司来说,3/4的缺陷是实施内部控制审计的外部审计人员发现的,公司内部控制评估只发现缺陷的1/4,这表明,具有独立性和内部控制相关知识较多的外部审计人员更能发现内部控制缺陷。

(五)评估模式

Morrill,Morrill&Kopp(2012)用实验方法研究内部控制评估模式对内部控制评估绩效的影响。他们将评估模式区分为风险优先和控制优先,根据实验数据分析发现,风险优先模式的评估绩效好于控制优先。他们用输出干扰理论解释了上述结果。

关于内部控制评估绩效影响因素的相关研究并不多,并没有针对同一主题形成不同的研究文献,所以也没有出现矛盾性的结论。

四、内部控制缺陷认定影响因素

内部控制缺陷认定,就是对内部控制缺陷做出分级。同样的内部控制缺陷,不同的评估人员是否会做出同样的缺陷等级认定呢?如果不是,哪些因素会影响其缺陷等级认定呢?针对这些问题,有一定数量的研究文献。从研究方法来说,基本上都是实验研究方法,只有个别的研究采用档案法。从影响因素来看,包括:内部控制流程性质、评估构架和评估证据评级、管理层因素、独立性等。

(一)内部控制流程性质

Libby,Artman和Willingham(1985)用实验方法研究内部控制流程对错弊的敏感程度是否影响审计人员对内部控制可依赖程度的评估。敏感程度是指没有控制措施的情况下,错弊发生的风险。他们选择采购与收款循环中的两个流程,一是根据购货发票,手工编制采购入库表,称为手工入库表流程;二是通过计算机程序更新应付账款文件,并编制采购清单,称为计算机采购清单流程。显然,这两个流程的敏感程度不同,手工入库表流程高于计算机采购清单流程。在此基础上,他们分别为每个流程设计了控制设计强度高和低及控制测试程度高和低两种情况。实验人员是14名高级审计人员,要求他们确定不同情形下内部控制的可信赖程度。研究结论是,与敏感程度较低的流程相比,敏感程度较高的流程中增加控制风险时,相同的控制风险增加会带来较多的控制信赖程度的降低;与敏感程度较低的流程相比,敏感程度较高的流程中控制设计强度降低时,相同的控制设计强度降低会带来较多的控制信赖程度的降低;与敏感程度较低的流程相比,敏感程度较高的流程中控制测试程度降低时,相同控制测试程度降低会带来较多的控制信赖程度的降低。

(二)评估构架和评估证据评级

Emby&Finley(1997)用实验方法研究评估构架和评估证据评级对内部控制判断的影响。实验任务是根据存货内部控制相关材料,确定存货审计所需要的实质性测试水平。他们将评估架构区分为两种情形,一是评估存货控制风险;二是评估存货控制强度。同时,为了验证评估证据的影响,他们还设计了两种不同的情形,一是要求首先对存货内部控制相关材料中的内部控制相关证据进行评级,然后再确定存货审计所需要的实质性测试水平;二是不需要对存货内部控制相关材料中的内部控制相关证据进行评级,而是直接确定存货审计所需要的实质性测试水平。研究结论是,在没有证据评级的情形下,评估构架对确定的实质性测试水平有显著影响,风险架构下所需要的实质性测试水平显著高于控制架构下所需要的实质性测试水平;而当要先对证据进行等级评定然后再确定所需要的实质性测试水平时,两种架构下所需要的实质性测试水平无显著差异。Emby&Finley认为,这是证据评级使得审计人员的注意力集中到证据本身,冲淡了评估构架的影响。

(三)管理层因素

一般来说,外部审计人员进行内部控制审计的公司,其管理层都自己首先进行内部控制评价。在这个评价中,对内部控制缺陷会确定其严重程度。Eariey,Hoffman&Joe(2008)采用实验方法,研究管理层提供的这些内部控制缺陷评定信息是否会影响外部审计人员对内部控制缺陷的评定。研究结论是,管理层对内部缺陷的认定会显著影响外部审计人员对内部控制缺陷的评定。

审计人员根据发现的内部控制偏差来判断内部控制缺陷,在做出这种判断之前,一般会与被审计单位适当的管理层进行沟通。此时,管理层的沟通策略可能会影响内部控制人员最终对内部控制缺陷的判断。Wolfe,Mauldin&Diaz(2009)将管理层沟通策略区分为承认策略和抵赖策略,分别研究这两种策略是否影响审计人员对信息控制偏差和人工控制偏差所形成的内部控制缺陷的判断。研究结论是,在信息化控制偏差下,管理层采用承认策略时会降低审计人员对内部控制缺陷评价的严重性并提高对管理层解释的接受程度;在人工控制偏差下,管理层无论是采用承认策略还是抵赖策略,审计人员对内部控制缺陷评价的严重性及对管理层解释的接受程度无显著差异。

(四)独立性

Bedard&Graham(2011)根据几个大型会计公司的档案材料研究发现,公司内部控制评估对缺陷的等级评价要低于外部审计人员,也就是说,同样的缺陷,外部审计人员认定的缺陷等级更严重。他们还发现,客户的一些特征及内部控制缺陷本身的一些特征会影响外部审计人员对缺陷的等级评定。

关于内部控制缺陷认定影响因素的相关研究并不多,研究方法也较为单一,并没有针对同一主题形成不同的研究文献,所以,也没有出现矛盾性的结论。

五、内部控制评估技术

虽然内部控制评估是一个充满职业判断的过程,然而,也需要依赖一定的具体技术,职业判断和评估技术相结合,是内部控制评估的未来发展方向。研究内部控制评估技术的文献,从涉及的主题来看,主要包括:数学方法、统计抽样方法、记录方法、风险模型及监视设备的应用等。

(一)数学方法与内部控制评估

Hamlen(1980)将内部控制设计和评估看成一个优化过程,用优化模型(线性规划和非线性规划)来描述内部过程。他认为,内部控制设计和评估,应该是满足一定错弊查出率条件下的总成本最低的数学规划问题,为此,他以内部控制总成本为目标函数,以各种错弊查出率为约束条件,对内部控制进行描述,得到规划模型。他认为,利用这个规划模型,选择不同的内部控制程序,如果将控制对象的最初错弊情况输入,则能知道各个控制程序输出结果的错弊率,这就是该程序的可靠性,从而可以用于审计程序设计。

Nichols(1987)利用多元统计的两组判别分析方法来建立内部控制评估的预测模型,Nichols从一个大型会计师事务所收集了该事务所对79个公司的应收账款内部控制调查和评价资料,该事务所针对应收账款的内部控制调查表中列示了五个问题,这五个问题也就是针对应收账款的五个措施。根据这些调查表,Nichols将五个措施作为独立变量,将应收账款内部控制的可信赖性作为依存变量,建立判别函数:Z=c+b1x1+b2x2+b3x3+b4x4+b5x5,x表示内部控制措施,b是判别系数,表示该控制措施在整个控制系统中的作用大小,Z是判别值,表示该内部控制系统总体是否可以依赖。Nichols以该事务所对79个公司的应收账款内部控制调查记录为依据,计算出了判别函数中的系数,然后使用该函数对79个公司的应收账款内部控制的可依赖性进行判别,并将判别结果与该事务所实际评估结果相比,相符率为79.75%。

(二)内部控制评估中的统计抽样方法

内部控制评估中的抽样方法包括金额单位抽样和实物单位抽样。支持实物单位抽样的认为,内部控制是中性的,也就是说,不会因为交易金额大小而呈现不同的缺陷情形。Ham, Loesll&Smieliauska(2010)用某大型会计公司的档案材料,分析其中的存货和应收账款错误分布,错误频度和错误率不呈现中性。根据这个发现,他们认为,控制测试中的抽样应该采用金额单位抽样。

(三)内部控制评估记录方法

审计准则要求审计人员在审计业务中了解及记录审计对象的内部控制,但是,对于如何记录内部控制并没有规定。Bierstaker,Janvrin&Lowe(2008)对会计公司的调查表明:审计人员偏好文字描述式,其次是问卷调查式;当使用多种格式时,一般也会偏好某种格式;事务所规模、客户IT程度及审计人员IT技能会影响审计人员记录内部控制的方式。

(四)内部控制评估风险模型

Akresh(2010)认为,内部控制审计是审计财务报告的生成过程,而财务审计是审计内部控制过程的产出,所以,二者应该有不同的风险模型。他们认为,内部控制审计风险是内部控制中有重大缺陷而审计人员未能发现,这一风险可以分解为固有风险、控制设计和执行风险、控制运行效果风险。

(五)监视设备的应用

美国反舞弊性财务报告委员会发起组织(The Committee of Sponsoring Organizations of the Treadway Commission,COSO),认为,内部控制监视能提高内部控制效果,Masli et al(2010)研究采用了内部控制监视设备的公司能否提高内部控制效果。根据139个使用内部控制监视设备的公司及配对企业的数据分析发现,内部控制监视设备采用后,对内部控制缺陷的减少、审计费用的降低及审计报告的及时性都有显著正面作用。

六、未来研究方向

(一)关于内部控制判断的一致性

关于内部控制判断的一致性,无论是考虑权变因素,还是不考虑权变因素,多数研究结论认为内部控制判断具有较高程度的一致性,也有一些研究结论与之相反。总体来说,关于这个方向的研究,一是需要进一步考虑权变因素,二是需要采用多种研究方法。从权变因素来说,现有研究主要考虑工作经验、评估小组、评估人员相处时间、决策模型和评估方式这些权变因素,还有其他很多权变因素可能会影响内部控制判断的一致性。一般来说,内部控制评估的权变因素如图1所示。

图1中,监管因素是指是否有相关机构对内部控制评估进行监管,包括是否要求对外披露内部控制评估结果及相应的法律责任;主体因素指内部控制评估主体相关的因素,包括评估机构的组织因素和评估实施者的个体因素;客体因素指评估对象的相关因素,包括评估客体的组织因素和特定内部控制的相关因素;关系因素指评估主体和客体的沟通及相互依赖程度;技术因素指评估模式和具体的技术方法等因素;文化因素指评估主体、评估客体及监管者的一些文化价值观、习惯、惯例、风俗等对内部控制评估可能形成的影响。上述这些权变因素都可能会影响内部控制评估时的职业判断。

内部控制判断一致性的主要研究方法是实验方法。这种样方法当然有其天然的优点,在实验人员随机分布的情形下,可以控制其他一些变量的影响,减少噪音。但也有其天然的弊端,内部控制评估现实生活中的许多权变因素可能无法在实验中考虑,可能正是这些在实验中没有考虑的权变因素,对内部控制评估产生了重要影响。所以,内部控制评估不能只是局限在实验中研究,要深入现实生活,从内部控制评估的现实生活中寻找因素。可以大量采用问卷调查、档案研究和案例研究的方法来研究内部控制评估中的权变因素。

(二)关于内部控制评估绩效影响因素

内部控制评估绩效是评估人员工作的效率和效果。现有文献发现了一些权变因素对内部控制评估绩效的影响。关于未来的研究方向,从研究方法来说,实验法当然继续会是重要的研究方法,但是,由于权变因素本身的变化性,问卷调查、档案研究和案例研究可能是重要的发展方向。从研究内容来说,现有研究主要是考虑技术因素,图1中的各种权变因素都可能会影响内部控制评估绩效,所以都可以纳入内部控制评估绩效影响因素的权变研究架构。

(三)关于内部控制缺陷认定影响因素

内部控制缺陷认定,就是对内部控制缺陷做出分级。哪些因素会影响其缺陷等级认定呢?现有文献发现了一些权变因素对内部控制评估缺陷认定的影响。关于未来的研究方向,从研究方法来说,实验法当然继续会是重要的研究方法,但是,由于权变因素本身的复杂性,问卷调查、档案研究和案例研究可能是重要的发展方向。由于重大缺陷还有公开信息,所以,还可以考虑采用公开数据来研究缺陷认定。从研究内容来说,现有研究涉及的权变因素很少,图1中的各种权变因素都可能会影响内部控制评估缺陷认定,所以,都可以纳入内部控制缺陷认定影响因素来研究。

总体来说,关于内部控制评估研究的上述三个主题,在方法和内容方面都需要扩展,从研究方法来看,在继续采用实验法的同时,需要大力发展问卷调查、档案研究和案例研究;从研究内容来说,需要扩展权变因素的范围,特别是其中的文化因素,基本上还是空白。

(四)关于内部控制评估技术

内部控制评估过分信赖职业判断是内部控制评估发展水平不高的表现。虽然内部控制评估离不开职业判断,但是,内部控制评估技术的发展,可一定程度减少职业判断。所以,发展内部控制评估技术是提高内部控制评估客观性和绩效的重要路径,也是未来的重要研究方向。从研究方法来看,应该是多种多样,实验方法可能不是主要选择;从研究内容来看,智能数学方法、统计抽样方法、风险模型应该是主要方向。

【主要参考文献】

[1] Ashton,R.H.An experimental study of internal control judgments[J]. Journal of Accounting Research,1974,12(1):143-157.

[2] Ashton,R.H.,Brown,P.R.Descritive modeling of auditor internal control judgments:replication and extension[J].Journal of Accounting Research,1980,18(1):269-277.

[3] Agoglia,C.P.,Beaudoin,C.,Tsakumis,G.T.,The Effect of Documentation Structure and Task-Specific Experience on Auditors’Ability to Identify Control Weaknesses[J]. Behavioral Research on Accounting,2009,21(1):1-17.

[4] Akresh,A.D.,A Risk Model to Opine on Internal Control[J].Accounting Horizons, 2010,24(1):65-78.

[5] Biggs,S.F.,Mock,T.J.An investigation of auditor decision process in the evaluation of internal control and audit scope decision[J]. Journal of Accounting Research,1983,21(1):234-255.

[6] Bierstaker,J., Janvrin,D.,Lowe,D.J.,An examination of factors associated with the type and number of internal control documentation formats[J]. Advances in Accounting,2008(23):31-48.

[7] Bryant,S.,Murthy,U.,Wheeler,P., The Effects of Cognitive Style and Feedback Type on Performance in an Internal Control Task[J]. Behavioral Research on Accounting, 2009,21(1):37-58.

[8] Bedard,J.C.,Graham,L..Detection and Severity Classifi cations of Sarbanes-Oxley Section 404 Internal Control Deiciencies [J]. Accounting Review, 2011,86(3):25-855.

[9] Eariey,C.E.,Hoffman,V.B.,Joe,J.R.,Reducing Management's Influence on Auditors' Judgments: An Experimental Investigation of SOX 404 Assessments[J].Accounting Review,2008,83(6):1461-1485.

[10] Gaumnitz,B.R.,et al.Auditor consensus in internal control evaluation and audit program planning[J]. Journal of Accounting Research,1982(2):745-755.

[11] Hamlen,S.S.A chance-constrained mixed integer programming model for internal control design[J].The Accounting Review,1980,55(4):578-593.

[12] Hardy,C.,Reeve,R.A study of the internal control structure for electronic data interchange system using the analytic hierarchy process[J].Accounting and Finance,2000(40):191-210.

[13] Kopp,L.S.,O’Donnell,E.The influence of a business-process focus on category knowledge and internal control evaluation[J]. Accounting, Organization,and Society,2005(30):423-434.

[14] Mautz,R.K.,Mini,D.L.Internal control evaluation and audit program modification[J],The Accounting Review,1966,41(2):283-291.

[15] Mock,T.J.,J.L.Turner,Internal accounting control evaluation and auditor judgment[M].Audit Research Monograph,no.3.New York:AICPA,1981.

[16] Morrill.J.B.,Morrill.C.K.J.,Kopp.L.S.,Internal control assessment and interference effects[J].Behavioral Research on Accounting,1984,9(2):73-90.

[17] Nichols,D.R.A model of auditors preliminary evaluation of internal control from audit data[J].The Accounting Review,1987,62(1):183-190.

[18] Purvis,S.E.C.The effect of audit documentation format on data collection[J].Accounting Organizations and Society,1989,14(5,6):551-563.

[19] Trotmna,K.T.,Yetton,P.W.,Zimmer,I..R.Individual and group judgment of internal control[J]. Journal of Accounting Research,1983(1):286-292.

评估制度论文篇6

[论文摘要]政府绩效评估机制作为社会大系统中的一个子系统,和其他系统进行连续不断的能量交换,以保持系统的动态平衡。基于生态环境视角,从经济体制类型和我国的财政状况、政治体制、政治环境以及中国传统文化和“官本位”思想等几个方面进行深入分析,探讨政府绩效评估制度影响和制约效应,为我国政府绩效评估制度的进一步完善寻找理论支撑。

一、引言

生态环境(ecological environment)原来是自然科学术语,主要用来描述任何有机体的生长环境。但在20世纪20年代,以美国芝加哥学派的派克(R·F·Park)和蒲基斯(E·w·Burgurs)为先锋,借用自然科学中动植物生态学的概念、术语,对人类社会的生存环境进行了系统分析。他们认为:“从功能理论之生态观点而言,任何经济、文化、政治和行政制度等皆为一有生命的个体,是经过一段漫长的成长过程渐渐演进而来的。也就是说在生命的个体之间,以及生物与环境之间都有一种功能的相互依赖关系。”这种与自然环境相对称的社会客观存在被称为社会生态环境,它主要包括三大社会系统:社会经济系统、社会政治系统和社会文化系统。

政府绩效是指政府在社会管理活动中的结果、效益及其管理工作效率、效能,是政府在行使其功能、实现其意志过程中体现出的管理能力;或者说,政府绩效评估是指对政府管理过程中投入、产出、中期成果与最终成果所反映的绩效进行评价和划分等级。政府绩效评估作为改进行政管理的关键一环,成为一项重大的政治活动而蓬勃展开。由此,加强和完善政府绩效评估制度无疑是政府部门职能转变的一个强大而有效的推动力。

正如一切事物都必然生长于特定的生态环境之中一样,政府绩效评估制度也丝毫不能例外。社会生态环境是政府绩效评估制度赖以生存和发展的基础和前提;政府效绩评估制度必然和周围的经济、政治和文化环境存在着一种功能上的依赖关系,但又受到其制约。从一定意义上理解,政府绩效评估制度的发展过程就是一个不断适应和不断克服社会生态环境制约的过程。

二、经济生态环境的制约

经济生态环境是指社会的经济活动方式及其经济力量。经济基础决定上层建筑,经济发展水平决定着一个社会的整体发展程度。作为评估政府管理能力的政府绩效评估制度必然植根于特定的经济基础,并受到生产力发展水平的制约。当前,我国经济生态环境对政府绩效评估制度的制约主要表现为经济体制类型、政府财政和预算体制。

(一)经济体制类型不同决定了政府职能范围不同,从而决定了政府绩效评估标准不同

计划经济体制要求建立起单一的全民所有制,排斥私人资本及其经营;政府对全社会高度集中统一管理,则政府的绩效就由政府对全社会集中统一管理的绩效决定,并由此形成了一整套适应计划经济体制的政府绩效评估体制。我国从计划经济转向社会主义市场经济后,引起了政府规模、结构、职能以及行政原则、行政观念、行政价值、行政信息、行政情感、行政思维和行为方式的一系列变化,而经济模式的转移也带给政府绩效评估体制根本性的冲击。政府绩效评估为适应社会主义市场经济体制,以政府职能转变为中心对原有评估体制进行了改革。但在经济体制转型期我国政府职能还存在着政企不分、政事不分、政社不分的弊端,出现了政府职能的缺位、越位和错位等现象,这给政府部门的绩效考评造成了很大困难。政府到底该管什么、不该管什么,虽然历经数次机构改革,目前仍然没有确定,特别是市县以下政府仍面临部门职能不断调整的不确定环境,在实际考评中仍然沿用计划经济时代的指标,将诸如创卫、综合治理、计划生育、精神文明建设等各种评估或考评与对部门工作业绩的考评混合,以致出现无论考评结果如何好,一票否决的项目都可将其业绩通盘否定的情况。

(二)我国目前的政府财政使绩效评估遭遇内部动力障碍

当前,我国各级政府的财政并不宽裕,评估所需的成本对财政形成新的压力。绩效评估是一个耗费资源的过程,需要投入相当数量的人力、物力、财力和时间;但由于评估工作及其价值尚未引起足够的重视和认同,国家没有单独的评估经费拨款,评估费用大都摊入具体的公共项目中,且许多地方政府部门为了保证其推行的公共项目顺利完成,往往不愿意将有限的资源用于评估工作,致使评估的资金投入不足。这样,由于缺乏充足的财政资金,一些地方政府绩效评估常常难以为继。

另一方面,我国现行的是以分税制为核心的财政体制,即本着一级政府、一级财政以及财权与事权相统一的原则,划分中央政府和地方政府的事权和财政支出范围。但是,我国现行的财政体制与政府体制却并不配套,基层政府没有独立的财政地位,取消农业税后,县乡几乎没有可靠的收人来源;现在国家虽然明显增加了财政转移支付的力度,但许多历史“欠账”却不是马上可以偿清的;没有财政的良好支持,政府无法正常运行;这种事权与财权的不对应引发了多重矛盾,当然也严重影响政府管理目标的实现。如果在现行的财政体制下考评政府绩效,特别是评估基层政府的工作,结果也不可能是科学、合理的。

(三)惩罚节约的预算体制使政府绩效评估流于形式

在我国,财政部门根据各个部门申报的投人以及结合上一年度的拨款使用状况来分配预算。如果当年的拨款用不完,剩余的将会失效,来年的预算将会减少,资金将被分配到其他“需要”的地方去;相反,如果预算超支,下一年度反而会得到更多的财政拨款。节约资金意味着来年的拨款减少,于是很多部门在年度即将结束时,都会陷入“为了花钱而花钱”的疯狂状态。在这种预算体制下,绩效的提高和节约成本不仅不会给他们带来任何收益,反而面临着预算被削减的危险。于是,政府各部门都把办事作为讨价还价的筹码,扩大自己的困难,谁也不愿意少花钱而把事情办好。政府绩效评估旨在提高政府业绩,但如果政府机构不能从重视产出、节约成本、提高业绩中获得利益回报,那么政府绩效评估就会流于形式。

三、政治生态环境的制约

政府绩效评估体制作为政治上层建筑的一部分,它的各项机制的运作和功能的实现最直接地受到政治环境的影响。政治生态环境对政府绩效评估的制约主要表现在以下几个方面:

(一)缺乏相应的法律、法规和相关政策作保障,评估多处于自发状态,没有规划,减弱了政府绩效评估机制的作用

一方面,我国目前还没有政府绩效评估方面的专门立法,相关立法也只是涉及某一具体领域的绩效评估立法。由于没有相应的法律、法规和相关政策作为制度保障,缺乏较具体的、可操作的政策性指导,各地开展的绩效评估工作完全处于一种放任自流的状态,形式五花八门,结果绩效评估工作难以在政府部门全面系统地推进,缺乏整体的战略规划;而且由于绩效评估的实施方法互不统一,难以相互比较和进行经验交流。另一方面,把绩效评估看成是一个短期行为,没有建立长效机制,这就导致了运动式的行政管理,领导者难以把工作重点放在政府绩效的持续改进上。政府绩效评估的非规范化导致评估中的不正之风和腐败行为,许多大检查、大评比不仅没有取得效果,而且使这种检查、评比成为基层政府的一种负担,某些检查团成员索要礼品、收受贿赂的行为更是直接损害政府形象。

(二)评估以官方为主。多是上级对下级的评估,缺乏社会公众和社会评估机构对政府以及政府内部的自身评估

我国现有政府体制层级结构分明,为了同这种层级制相适应,对政府的考评主要实行上级对下级的层层考评。这种自上而下的评估虽然有利于实现一定的引导和监督目的,但在实践过程中却导致了一些地方政府部门只唯上不唯实、“政绩”做给上级看的现象,从而导致了评估结果失真、评估难以达到预期的目的,这不仅无助于政府绩效的提升,相反却损害了政府的形象。由于评估程序公开度不够,缺乏公众和大众媒体的积极介入,就难以形成有效的监督系统,而仅靠政府自我监督则难以达到有效的督促效果,评估的结果往往也是报喜不报忧。

西方发达国家的政府绩效评估往往是由民间自发进行,特别是在一些大的基金会的资助下,由一些大学、研究机构或媒体来组织进行。社会自发成立的评估机构的作用在于:一方面,由于其具有独立性,使得评估的结果更加客观、公正,而客观、公正是评估结果发挥作用的基础;另一方面,由于评估主体多元化的存在,可以弥补单一政府绩效评估的不足,特别是当地方政府绩效评估本身存在较大缺陷的时候。而且,社会评估还具有及时反映公众需要、促进地方政府创新的独特功能。2004年12月18日,我国第一家民间政府绩效评估机构——中国地方政府绩效评价中心在兰州大学成立。这表明中国开始有了独立的、专门的民间评估机构,意味着社会开始更加积极主动地参与对地方政府绩效的评估,参与地方的发展。但从目前情况来看,我国民间评估力量的发展还很不成熟,评估方法和评估指标的科学性还有待进一步提高。

(三)政府机构改革的困境给政府绩效评估带来刚性约束

机构是职能的载体,政府职能不同则所设机构肯定就不同,所以,政府职能转变必然要求机构改革。改革以来的20多年时间里,我国曾进行了多次政府机构改革,但改革的成效却并不明显,主要原因是机构改革总是把解决财政压力放在首位,机构改革的重点也是精简机构和人员,如1998年进行的机构改革甚至明确提出了精简比例。但是,如果从绩效管理的视角看政府机构改革,机构改革就不应该是简单地做“加减法”,而应该立足于整合各个机构的职能。党委、人大、政府等序列机构性质不同。静态看,它们各有职权,分工明确;但在中国特色的政权结构中实际运作却会出现职能重复、交叉的状况,而且越到基层,各机构职能交叉的弊端就越明显。不论行政管理幅度大小、工作多少,都与上级政府设置同样数量的机构,这本身就不是经济的选择。再加上各序列机构的职权边界不清,党政主要领导人的工作作风不同,工作成本就被大大增加了。所以,如果不先整合机构,解决机构重叠的问题,就在现有机构的基础上设计评估指标,那么设计出来的指标体系科学性将难以得到保证,评估的实效性也难以得到体现。只有在减少管理层次、理顺党委、人大、政府、政协等各序列权力机构管理关系的前提下,才能实现真正科学合理、具有实效性的政府绩效评估。“十一五”规划已经对政府机构改革进行了论述,即“深化机构改革,优化组织结构,减少行政层级,理顺职责分工,推进电子政务,提高行政效率,降低行政成本”。

四、文化生态环境的制约

所谓文化生态主要是指一个机构或一项制度所赖以存在的社会思想意识、文化心态和观念形态的总和,它是社会成员在社会化过程中长期积淀而形成的一种较为稳定的价值取向。在现实中,一项改革方案能否顺利实施或取得成效,并不仅仅取决于方案是否完备或是否符合理性的设计,而是取决于方案是否被大多数参与改革者所认同和接受,也就是说深受文化生态的影响和制约。在文化生态的诸要素中,与我国历史发展有密切联系的中国传统文化对政府绩效评估制度的制约最为明显。

(一)中国传统文化中的“人情至上”原则使政府绩效评估制度失灵

中国传统文化看重人性。如孔子讲性相近、孟子讲性善、荀子讲性恶以及《三字经》开始便说“人之初,性本善”等等。但中国人的人性不是偏于理智,而是偏于情感;人性中情是主要的,智是次要的。这种“人情至上”的精神融入到行政中,使政府在管理的诸多环节中注重亲缘血缘关系,讲情面、论义气,将工作关系、契约关系与私人的情谊关系联在一起,因人情破坏原则规范的现象时有发生。很显然,政府绩效评估体系再健全,如果还是以“人情”作为利益分配和调节的工具,终将归于失灵。

(二)中国传统文化重感情、轻理性。重人的德行、轻科学的技术方法,导致政府绩效评估理论不足、评估程序不规范以及评估结果不够科学

中国传统文化的一个典型特点就是在思维上重视感情因素,缺乏纯理性的分析,而重感情、轻理性必然重经验轻理论。中国古代科学技术大多属于对当时生产经验的直接记录和对自然现象的直接描写,极少有科学理论的探索与规律的发现。这种传统文化延续至今,对我们的政府绩效评估同样产生了不良影响,理论界对政府绩效评估的评估理论研究不足,仅一味地引进“先进方法”而忽视对评估理论本身的研究,致使我国的政府绩效评估缺乏理论根基。另外,我国自古就重伦理、重德行,对科学技术重视不足。中国古代科学技术的每一种发明创造都要经过伦理规范的检验,这样,中国古代的这种轻视科学反应在政府绩效评估上,就造成了评估程序不规范,流于形式;评估方法多为定性,较少采取定量方法;评估结果不够科学。

(三)中国传统文化重中庸、轻竞争。重“官本位”思想、轻“民本”思想。造成了政府缺乏竞争意识。导致了政府绩效评估常常忽视人民群众的意愿

源于西方的政府绩效评估追求效率、效益,提倡竞争,充分发挥个人和组织的能力,适者生存。而我国传统的儒家思想崇尚“和”,提倡“和为贵”,避免人与人之间的竞争以维护社会稳定;这一思想与政府绩效评估的目标背道而驰,因为本着“和”的原则,当评估结果有损下属颜面时,领导就大事化小,不将评估结果公布于众,这样评估的反馈作用得不到实现,严重影响了绩效评估的实施。另一方面,我们现有的一些政府官员“官本位”思想严重,可以说某种程度上支配着他们的行为选择,造成了这些政府官员缺少服务于民的意识,这给政府绩效评估的实施带来不少困难。其主要表现在一些政府和部门把引入和实施政府绩效评估作为一种“政绩工程”和“形象工程”,在目标制定中没有把服务于人民群众作为评估的一项重要指标。这种“形象包装”式的政府绩效评估必将会导致形式主义泛滥、公信力下降、作用失效,最终使政府绩效评估演变成劳民伤财的举措。

评估制度论文篇7

一、概念的辨析

(一)行政立法和规制

一般认为,行政立法是指行政机关依照法定程序,在自己的职权范围内制定并颁行有关行政管理事项普遍应用的规则的活动。具体是指根据《宪法》、《地方组织法》和《立法法》规定,国务院制定行政法规的活动以及国务院各部门和有关地方政府制定行政规章的活动。但是这些法律条文本身并没有界定行政立法的概念。

行政法学者做了不少研究,有人就总结出了四种含义[1],一是由全国人大及其常委会制定的行政领域的法律;二是国家机关制定行政管理的法律规范的活动;三是行政机关制定规范性文件的活动;四是享有行政法规和规章制定权的行政机关制定规范性文件的活动,将不享有行政法规和规章制定权的行政机关制定规范性文件的活动排除在行政立法之外,这一种是行政法学界较为接受的。当然也有学者从批判的眼光提出,国内行政法学界关于行政规范性文件和行政立法的理论与立法存在着方向性错误。因为规范性文件能够直接规定私人的普遍性权利义务,从实质上的权力划分角度而言,至少部分的行政规范性文件可以纳入行政立法之列。而《立法法》只规定到行政法规和规章而没有规定行政规范性文件,那是该法的缺陷。[2]

现实生活中,除了行政法规和规章外,行政政策、管理措施、办法细则等,数量非常之多,影响公民身边权利义务之广泛和深入,每个人都有切身体会,比如关于房屋拆迁、机动车限号等措施。“闯黄灯处罚”条款的法律渊源就有两种,一个是部门规章,即公安部第123号令,另一个是公安部为贯彻该规章的《一百问》,恰恰是这个文件明确了闯黄灯的具体处罚措施。

因此只要具备由行政机关制定的具有普遍约束力的规则这个特点,就可以纳入行政立法的范畴,不应该因为行政机关的层级大小而有所区分。把规范性文件排除在行政立法范畴之外,这种区分层级高低的做法应该看做是权力本位的思维逻辑。

国外并没有行政立法这样的表述,英美文献中的表达形式是:rule-making 或者regulation-making。近些年来,西方主要国家开展的规制治理改革(regulatory governance reform)规模和范围非常之大,就是通过提高政府制定法规规章和政策的质量,达到改进政府管理事务的效率和效果。随着政府规制理论的兴起,经合组织和政府规制理论研究者逐渐习惯于用“regulation”或者“regulatory”。近来法学界一些学者越来越接受“规制”的译法,并认为它既包括政府部门的法规规章(这是最主要的部分),也包括相关政策、措施、大型项目、规划和监管行为等。当行政立法的范围扩展到行政法规和规章之外的规范性文件、政策措施等时,就与规制的含义有了很大的交集。

(二)行政立法前评估和规制影响评估

通过概念辨析,行政立法评估和规制影响评估在本文语境下是基本相通的。规制影响评估制度,就是对拟定的或者已经的规制政策和方案产生的影响进行分析和估计的政府决策工具,分析对象包括法律法规、规章、政策、措施等具有普遍约束力的政府行为和规则,包括前评估、过程评估和后评估。[3]行政立法前评估的含义,是指对各种潜在的或者可能的行政立法方案进行的必要性、可行性和有效性等问题的评估和预测分析。

近些年,对中国法制建设情况的批评大多集中在法律法规的制定和实施效果上。欧盟中国商会在2012年指出,“法律和法规范围宽泛、执行尺度不一”是影响中国未来经济表现的最大障碍。[4]美中贸易全国委员会也在2012年度《中国商业环境调查结果》中表示,“虽然中国的法律法规大部分由中央政府制定,其实际执法和法律实施则由省级和地方机关进行。地方机关常常对法律有不同的解读,导致具体执法也多有差异。”[5]这些评论不无道理,如劳动合同法刚一颁布,企业界、学者提出了劳动合同法的质疑与反对意见,提出了加重企业负担的问题。再比如,北京、广州汽车限号和摇号政策的出台,引发政策实施前的购车狂潮,虽然官方认为起到了缓解交通的作用,但交通管理局和民营调查机构甚至媒体的调查结果相互矛盾。因此,为避免现实生活中的“规制失灵”,引入科学的行政立法前评估,对一项政策给社会、经济、相关人带来的正负影响进行量化的评估,为是否出台该项措施提供支撑,具有迫切的现实需要和深远意义。

二、 前评估和后评估之争

立法评估制度是一个全面的概念,之所以提出前评估的概念,是因为我国目前开展的立法评估都是后评估。2004年《全面推进依法行政实施纲要》提出了对行政立法进行成本效益分析和事后评估的要求,标志着行政立法评估制度在我国中央层面的正式法律文件中得到了确认,但是没提出前评估的问题。2011年,国务院新闻办公室发表《中国特色社会主义法律体系》白皮书提出,要“建立健全立法前论证和立法后评估机制,不断提高立法的科学性、合理性,进一步增强法律法规的可操作性。”这里使用了前论证的表述,但是没有具体解释,无法辨析与前评估概念的异同。

目前的文献资料,几乎都是关于后评估的论述,有人认为,“立法后评估,一般是指在法律、法规颁布实施一段时间后,结合法律、法规的实施情况,包括取得的成效、存在的问题,对特定的法律、法规所进行的评价,目的在于更好地实施、修改完善被评估的法律、法规,并从中总结经验,为开展相关立法提供借鉴和指导。”[6]有人提出,“立法后评估是指有关主体按照一定的标准和程序,通过一定的方法和技术,对实施了一定时间的立法的协调性、科学性、可操作性、有效性等进行分析和评价的一种活动,是了解立法效果、提高立法质量和立法水平的重要手段。”[7]也有人认为认为,立法后评估是着眼于立法制定出来并在实施一定阶段后对其效果所进行的评估。立法后评估制度在我国自产生时候起,虽然也关注法律实施的效果、后果,但更多是从它实施的效果、后果来考察法律本身存在的问题(更准确地讲是立法的问题,比如立法的价值、技术、内容等) ,以此判断该法律是否有修改完善甚至废除的必要。”[8]

有少数学者论及前评估问题。毛亚儒、何蓉认为我国行政立法评估制度的第一个问题就是行政立法前评估制度的缺失[9]。论述较为深入的是中国政法大学的席涛,他认为,众多关于后评估的文章虽然都强调评估法律法规制度的实施绩效和发现存在的问题,以便修改或者废止,但概念仍然不清晰。目前的立法后评估强调了评估的必要性、合法性、协调性、可操作性和实效性,没有直接将法律法规的经济影响、社会影响和环境影响作为评估标准或者一级指标,也没有评估法律法规的经济成本、社会成本、经济收益和社会收益。这些评估标准应置于立法前评估,而现实作为立法后评估标准,产生了本末倒置。[10]

席涛还认为,无论中央政府部门还是地方政府都是选择立法影响比较单一的法规进行后评估,适用范围比较窄,执法主体必较少,相关信息的收集、整理和分析比较集中,评估难度相对较小。[11]这是有道理的。没有公开的信息表明,“闯黄灯”条款进行了前评估,反而在出台后连篇累牍的议论文章提供了大量的本来应由制定机关进行前评估工作的数据和信息,形成了事实上的后评估。比如,变成黄灯时,距离多远才能刹住车不越线;是否应该加“绿灯闪”;黄灯规则是否利于交通通畅等,提供了定量的和实证的资料。[12]

通过统计历年《中国法律年鉴》和网络公开信息,1987—2012年间行政法规一档计划数量和一档计划实际完成数量有个对比(参见表1)。

行政法规一档计划数量与实际完成数量对比(1987—2012)

可以看出,立法计划的完成总体不尽如人意,说明立法的预测和计划存在瑕疵,立项研究存在改进的地方。部门在报送立法项目时,没有开展行政立法前评估,尤其是定量的分析和预测,是导致立法项目出台不顺的一个重要原因,反倒是计划外完成的立法项目占了相当比例。由此可见,无论学术还是实践都表现出了对前评估的忽视。

三、 国外行政立法前评估制度的启示

国外行政立法评估发展的最初阶段就是为了对行政立法、规制政策制定进行前评估。

(一) 美国。美国是最早实施行政立法前评估的国家,行政立法评估制度形成了较为成熟的理论框架,并在政府规制治理中广泛应用,取得良好效果。其法律渊源来自于美国政府的几个法案和政府命令,重要的是1993年的12866号总统令,要求对拟定的行政立法(proposed rule)进行规制影响评估,1996年预算管理办公室了评估的方法指引。2011年1月,奥巴马总统的13563号令《改进规制和规制审查》,重申了12866号令确定的对拟定规章的影响进行评估的制度,保证规章的成本有效性,减少对社会经济的负担。

(二)经合组织。1997年,经合组织了《规制影响评估:经合组织国家最佳实践》[13],通过总结各主要国家的经验,对开展行政立法评估提出了10条有益的经验。2008年,了《建立规制影响评估的机制性框架:政策制定者指南》,针对行政立法前评估问题提出,在决策过程中的尽早阶段进行,很多国家在部门提供立法草案第一个初稿时,就要进行规制影响评估,这样在初次意见沟通时就可以提供草案将来可能的影响,评估结果也容易融入决策预定目标,否则评估只能作为政治工具了。2012年,在捷克召开了规制影响评估研讨会,再次强调行政立法前评估问题,在决策制定过程中起草新的规制措施草案的尽早阶段实施评估,明确政策目标,评估出台法规是否必要,怎样的措施才最有效果和效率。

(三)欧盟。2001年欧盟理事会持续发展战略中提出,为了改善欧盟规制质量,所有涉及政府与市场的重要的立法、条例、规章、指令等议案,都要进行对经济、社会、环境的潜在影响的评价。2009年修订了2005年的《影响评估指南》,一是扩大了影响评估的范围,包括了所有立法动议文件;二是强调加强公众参与,确保相关人对新制定的方案及其影响评估能够提出意见,有些复杂敏感的方案至少提供8周的评论时间,并且对公众意见明确反馈。评估方法上,强调基本权利保护,社会影响评估包括就业和劳动力市场、就业平等、非歧视公共卫生和安全等,小企业是否被排挤,以及如何提供备选机制帮助小企业遵守规制,在竞争影响、行政负担遵守实施成本等方面,更加强调量性评估,包括二氧化碳甚至非市场如环境、健康影响的数量化和货币化。

经合组织和欧盟包括了西方的主要发达国家,从他们的实践来看,前评估工作得到了良好的效果和推广。总结其成功经验,有几个共同的特点或者启示:

——政治层面包括议会和政府高层的支持十分重要,否则评估工作的推动力不足,也就无法对立法质量做出贡献。

——使用清楚的评估方法,对于评估工作质量非常关键。比如运用定量的成本效益分析法等方法,其作用不在于计算的精确度,而在于分析、了解拟定立法对现实社会的影响,通过改变传统的拍脑袋式的决策思维逻辑,来改善问题解决方案、拓展政府在社会中发挥的作用。闯黄灯条款之所以引起如此的争议,就是操作性问题没有解决,当黄灯亮起时,机动车要保持什么样的速度,才能不违反交规。一些人戏称,象“驴”车一样走照样来不及刹车,实施首日各地因为黄灯条款频发追尾事件印证了这一窘迫;有关民间组织提供的数据显示,定量分析对于制定法规规章非常有用,尤其是对于条款的操作性《新京报》2013年1月5日转载DCCI互联网数据中心数据:时速哪怕在20公里,离线5米时黄灯亮则100%越线;如果提前8秒预警,或可保证车辆不越线。7组司机按时速80到20公里限速行驶,发现黄灯踩刹车到制动力完全发挥,平均反应时间近1秒,刹车距离结果为:以7组司机按80到20公里限速行驶,距离5米时,全部车辆都会在黄灯亮时越线;距离10米时,只有车速最低的一辆车能停住不越线;距离20米时,车速较低的3辆车可以停住;40米时,车速较低的5辆车能停住;50米时,车速较低的6辆车能停住,但时速80公里的车仍然会越线。。

——强调公众参与,并以此验证评估工作设定的前提条件。如果在行政立法起草早期公布,就是非常好的参与行政立法制定的机会,而公众参与本身也有积极的意义,在参与过程中收到的各种信息和反馈更加全面,尤其是利益相关人的信息。

——评估是一个全面的、连续的过程,事前、事中和事后的评估都应该尽可能地开展。但是各国都强调前评估,要求要尽早地开展行政立法评估。

——建立一个行政立法前评估的机构机制,由行政立法起草部门负责评估,而质量控制交给一个独立的能够建立评估质量标准的监督机构。

——培训专家和技术力量,制定书面指南,让评估工作规范、有效。我们这方面是短板。

四、行政立法前评估制度设计的关键问题

西方行政立法前评估的实践产生了良好的效果,证明是一个行之有效的工具。探索如何构建符合中国国情的具有操作性的行政立法前评估制度,具有现实意义,有几个在制度设计中需要认真研究的问题。

(一)行政立法前评估的内容和目的

立法前评估,是一个收集信息、反映问题的过程,也是利益主体诉求的博弈过程。评估内容包括行政立法方案的必要性、合法性、协调性和可操作性,评估对经济、社会和环境产生的影响,尤其要评估立法设计的制度、规则和操作性措施的约束条件,寻求解决约束条件的方法和步骤。[14]通过评估,达到以下目的:

—— 希望在备选方案中做出最佳选择。高质量行政立法项目应当是以尽可能有效的成本获得高效率的政策决定。

——为决策者和公众提供有关可能产生影响的信息,提高透明度和公众参与。

——改善立法和政策制定过程。通过前评估,可以提供广泛的信息和展示政府决策如何造福社会,提高决策者的参与度和问责制。

(二)行政立法前评估的定位

评估只是一个决策工具,系统地和连贯地审视、分析政府行为引起的有关潜在影响,向决策者沟通信息。评估自身不做决策,并不意味它是中立的。它所提供的强有力的信息、分析事项、分析和表述方式及其在决策进程中的安排,能够强烈地影响相关人的价值观念、增强或者削弱决策参与人的争论能力,甚至产生出本来不可能做出的决策。它不仅仅是一种简单“增加”到决策系统中的技术工具,更是一种传输观念的方法,这个观念就是,什么是适当行为,什么是国家的正当作用。

(三)行政立法前评估的基本步骤

首先由行政立法起草部门进行评估:一是评估行政立法项目的必要性,该评估的核心是市场失灵,因为只有市场失灵时政府规制才是必要的。在美国,制定部门应指出立法要解决的问题是什么?该问题是否是由重大的市场失灵造成的,或者存在令人信服的公众需求?如果是重大市场失灵造成的,则要从定性和定量两个方面描述该问题的状况,从而进一步证明由政府进行干预的必要性。如果不能充分证明政府干预是正当的,则要证明政府干预、修正市场失灵,可以带来更多的经济利益而不是损失。二是,评估备选方案。即便存在市场失灵,还有一些替代方案可供选择,这样的替代方案包括利用司法、政府补贴、运用经济刺激的立法手段、修订现行法规以及地方政府的干预等。三是,进行具体的成本效益评估。成本效益评估的主要内容包括两个方面:立法对经济、就业、环境、公共卫生与安全所产生的效益,包括经济效益、社会效益和积极的影响;立法对中央和地方政府以及对公民守法所产生的消极影响或者带来的负担。

其次,设立专门机构对评估进行审查。在美国,行政立法成本效益评估的审查机关是联邦管理和预算办公室,其下属的信息与规制事务办公室负责对联邦部门起草的法规草案和评估报告进行审查。.

第三,要公开征求公众意见。行政立法成本效益评估的意见能否被接受,还要经过公众评论的检验。

(四)行政立法前评估的基本方法

在法律经济学研究中,实证经济学的分析方法最适合于研究法律的“效果评估”问题,包括对法律的效能做定性的研究和定量的分析,目的是为了更好地说明,法律的实际效果与人们对该项法律预期的效果是否一致,或是在多大程度是一致的。评估的主要方法参见表2 。

我们目前缺失的是定量的分析评估方法,无论是立法项目的前论证,还是立法后评估,普遍反映了这一问题。从国外经验来看,成本效益分析法的使用是一种趋势。成本和效益的量化,能够对各种方案中成本和效益通过货币价值计算方式进行比较。澳大利亚在制定国家燃油质量标准时就使用了成本效益分析法,对四个方案主要进行资金、操作成本和健康效益的分析,从中选出最佳效益方案。在进行成本和效益量化时,如果存在市场竞争比较价格,则有助于测算成本和效益,比如工资水平、产品价格变化等;如果没有市场存在,可以从其他数据中推算,比如支付意愿的民意调查、预期寿命的价值估算、对资产或者财产价格的影响程度等。

当然定量分析从技术上有难度,这也是我们没有专门的技术力量,开展有效的定量分析的主要原因。有些成本和效益可能形成于将来,人们更倾向于看重眼前的成本和效益,所以可以允许成本和效益“折现”成“当前价值”的形式予以表述,从而计算一项方案的“当前净价值”。这时,由于未来成本和效益出现了不确定性的问题,所以清楚地界定假设条件非常重要,一方面使用现行可能的最佳估算方法,另一方面也要承认永无“正确”答案。

如果量化不可行,就用定性分析。尤其是货币化是成本收益分析中非常有难度的一个步骤,但是还是有一些实用的方法协助比较各个方案的影响,而且不需要很高的技术含量。多重标准分析法就是其中最常见的一种,在确定方案目标的同时也确立可以准确衡量这些目标完成程度的标准,用打分的形式比较各个备选方案的优劣,评出最能有效利用现有资源的一项。

(五)行政立法前评估的公众参与

国外实践表明,把行政立法其评估纳入公众参与程序中,是一个日益明显的融合趋势。公众参与是促进行政立法前评估质量的有效手段。成本效益分析方法是预测性的分析,存在许多不确定的因素。即使是最好的评估分析也不可能完全预见风险,真实的信息也往往会因为各种原因失真,如对生命价值的确定等就很难有统一的认识。因此,公众评论在立法评估中占有重要地位。

评估制度论文篇8

关键词: 高等教育评估;制度环境;合法性

中图分类号:G64文献标识码: A文章编号: 1673-8381(2012)04-0038-05

现代意义上的高等教育评估在我国始于20世纪80年代中期,经过20多年的发展,已经形成了包括教学水平评估、学科评估、专业认证、大学排名等多种类型和层次的高等教育评估体系。从评估主体角度来看,这些活动大致可分为三类:一类是政府部门(包括教育行政部门及其下属事业单位)组织实施的,其中影响最大的是本科教学评估;一类是社会机构组织实施的,其中最受关注的是大学排名;还有一类是行业组织实施的(此类评估较少,社会关注度不高),如中国高等学校土木工程专业教育评估委员会开展的土木工程专业评估。其中第一类评估对高等教育发展的影响最为直接,也最受关注,是我国高等教育评估制度的主体,也是本文主要的研究对象。在这类评估活动中,影响最大、最深,也最受社会关注的是教育部组织的本科教学评估。在经过多年试点探索,完成首轮全面评估后本科教学评估却遭受了来自社会、高校等多个方面的广泛批评和质疑,甚至“取消评估”之声也不断涌起,本科教学评估面临着严重的合法性危机。综观这些批评和质疑的内容,涉及面很广,既有评估工作本身的技术性问题,如指标体系、工作程序、评估方法等需要不断完善和改进,也有评估制度本身的社会认可度问题,也就是制度的合法性问题。本文拟运用社会学新制度主义理论,主要以政府组织的本科教学评估为主要对象,分析我国高等教育评估制度的合法性问题,并提出改进的思路。

一、 社会学新制度主义的合法性理论

“合法性”是政治学、社会学领域的核心概念,其内涵不是指与法律法规相一致的“合法律性”,而是指得到社会大众或各利益相关者的普遍认同与自愿遵从。马克斯·韦伯(Max Weber)第一次对合法性问题作了系统的探讨,将合法性定义为人民“自愿服从”的一种政治统治或国家状态,存在合法性的政权就不需要大规模地使用强制力而使人们服从。他还以合法性为标准将政治统治划分为三种类型,即人格魅力型统治如革命领袖的政权、传统型统治如君权神授的政权、法理型统治如主义政权\[1\]。尤尔根·哈贝马斯(J·rgen Habermas)是合法性理论的集大成者,他在对韦伯等人把合法性作为人们对政治秩序认同和信任的事实判断这一观点进行批判的基础上,提出了“合法性意味着某种政治秩序被认可的价值”的著名论断,突出强调了政治合法性赖以存在的价值基础,并从历史的角度对资本主义社会的合法性危机进行了深入的分析\[2\] 。

借用合法性概念,当代社会学新制度主义在解释组织或制度变迁的趋同化现象时,提出了合法性机制这一概念,认为当社会的法律制度、社会规范、文化观念或某种特定的组织形式成为“广为接受”的社会事实之后,就成为规范人的行为的观念力量,能够诱使或迫使组织采纳与这种共享观念相符的组织结构和制度\[3\]。按照斯格特的理论,组织不仅受其所处环境的技术因素(即技术环境)的影响,更受环境的制度因素(即制度环境)的制约。前者是从技术的角度看待组织的运行,包括组织外部的资源与市场、组织内部将投入转化为产出的技术系统等;后者则是指组织生存于其中的社会的法律制度、文化观念和社会规范等因素,而这才是组织合法性的真正根源。“组织之所以获得支持和合法性,是因为组织符合了‘恰当’的、建立组织的当代规范”,“符合这些信念的组织即便在没有特殊技术优势的情况下,仍能得到公众的支持和信任”\[4\]。技术环境和制度环境对组织的影响是不同的,技术环境要求组织内部的结构和运行程序满足技术效率,而制度环境则要求组织内部的结构和制度符合社会公认的“合法性”,如果组织与其所处的制度环境不相适应,那么必然就面临着合法性的危机,进而要求制度创新。

这就是社会学新制度主义理论解释制度产生和变迁的合法性机制,它强调的是制度环境对新制度产生或旧制度变迁的重要作用。这一机制不同于新制度经济学关于制度创新是基于利益最大化原则的效率机制的主张,即如果制度创新的预期收入大于预期成本,制度创新就会发生;反之,则制度就会处于平衡状态。

二、 我国高等教育评估制度面临的合法性危机

从合法性角度进行审视,可以看出,我国高等教育评估制度是在20世纪80年代为适应国家推行高等教育管理体制改革需要应运而生的,在建立之初具有坚实的合法性基础。但在之后的不断探索和演变过程中,特别是进入21世纪以来,并没有顺应社会制度环境变化需求而及时进行变革,逐渐丧失了合法性根源。

(一) 我国高等教育评估制度的历史变迁

无论是从政策依据还是从评估实践角度,学术界一般都认为我国高等教育评估制度始于1985年,此后大致经历了3个发展阶段:

1 评估制度初建与试点阶段(1985—1989年)。为适应国家推进高等教育管理体制改革,在扩大高校办学自的同时,加强对高等教育的宏观指导与管理,国家决定开展高等教育评估。1985年5月,中央颁布《关于教育体制改革的决定》,明确要求教育管理部门“要组织教育界、知识界和用人部门定期对高等学校的办学水平进行评估”;同年12月,国家教委《关于开展高等工程教育评估研究和试点工作的通知》,明确提出“要有计划有步骤地进行评估的试点工作”,并对试点工作作了具体部署。这两个事件一般被认为是我国高等教育评估制度建立的标志。此后,政府教育部门和高教界积极开展相关工作,一方面通过组织研讨会、课题组等形式,大力加强评估理论研究;另一方面积极进行评估试点,据统计,从1986年至1989年,共对87所高等工科院校进行了试点评估。这些理论研究和评估试点,为高等教育评估制度规范化建设和发展奠定了良好的基础。

2 评估制度规范化稳步发展阶段(1990—2002年)。经过几年的理论研究和试点经验积累,1990年国家教委颁布了《普通高等学校教育评估暂行规定》,对普通高等学校教育评估的目的、任务、指导思想、基本形式、组织机构、评估程序等作了明确规定,确立了我国高等教育评估制度的基本框架。这是我国关于高等教育评估的第一个立法,标志着我国高等教育评估开始走上法制化、规范化发展道路。此后,国家在《中国教育改革和发展纲要》、《中华人民共和国高等教育法》等重要法律法规和政策文件中也都对高等教育评估制度进行了表述,教育部也于1998年针对本科教学评估中出现的问题专门下发了《关于进一步做好普通高等学校本科教学工作评价的若干意见》。另一方面,评估实践也在稳步发展。从1994年开始至2002年,教育部以合格评估、选优评估、随机评估、水平评估4种形式,共对252所普通本科院校进行了教学评估。可以说,这一阶段是我国高等教育评估大面积试点、探索,日趋规范化和稳步发展的时期。

3 评估制度全面发展及反思重构阶段(2003年至今)。2003年8月,教育部原部长周济在高等学校本科教学工作水平评估研讨班上宣布,从2003年开始用5年左右的时间对我国所有普通高等学校教学工作进行一次全面的评估,并形成5年一轮的教学评估制度。2004年3月,国务院批转的教育部《2003—2007年教育振兴行动计划》指出,“建立高等学校教学质量评估和咨询机构,实行以五年为一周期的全国高等学校教学质量评估制度”。同年8月教育部高等教育教学评估中心正式成立,主要任务就是负责组织实施高等学校本专科教育的评估工作。从2003年开始至2008年,教育部共对589所高校进行了本科教学工作水平评估,完成了政府对高等教育质量的第一次全面审视。应该说,这一轮评估对促进高校教学改革、提升教育质量的正面作用是不可否认的,但同时遭受的批评和质疑也是非常强烈而普遍的,这也引起了政府、高校及学术界的深刻反思,目前新一轮评估工作仍未启动,高等教育评估制度正在重构之中。

(二) 当前我国高等教育评估制度面临的合法性危机

分析我国高等教育评估制度,可以看出,它从建立之初就带有明显的政府主导色彩,在之后的变迁中,经由路径依赖的不断强化,这一特征更趋明显。在刚刚实行改革开放,国家刚开始对政府高度集权的计划经济体制和高等教育管理体制进行改革之时,由政府主导实行的高等教育评估是符合当时的社会环境的,是具有合法性的;但是,在改革开放30年后的今天,在社会主义市场经济体制已经建立,高等教育管理体制改革不断深化,高校在法律意义上已经成为面向社会自主办学的实体的新的时代,仍实行完全由政府主导的集权化的高等教育评估制度,就显得“不合时宜”了,这一制度已经与其所处的制度环境不相适应,自然也就难以获得社会的认同,这正是其合法性危机产生的根源所在。下面,从三个方面进行初步分析。

一是评估主体单一性与利益主体多元化的矛盾。在高度集中的计划经济时代,我国高等教育领域是一种一元化的办学体制,高校是政府的附属机构,高校成员作为“单位人”对学校全面依附,政府代表国家成为唯一的利益主体。20世纪80年代,高等教育评估制度产生之时正处于国家对计划经济进行改革的初期阶段,并未出现明显的利益分化。因此,国家建立以政府为单一主体的一元化评估制度,是与当时高等教育系统利益关系和社会的普遍认识相适应的,自然也就能够得到高校及社会的认可与接受。但是,随着社会主义市场经济体制的确立以及高等教育体制改革的深入,高等教育利益格局逐渐出现了分化,“计划经济体制下中国公立高校政府‘一言堂’的利益垄断格局,被以教师为代表的教职工群体、以书记和校(院)长为代表的校(院)级管理者群体、学生群体及合作办学者等多元利益主体并存的格局所取代”\[5\]。虽然关于利益主体的划分,不同学者有不同的观点,但高等教育多元利益主体生成的事实已经得到了社会的普遍认同。在这一背景下,仍然坚持政府主导的一元化评估制度,忽视其他利益主体的参与意愿、价值取向和利益诉求,既与利益主体和价值取向多元化的社会环境不相适应,也背离了社会公众的普遍认知,自然就再难以得到人们的信任与认同。

二是政府行政控制与高校自主办学的矛盾。如前所述,我国高等教育评估制度最初是作为政府对高等教育进行宏观管理的手段而建立的,体现的是政府对高校进行管控的思想。在之后的变迁演化过程中,由于路径依赖的不断强化,政府行政控制的色彩日益浓厚,无论是被评对象(高校)的被动接受,还是评估活动的组织、评估专家的选择、评估结果的确定等,都体现了明显的行政干预性质。这种特征与被国家法律和社会普遍认同的高校自主办学理念是相矛盾的。大学自治一直是高教界普遍认可的办学理念,高校面向社会自主办学也一直是我国高等教育改革的基本走向。虽然国家在多个重要法律法规和政策文件中都强调要扩大高校办学自,使高校能够“面向社会,依法自主办学”,而且在实践中高校的办学自也确实不断得到增强,但政府对高校的控制和直接管理色彩依然很浓。正如有学者所言,改革开放以来,“我们在推动高校办学自方面做了许多工作,也取得了不少成绩。但是,政府对高校的管理,手段仍比较直接,管得还比较细,转变政府职能的工作还有待深化”\[6\]。在这种情况下,行政色彩过于浓厚的高等教育评估很容易被认为是政府对高校进行管制的工具而遭到质疑和批评。“评估功能体现出局限于监督与管理的单一化和狭隘化,高等教育评估也就演变成政府及其教育行政部门依据一定的评估指标体系对高等学校进行检查、评价的一种具体行政行为。明显的行政行为化倾向使得高等教育评估被批评是政府强化规制的一种手段。”\[7\]这与高校追求自主办学的理念和改革趋势是背道而驰的,自然也就难以得到人们的信任与认同。

三是政府职能定位与社会角色认同的矛盾。在高度集中和封闭的计划经济时代,政府处于统治地位,是一个全能者的角色,人们对政府是高度依赖、信任甚至是“盲目崇拜”的,政府行为很容易得到公众普遍的认同和支持。但是在开放多元的市场经济时期,人们的自我意识和权利意识不断增强,对政府的认识和角色定位也在不断变化,对政府已不再是完全的信任,对不合理、不正当的政府行为也会提出质疑和批评,近些年出现的政府“信任危机”甚至“民告官”等现象就充分说明了这种变化。有限政府、服务政府、责任政府、治理政府等理念成为公众对政府角色定位的新要求。在这种背景下,政府仍然在高等教育评估中扮演“‘总指挥式’的集权领导的角色”\[8\],处于“统治”地位,已经不再符合人们在心理上对政府角色的普遍认同。通过上面的分析,可以看出,从高等教育评估制度建立之初到现在,我国高等教育发展的社会环境发生了巨大的变化,仍然依循政府主导模式的高等教育评估制度已经与外在的制度环境不相适应,从而逐渐失去了合法性基础,这正是其面临合法性危机的根源所在。

三、 我国高等教育评估制度变革的基本走向

根据社会学新制度主义理论,我国高等教育评估制度要想走出当前的合法性危机,就必须适应外在制度环境的变化,积极进行变革,从中获得新的合法性基础。当然,这是一项复杂的系统工程,笔者在此也无法给出详细的论述,仅提出以下几项应遵循的基本原则。

一是坚持多元参与的理念。利益主体和价值观念的多元化已经成为我国高等教育领域的现实。高等教育是一种准公共产品,高校是一个典型的利益相关者组织,各利益主体均有权利参与对高等教育的评估活动,这也是从根本上保证高等教育质量的重要举措,因为任何片面适应单一利益主体需求的高等教育都不能称得上是真正高质量的教育,只有充分反映各利益主体需求的教育才是全面的,才可能是高质量的。因此,高等教育评估活动理应有各利益主体广泛而充分的参与。当然,由于高等教育的利益相关者群体很多,如何让这些群体参与并发挥好作用,确实是一个很复杂的问题。笔者认为,至少有三个方面的工作要做好:(1) 在制度设计上,要把各利益相关者作为高等教育评估的合法主体,即要在相关法律法规和政策文件中明确各利益主体有权参与评估活动,评估机构开展评估活动应充分考虑和听取各利益主体的价值意愿和利益诉求。(2) 在程序规范上,要明确各利益主体参与评估活动的途径和方式,包括评估方案制定、评估人员组成、评估结论形成等各个环节和方面,这是多元利益主体能否真正参与评估的重要保证。(3) 在文化氛围上,要塑造一种良好的评估文化,让各利益相关者群体能够充分认识到参与评估活动的重要意义和责任,引导和鼓励他们积极主动认真地参与到评估工作之中。

二是正确定位政府的角色。在多元化的高等教育评估制度中,政府的角色定位比较特殊,一方面,它仅是众多主体中的一员,与其他利益主体之间是一种平等的关系,不再处于领导者和控制者的地位;另一方面,由于政府在社会公共事务管理中的特殊性,特别是在我国政府仍在高等教育管理中占据主导地位的背景下,政府在高等教育评估制度中还应担负起不同于一般主体的特殊职责。具体来说,除作为利益主体之一平等参与评估活动外,还应担负以下几种角色:(1) 评估规则制定者。政府应积极组织制定和完善评估工作所涉及的各种法律法规、政策文件、制度规范等,为评估工作开展提供基本的依据。强调政府是评估规则的制定者,并不是说这些规则应由政府独自研究制定,而是指政府应充分发挥领导者和组织者的作用,动员和组织各方面的力量积极开展这一方面的工作。(2) 评估活动服务者。政府应强化在评估活动中的服务职能,积极为评估机构开展评估工作提供各种服务和支持,包括建立信息库,提供评估信息数据,开展人员培训,提高评估人员队伍的素质等。这里主要是要求政府充分发挥公共资源丰富的优势,担负起评估活动的公共服务者的角色。(3) 评估工作监督者。也就是要求政府要充当“元评估”的角色,对评估机构开展的评估活动进行监督和评价,一方面确保评估工作的公正性、科学性,另一方面从更高层面上把握评估工作的发展方向,引导评估工作科学发展。总之,政府应从原来的组织者、控制者定位,转向参与者、引导者、服务者、监督者的角色。

三是合理界定评估的功能。在我国,高等教育评估一直是作为政府加强和改善对高等学校宏观指导和管理的重要手段来定位的,这一点无论是在相关政策法规,还是在评估的具体实践中都得到了充分的体现。但是,在政府职能不断转变,公共治理、服务行政等成为政府职能定位新理念,政府与高校之间从原来的行政隶属关系,正在逐步走向平等伙伴关系的今天,高等教育评估原来的行政管理功能就需要进行调整了,应转向于服务高校发展的功能,成为一种“发展性评估”,即以增强学校自主发展能力、促进学校科学发展为目的的评估。在这一功能定位下,评估主体(各利益相关者)、评估机构(具体承担评估任务的组织机构)与被评对象(高等学校)之间是一种平等的合作关系,而不是上下级之间的管理指导关系,它们通过一系列的协商与互动,共同发现问题,提出改进的方向和策略,促进学校发展。在这里,高校已不再是被动的接受者,而是主动的参与者,为了谋求自身的发展而主动参与其中;高校也不再是单纯的评估客体,也是评估的主体之一,它们的价值期望和利益诉求能够在评估活动中得到尊重和体现;即使是作为评估客体,高校的意见和诉求也能够在互动交流中得到尊重和回应。这样,高校的主动性、积极性就能够被充分发挥调动起来,评估的发展也就能够得以实现。

参考文献

[1]杨光斌“合法性”问题再认识\[J\]河南社会科学,2008(7):40-42

[2]张康之合法性的思维历程:从韦伯到哈贝马斯\[J\] 教学与研究,2002(3):63-68

[3]周雪光组织社会学十讲\[M\]北京:社会科学文献出版社,2003:75

[4]W·理查德·斯格特组织理论\[M\]北京:华夏出版社,2002:126-127

[5]于文明中国公立高校多元利益主体生成与协调研究\[M\]北京:高等教育出版社,2007:69

[6]马陆亭我国高等教育管理体制改革30年——历程、经验与思考\[J\]中国高教研究,2008(11):12-17

推荐期刊