医学教育测量与教育评价

书籍：现代科技综述大辞典上更新时间：2018-09-11 02:53:41

出处：按学科分类—自然科学总论北京出版社《现代科技综述大辞典上》第1155页（3670字）

教育测量和教育评价，是根据一定的标准对受教育者在教育过程中所产生的思想、学业、品行和个性等方面的变化进行估价的过程。

教育测量是运用考试和评定的方法客观地对学生是否达到教育目标的程度进行定量分析，而教育评价则是以测量结果具有多大的价值为着眼点，结合其他有关材料，对学业成绩进行综合判断。在医学教育领域，根据评价的目的，通常分为配置性评价、形成性评价、和总结性评价3类。

医学教育评价产生于对医学生学力的检验，12世纪以后，随着牛津、剑桥、巴黎等大学学位制度的建立，考试制度也得以建立和发展。

直到19世纪中叶，医学考试主要采用口试和笔试论述题。由于这两类方法评分易受主观影响，不能对医学生的知识与技能作出科学的评价，因此，19世纪中叶以后，教育评价研究主要集中在测量技术的探索。1864年，英国格林威治医学院院长G．Fisher编制了“量表簿”，试图为医学考试提出标准。

19世纪以来，特别是第二次世界大战以后，不论是发达国家还是发展中国家，医学院校和医科毕业生均有很大的增加，为加强对医学生的管理，保证向社会提供合格的医生，各国政府或医学团体都十分重视对医学生或医科毕业生知识和技能的测量。美国早在1915年就成立了非官方的全国医学考试委员会(以下简称NBME)，并于1916年首次举行了NBME考试，开创了现代医学教育考试之先河。

但是，由于各国教育制度和卫生管理制度不同，故医学考试制度不甚相同。综观各国现行的医学考试制度，大体上可分为3种类型：(1)由大学或医学院校主持的考试，其目的是对医学生在完成某一课程或某一阶段学习后的专业水平作出鉴定，以便决定是否具有进入下一阶段学习或准予毕业的资格，实施这一考试制度的有新西兰、法国、奥地利、荷兰、葡萄牙、前南斯拉夫、马耳他、土耳其、菲律宾、巴基斯坦、孟加拉国、斯里兰卡、赞比亚、尼日利亚等国的医学院校。(2)由政府授权进行的国家考试，这是一类由政府教育主管当局通过法律程序建立的以授予学位或证书为目标的国家医学考试制度，通常由国家认可的校外考试团体或在政府代表的监督下授权各医学院校所主持的考试。实施这一考试制度的国家有前民主德国、前苏联、缅甸、肯尼亚、塞内加尔、瑞士、贝宁、智利、加纳、意大利、利比亚、马来西亚、苏丹、多哥等国。

(3)根据医疗法规，由医疗批照管理部门所主持的医师资格鉴定考核。实施这一考试制度的国家，医科毕业生不仅要参加以取得学位为目标的学历考试，也要参加授予医疗执照为目标的医师资格鉴定考试，并以通过学位考试作为申请医师资格鉴定考试的必要条件，此即所谓的双重资格鉴定考试。目前，实施这一考试制度的国家有美国、加拿大、日本、韩国、菲律宾和约旦等。

近代医学考试评价是建立在R．W．Tyler，1940年提出的以教育目标为评价中心的理论基础之上的。

1948年在波士顿召开的美国心理学大会上，根据这一理论，韩国提出对教育目标进行分类的建议。随后，在教育领域陆续出现Bloom等(1956年)、Gagne(1965年)、Ausblbel等(1969年)和Merrill(1971年)等4种教育目标分类学理论。鉴于Bloom等的教育目标分类学理论反映了教育工作者(不是心理学家)所得出的结论，具有较高的可操作性，其理论曾列为美国教育研究的重大成果而受到广泛的重视，对教育评价工作影响很大。在医学教育领域，1966年，伊利诺斯大学医学教育研究中心的McGuire对Bloom等的教育目标分类学理论进行了简化，并首次成功地用于医学考试。

1977年，WHO医学教育专家委员会在Bloom等的教育目标分类基础上，结合医学教育特点，提出医学教育目标分类理论，并建议以此作为医学教育测量的理论基础。目前，从多数国家的医学考试制度来看，如美国医学院校的考试包括NBME考试和日本国家医师考试等，在考试内容和方法的设计上都以Bloom等的教育目标分类学理论为基础。

根据这一理论，学习过程被区分成3个领域，即认知领域、精神运动领域和情感领域，每个领域又由低到高分成若干个层次。为综合评价学生，应对其知识、技能和态度3个方面进行评定。

战后时期，一方面由于医学科学技术的发展，要求学生必须学习的知识越来越多，如何采用合适的方式来评定学生的知识、技能和态度日益受到人们的关注。另一方面，由于教育科学和心理测量学的发展，也为考试方法的改革提供了依据。因此，自1950年以来，医学考试方法已有重大改革。

在认知领域的测量方面，为提高测量的信度和效度，1950年初，美国率先在NBME考试中部分采用以多选题(以下简称MCQ)为主要形式的客观性考试方式。

据1952年Cowles和Hubbard的研究资料表明，NBME考试中，内科学和药理学采用论述题得分水平与在校相应成绩的相关性系数分别为0．21和0．18，而在MCQ中的得分水平与在校相应成绩的相关系数为0．37和0．49。根据这一研究结果，自1954年起，NBME第1、第Ⅱ部分考试全部改为MCQ形式。据梅人朗报告，目前已有32个国家的考试团体和医学院把MCQ作为医学考试的主要方式，美国、前联邦德国、日本、马耳他、斐济、哥斯达黎加、贝宁等国的医学考试已完全采用MCQ。在实验室和临床技能的考试，绝大部分国家传统习惯均以评分量表为测试工具，在实验室或病床边对学生进行现场观察评分，这种方法评分主观，而且考试组织工作不便。为克服这一弊端，自1960年以来，许多国家医学院校或考试团体大力发展以模拟技术、录像及其它声像材料为基础的考试方式，来客观地测试医学生解决问题的能力。目前，在医学考试中常用的模拟方式有模拟病人、模拟模型、书面模拟(PMP)和计算机模拟等。美国NBME第Ⅲ部分临床技能考试，自1961年起，已将在病床边进行的实践操作考试和口试改为PMP的形式，大大提高了考试的信度。

80年代以来，对中国医学考试制度和考试方法的改革，已经引起医学教育工作者的重视。

目前，中国对医学生的评定主要由各医学院校自己组织的考试来决定，医学考试通常由各校各教研室自行组织，毕业时或阶段学习结束时是否要对学生进行综合性考试由各校自行决定。医学考试方法，自1982年卫生部组织13所医学院校医学专业毕业生统一考试中首先全部采用MCQ方法以来，各校组织的考试都在传统考试方式的基础上部分地采用MCQ为主要形式的客观考试方法。目前，少数医学院校还在开展以电子计算机模拟、录音、录像等为基础的考试方式的改革试验。

综观国内外医学考试方法的发展，由于各国教育制度和卫生管理体制不同，医学考试制度也不相同，但是，就多数国家来说，现行的考试方法均建立在Bloom等的教育目标分类学基础之上。

从发展趋势来说，由于MCQ考试技术的发展，认知领域的测量倾向于采用固定应答型(客观性)的和自由应答型(主观性)考试方法进行复合测量，以提高考试的可靠性和有效性。在各型多选题考试中，鉴于K型题具有较高的猜测得分概率，自1990年起，美国NBME已决定予以取销。

对实验室和临床技能的考试趋向于采用模拟病人、PMP、计算机模拟和客观的有结构的临床考试(简称OSCE)等客观性考试方法，以提高技能考试的可靠性。但是，根据Bloom等教育目标分类学理论，对医学生和医科毕业生的综合评价，应包括知识、技能和态度3个领域，但从各国现行的医学考试方法来看，如何评价学生的态度是一个有待开发的领域。

由于各种考试方法会影响到教学内容和教学方法的选择，因此，如何把考试方法的改革同教育过程改革联系起来是一个各国医学教育工作者普遍关心的问题。

。【参考文献】：

1 WHO. Technical Peport Series 608,Geneva,1977

2 Hubbard J P. Measuring Medical Education - the Teste and Experience of the National Board of Medical Examiners, 197.8

3 Hubbard J P, et al. NBNE.1985

4 张玉田，等编．学校教育评价．北京：中央民族学院出版社，1987

5 梅人朗，等编．医学考试的理论与实践，上海：上海医科大学出版社，1990

(上海医科大学陈刚、梅人朗教授撰)

上一篇：医学教育下一篇：现代科技综述大辞典上目录

分享到：

医学教育测量与教育评价

一周热点