下载此文档

中国历史上第一次对ETS记分方式的最科学、最详细解释.doc


文档分类:高等教育 | 页数:约4页 举报非法文档有奖
1/4
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/4 下载此文档
文档列表 文档介绍
中国历史上第一次对ETS记分方式的最科学、最详细解释.doc中国历史上第一次对ETS记分方式的最科学、最详细解释
    今天上网看见了TFSATKS的帖子:ETS对正态分布的最新解释。。。  ,里面有一句官方的对“正态分布”的解释:
ETS官方:考生的评分并不完全是按照回答对的题目的数量而决定,而是会根据所有考生在此题上的表现而进行相应的等值(Equiting)。因而有可能出现两人回答对的题目总数量一样,而所的分数不同的情况。
    帖子最后,TFSATKS同学提出了这样一个问题:大家看法怎样?关键是怎么理解“进行相应的等值(Equiting)。
    这个解释让我想到了心理测量上的一个基本概念——常态转化等距难度指数。可能因为大家平时接触的一些心理测验都不太专业,或者对心理测验的了解太少,所以觉得ETS的考试和心理测验相去甚远,但是事实上一套考试题目从某种意义上来说就是一套心理测验题。
一套托福试题就是一套心理测验
    要明白这一点,我们首先要明白什么是心理评估。心理评估指运用多种手段,从各方面来获得信息,进而对某一心理现象作全面、系统和深入的客观描述;心理评估是对心理品质水平做出全面的鉴定,常需要采用一套方法,包括非正式的评估方法(如观察法)和正式的方法(如晤谈、评定量表、调查表、问卷和心理测验)来进行,心理测验包括在心理评估之中。
    对某种语言的掌握无疑是一种心理现象,因此,对于测量英语掌握程度的托福考试事实上就是一套心理测验。
如何评价心理测验的质量
    一套心理测验是否有效,质量是否很好,我们需要用效度、信度等指标来衡量;而评估测验中各项题目的质量,我们则使用区分度、难度等指标。
    效度指的是一套测验是否能够有效测量我们要测量的心理量。比如说《比奈—西蒙智力量表》,这个量表有很多道题目,也有很多种测验方式,但是,通过这些题目和这些测验方式是否真的可以有效测量我们要测量的所谓的“智力”呢?同理,一套托福试题,是否真的可以通过那些题目和测验方式(阅读、听力、口语、写作),来有效衡量我们要测量的所谓的“对英语的掌握”这一心理量呢?
    信度又称“可靠性或精确度”,指在同一条件下,对相同客观事物测量若干次,测量结果的相互符合程度或一致程度,说明数据的可靠性。
    举个例子。我们先完全随机从同一个正态整体中抽出两组(AB两组)学生,每组各100人(假设这样的样本容量已经足够大了),从而每组学生都可以代表学生这个正态总体。然后,让A组和B组都做同一套英语试题,结果A组平均分是90分,B组平均分是30分,且统计学差异显著。那么,我们应该相信哪个平均分最能代表学生这个正态总体对英语的掌握程度呢?当然两个都不能,因为这套英语试题本身就有问题,因为它“不可靠”;如果它“可靠”的话,两组学生的平均分应该相差不大,更不会有显著的统计学差异。对于托福试题也是一样。假设一套题目,一次学生测量之后的平均分是90,另外一次平均分是30,还有一次平均分是50,且都差异显著,那么这样的题目对于测量英语掌握程度来说就是不可靠的,必须被淘汰。
    区分度就是一道题目对测试者的区分程度,和难度有关系,,区分度最大。具体的内容这里就不多说了,本篇主要要介绍的是难度。
    难度就是每道题目的难易程度,它用于评价每道题目的质量。难度和托福“惨案”的发生至关重

中国历史上第一次对ETS记分方式的最科学、最详细解释 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数4
  • 收藏数0 收藏
  • 顶次数0
  • 上传人changjinlai
  • 文件大小30 KB
  • 时间2018-09-14