欢迎来到新航道广州学校官网!

资料申领 在线咨询 关于我们 课程中心 校区网点720°全景观校
新航道北京学校

400-660-2206

当前位置:首页 托福备考 托福口语机器评分机制是怎样的?

托福口语机器评分机制是怎样的?

发布时间:2021-07-28 关键词:

摘要:同学们在备考的过程中都会对它的评分标准进行一定的了解,口语作为我们的薄弱部分,它的评分标准自然也是受到了我们的关注。了解过的同学应该知道,ETS官方进行评分的时候,他们是结合人评和机评两种评分方式的结合,那么托福口语机器评分机制是怎样的?

同学们在备考的过程中都会对它的评分标准进行一定的了解,口语作为我们的薄弱部分,它的评分标准自然也是受到了我们的关注。了解过的同学应该知道,ETS官方进行评分的时候,他们是结合人评和机评两种评分方式的结合,那么托福口语机器评分机制是怎样的?

托福口语机器评分机制是怎样的?

2019年8月托福改革除了减少题目数量,缩减了考试时间之外,还有一个重大的改变就是托福口语部分的评分引入了机器评分,开始实施人工评分和自动化评分结合的评分机制。从官方的报告中可以发现此次自动评分系统使用的是5.0版本的引擎(最早口语自动评分的引擎是2008年的1.0版本),那个时候这个自动评分系统只用于托福考试的官方练习平台TOEFL Practice Online 中的口语练习的自动评分,并没有用于正式考试的口语评分;并且根据官方报告,真人评分和机器评分的相关系数已经达到了0.81,也就是说ETS觉得这个自动评分系统已经非常人工智能化了,可以用于真实考试的评分机制中。

从官方的第23页中的表格可以发现,机器评分主要可以评的部分是delivery(表达)和language use(语言使用)总共细分成20个小项,最终20个小项的系数加起来是1。每个小项所占比重不一样也就是权重不一样,系数越高也就表示权重越高,今天挑出几个权重较大的评分小项来分析一下,也指明了在实际口语练习过程中侧重点。

1、20项中权重非常大的一项--- Mean silence duration(平均沉默时长),达到了0.119也就是11.9%, 也是20项中一项超过0.1的影响因素,也就是说在托福口语回答中,不正常的停顿是负面影响口语分数最严重的因素,停顿的时间越长,停顿的次数越多,对分数的负面影响越大。

2、20项中权重第二位的一项--- Score point with the highest word CVA similarity score (单词的相似性) 权重是0.099。这一项指的是你的词汇量越大,在口语回答中能够适当的应用不同的词或者词组来表达同一个意思,那么分数就会越高。

3、20项中权重第三位的一项—Speaking rate in words per second(每秒平均的单词数),影响指数到达了0.097. 这里指的其实就是语速,在正常的情况下(强调),你的语速越快,分数就越高;相反,你说的越慢,分数就越低。再次强调并不是单纯的越快越好,你整体的回答必须是在正常范围内,让人听起来比较舒服的语速,让考官easy to follow, 而不是像机关枪一样。

4、20项权重位居第四位的一项--- Total acoustic model score for all words with model trained on native data, 权重是0.081, 这里的意思是评判考生的英文是否地道,这里的地道是从音上来判断,即发音/语音语调/节奏,越接近地道的发音,你的分数就越高;

除了以上权重大的四小项,后面其次分别是:Average of chunk length in seconds –平均意群长度;No repetitions--- 重复程度;Score point with the highest grammatical similarity score--- 语法的相似程度;total no different lexical types --- 词汇的多样性等等。

托福口语机器评分机制是怎样的就和大家分享到这里了,希望以上内容能帮助给为备考的同学在接下来的学习中有所帮助。

更多托福课程、雅思课程、雅思写作单项突破、留学规划、四六级课程、PTE课程、多邻国课程、A-level课程、GRE课程,或者有任何疑问,欢迎联系新航道广州学校。


意向课程
请选择您想学习的课程
留学预备课程
雅思IELTS
托福TOEFL
A-Level、IB、AP、BC、PGA
SAT/ACT
GRE/GMAT
SSAT/小托福
全封闭学院(住宿班)
出国留学
姓名
电话
免费领取