大数据能否预测高考作文题?押题到底靠不靠谱?

18.06.2014  12:47

  随着大数据时代的到来,用大数据预测今年的高考作文题成为不少信息供应商的噱头之一,其中以百度预测最为引人关注,其称押中全国18道高考作文题中的12道。到底大数据押题靠不靠谱呢?

   大数据库提供六命题方向

  今年高考前夕,百度预测推出了“高考作文预测”项目,记者登录百度预测网站,就可以打开“高考作文预测”页面,页面上出现一个类似蜂巢般的图表,分成六大色块,每一个色块都代表今年高考作文最有可能的命题方向,每个色块均有一个主题,并配有命中百分比数据的分析,包括时间的馈赠(28.61%)、生命的多彩(15.80%)、民族的变迁(14.99%)、教育的思辨(14.58%)、心灵的坚守(14.03%)和发展的困惑(11.99%)。根据这六大方向分别配有8~9个不同的关键词,点击这些关键词就会出现3篇例文,再次点击例文,就会和百度搜索联系在一起,直接查看例文和相关素材。

  根据这一预测,百度宣布这一预测项目成功押中今年全国18道高考作文题中的12道,如“时间的馈赠”,关键词为依旧和记忆,对应今年高考作文题中,江苏卷和广东卷的作文题目分别为“什么是不朽”、“胶片与数码时代”。而“生命的多彩”中,直接给出了关键词“自由”,几乎完全和今年上海作文题“穿越沙漠的自由和不自由”契合,而“青春”一词也在江苏卷中提到。百度预测方面认为,大数据命中率之高令人难以想象。

   挖掘8年海量数据做预测

  据百度大数据专家介绍,此次预测高考作文题是百度挖掘了近八年各个省市的高考真题和模拟题,并且结合了近些年的搜索风云热点和新闻热点数据,根据当年社会思想的关注与潮流,现有数据和实时数据相结合组成百度作文预测的大数据库,并在它们与高考命题之间建立关联;而后,百度大脑将前面提到的大数据进行智能分析,通过“概率主题”模型算法模拟人脑思维,反向推导出作文主题及关联词汇,从而进行主题预测,提供关键词、几率以及范题和素材。

  专家称,表面上看,命题者的思路千变万化,毫无头绪,但是一旦放到海量数据下面进行分析,命题的个人意志一定会受到社会各种因素和信息的影响,大数据预测者就是要找到这个可能影响命题者思路的变量因素,而这中间的规律和轨迹又不是个体命题者能够体会和察觉的。

   考生:上百范文等于没押题

  今年参加高考的考生小利也告诉记者,如果像大数据库这样提供了四五十个关键词,每个关键词又有3篇例文和大量素材,这样算下来就是100多道作文题,如果给你100多道作文题就不叫押题,直接叫复习而已,因为给出的可能性太多,其实可以忽略不计了,因为高三也会复习到大量作文题。

  中学老师陈庆雯老师表示,好题不怕押,押中完全一样的作文题的几率并不高,如果学生自己没有理解、分析能力,似是而非的去生搬硬套材料和范文,阅卷老师一般都能看出来,不但不会得到高分,甚至可能因为没有写出自己的真情实感而获得低分,不如扩大阅读面,储备更多的知识,这才是写好高考作文的制胜法宝。

  华南师范大学文学院教授柯汉琳表示,用大数据押题不但能让考生看到,也会让命题者看到,就算是沾边押中了部分关键词,能不能得到高分仍是未知数,这些年作文题思辨性越来越强,几乎难有标准结论和答案,即便是范文可能也会因为缺乏新意而无法得到高分。据《广州日报