2024T-EDGE文章详情顶部

别轻易相信AI颠覆人类,做高考题它们还是输给了中国考生

出人意料的是,这一次AI并没有全面碾压人类。阅卷结果显示,三组高考状元分别得分为146分、140分、119分,而Aidam为134分。

当 Alpha Go 又一次出招,三连胜中国围棋天才柯洁之后,或许人们担心的可能是,人工智能下一步又要在哪个领域干掉人类。

不过,在考试这件事儿上,经过了大量“学习”的机器人,也还是没能超越人类。不得不说,中国学霸实在威武。

昨天是2017年全国高考第一天,在当天的数学考试结束之后,一场人机高考大战的对决在北京上演了:在线教育公司“学霸君”自主研发的智能教育机器人“Aidam”首次公开亮相,通过现场直播的方式,与六名高考状元同台竞技今年全国卷文科数学试题,完成包括客观题和主观题在内的整张试卷,并按照评分标准得出最终成绩。

不过,出人意料的是,这一次AI并没有全面碾压人类。阅卷结果显示,三组高考状元分别得分为146分,140分,119分,而Aidam为134分,总分为150分。

在成都,“国家队”的成绩表现也不是很理想。由国家863计划 “超脑计划”牵头研制的“高考机器人”,成都准星云学科技有限公司研发设计的数学高考机器人AI-MATHS,在断网断题库的环境下,用时22分钟完成当天北京卷文科数学高考试题。

经过现场批阅,成绩为105分(总分150分)。之后,AI-MATHS再次挑战解答全国二卷数学卷,用时10分钟,考了100分(总分150分)。

AI-MATHS是由国家863计划 “超脑计划”牵头研制的“高考机器人”, 该“类人智能”项目于2015年7月21日由国家科技部正式启动。

在学霸君人机大战考试结束后的对话环节中,小组得分为119的2015年新疆理科状元多力岗表示,对Aidam的成绩有点意外,称“这个比赛结果和我们的预期还是有一定的差距,我们在比赛之后分析了一下,自己在一些细节或者在一些计算方面出了一些问题”。

当然,从接近的分数来看,这次Aidam虽然没有完胜,然而其在10分钟解题,获得了134分的成绩,也足够超越一大批考生。

学霸君首席科学家陈锐锋在考试比赛的现场解释说,Aidam解题主要分为三大步骤:

第一,把试卷题目变成机器可以理解的形式语言。

第二,在用形式语言完整描述了一系列环境之后,计算机就会在知识网络里启动搜索,确认题目触发了哪些知识点,然后进行一系列的推理,找出最佳解题路径。

第三,把解题的过程和答案,从形式语言转化为自然语言,完成解题过程。

而要实现这些,基础是庞大的数据库和人工智能领域多年技术的积累。从学霸君官方披露的数据来看,截至2017年5月,“学霸君”App已经积累超过7000万学生用户,累计已经解决问题100亿道,答疑命中率为93%。

那么,为何PK高考状元选择的是数学学科?

学霸君创始人兼CEO张凯磊说,“一千个人有一千个哈姆雷特,但是世界上只有一个勾股定理”。

数学、物理等理科类科目是强逻辑链路的,考点基本稳定,容易判定对错。同时,数学试卷中包括简单的选择题,也有复杂的需要解题过程的大题,非常适合测试AI。

学霸君创始人兼 CEO 张凯磊,他本人以高考数学和物理满分成绩考入南开大学数学基地班

对于机器人来说,形式化语言是自动解题的一大挑战,而目前数学学科最大的难点在于应用题的解题上,期间涉及到一些社会常识和文字性表述等。

在业内人士看来,让机器人参加高考,并不是项目的根本目标,只是其对于人类智能的一种模拟、扩展和延伸。目前来说,高考是一种衡量人的知识水平、理解能力、推理能力等相关智力水平的测试工具,其包含了对题目的理解、知识表现、逻辑推理等方式获得知识。

在接受钛媒体等多家媒体采访时,张凯磊表示,“实现个性化学习,大幅度提升学习效率和成果是学霸君研发智能教育机器人的初衷”。

张凯磊告诉钛媒体,中学期间大概有3529个考点、平均每个做3-4道题就够了,写1万道题目可以做完,但目前绝大部分学生面对的练习题有3万—4万,其中3/4的题目是不需要写的,75%的宝贵时间都被浪费掉了。

学霸君构建于深度神经网络的句法和语义分析器,在海量题库中不断强化和扩充训练。在K12中,有大部分的数学应用题,需要知识图谱和常识才能解决,学霸君构建的是一个真实题目海洋的模拟器,逐步提升其对于真实世界的接近程度。

基于人工智能的专家系统成就了精准推理。学霸君推进图像识别、自然语言理解、深度学习等人工智能领域的研究,并整合成为智能教育机器人。其在现有教育环境下,使机器判卷、个性化指导、个性化作业、教案改进等变成可能。

尽管如此,陈锐锋认为,即便是刷题,AI也并不能代替老师。因为,任何时候机器人都没有办法代替老师讲解。比如说,这道题为什么对,为什么错,解题思路为什么这么想不对,为什么那样想又是对的。但是,AI可以告诉老师说,这个学生的哪些知识点有问题,应该花更多时间在哪些知识点训练,而不是浪费在其他已经掌握的知识上。

值得注意的是,无论是作业帮、猿辅导还是阿凡题,目前市面上大部分工具属性偏强的题库类在线教育产品,一直都没找到盈利爆发点。张凯磊也向钛媒体透露,目前学霸君暂未实现盈利,但是已经开始实现了规模化收入。

据钛媒体编辑了解,“国家队” 还将在2019年和2020年参加高考。 作为“十二五”863计划信息技术领域“基于大数据的类人智能关键技术与系统”项目的牵头单位,科大讯飞方面表示,语文、地理、历史高考机器人将于2019、2020年参加高考进行最后的成果测试。(本文首发钛媒体,记者/李程程)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 虽然高考没有颠覆人类,但能考这么高分也足以说明很多问题了。人工智能也会在未来越来越影响我们的生活。以后说不定什么题型不会,直接问手机上的灵犀,siri这样的语音助手,就直接给出答案了。

    置顶
    回复 2017.06.08 · via pc
  • 伪AI罢了,不会训练和学习,只是搜索数据海量库罢了

    回复 2017.06.08 · via pc
  • 学霸加油,科教兴国。

    回复 2017.06.12 · via iphone
  • 研发水平还未达到一定高度,也就是时间早晚的问题!

    回复 2017.06.08 · via android
  • AI也有区别

    回复 2017.06.08 · via iphone
  • 别侮辱AI这个词汇

    回复 2017.06.08 · via android
  • 我们看一下时间哈。机器用了不超过一小时。学霸呢

    回复 2017.06.08 · via iphone
  • 只是技术上的问题和时间上的问题,模型和算法后期可以优化,现在这个成绩已经很理想了,未来定能超越人类!

    回复 2017.06.08 · via pc
  • 有一天,批卷老师会失业!?

    回复 2017.06.08 · via iphone

AWARDS-文章详情右上

10

扫描下载App