机器人挑战高考数学告败 AI+教育还将如何进化?
2017-06-08 14:59:02

  6月7日,高考第一天第二场数学考试结束,场外,两名机器人“考生”的“应考”才刚刚开始。身处北京的学霸君智能教育机器人Adiam和来自成都准星云学的高考机器人AI-MATHS将分别完成不同体量的数学试题,他们的竞争对手,一边是往届优秀的高考状元,另一边是期望的110分。


机器人挑战高考数学告败 AI+教育还将如何进化?

  就在10天前,柯洁和AlphaGo的人机大战还在为人们津津乐道,2.0版本的AlphaGo随着算法的完善和自我学习的不断增强,犀利的表现依然令人类棋手惊叹不已。

 

  不同的是,AlphaGo专攻围棋,Adiam和AI-MATHS专攻数学。AlphaGo的难点在于自我的学习,通过与自己对弈积累经验,从第一步开始,它就在计算每一步的胜率,进而选择最佳落子位置。而研发考试机器人的难点在于,要让系统理解人类语言,后面做题的步骤反而较少。相比围棋的黑白规则、点位置规则和吃子规则,高考机器人在本地知识库和泛化知识库的大量规则要复杂很多。例如遇到不懂的生词,人类考生会结合上下文语境进行理解,但机器人就会因为“读不懂”而卡壳。

 

  最终,学霸君的Aidam用时10分钟完成答题,获得134分,三组高考状元分别得分119分、140分和146分,平均分135分,从分数来看,学霸还是在高考中扳回一局;另一款准星高考机器人AI-MATHS北京卷用时22分钟完成北京文综数学考试,得分105;全国二卷数学考试用时10分钟,得分100分,离预期的110分也还存在着差距。

 

  事实上,这并非机器人首次参加考试。2015年,来自日本国立情报学研究所(NII)研发的人工智能(AI)技术能在日本高考中考取511分的成绩,可被80%的日本大学录取。考试的内容包括数学、物理、英语以及其他科目。

 

  历年人机之战


  除围棋和高考外,过去二十年中,机器人还曾在国际象棋、电视问答节目和德州扑克等几个领域应战人类选手。

 

  1996年2月,国际象棋世界棋王卡斯帕罗夫就与IBM的超级国际象棋电脑“深蓝”展开了“实际大战”。6局比赛,深蓝最终以2:4落败。一年后,“深蓝”运算速度提高了一倍,达到两亿次每秒。1997年深蓝再战棋王卡斯帕罗夫,最终以3.5:2.5(1胜2负3平)获胜,成为首个在标准比赛时限内击败国际象棋世界冠军的电脑系统。

 

  2006年,浪潮天梭超级计算机挑战人类象棋大师的交战中,当时的中国象棋第一人许银川与浪潮天梭在巅峰对决中两战皆和。

 

  2011年,IBM的超级计算机Watson参加美国综合挑战节目《危险边缘》。人类选手詹宁斯和鲁特都是这个领域的顶级高手,前者曾创下连续74场赢得比赛的纪录,后者在比赛中共拿到325万美元奖金,但依然不敌Watson。比赛进行第三天,Watson以41413美元的分数锁定胜局,而两位人类选手分别仅获得19200美元和11200美元。

 

  2016年3月,在与AlphaGo的对决中,来自韩国的世界围棋冠军李世石以1:4告负;2017年3月,AlphaGo的升级版Master横空出世,通过下快棋连胜职业高手60盘;2017年5月23日—5月27日,柯洁与AlphaGo对弈共三局。最终比分比分3:0,AlphaGo胜。

 

  今年1月11日至1月30日,美国卡内基梅隆大学开发的人工智能Libratus(“冷扑大师”)与4名人类顶尖德州扑克选手展开“人机大战”。经过了为期20天,总计对战12万手牌的赛程,最终人工智能取得胜利。与之前和人类在棋类的竞赛中比拼智力不同,AI在德州扑克项目上挑战人类反映了AI更值得关注的进化方向,即在面对大量不完整信息时,机器的概率统计和运筹策略,以及巨大的信息处理计算量。

 

  1996年到2017年的20年间,多次人机之战从侧面印证了人工智能的进化历程:从计算能力超越人类到学会自然语言理解,再到深度学习并且掌握不完美信息的博弈能力,直至理解人类思考过程,以及处理信息的能力。

 

  切中痛点,辅助教学提高效率

 

  其实,早在高考机器人的概念成为热门关键词之前,针对各个专业领域知识处理的自动问答系统的研发,全球顶尖的研究机构已经有各类尝试。

 

  比如1984年启动的塞克(Cyc)工程,其目标是建立一个庞大的人类常识知识库,用于回答和解决一系列的科学和技术难题。2002年启动的ProjectHalo则是要研发一个科学知识库,用于回答学生或专业人员提出的复杂科学问题,ProjectAristo则致力于解答标准化考试问题。

 

  像所有考生不断做题巩固知识点和AlphaGo学习3000多万人类棋谱一样,此次参加高考的AI-MATHS也经过大量“刷题”训练,目前已训练500套、约1.2万道题。

 

  准星云学科技CEO林辉曾在接受媒体采访时表示:“高考机器人每天要‘吃’10套题,我们将考卷输入进去,机器人就开始做题,可以学习小学到高中的7000多个考点,运算量可达2的800次方。”


  对于此次结果,林辉表示很欣慰。AI-MATHS在完全掐断题库、断网、无人干涉、仅有11台服务器、1.2万道题小样本训练场景下的诸多限制下,机器人实现自动解题时会受到巨大限制,必须要求机器人能够完全理解题干,包括题干中的数字、名词等,同时也要能够读懂题意,否则,没有办法完成题目解答。“它不是题库,而是理解答题的逻辑。”这是林辉对数学机器人的解释。


  而在Aidam现场解题过程中,学霸君创始人兼CEO张凯磊介绍,机器解题分为三个步骤,第一步是通过句法解构、算式解构和主谓宾解构,转译为机器能看懂的语言,从而让机器读懂题目;第二步是激活神经元之间的连接,机器通过自动证明和推理,得出解题结果;第三步是将解题步骤和结果翻译为人类语言,展示给学生和老师。


  此外,科大讯飞也于2015年7月对外公布了“讯飞超脑”计划,并表示数学也是机器相对容易攻克的学科。为什么在很多考生看来更难学的数学对机器来说反而更得心应手呢?


  讯飞研究院院长胡国平认为,“因为数学更多的是依据符号逻辑。详细来说主要有两方面的原因,一个是数学题目的语言理解相对比较容易,因为都是一些比较标准化、结构化的描述语言或出题语言,所以机器较好理解;第二,几十年前就已经做得比较好的定理、自动证明等一系列的研究成果,也可以在高考机器人中发挥作用”。


  事实上,教育并非AI渗透的第一个领域,消费电子、电子商务、媒体、交通和医疗等行业都有人工智能的身影。而在教育行业,我们今天的教育模式同几个世纪以前相比几乎未曾改变,仍旧遵循着“讲台圣人”和流水线式灌输的教育模式。


  但随着优质教师资源的减少和课堂规模的增加,AI被寄予在提高教育质量和可负担性方面扮演着重要角色。当然,研发人工智能机器人并不仅仅是为了参加智力答题竞赛,高考机器人也并不是人工智能系统研发的最终目的。


  与人类PK不是最终目的,两家机器人的布局探索


  关于此次与高考状元的PK,准星云学和学霸君都表示,其目的不是为了与人类PK,而是利用高考机器人的技术辅助老师更高效地教学。


  据猎云网了解,不论是准星云学还是学霸君,经过多年的积累,如今在教育领域的尝试还不止于挑战高考。目前,准星已研发出了可自动批阅主观题的“准星智能评测系统”等AI教育系列产品。已落地的AI教育产品主要针对中学数学,大概涵盖几十个章节、四五千个知识点和考点。


  伴随人工智能技术的浪潮,准星积极抢占全球人工智能产业制高点。在教育领域,准星超前实现智能阅卷、自动出卷、个性化教学等教学环节,用信息化技术推动教育领域变革,更会利用准星的人工智能核心技术不断扩展、迁移,推动形成完整的人工智能产业链。


  同样,学霸君也在判卷、个性化指导、个性化作业、教案改进等方面有所尝试,如此前就曾推出了在线一对一辅导产品“君君辅导”。君君辅导采用了笔+本的智能套装:老师用智能笔在配套本子上所写的板书,可以同步显示在电脑屏幕的课件当中,学生可以在自己的电脑屏幕上看到老师的笔迹;学生作答时,笔记也会同步传输,在老师端实时看到。


  高考机器人能够完成自动解题意味着它在盲测场景下,具备感知分析、认知联想、推理验证的能力。因此,只要把题目和答案告诉机器人,它就会知道如何批阅,越到学生的作业和试卷,能标记出错误的步骤,进行批阅。


  场景下找需求,避免让AI沦为玩具机器人


  通过人工智能技术的引入大幅提升教学和学习的效率,然后提高教和学的效果,这是目前高考机器人的主要应用场景。因此可以预测,2017年,我们将看到AI在教育领域的更多应用,包括:


  1、能够批改学生文字作业的AI;


  2、回答学生问题的机器人;


  3、辅导学生的虚拟个人助理;


  4、提供身临其境动手学习的虚拟现实和计算机视觉;


  5、模拟和游戏化教学平台;


  当下,教育机器人存在以下几个方面的问题:


  首先,要尝试内容开发,避免沦为玩具机器人。早在教育机器人推向市场之际,娱乐性多于教育价值的声音此起彼伏。为了避免这样的窘境,不论是主打陪护的机器人,还是辅助学习的机器人,都开始尝试做内容开发。毕竟,教育机器人最重要的属性还是“教育”,确定好的教育定位、增强教育属性成为诸多教育机器人目前在深耕的方向。但目前所呈现的情况是,“教材”质量不高,大多属于”产品说明书“或”用户指南“式的,缺少课程与教学专家的参与和指导。


  其次,教育因为本身的专业性、系统性及教育机构的垄断性,很难立即打通,换言之,教育机器人的消费者与用户是割裂的,这也就铺开了面向B端市场和C端市场的两条路径。一方面面向学校等B端机构,希望成为教学辅助工具;一方面则面向家庭,希望在陪护和教育之余切入更多的服务空间。但国内教育机器人市场C端理念还不够成熟,市场目前仍处于培育期,不少C端产品不断死去,B端市场成为了教育机器人发展的关键之路,也成为了连接C端的重要衔接点。


  再次,一方面,越来越多的教育机器人瞄准幼儿市场,教育机器人教学走向低龄化;另一方面,儿童陪护机器人也在向更专业的教育方向开始延展。例如,360儿童陪护机器人在自身没有开发内容和课程的情况下,和悟空识字、数学王国等25家以上的内容方合作,将软件嵌套到机器人中,并根据机器人的属性进行适当调整,如学画画等就会利用机器人独有的AR幻镜进行交互式教学。


  当然,各种政策也在暗示着这个领域蕴含着多重潜力。例如,去年9月份教育部发布的《关于“十三五”期间全面深入推进教育信息化工作的指导意见(征求意见稿)》中,明确提到学校要探索STEAM教育、创客教育,这为教育机器人的学校普及做了铺垫,都将在一定程度上让更多的学校拥抱教育类机器人。


  此前,在与柯洁三番棋对弈完胜之后,谷歌Deepmind团队表示,AlphGo将正式封棋,并停止其在围棋领域的开发,将更多精力放在AI的快速落地上。人机围棋之战的落幕开启了机器人在更多实用领域的探索。


  Adiam和AI-MATCH今天的高考成绩只是机器阶段性的成果,尽管和最优秀的人类考生相比还有距离,但它并非要做一架“考试机器”,而是为了“辅助”和“提效”——随着学校和大学在不断开发在线战略、寻求降低成本和改善产出的机会,AI在教育中的应用度还将继续上升。


    推荐阅读:彭博专访tutorabc:以人工智能打造在线教育的未来


热线电话:010-84921764
邮箱:372156937@qq.com
地址:北京朝阳区双营路美立方4号楼3单元1105
Copyright 2014-2017.智云凌飞(北京)科技有限公司 版权所有 京ICP备15011506号