首页>会议文档 >

苗广艺 - 人工智能技术如何在教育行业落地

page:
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地
苗广艺 - 人工智能技术如何在教育行业落地

苗广艺 - 人工智能技术如何在教育行业落地

所属会议:GIAC 2017全球互联网架构大会会议地点:上海


下载

手机看
活动家APP客户端

扫二维码下载
或点击下载
Android iOS

9536次
浏览次数
GIAC 2017全球互联网架构大会所有文档 毛茂德-阿里智能运维平台如何助力研发应对双11挑战_部分1 毛茂德-阿里智能运维平台如何助力研发应对双11挑战_部分2 jolestar 王渊命-如何利用+Kubernetes+建设+AI+时代的+DevOps+平台 曾勇 - Elastic Stack- Past, Present, & Future 滴滴出行 梁李印 - 滴滴实时计算平台架构与实践 董西成 - PB级Hadoop集群跨机房迁移实战 刘洋(炎寻) - 蘑菇街作业调度系统Jarvis的架构与实现 hai lu - 领英对实时流计算的应用和探索 洪倍-软硬兼施:分布式高速缓存和流式计算架构设计 杜修文 - 预览新世代MySQL 8-0 张文升 - Happy Hacking in Tantan Using PostgreSQL - PostgreSQL in Tantan 姚捷 - 秒级监控时代-GIAC(公开版) 杨保华-区块链到分布式账本 张晓通-壹钱包架构演进之路 赵文乐-互金企业如何运用技术解决发展和合规的挑战 袁进辉 - 深度学习平台技术演进 58速运 沈剑 - 头疼,技术 leader 怎么定量化 KPI 饿了么 史海峰-不忘初心,中级领导力修炼 沪江 余晟-要“蜕变”不要“退变”——成为合格技术领导者 特赞科技 黄勇 - 工程师择业之道 廖雄杰 - APM全栈性能监控实践 陆传胜 - bytecode dance 肖桦 - Java Tuning Guide 杨大鹏 - APM系统构建与应用 360 王浩 - APK行为监控与分析 白山云科技 丛磊 - AI重塑Web安全_部分1 白山云科技 丛磊 - AI重塑Web安全_部分2 刘明浩 - 金融科技分布式安全架构 郭扬 - 持续集成技术实践 何勉&洪永潮 - 度量引导的持续交付和敏捷实施 姚延栋 - Greenplum机器学习工具集和案例 李远策 - XLeaning:360深度学习调度平台架构设计 腾讯 黄明 - 进击的巨人:基于Angel的高维度Online Learning 谢孟军 - 微服务和Go语言的应用 杨晓峰 - Java9-In-Practice bilibili 毛剑 - B站微服务链路监控实践 陈皓 - Cloud Native 云化架构_部分1 陈皓 - Cloud Native 云化架构_部分2 吴疆 - Microservice 在 Cloud Foundry 的应用 邢海涛 - 微服务和K8s集成探索实践 jiangjie qin-Auto Management for Apache Kafka and Distributed Stateful System in General 阿里巴巴 马昕曦-Dubbo 的过去、现在以及未来 携程 余昭辉-去哪儿网消息中间件演进 阿里巴巴 姜天意-基于bpmn流程引擎驱动的前端研发平台 百度 彭星-基于 Vue 的 PWA 解决方案——开源 Lavas 项目案例 饿了么 邓钢-前端生产环境部署 ES6 代码 360 董福源 - Android框架虚拟化实战 滴滴出行 戴铭 - Swift 将 Web 代码转成60帧满帧原生应用的方案及实践_部分1 滴滴出行 戴铭 - Swift 将 Web 代码转成60帧满帧原生应用的方案及实践_部分2 极光 王可为 - 极光Android SDK架构演进之路 阿里巴巴 邹迪飞 - 移动应用高可用技术探索 华为 杜玉杰 - 物联网操作系统漫谈 映云科技 李枫 - 基于 EMQ 开发千万级 IoT 平台架构实践 云吧 张虎 - IoT:海量设备的连接和安全 饿了么 吴俊龙&严佳奇 - 饿了么全链路压测的实践与体系建设 京东 张琪 - 质效合一----驱动质量团队提效之路 腾讯 何纯 - 基于真实用户体验的实时监控和优化 宋子豪@Mesosphere_ 容器行业存储标准CSI与Apache Mesos 网易云 赖冬林-Kubernetes 网易云 性能优化实践-Final_部分1 网易云 赖冬林-Kubernetes 网易云 性能优化实践-Final_部分2 俞圆圆 - 电竞数据的容器实践 — serverless的电竞数据计算平台 鸟哥惠新宸-The Next G of PHP

文档介绍

随着人工智能技术的火热,人工智能在各行业开始落地,产生了很多AI+行业的案例。学霸君定位是一家教育公司,在教育行业的多个业务场景中都使用到了AI相关的算法,例如:利用图像和OCR等算法制作智能题库,利用手写识别和自动解题技术代替老师由系统自动批改作业,利用知识图谱和学生行为数据做到个性化学习,等。未来教育行业与AI技术结合可以做到更多之前做不到的事情,甚至改变教育的模式。

演讲实录

今天我分享的主题会和人工智能相关,虽然学霸君做的也是人工智能方面的事情,但我们的定位是一家教育公司。刚开始,我们想定位为一家做教育相关事情的技术公司,但在做的过程中也发现,如果对教育行业的了解深度不够的话,那么一些人工智能技术就始终没有办法落地,于是公司做了战略调整,转变为一家教育公司。

学霸君是问吧科技最早做的一款软件,这款App主要面向中小学生用户,通过这个APP学生可以搜索一些题目的答案和了解解题过程。在早期时候,学霸君App还比较简单,学生如果遇到不会做的题目,对着题目拿手机拍照片进行搜索,然后App就可以告诉学生题目的答案和解题过程。虽然有很多人在用,但这款App始终只是一个工具,离教育的业务还是比较远的,并不够完整。因此,我们在之后也尝试了各种业务,第一个业务就是实时答疑,这有点像现在的滴滴打车软件的特点。

我们发现,很多学生在获得题目的答案之后,还希望有老师能够讲解解题的过程或者如果有疑问可以寻求老师帮助解答,学生可以对着题目用App拍照,点击呼叫老师,然后题目会被发送给全国各地的老师。在这背后实际上是有一套算法的,首先需要识别出图片上面的文字,分析出图片上面的内容属于哪一个学科、哪一个年级、哪一个知识点。然后,根据题目的属性推送给合适的老师。老师可以抢单,抢单之后,学生和老师就建立了连接,并且通过语音的方式进行交流。

同时,我们还推出了一款智能笔,老师可以把纸上写的字实时传输到学生手机上面,这样可以实时地在学生的屏幕上进行展示,通过这个手段学生可以快速地了解这个题目的解题过程。但是,我们在做的过程中发现有两个因素没有考虑到:第一个因素是学生本身是没有钱的,学生的花费需要问家长要,因为在这个付费过程中增加了一个人的环节,导致付费意愿下降,因为有很多学生并不愿意问家长要钱。另外还有一个因素,在中国人的传统观念里,大家会觉得老师应该是给学生免费解答问题的,收费会让家长和学生觉得不舒服。

因此,也在这样的因素之下,我们推出了“君君辅导”业务,这是一个在线的1对1辅导,现在已经改名叫“学霸君1对1”。我们发现学生和家长家还是相对比较认可花钱听课的模式,我们也发现通过技术手段,线上1对1的辅导可以做到和线下辅导类似的效果。为什么选1对1的模式,我们认为线上的大班课在教学效果上不太好,因为线上班课对学生没有约束力。但是1对1的辅导场景下,老师是和学生面对面的交流,有实时互动,有实时的笔记和实时的PPT,可以做到线上效果和线下效果几乎类似的结果,同时也把一些成本降下来。

在面向B端的业务方面,我们推出了AI学这样的一款智能教学系统。这个教学系统是面向学校的,老师和学生用我们系统进行上课和考试。校外的学习场景只是学生在学习时间花费上相对较少的一段时间,学生学习的大部分数据而是通过校内产生的,并且教育行业关键的几个角色都是在校内市场,比如说老师、校长等等。我们认为,只有把服务校内的市场做好了,才能真正把教育做好,我个人觉得校内市场是以后更大的一块空间。

在校内市场,需要关注国家政策,今年国内人工智能很火热,国家也很关注,推出了一些文件支持人工智能的发展。尤其是今年7月份,国务院印发了新一代人工智能发展规划,明确提出要把教育和人工智能提升到一个国家战略的高度。

除了关注政策还要关注市场,校内市场比较大的一块就是教育信息化。教育信息化是几年前开始提出的,是把学校的传统课堂转变成利用信息化手段教学的方式。虽然国家投入了很多钱,但是大家并不清楚应该怎么做教育信息化,尤其学校里面老师、校长不懂技术,也不懂教育信息化,虽然很多产品被卖到学校,但是没有真正用起来。但是经过几年的发展,也带来了相应的变化,首先,现在大部分的学校里面都通了互联网,学校网络正在陆陆续续建设起来。另外,现在学校老师、家长、校长等都对教育信息化产品有了一些了解,有了初步的分辨产品好坏的能力,整个市场有了基本的环境。

站在现在这个时间点往前看,尽管我们已经做了一些教育信息化的事情,但还都是一些比较简单的事情,我们将这称之为辅助教学时代。比如说学校里面配个机房,但是使用率很低的。或者学校里布设了网络,但是老师也只是偶尔上网。现在学校正面临更大的变革,一个来自人工智能、互联网、大数据等一系列技术来推动的变革,这些可能对学校教育模式发生根本的改变。我们现在正好站在这个分水岭的时间,可以说教育信息化的时代已经来临了。

大家都知道题库是非常关键的,问吧科技从一开始就在做搜题和积累题库的事情。目前为止已经有了八千万量级的题库,但仅仅有题库量还是不够的,还要有题库的质量,我们需要智慧化的题库。对于大部分教育公司,一张卷子的题目在题库里面存储就是一个字符串,但我们人眼看到这样的卷子和题目,在脑中反射出来的不仅仅是一个字符串。比如我们可以知道一道选择题有几个选项,每个选项考点是什么等信息,在人类的大脑里可能是更加高维抽象的信息。因此,我们需要题库也有这样的能力。对于一张试卷,我们需要通过一系列的算法进行处理,可以通过版面分析知道卷子的结构,知道每个题的结构是怎样的,这道题又包含了哪些小题目,题目的选项是什么。从而进一步识别和知道每道题的内容是什么,还需要将题目中的公式识别出来。在经过这些处理之后,就可以实现普通的试卷输入题库之后输出的是结构化的题目。

结构化题目除了能解析出题目的结构外,另一个比较重要的特点是所有的公式都是LaTeX化的。一般来说,多数题目的公式都是很复杂的,很难处理,只能被截成图片保存在题库里面。但是我们的题库会把公式识别成一个真正的表达式。LaTeX是一种排版格式,它可以把公式内容描述出来,这样题库就可以读懂这道题目。当我们需要展示题目的时候,只需要把LaTeX的这一串代码渲染出来,通过渲染算法就可以变成最终的题目形式。这样的好处是题目的表达比较美观,而且在所有平台的展示都会比较好,更重要的一点是可以对题目进行识别,当机器读到LaTeX这个结构的时候,机器是可以读懂题目意思的。

目前,所有的题库都是我们自己生产的,我们需要将试卷和课本进行扫描并录入到系统,这是一项庞大的工作。我们可以通过算法进行自动识别公式、自动对格式进行切分,大大提高了生产效率。这个过程中人需要做的只是最终的确认,如果有问题需要局部修改也会更加方便。

另外一块我们要解决的问题是学生数据输入的问题。因为要把学生的数据收集起来是很麻烦的,特别是平常的日常学习的数据是很难收集的。我们现在的解决方案是点阵数码笔,这是一款带有蓝牙设备的笔,配有高速摄象头,学生在写字的时候摄像头会采集、识别学生的笔记,把学生的笔记实时地通过蓝牙传输到所连接的设备上。这样,学生每天写作业的数据就可以实时地收集到系统里面,并且每天都可以使用。这是学校学生在使用的场景,学生有一个这样的Pad,Pad上面告诉他这道题的题目,他在本子上面一步一步写,答案传输到这个Pad上面,然后到系统里面,收集到学生的学习数据。因为这个笔和正常笔没有什么区别,其实是可以日常每天用的,平时做作业、考试都是可以用的。在学校里面,很多学校日常每天都在用我们的笔了。

另外这中间还用到手写识别的技术。当拿到学生做的每道题答案之后,我们需要进行版面处理,最后形成系统里面有意义的文字。这样可以把学生做的作业内容转化成有价值的字符串数据。在识别的应用方面大体上有中文识别、英文识别、公式识别几种。特别是公式识别,需要采集大量的数据进行标注和学习,可以让识别支持所有学校学习场景下的所有数据的识别。我们在文字识别方面已经有了4年多的积累,我们开始做拍照搜题应用的时候就用到了文字识别技术。当时主要是印刷体文档的拍照识别,再后来开始做扫描的书本识别,后来开始做手写识别,这些技术之间是有一定的关联性的。

有了上述的这些技术,学生作业的数据就可以被收集到并且可以进行识别。今后,我们可以让机器自动批改作业,老师的参与程度会进一步降低。除了手写识别之外,我们还要知道每道题的步骤、关键点。这就涉及到了另外一个技术:自动解题。

在2017年6月高考当天,学霸君的高考机器人和学生一起参加了高考,在高中数学科目中得到了134分,我们的平均分和高考状元的平均分差不多,这是人工智能技术在教育行业的突破。高考机器人会识别出若干知识元,是描述一个知识点的最小单位。知识元是通过技术和教研老师来定义的,通过知识元知道这个题目考了哪些知识点。在题目的每一步解答过程中,用到哪一个知识元也会输出来,我们就知道了每个步骤是用了什么知识点解答出来的。高考机器人的页面背后是连了我们的服务器集群,也就是高考机器人的大脑。通过高考机器人可以分析出每道题考了什么知识点,并且这些知识点是有关联关系的,它们之间也是有互相依赖路径的。机器人分析出这些题的知识点,可以进一步分析学生的学习情况。我们可以把初中、高中所有学科的知识点记录在数据库里,形成一个网状结构。一个知识点可以关联到另外一个知识点,这些都是在数据库里有记录,也就形成了所谓的知识图谱。在有了知识图谱的体系之后,我们就可以做自适应学习的尝试。

当我们获得学生每天作业的情况和不同学生做每一道题正确与否的数据,通过模型进一步分析,可以分析出每道题对应的难度,知道题目的难度等级。因为对于每个学生来说,同样的题目,对于不同的学生的难度是不一样的。有了这样的属性,我们可以让学生有选择性的做题目,学生所做的练习题都是不一样的,可以根据目前掌握的知识点情况进行做题。我们既不会给学生分配一个特别难的题目,也不会分配一个特别简单的题,我们给学生分配的题目是学生有一半概率可以做对的题目,在这样的学习区间的范围内,可以保证学生学习效率是最高的。

由此,我们可以达到一个效果,即每个人的学习路径是不一样的。当学生做完一道题目之后,我们会根据学生的情况定制化地分配下一道题,每个人都在走不同的学习路径,这些都是个性化和定制化的。

目前,我们现在已经覆盖了校内学习的几乎所有场景,包括课前预习、课前导学、课堂互动、课后作业、考试、小测验、回家的自主练习等等。这些场景中,我们运用了大数据、人工智能相关的技术,这些技术最终落地服务了教育场景。在我们服务学校的过程中,我们发现了许多痛点并基于这些痛点寻找解决方案,然后用技术达到智慧教学的目的。

×

打开微信扫一扫,分享到朋友圈