教育大数据挖掘及挑战
- 来源:中国信息化周报 smarty:if $article.tag?>
- 关键字:教育,大数据 smarty:/if?>
- 发布时间:2016-10-25 10:30
教育大数据技术对教育的管理、教学、学习、科研和评价等都产生了很大的影响。
教育大数据的业务分析
■教育大数据对教育管理的支持
将更加依赖于数据和分析,而不是直觉和经验;同样,教育大数据还将改变领导力和管理的本质。服务管理、数据科学管理将取代传统的行政管理、经验管理。技术不断发展,教育数据挖掘与分析不断深入,不仅要着眼于已有的确定关系,更要探寻隐藏的因果关系。利用大数据技术可以深度挖掘教育数据中的隐藏信息,可以暴露教育过程中存在的问题,提供决策来优化教育管理。大数据不仅可以运行和维护各教育机构的人事信息、教育经费、办学条件和服务管理的数据,而且可以长期积累所有类型教育机构的数据,利用统计分析、应用模型等技术将数据转换为知识,最终为教育者和学习者提供科学的决策。
■教育大数据对教学模式的支持
教育大数据推进实现智慧学习。教师在智慧教学环境下,利用大数据技术可以更深入了解每一个学习者的学习状况,并且与学习者的沟通更加通畅,教师的整个教学过程和学习者的学习过程更加精准化和智能化。教师对教学过程的掌握从依靠经验转向以教育数据分析为支撑,学生对于自己学习状况的了解从模糊发展到心中有数,可以更好地认识自我、发展自我、规划自我。大数据技术可以帮助教师及时调整教学计划和教学方法,有利于教师自身能力提高和职业发展。
■教育大数据对个性化学习的支持
除了学生学习的行为可以被记录下来外,在学习资源上的数据也可以被精确记录下来,如点击资源的时间、停留多久、问题回答正确率、重复次数、参考阅读、回访率和其他资源信息,通过大数据可以定制个人学习报告,分析学习过程潜在的学习规律,还可以找到学生的学习特点、兴趣爱好和行为倾向,并对教育状态信息一目了然。大数据技术使教育围绕学习者展开,使传统的集体教育方式转向为个性学习方式。
■教育大数据对教育评价的支持
教育评价正在从“经验主义”走向“数据主义”,从“宏观群体”评价走向“微观个体”评价,从“单一评价”走向“综合评价”。教育大数据下教育评价的变化,不仅表现在评价思想,还包括评价方法,不仅包括对学生的评价,还包括对教学管理、评估质量等具体水平的评价。教学评估不再仅仅是由考试成绩和纪律帮助教师评价主观传统意义上的感受,而是由大量的数据感知得到,为实现教学评价的公正提供了依据,优化了教学方向。教育评价可以是多元化的,而不是仅停留在知识掌握程度这一单一维度。
■教育大数据对科学研究的支持
教育大数据使得从追求单向因果性转向追求复杂的多元相关性,并用直观的图形等表达方式体、系统、清晰、简洁地展现。这种新理念、新思维的创生,是实现教育创新和发展不可缺少的手段、工具和方法论。教育大数据时代,科学研究将从随机抽样、探讨因果关系走向全部数据、寻找相关关系。大数据技术减少了研究资金的浪费,在某些问题上,数据分析为研究人员提供了个性化的服务,可以提高研究的效率和成果的可靠性。大数据依赖于自动、连续的记录和搜集的数据比传统调查数据更加客观和中立。大数据还将改变传统学术研究的过程,信息系统依赖于自动同步,连续获得持续的行为数据,这意味着学术研究和信息技术、课题研究与实践联系在一起。
教育大数据转换层次模型
教育大数据具有转换层次的四个过程特征:数据、信息、知识、智慧。教育大数据技术采集的海量教育元数据,经过抽取、转换、加载,联机分析处理和统计分析等过程,转换为教育信息,又经过数据可视化将教育数据呈现出来,最后形成教育决策来指导教育者和学习的教学,这个过程数据完成了从数据到信息、知识和智慧的演变。目前在教育大数据领域中有很多研究领域,比较主要的是数据挖掘和学习分析。两者既有相同之处,又存在一定差异。
■教育大数据和数据挖掘
在大数据时代处理数据理念上有三大转变:抽样到全体、绝对精确到效率、因果到相关。大数据时代的数据挖掘继承于传统数据挖掘又不同于传统数据挖掘。首先是分析对象不同,传统数据分析的对象是在已知的数据范围中易处理的数据,而基于大数据的数据挖掘对象时包括非结构化数据的全部数据,不能保证原始数据是完整的、清洗过和没有错误的。其次是分析基础,传统分析是建立在关系数据模型之上的,是在系统内就创立的主题之间的关系基础上进行的,而在大数据分析中,绝大部分分析基于纵裂数据库之外。再次是分析效率,传统数据处理过程中需要等待抽取、转换、加载等工作完成。而大数据分析是对数据进行实时分析。最后是硬件差别,在传统数据处理中所使用硬件比较昂贵。而大数据处理过程加入了对分析软件的使用,所以硬件成本较低。
基于教育大数据的数据挖掘过程即将学习结果、学习内容、学习资源与教学行为等教育原始数据使用多种技术,如聚类、关系挖掘和模型构建等,最终达到预测学习者发展趋势、促进有效学习的目标。
教育大数据公认的特征之一是规模性,面对海量数据,可以采取分布式文件的系统进行并行运算。对于半结构化或非结构化的数据,可以采用自然语言理解和信息抽取等方式将其转化为结构化数据。对于杂质较多的数据,可以在数据挖掘时进行数据清洗。对于实时产生的数据可以使用自动获取效率优先的方式来采集数据。
■教育大数据和学习分析
新媒体联盟将学习分析定义为:利用松散耦合的数据收集工具和分析技术,研究分析学习者学习参与、学习表现和学习过程的相关数据,进而对课程、教学和评价进行实时修正。总之,学习分析运用多种方法采集、存储和分析学习者数据,如移动终端的数据和现场智能数据等,再使用多种技术来分析处理这些数据,最终应用于教育者和学习者,产生评估、预测和干预。
教育大数据学习的具体应用体现在评估、预测和干预。评估是指基本统计分析及其可视化、发现问题学生、学生社交网络分析与应用,预测是指学生分类、学生模型的构建、预测学生成绩,干预是指对教师的教学方法提供改进意见。除此之外,大数据在学习分析中的应用还包括学生分组与协作、社交网络分析、开发概念图、课件制作、规划和调度等。
教育大数据的进一步挑战
■教育大数据的技术挑战
教育大数据在实际应用存在很多技术瓶颈,如:在数据的采集时数据挖掘和学习分析的重要环节,在这一环节有很多技术挑战;面对海量教育数据,数据的存储、处理和分析都存在技术考验;另外由于目前没有统一的数据规范,不同系统之间的兼容也是一大问题。从全局考虑,我国的教育大数据系统应遵循顶层设计原则,由教育部对数据格式、数据存储等问题制定统一规范,下级企业、学校按照统一规范去设计自己的系统,这带来了新的技术挑战。
■教育大数据的安全与隐私挑战
在伦理道德方面,教育大数据面临着数据安全与保护隐私的挑战。教育大数据不仅是一种宝贵的教育收益,而且有关学习者和教育工作者的隐私权,其潜在的安全和隐私甚至是无法用常用办法评估出来,甚至无法通过独立的方法进行评估。如果教育大数据处理不当将导致严重的安全漏洞,甚至是影响区域教育政策的制定。教育数据所有权究竟属于学习者还是运行平台或是双方共享,这是互联网教育和教育大数据发展所面临的必然问题。如何保证所有权归属、如何判定所有权归属,这些仍是需要深虑的问题。
■教育大数据的价值挑战
教育大数据技术挖掘出教育数据的巨大价值,但是数据的权属问题不是传统的财产、知识产权等可以涵盖的,数据成为国家间争夺的资源,人口红利、地大物博、经济实力、文化优势等都体现为数据资源储备和数据服务影响力。
教育大数据是一种无形资产,国家应当保障教育大数据不外泄并不被恶意使用,而且还要兼顾部分数据向公众开放,发挥其应用的社会价值,做到适当的综合评估来进行价值平衡,这也是前所未有的一种挑战。
■首都师范大学 杜婧敏、方海光等