【媒体观点】大数据预警是把双刃剑,如何用好就看这5点
大数据的发展为高校的管理决策提供了更多思路。在大数据预测性分析功能的开发上,高校规划好五个方面的工作,可以让数据为未来开路。
从大学生的食堂消费记录找出贫困生群体,从课程分数、挂科多少确认学生是否急需辅导,通过往届学生的入学情况预测今年的招生情况和调整招生方式——近年来,大数据在高校中的应用越来越精细化,高校管理者的决策早已不是仅凭经验或摸着石头过河,数据的预测性分析工作成为许多大学的必备之选。
省时省力、精准找到“病因”、辅助高校科学决策,有关大数据预测预警分析对高校提高教学质量和管理水平的好处已说得太多。换一个角度来看,发挥预警功能的大数据也是把双刃剑。若数据没有得到妥善处理和运用,高校不仅无法吸收大数据带来的好处,还会反伤其身。
新美国基金会(New America Foundation)今年上半年发布的报告强调了这一点。在这份名为《高等教育预测分析——五种合乎伦理道德的使用指导方针》的报告中,两位研究员指出,面对新形势下的压力和挑战,越来越多的高校利用大数据的预测性分析功能。但如果大数据预测分析的应用不加以限制,或者错误地将数据预测结果用于貌似合理的情境,会加剧教育不公,削弱教师教学,降低学生学习的质量,带来一系列消极影响。
注: 新美国基金会是美国一个非营利的公共政策研究机构。该机构关注的问题包括国家安全研究、技术、资产建设、卫生、能源、教育和经济等。该组织总部在华盛顿哥伦比亚特区。
为了避免这些意想不到的后果,研究人员建议,数据的预测性分析工作应从五个方面的使用指导方针出发,让大数据精准发挥功效。
确定目标与计划
为数据的使用确定目标及配套的计划方案,会让数据预测功能的发挥更有方向性。在这一初始阶段,召集可以起到关键作用的员工和利益相关者,让他们参与决策制定并得到他们的支持相当重要。参与决策的人员可以有学术办公室的教务长、招生办公室的负责人、学生事务的负责人、公共事务负责人、教师代表、数据分析人员、大数据供应商代表和学生代表等。通过倾听多方面的声音,让高校管理者在数据的运用上有全方位的考虑和把控。
在制定具体计划时,三个方面的因素需要被涵盖:
1.预测性分析的目的。数据应用计划应包括学校希望通过预测性分析解答的问题和想要达成的目标,以及使用学生和院校数据时会遇到的潜在危险。
2.使用预测性分析的非预期后果。计划中应包括学校和合作伙伴(例如第三方机构)对使用数据进行预测可能带来的任何意外后果进行的讨论,以及出现意外后果时考虑采取的补救措施。
3.可衡量的结果。该计划还应列出学校希望借由数据的预测分析取得的结果,该结果应当有衡量的标准。
搭建数据的基础设施
大数据的收集和运行少不了一个配套的支持性基础设施,但许多高校以前可能并没有以预测预警的用途使用大数据的经验。在搭建配套的基础设施之前,学校应与校领导、教职工和学生充分说明它的目的和意义,同时宣传部门理应发挥关键作用。另外,基础设施的搭建需要耗费巨大精力,技术、数据设备、人才、服务、资金等这些都不可或缺,学校需要权衡自己是否有能力承担所有的成本和风险。
一个结构完整的支持性的基础设施确保了数据收集、分析的有效运转,让部门间的数据结果共享变得简单,也让校内利益相关者对用于预测分析的大数据项目接受度更高。
确保数据的正确使用
如何让数据的使用合理且有效?首先要确保的一点是数据有足够高的质量回答学校预设的问题。“高质量”意味着不仅收集的数据要准确,并且对数据的考虑要全面。举例来说,早期预警系统通常会依据学生过去的成绩和其他趋势图表标记处于学业危机的学生。系统拥有准确的往期数据,但可能会丢失一些重要信息,例如学生的当前学业表现。而学生的当前学业表现有可能会成为是否应将一些“中危”学生划分为“高危”群体的关键判断因素。
其次,数据应得到精准解读。数据统计完毕后,数据分析人员会根据分析和预测的结果,对结果数据的数值大小或意义进行解释。这需要数据分析人员不仅有基本的解读能力,并且对学校的数据相当熟悉,能联系学校实际情况和大环境进行综合分析。
第三,确保数据的保密性。如何做到大数据采集分析与用户隐私保护的平衡一直是高校难以把控的问题。高校在数据的使用上应时刻保持警惕态度,让数据得到良好的保护而不被无关人士滥用。在数据的所有权和访问权限上,高校应有明确清晰的政策规定,例如:
1.学生顾问有权利查看他所负责的学生的表现情况分析数据。
2.教师除了有权利查看需要他们人为干预指导的学生学习数据,还有权利查看所有的在线学习系统数据。
3.校长和教务长可以访问经过提炼的高层次学生分析数据,以及剔除了个人身份信息的系部层面数据。
4.入学登记管理人员和财务人员在预测性分析数据的访问上具有排他性。
5.若学生无权看到总体的预测性分析数据,他们应被告知在访问个人数据上拥有怎样的权利。
第四,监测数据的安全性。安全隐患通常有着很长的潜伏期。随着高校在学生、教职工数据上的存储量越来越多,如何保证数据安全日益成为摆在高校面前的一个紧迫问题。对此,学校IT部门和大数据供应商工作人员都应严格遵守学生隐私的安全协议,监控数据库的安全威胁和潜在风险应成为高校的定期常规工作,对IT部门员工的定期安全培训也应成为学校的头等大事。
减少偏差
精确的数据结果和有效的决策,建立在诚实的预测模型和算法之上。高校在与设计预测性分析模型和算法的大数据服务供应商合作时,应充分强调这一点。有三类问题值得高校管理者思考:
●我们怎样处理预测性分析模型和算法产生的偏差?出现偏差后,我们是选择中断预测模型和算法的使用,还是考虑怎样缩短针对不同学生群体的系统干预措施间的落差?
●我们是否理解这些算法的工作原理和它们通过机器学习能自我完善的原理?
●我们和大数据服务供应商的合作标准是什么?在选择供应商时我们是否问了该问的问题,例如:你们公司的服务及产品怎样与我们学校相契合?你们公司如何确保数据服务的透明性?对统计出的学生数据结果你们将如何负责?
让干预措施更给力
分析数据结果,实施干预措施是高校应用大数据预测性分析的最后一个步骤。在这一阶段,仍有很多需要高校管理者注意的要点。首先,尽管预测性分析是辅助决策的强有力工具,但它也仅仅是高校工具箱里的一部分。高校管理者依靠大数据预测分析功能实施的系统干预和人为干预措施,需要与其他有助于学生成长的活动联合在一起,才能发挥综合作用。
其次,尽管高校在数据收集、预测模型和算法设计、人员培训上做到尽可能地完善,但错误有时也难以避免。因此,高校在对学生实施干预措施时需要非常小心,避免对学生造成伤害。当出现滥用学生数据或数据处理不当的情况时,学校应有对应的追责和制裁措施。
第三,在实施干预时,应注意沟通的内容和方式。一方面,高校在与需要被干预的学生沟通时应注意遣词用字,多使用积极正面的语句。另一方面,高校应确保目标学生群体能以多种方式接收到学校的干预措施和投放的资源,做到有的放矢。
结语
大数据时代,数据为王。每一所高校,无论规模大小,都在管理、科研、教学等多个环节持续释放着各类数据。中国科学院院士戴汝曾说:“我们已经拥有了的数据原材料基础,就是丰沃的土壤和富饶的金矿。但这些积累,必须要通过更好地运用大数据技术进行精耕细作和挖掘提炼,才能真正释放出海量数据巨大的内涵价值。”
在当前信息爆炸的形势下,国内已有华东师范大学等多所高校开始重视数据的预测性分析和应用工作,但大部分高校仍处在积累和查询数据阶段,并没有对数据信息进行大规模开发。由于缺乏接受过专业、系统的数据分析训练的人员,不少高校管理者和职能部门在收集、分析、解读和使用数据时往往“心有余而力不足”。
为满足众多高校对专业数据分析人员的需求,麦可思学院正式成立,愿景是“为高教管理培养数据分析人才,为高校职能部门培养专业化能力”。自2017年7月开班到9月,已经完成九场“高校管理数据应用分析”培训和一场“高校新生工作创新实务”培训,共有来自105所本科院校、73所高职高专院校的近350位管理者和教师参与了培训。如何加强数据人才培养,以正确的方向和形式,整合、梳理校内海量但零散的数据并进行预测判断,为教育管理和决策工作提供依据,这依然是值得高校管理者深思的问题。