关于大数据条件下行车班前预想重点卡控可行性探讨

  【摘要】班前预想是提高作业效率,降低违章、违纪的有效手段。当前的班前预想只是简单地根据天气、班前计划、调度命令等条件提出卡控措施,而忽略了以往的在相同情况下发生违章、违纪的经验教训,尤其未考虑特定时间与发生违章作业之间的相关关系。本文利用大数据理论,通过统计某一时间段内发生违章作业的概率分布,找出发生违章概率大的时间段,并进行重点卡控,可有效降低此违章的发生率。

  【关键字】大数据;班前预想;分布统计;重点卡控

  1.引言

  班前点名会是车间各班组考勤考核、技能培训、任务布置、班前预想的重要过程。它不仅能记录各班组的人员到场情况,而且可以通过班前技能培训,提高职工的业务水平能力。任务布置主要是根据班前计划、调度命令、施工计划等筹划班组作业,精心配合,完成任务。班前预想是针对任务布置过程中遇到的重点、难点进行提前考虑,透过班前预想可对存在很大发生概率的违章作业提前卡控,重点提醒,降低发生概率。但是目前的班前预想只是简单地根据天气、班前计划、调度命令提出卡控措施,忽略了在相同条件下发生违章、违纪的经验教训,以往大量的数据没有被有效的利用。本文通过全样本数据统计,并采用大数据算法对以往违章事件进行更新,实时对特定岗位进行违纪分析,并得出针对特定时间特定岗位的卡控重点,以此来降低违章、违纪发生的概率。

  2.大数据挖掘分析

  为加强铁路行车正常化管理运作,包括铁路总公司(简称铁总)、路局会对工作班组效果进行发卡考核,并对问题原因进行分析和整改。同时各个站、段以及行车班组也会对行车安全进行监督,对不合规定的行为提出建议并限期整改。问题涉及工作生产的各个方面,数据呈现出非结构化、量大和处理难等特点。

  2.1大数据的概念

  目前,对于大数据的概念,还没有统一的定义。根据大多数学者的认为大数据是指无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量复杂数据集合[1]。大数据并非产品也不是技术,只是数字化时代的一种现象。而且,以战略眼光分析大数据可得出,大数据不单指其庞大的数据量,还包括如何用专业化方式处理这些数据。大数据不但包括大数据技术、应用还包括大数据科学以及大数据工程。在大数据时代,如何深层次开发大数据并提供相关服务能力将成为竞争的关键[2]。对行车进行监管的数据非常庞杂,结构形式不统一,直接取得应用效果不明显。利用大数据技术铁路行车班组能够对监管数据建立实时或准实时的采集、监控机制,对日常生产的要求提出卡控措施。通过深入挖掘一段时期内的行车各岗位存在的问题,收集、评估岗位在班中可能将发生的情况,提出对特定岗位重点卡控的措施。

  2.2数据挖掘的功能和应用

  数据挖掘是大数据时代的关键技术,是指从非完整的、海量的、有噪音的、模糊且随机的数据中挖掘隐含在内且人们未提前得知的有用信息的过程。一般,数据挖掘的功能有两类,即描述和预测[3]。描述性挖掘用于展现集体数据的一般特性,而预测性挖掘用于推算处理数据,完成预测目的。数据挖掘功能同目标数据的类型有关,有些功能适用于不同类型的数据,有些功能则只适用于某种特定数据。数据挖掘功能能够让人得知未知信息,提升数据价值,从而应用到了不同领域。大数据可以发现事物发展潜在的规律,具有某种意义上的智能性。它不关注于事物发展的因果关系,而专注于从事物中得出相关关系获取价值。比如日本先进工业技术研究所的坐姿研究与汽车防盗系统,这个系统可根据人体对座位的压力差异识别出乘坐者的身份,准确率高达98%。这是把一个不被认为是数据、甚至不被认为和数据沾边的事物转化成了可以用数值来量化的数据模式[4]。

  3.大数据下制定行车重点卡控措施流程

  通过分析研究行车岗位发生违章、违纪与发生时间的相关关系,利用大数据理论分析方法,找出各个岗位在一定条件下容易发生违规作业的时间段,监管人员要重点卡控,及时提醒,降低发生类似事件的概率。

  3.1大数据的采集和处理

  为加强铁路行车安全,路局各部门都会针对特定问题对站段进行检查,并提出合理化建议,督促各单位按期整改,很大程度上提高了各站段的管理水平和职工的作业能力。站段也会依据路局要求针对本单位的特点对科室、车间进行发卡考核,从违章、违纪、管理等各方面指出存在的问题。这些问题在整改后,作为闲置的数据没有被很好的利用。并且在一段时间内,数据呈现出量大、非结构化和难处理的特点,完全分析数据变得几乎不可能。通过大数据理论算法,可以利用数据得出有利用价值的事物之间的相关关系。

  3.2行车岗位发卡统计与发生时间段的相关关系

  每年有关行车问题的信息多达上万条,其中包含时间、责任人、单位、岗位、问题概述、问题分析及问题整改措施等类型,同时信息的重要度也有很大差别。在处理过程中可只选取与行车有关的问题进行建模,类型中选取岗位和时间段,对于路局信息和站段信息可以添加重要度系数。同时对班中时间划分为若干个时间段(一般以1小时划分),这样经过统计就可以得出各岗位与发生时间的概率分布,

  其中:表示时间与不同岗位的分布关系;

  表示时间段;

  表示不同的岗位。

  经过计算就可以得出发生违纪现象概率最大的时间段,监管人员可以依据计算结果对特定岗位进行重点卡控。

  4.结论

  应用大数据技术进行数据采集、分析,挖掘出有价值的信息,是铁路将数据转化为竞争力的必然过程[5]。通过统计分析路局、车站对行车一段时间内的监督效果,为班前预想提供理论参考。本文利用大数据理论,通过统计某一时间段内发生违章作业的概率分布,找出发生违章概率大的时间段,并进行重点卡控,可有效降低此违章的发生率。

  参考文献

  [1]王倩,朱宏峰,刘天华.大数据安全的现状与发展[J].计算机与网络创新生活,2013(16):66-69.

  [2]程陈.大数据挖掘分析[J].软件,2014,35(4):130-131.

  [3]韩少锋,陈立潮.数据挖掘技术及应用综述[J].机械管理开发2006(02).

  [4]维克托.迈尔-舍恩伯格,肯尼斯.库克耶.大数据时代[M].浙江人民出版社,2013.1

  [5]代明睿,朱克非,郑平标.我国铁路应用大数据技术的思考[J].铁道运输与经济.2014,36(3):23-26.

  曹辉剑 李舜 戴永富

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: