• 智能交通设备运维系统
    2014-10-17 16:48:30   来源:吴明远 林宝华   评论:0 点击:

    中文摘要:城市智能交通涉及到大量基础设施设备,这些基础资源维护的好坏,将直接影响智能交通的建设成效。要取得良好的运维效果,需要结合先进的运维理念,全面提升智能交通设备的运维效率,保障智能交通系统的正常运行,为交通参与者提供更好的服务。本文作者结合实际工作经验,按照ITIL的运维思想,提出了切实可行的设备运维方案,可供参考。

    Abstract: Urban Intelligent Traffic includes a lot of infrastructure equipment, the maintenance of these basic resources, good or bad, will directly affect the effectiveness of intelligent transportation construction. To get a good operation and maintenance effect, we need to combine the advanced concepts of operation and maintenance, to enhance the efficiency of the operation and maintenance of intelligent transportation equipment, to ensure the normal operation of intelligent transportation systems, to provide better service to transport participants. The author combines practical work experience, according to the ITIL conception, put forward practical equipment operation and maintenance program, for reference.

    关键词:智能交通、运维、GIS、拓扑

    Keywords: Urban Intelligent Traffic, Operation and Maintenance, GIS, Topology

    0 引言

    随着各地智能交通信息系统工程的持续建设和投入,交通设施设备大量增加。这些设施设备分散在城市的各条道路上,数量数以万计,客户亟需合适的方式方法对此进行管理。遍布在路面的这些设施设备,可以看作是物联网传感单元,每天采集的数据汇集起来,形成海量数据,为了存储和利用这些海量数据,客户必须辅以规模较大的数据中心,包含大量的IT设备,如何有效监控这些IT设备的运转情况,也成为了客户不得不面对的问题。

    在信息化社会,城市智能交通的重要性愈发凸显,公众对智能交通的感受也愈加强烈,一旦智能交通的基础(交通设施设备)出现故障,例如信号故障、电子警察误拍、诱导信息发布错误等,将会立即对公众出行产生严重影响。如何快速发现设施设备存在的问题,并及时进行修复,改善设备可用性,是智能交通管理者尤为关注的焦点。

    IT设备运维发展较早,最为有名的运维框架是“ITIL ( Information Technology Infrastructure Library)”,中译为“信息技术基础架构库”或“IT基础架构库”。ITIL 产生的背景,是英国政府为了提高政府部门 IT服务的质量,邀请国内外知名 IT厂商和专家共同开发的一套规范化的 IT资源使用方法。ITIL强调以客户为中心、以流程为导向,通过引入服务台、事件管理、配置管理、问题管理、知识库管理等手段,对设备运维需要解决的问题条分缕析,有效提高了设备运维水平。

    在智能交通设备运维中,无论是数据中心的IT设备,还是路面上的交通设施设备,都可以参照ITIL的运维思想,据此设计出一套与智能交通相契合的设备运维系统。

    1 服务台

    在ITIL运维思想中,服务台扮演了一个极为重要的角色,起到对外连接的作用。对应到智能交通中,服务台用于收集来自运维设备的各种告警信息,这些告警信息的来源多种多样。

    1.1 告警自动采集

    要取得良好的智能交通设备运维效果,就必须快速获取设备状态,及时掌握状态变化。随着城市逐步向信息化、智能化发展,智能交通依赖的设备越来越多,需要管理的设备迅速增加,传统上依靠人工采集设备状态的方式,已经无法满足交通管理部门的需求,这就为自动采集设备状态提出了明确需求,以有效提升服务台的运作效率。

    与城市智能交通相关的设施设备多种多样,遍布在城市各个路段上的设施设备,可称之为“外场设备”;而位于交通管理部门指挥中心的设施设备,则称之为“内场设备”。对于外场设备,又可分为两类,其中一类设备已经IP化,具备联网能力,包括卡口、电子警察、信号机、视频、诱导屏、事件采集器等,它们是城市智能交通最为重要的组成部分,负责自动收集城市交通的各项指标,并适时进行调整,为管理者提供用于决策的关键信息;另一类不具备联网能力,用于交通出行的常规静态指示,例如标志、标牌、标线等。

    对于具备联网能力的外场设备,可以通过网络自动收集设备状态。设备异常状态大致可以分为三类:供电故障、通讯故障、设备故障,对于设备故障,不同设备的故障情况多有不同,需要具体分析。遗憾的是,在设备状态自动采集方面,各厂商并无统一接口,有的厂商甚至不支持设备状态上报,或者虽能支持,但上报的状态信息较为有限,这对集成厂商提出了挑战,后者需要针对不同厂商提供不同适配接口,以完成自动状态收集。从长远来看,一个标准化的设备接口,有利于市场向良性方向发展,也有利于提高行业的话语权。

    对于不具备联网能力的外场设备,可通过线上和线下的人工巡检来完成。所谓线上人工巡检,是指借助遍布城市的视频监控设备,通过网络远程查看设施设备的好坏,这种方式可在各种天气条件下迅速完成巡检工作,避免在路面来回奔走,大幅度提高了人工巡检的效率。更进一步,可对每一台已被视频覆盖的设备配置关联视频预置位,当在GIS上选中要巡检的设备时,自动将关联视频切换到设定的预置位,减少每次手工调整视频焦点的工作量。对于没有视频覆盖的区域,则只能通过线下人工巡检来完成,依靠人力在路面来回巡检,实时性较差。

    对于内场设备,以计算机设备、网络设备、安全设备、存储设备为主,自动化程度很高,完全可以实现自动告警收集,这方面大多基于标准的简单网络管理协议(Simple Network Management Protocol,SNMP),管理方式和工具都已很成熟,只要应用得当,完全可以满足交通管理部门的需求。

    1.2 人工快速报障

    虽然自动采集设备状态效率很高,能够及时发现大部分设备存在的故障,但并不能解决全部问题。如前所述,部分外场设备不具备联网能力,除此以外,即便具备联网能力的设备,也存在漏报故障的可能。因此,作为自动化的补充,线下人工巡检其实是不可或缺的。此外,随着公众参与积极性的提高,当发现设施设备存在故障时,公众也会随时上报故障信息,这对巡检人力不足的交通管理部门而言,是一个有效补充手段。

    无论是交通管理部门派出的巡检人力,还是主动上报设备状态的公众,当发现设备存在异常时,都需要有合适的方式或工具,迅速完成设备状态的登记,以便设备得到及时修复。传统上,主要依赖呼叫中心来完成上述过程,效率较低。考虑到移动智能终端的普及,完全可以通过移动APP的方式,结合GPS定位信息,由外场人员自行完成故障信息登记,提高故障登记效率。

    此外,在呼叫中心,也可以结合GIS地图,利用GIS提供的框选、沿线选择等功能,迅速定位到故障设备所在位置,以便快速完成故障登记。

    图 1 关联视频查看(红色为故障设备)

    2 事件管理

    ITIL中事件管理的作用,是当运维管理人员接到工单之后,快速作出响应,及时修复故障,让系统恢复正常运行的一个过程。事件管理的特点是以快速解决故障为目的,而对反复出现或者重大的故障,可升级到问题管理来分析根本原因,防止以后再次出现。

    事件分为四个等级,按照严重程度,依次分为以下四种等级:普通事件、一般事件、重大事件、特大事件。对于普通事件,仅需很简单的处理,运维人员即可修复故障设备,恢复系统运行。当发现表现现象相同的故障经常发生或者事件管理无法解决某个故障时,可以将事件进行升级,根据事件等级升级为一般事件、重大事件、特大事件。一般事件由一线运维团队来解决;重大和特大事件交由二线或三线专家团队来解决故障背后的深层次问题,以防止事件再次发生。

    对于内场和外场设备,事件管理的侧重点也有不同。

    2.1 外场设备

    以管理10000台外场设备为例,设备完好率控制目标为98%,平均故障修复时间为0.5天,则系统每天新产生的告警数量在400条左右。为了提高告警管理效率,可将各种来源产生的的告警直观地呈现在GIS上,并根据配置参数,自动将告警信息通知到相关运维人员,实现自动派单,通知手段包括自动语音、短信、邮件、微信、专有APP等,可根据客户需求采用其中的一种或多种通知方式。管理人员可在GIS上了解当前存在故障的设备位置,以及通知发送记录、维修记录、电子档案等,藉此可以了解告警设备的故障历史,分析故障根源。

    派单只是开始设备维护过程的第一步,后续还包括接单、确认、反馈、结单、归档等环节,对于不同客户,甚至不同类型设备,上述环节多有不同,变动较大,同时这也是客户较为关注的内容,因此需要针对不同客户进行定制。为了减轻集成厂商的定制开发压力,引入恰当的流程引擎就显得尤为重要,这方面有很多工具可供参考,例如JAVA“业务流程管理”(Java Business Process Management,JBPM)等。使用流程引擎,项目实施阶段只需很短时间即可配置出一整套全新的运维流程,满足不同客户的个体差异,大幅度提高实施效率。

    2.2 内场设备

    对于内场设备,故障处理工具已经较为成熟。借助网络拓扑图、业务视图、机房视图等多种视图,设备状态和链路状态都能够一目了然。

    图 2 内场设备业务视图

    此外,通过合理的设计,能够让内场设备具备一定的自愈能力,硬件上包括冗余链路、双机热备、冗余磁盘阵列(Redundant Arrays of independent Disks,RAID)等,为故障修复提供缓冲时间;软件上可采取监守进程,当监测到某个服务出现故障时,例如Oracle数据库表空间满,可自动记录故障信息,并自动修复或重启该服务,缩短系统故障修复时间,提高系统可用性。

    3 配置管理

    配置管理记录了智能交通所有设备的配置项数据,例如信号机配时、视频预置位、设备关联、告警阈值等;存储了设备的全生命周期过程,涵盖设备的购买、安装、验收、维护、移除、报废等环节。

    当系统配置或环境发生变化时,需要引入变更管理流程,支持变更审批,提高系统适应变化的能力。系统同时记录变更内容、变更时间、变更人、审批人等信息,使系统具备可追溯能力。每个变更都有相应的版本号,当新的配置出现问题时,配置管理允许系统恢复到之前的任意有效配置版本。

    4 问题管理

    当运维的设备越来越多,系统产生的告警数量也随之快速增加,这时仅靠事件管理已经无法有效解决问题,这就催生了问题管理。问题管理的目标,是要找出突发事件产生的根本原因,避免同样的突发事件再次发生,未雨绸缪,防患于未然。

    要达到问题管理的目标,需要主动出击,通过对已有数据的统计分析,对故障进行分类归纳,找出故障的深层次原因。

    例如可按故障类型排序,生成故障类型TOP10报表,以便找出最为频繁的故障,督促厂家进行有针对性的改进,提高设备质量。

    对使用的备件进行统计分析,可找出使用最频繁的备件,及早做好备件规划,有助于提高维修效率。

    此外,还可分析同一厂家设备在不同区域的故障率,了解环境对设备的影响。

    5 知识库管理

    智能交通涉及的设备类型多种多样,加上品牌众多,运维方式常常差别较大。在长期的运维过程中,积累了不少优秀的运维方法,如果能将这些方法传承下来,将有助于提高运维人员的业务水平,改善设备运维效率,这就是ITIL中的知识库管理。利用知识库管理,新的运维人员可以通过学习前人累积下来的知识记录,迅速提升运维经验,老员工也可以随时查阅知识库记录。

    知识库管理包括知识提交、知识审核、知识检索等功能,确保知识库的可用性和权威性。运维人员可在任何时候通过WEB访问到知识库,支持全文检索。可通过适当的物质和精神奖励,鼓励运维人员踊跃提交新知识到知识库。

    6 服务外包

    随着城市交通设施设备大量增加,由于建成时间不一致、设施设备品牌不统一、应用环境不同,缺乏统一的运维管理手段,造成设施设备的管理成本、维护压力越来越大。

    考虑到目前面临的运维压力,交通管理部门向社会购买运维服务的呼声也愈发高涨。通过专业的运维团队,在交通管理部门的统一领导下,以智能交通运维系统为依托,及时掌握、汇总各类信息,展现系统资源的可用性和运行状况。采用先进管理技术和监控手段为交通管理部门提供信息系统相关的内外场设备设施、主机设备、操作系统、数据库和存储设备的运维管理服务,保证交通管理部门现有的信息系统及其设备的正常运行。

    依托专业运维团队,逐步形成完善的运维管理规范。根据日常维护的数据和工作记录,逐步建立维护管理制度,完善流程规范,保证设备性能稳定、网络安全畅通、功能齐全实用,实现交通管理指挥现代化、管理数字化、信息网络化、办公自动化的目标。

    事实上,目前国内已有几个城市引入或正在考虑引入服务外包模式,借助专业运维团队,来承担智能交通设备运维工作,将智能交通集成平台各项应用功能充分挖掘出来,通过信息分析研判,为各级领导决策提供科学依据。

    7 结语

    利用先进的运维管理系统、计算机通信技术,将智能交通外场电子警察、信号、诱导、视频等设备,以及内场计算机设备、网络设备、安全设备、存储设备、数据机房、网络通信,科学地管理起来,结合ITIL运维思想,通过服务台、事件管理、配置管理、问题管理、知识库管理等手段,实现智能交通设备运维的自动、高效、有的放矢。

    从智能交通的长远发展趋势看,设备运维服务外包正在成为一个重要选项,有望在未来得到大面积推广,全面改善设备运维效率。

    责任编辑:佚名

    相关热词搜索: 智能交通 运维

    上一篇:服务意识要融入到软件中
    下一篇:是年繁华遇见你

    [内刊文章:42 篇]刊物介绍
      中央研究院介绍:由易华录中央研究院负责建设、管理的自媒体运营项目——《易华录中央研究院》微信公众号,正式上线。利用新媒体网络传播平台,开展智能交通与智慧城市领域的技术、产品和方案交流与传播。
    联系方式
    • 白先生:010--53396817