智能交通系统数据的管理技术与策略
2012-10-23 12:19:51   来源:Tranbbs.com      作者:未知    评论:0 点击:

摘要:智能交通系统的飞速发展为交通管理领域提供了丰富、连续的ITS数据,但大部分交通管理中心仍缺乏针对ITS数据的系统化管理体制和方法,所存储ITS数据的利用效率极低,造成了数据资源的巨大浪费。为了对数据资源进行管理整合以满足用户不断涌现的ITS数据需求,本文提出并描述了以下六大类数据管理技术,包括(1)ITS数据质量控制技术:提供高质量的准确的ITS数据;(2)ITS数据集成技术:根据用户需求、应用类型和数据特征提供最佳的数据集成度;(3)ITS数据抽样技术:从多个数据样本中提取出最具代表性的样本数据实现数据的有效存储;(4)ITS数据压缩技术:在失真度有限的前提下以较高的压缩比压缩历史ITS数据来便利传输和存储;(5)分布式动态ITS数据系统:针对来自不同探测器的分布式ITS数据进行动态分析、显示和处理;(6)ITS数据再获得技术:建立ITS数据库与用户间的接口以改善终端用户的数据检索和获取。所开发的ITS数据管理技术与数据处理流程相结合,基于数据的采集、传输、处理加工、存储和发布的各个环节构造出一整套对ITS数据实施有效管理的完善策略,能够加强数据资源的共享和交换,促进各个交通子系统的有效运作,提高交通运输系统的整体效率。

1.引言

随着国内城市交通管理基础设施的迅速发展,功能不断完善的各类交通检测器和电子信息化采集技术为交通管理领域提供了丰富的ITS数据源,为交通规划、信号控制、建模参数标定、交通诱导等交通应用的开展打下了良好的数据基础,各类ITS数据用户的数据需求也不断增长。

但截至目前,大部分交通管理中心仍缺乏针对ITS数据的系统化管理体制和方法,所存储ITS数据的利用效率极低,其常用的数据管理方法有两类:或者将数据投入实时应用之后立即丢弃,或者将所有数据进行无限期存储。前者仅能满足实时交通应用需求,且严重浪费了数据资源;而后者则以牺牲巨额的物理存储空间为代价,两者均非数据管理的最佳策略。为了提高分布式ITS数据的使用效率,避免数据资源的巨大浪费,需要开发有效的ITS数据管理技术,对数据资源进行管理整合并存储为适当的数据格式,提供给终端用户,以满足其不断涌现的ITS数据需求。

2.ITS数据管理需求

国内ITS数据应用中存在的问题是:数据服务对象单一,通常仅面向交警或公交系统;并且,若干已建成系统(各种信息系统、管理系统和控制系统)间缺乏信息资源的共享和交换,基本处于“孤岛型”运作状况,影响了系统的推广应用。

国外近几年开展了包括数据挖掘技术在内的ITS数据管理技术的研究,一些交通管理中心也开始在数据集成、压缩及存储方面进行初步探索[1]。如何实施数据管理,使之既能满足实时交通应用,又能从长远利益出发,使这些数据易于检索与应用,这是亟需数据管理人员解决的问题。另一方面,对隶属于不同交通领域的ITS数据用户而言,在表达其对各类交通数据需求的同时,更希望数据管理部门提高所收集数据的精度、质量和有效性,来满足未来开发全新的交通应用时的数据需求。

目前交通研究人员正在尝试各种途径来开发有效的ITS数据管理技术,包括不同用户的ITS数据需求分析、数据处理途径和方法以及数据的有效检索和发布策略等,其目的均在于使数据易于存储和管理,且能更加灵活地满足用户目前和未来的数据需求。可见,有必要开发有效的数据管理技术,加强数据资源的共享和交换,实现ITS数据的全面管理和整合。

3.ITS数据管理技术的提出

针对既有的大量ITS数据,很多交通管理中心已经初步设计开发了一系列数据管理技术、方法和规范,其中少量技术在实践中运用后也取得了一定效果。下面对于有关的ITS数据管理技术的概念、作用和发展现状做一评述:

ITS数据质量控制技术——针对所采集的原始数据中的错误、丢失、不精确和不规则时间点等情况进行修正处理,得到高质量的数据。该技术目前能够对交通数据进行简单的质量控制,或者能够修正很明显的错误数据,或者能够对缺失数据进行简单的补齐[2]。但是目前的质量控制方法具有随意性,算法并不完善(如不规则时间点问题尚未解决),操作停留在手工层次,需要提出更加完善的质量控制算法并且编程实现。

ITS数据集成技术——旨在根据用户需求、应用类型和数据特征提供具有最适当集成度(数据时间间隔)的集成数据用于不同的交通应用。既然不同的交通应用类型对应着不同的数据集成度,而目前交通管理中心主要依靠经验确定集成度,则需要通过定量分析提出更为准确有效的数据集成方法。
ITS数据抽样技术——旨在从具有相似性的一组数据集合中提取出最能代表总体特征的个体数据样本,在保留数据有用信息的同时节省存储空间。目前数据抽样技术缺乏必要的理论指导,且大多停留在手工层次,需要开发针对大样本量数据的自动化抽样算法,并对算法的实际应用前景做深入研究。

ITS数据压缩和存储技术——其出发点是利用各种算法将数据冗余压缩到最小,并在有限失真度的前提下尽可能提高压缩比,便于存储和传输。交通管理中心在存储历史数据时,通常是使用通用的WinRar或者Winzip等无损压缩软件进行压缩,此法较为简便,但其压缩率有限,需要开发更为有效的数据压缩技术来大幅提高压缩比,并且保证重构后数据具备很低的失真率,能够满足各类交通需求。

分布式动态ITS数据处理技术——交通数据在决策支持领域已经取得了初步进展,如优化信号配时、变换可变标识信息、交通事故探测等。但是目前尚不能做到对大量动态的分布式交通数据进行实时分析和处理,需要实现针对数百个检测点采集得到的分布式ITS数据的并行数据分析、处理和显示功能。

ITS数据再获得技术——旨在建立ITS数据库与用户间的接口以改善终端用户的数据检索和获取。有的交通管理中心已经开发了自身的ITS数据与用户的接口界面[3],但是需要设计完善的ITS数据再获得应用方案,并对已有的和在建的ITS数据库的维护策略与用户接口进行详细规范。

4.ITS数据管理技术的具体内容

4.1 ITS数据质量控制技术

由于传输设备故障、路面交通状况和环境因素的异常以及ITS设备的连续性工作特点所引发的间歇性工作故障,所采集的ITS原始数据中存在着问题数据。由于这些问题数据影响了数据的正确性与完整性,必须对问题数据进行判别并且给予修正,以利于ITS数据应用的顺利进行。该过程称为ITS数据的质量控制[2]。

问题数据可以分为四类:错误数据、缺失数据、不精确的数据和采集时间点的偏移。(1)对于错误数据,首先根据阈值理论和交通流理论来进行判别。对于不满足阈值理论的数据,用阈值替代错误数据;而对于不满足交通流理论的数据,可以采用数据插值或者历史数据平均的方法来进行修正,就目前历史数据还不很丰富的情况下,推荐使用数据插值方法来进行数据修正。(2)对于缺失数据,对既定的时间点依次进行检查识别,判别出缺失数据的具体位置。接下来使用同期历史数据或者插值方法进行数据补齐,使用前法需要有大量的原始数据为基础,而插值方法用于短间隔内数据丢失时的补齐效果较好。(3)对于不精确数据,通常需要通过准确的多样本数据采集方法来获取所研究交通状况的基准值,将实际值与之作对比后得出修正方案和结论。识别这部分数据必须首先判定设备的校正误差和测量误差,而这些信息都由现场技术人员分析后提供。(4)对于不规则时间点判别和修正,假设探测器的数据采集间隔时间为指定的N秒,但是由于实际中探测器工作的不稳定性,部分实测数据的时间间隔不能严格满足N秒的要求,导致实测数据的时间属性不够规范,这将严重妨碍后期对数据的管理和应用(包括集成和抽样等),从而需要对其进行修正。进行时间点修正的原则是既要在最大程度上保留原始数据的信息,又要将时间点修正为规范的格式[4]。

考虑到数据修正方法的适用性, ITS数据质量控制的具体实施步骤见图1,由于基准值很难获取,其中没有考虑不精确数据的修正。ITS数据质量控制技术软件的前台程序采用Visual Basic 6.0程序语言开发完成,后台数据库采用Microsoft Access数据库作为支撑平台[5]。

图1  ITS数据质量控制的具体实施步骤

以上主要从单数据源质量问题的角度出发,研究了ITS数据的质量控制技术。若考虑多个数据源的情况,假设从多个数据源同时获取具备同一时空属性的ITS数据,由于不同数据源的精确度和可靠度各不相同,各有优势,如何对多数据源得到的数据进行整合加工,以得到质量更好的数据,这需要借助数据融合技术来实现,称为基于融合技术的多源ITS数据质量控制,属于质量控制技术的外延。

4.2 ITS数据集成技术

对于交通数据而言,集成度即为时间间隔,是用来计量ITS数据的特定时间间隔。而最佳集成度则是针对某一特定的交通需求计算出的最佳时间间隔。数据集成是根据不同用户对交通数据的需求,采用一定的集成方法将ITS存档数据转化成为更能够满足给定需求的最佳时间间隔数据的过程。

针对来自于多个探测器的连续数据,交管中心若直接存储原始数据,在浪费硬件资源的同时也不能满足某些用户特定的需求;若对原始数据进行有效集成后提取有用信息。

责任编辑:佚名

相关热词搜索: 智能交通系统

上一篇:车辆行驶记录仪在道路运输业管理中的应用
下一篇:中国射频识别(RFID)技术政策白皮书

分享到: 收藏
智能交通行业首家推出移动互联网媒体,每日更新 !让您随时随地了解行业资讯。
专栏观点更多>>