System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于多源异构信息整理的城区模型数字化方法及系统技术方案_技高网

基于多源异构信息整理的城区模型数字化方法及系统技术方案

技术编号:43847669 阅读:2 留言:0更新日期:2024-12-31 18:41
本申请涉及数据处理技术领域,具体涉及基于多源异构信息整理的城区模型数字化方法及系统,该方法包括:采集城区中各领域下各采集点的各时刻的各类型数据;将各领域下各采集点的各时刻的所有类型数据组成各时刻的特征向量;确定各领域下各采集点当前时刻特征向量的初始异常值;获取各领域下所述任一采集点与其余各采集点的当前时刻特征向量的参考可靠性;得到各领域下各采集点当前时刻特征向量的第一异常值;确定各领域下各采集点当前时刻特征向量的第二异常值;对所述初始异常值进行修正,获取各领域下各采集点的当前时刻所有类型数据的处理结果,并进行数字化。从而提高对城区模型数字化的精度。

【技术实现步骤摘要】

本申请涉及数据处理,具体涉及基于多源异构信息整理的城区模型数字化方法及系统


技术介绍

1、城区模型数字化是指将城市区域的实际信息和数据转化为数字化模型的过程。将收集到的异构数据进行整合和处理,以形成统一的数字化模型,这通常涉及到数据清洗、去噪等,在保证不同来源的数据能够无缝结合的同时,提高数字化模型创建的精度。

2、在对多源异构数据进行清洗去噪时,需要对收集的多源异构数据进行异常值检测,通常现有的异常检测算法在对数据进行异常检测的过程中,未能考虑到不同采集点数据之间的相互影响,以及单个采集点采集的数据之间的时序关联性,造成数据异常检测的准确度较低,进而影响城区模型数字化的精度。


技术实现思路

1、为了解决上述技术问题,本申请的目的在于提供基于多源异构信息整理的城区模型数字化方法及系统,所采用的技术方案具体如下:

2、第一方面,本申请实施例提供了基于多源异构信息整理的城区模型数字化方法,该方法包括以下步骤:

3、采集城区中各领域下各采集点的各时刻的各类型数据;将各领域下各采集点的各时刻的所有类型数据组成各时刻的特征向量;

4、将各领域下各采集点当前时刻的所有历史时刻下所述特征向量划分为各聚类簇,基于各领域下各采集点的当前时刻特征向量在不同聚类簇中隶属度的差异,确定各领域下各采集点当前时刻特征向量的初始异常值;分析各领域下各采集点的当前时刻及其所有历史时刻的任意两类型数据之间的相关性,基于各领域下任一采集点与其余各采集点的所述相关性的差异,以及所述任一采集点与其余各采集点的同类型数据之间的差异,确定各领域下所述任一采集点与其余各采集点的当前时刻特征向量的参考可靠性;

5、将各领域下各采集点的当前时刻及其所有历史时刻的各类型数据划分为各数据簇,基于当前时刻的任一类型数据所在的数据簇与所述任一类型数据的剩余数据簇之间的差异,确定各领域下各采集点的当前时刻所述任一类型数据的异常程度;基于各领域下各采集点的当前时刻所有类型数据的异常程度,确定各领域下各采集点当前时刻特征向量的第一异常值;

6、基于各领域下所述任一采集点的所有所述参考可靠性,以及所述同类型数据之间的差异,确定各领域下各采集点当前时刻特征向量的第二异常值;结合所述第一异常值与所述第二异常值,对所述初始异常值进行修正,得到各领域下各采集点当前时刻特征向量的修正异常值,获取各领域下各采集点的当前时刻所有类型数据的处理结果,并进行数字化。

7、在其中一种实施例中,所述初始异常值的确定过程为:

8、针对各采集点当前时刻的任一特征向量,统计所述任一特征向量在所述各聚类簇中的隶属度,计算所述任一特征向量位于所在聚类簇与剩余各聚类簇的所述隶属度的差值绝对值,将所述任一特征向量的所有所述差值绝对值的和值的归一化值,作为所述任一特征向量的初始异常值。

9、在其中一种实施例中,所述参考可靠性的确定包括:

10、将各领域下各采集点的当前时刻及其所有历史时刻各类型数据组成当前时刻的各数据序列,计算各领域下各采集点的当前时刻任意两个所述数据序列的相关性,记为第一相关性,分析所述任一采集点与其余各采集点的所有所述第一相关性的差异,确定各领域下所述任一采集点与其余各采集点的当前时刻特征向量的参数分布相似性;

11、计算各领域下所述任一采集点与其余各采集点的当前时刻同类型的所述数据序列之间的相关性,记为第二相关性,将各领域下所述任一采集点与其余各采集点的当前时刻所有所述第二相关性的和值的归一化值,作为各领域下所述任一采集点与其余各采集点的当前时刻特征向量的参数值相似性;

12、将所述参数分布相似性与所述参数值相似性的乘积,作为所述参考可靠性。

13、在其中一种实施例中,所述参数分布相似性的计算方式为:

14、;为采集点与采集点的当前时刻特征向量a的参数分布相似性,为采集点与采集点的类型数据、类型数据之间所述第一相关性的差值绝对值,为特征向量a包含的类型数量,exp()表示以自然常数为底数的指数函数。

15、在其中一种实施例中,所述异常程度的确定过程为:

16、将所述各数据簇内在时序上相连的多个元素作为一个序列段,若各领域下各采集点当前时刻的所述任一类型数据位于所述序列段内,计算所述任一类型数据所在数据簇内与其余各数据簇内序列段的数量的差值绝对值,记为第一差值绝对值,计算所述任一类型数据的所有所述第一差值绝对值的和值,记为第一和值,计算所述任一类型数据所在的序列段与其余各序列段的度量距离,计算所述任一类型数据的所有所述度量距离的和值,记为第二和值;

17、将所述第一和值与所述第二和值的乘积,作为当前时刻所述任一类型数据的异常因子;

18、基于所述异常因子确定当前时刻所述任一类型数据的异常显著性;

19、将所述异常因子与所述异常显著性的乘积的归一化值,作为所述异常程度,若所述任一类型数据未位于序列段内,则将所述异常程度设定为预设数值。

20、在其中一种实施例中,所述异常显著性的计算方式为:

21、;为当前时刻所述任一类型数据的异常显著性,为当前时刻所述任一类型数据所在序列段内去除第o个数据前后计算得到的所述异常因子的差值绝对值,为当前时刻所述任一类型数据所在序列段内去除所述任一类型数据前后计算得到的所述异常因子的差值绝对值,d为当前时刻所述任一类型数据所在序列段内包含数据的个数。

22、在其中一种实施例中,所述第一异常值为各领域下各采集点当前时刻所有类型数据的所述异常程度的和值的归一化值。

23、在其中一种实施例中,所述第二异常值的计算方式为:

24、;为采集点当前时刻特征向量a的第二异常值,为采集点与采集点的当前时刻特征向量a的参考可靠性,m为采集点的数量,为采集点与采集点的当前时刻h类型数据的差值绝对值,为特征向量a包含的类型数量,norm()为归一化函数。

25、在其中一种实施例中,所述获取各领域下各采集点的当前时刻所有类型数据的处理结果,包括:

26、计算所述第一异常值与所述第二异常值的均值,所述修正异常值为所述初始异常值与所述均值的乘积,若所述修正异常值大于等于预设异常阈值,则剔除当前时刻对应的特征向量内的所有类型数据,否则,保留当前时刻对应的特征向量内的所有类型数据。

27、第二方面,本申请实施例还提供了基于多源异构信息整理的城区模型数字化系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项所述方法的步骤。

28、本申请至少具有如下有益效果:

29、本申请通过采集城区中各领域下各采集点的各时刻的各类型数据;将各领域下各采集点的各时刻的所有类型数据组成各时刻的特征向量;将各领域下各采集点当前时刻的所有历史时刻下所述特征向量划分为各聚类簇,基于各领域下各采集点的当前时刻本文档来自技高网...

【技术保护点】

1.基于多源异构信息整理的城区模型数字化方法,其特征在于,该方法包括以下步骤:

2.如权利要求1所述的基于多源异构信息整理的城区模型数字化方法,其特征在于,所述初始异常值的确定过程为:

3.如权利要求1所述的基于多源异构信息整理的城区模型数字化方法,其特征在于,所述参考可靠性的确定包括:

4.如权利要求3所述的基于多源异构信息整理的城区模型数字化方法,其特征在于,所述参数分布相似性的计算方式为:

5.如权利要求1所述的基于多源异构信息整理的城区模型数字化方法,其特征在于,所述异常程度的确定过程为:

6.如权利要求5所述的基于多源异构信息整理的城区模型数字化方法,其特征在于,所述异常显著性的计算方式为:

7.如权利要求1所述的基于多源异构信息整理的城区模型数字化方法,其特征在于,所述第一异常值为各领域下各采集点当前时刻所有类型数据的所述异常程度的和值的归一化值。

8.如权利要求1所述的基于多源异构信息整理的城区模型数字化方法,其特征在于,所述第二异常值的计算方式为:

9.如权利要求1所述的基于多源异构信息整理的城区模型数字化方法,其特征在于,所述获取各领域下各采集点的当前时刻所有类型数据的处理结果,包括:

10.基于多源异构信息整理的城区模型数字化系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-9任意一项所述方法的步骤。

...

【技术特征摘要】

1.基于多源异构信息整理的城区模型数字化方法,其特征在于,该方法包括以下步骤:

2.如权利要求1所述的基于多源异构信息整理的城区模型数字化方法,其特征在于,所述初始异常值的确定过程为:

3.如权利要求1所述的基于多源异构信息整理的城区模型数字化方法,其特征在于,所述参考可靠性的确定包括:

4.如权利要求3所述的基于多源异构信息整理的城区模型数字化方法,其特征在于,所述参数分布相似性的计算方式为:

5.如权利要求1所述的基于多源异构信息整理的城区模型数字化方法,其特征在于,所述异常程度的确定过程为:

6.如权利要求5所述的基于多源异构信息整理的城区模型数字化方法,其特征在于,所述异常显著性的计算方式为:...

【专利技术属性】
技术研发人员:沙洋张静庞海峰高正周吉金
申请(专利权)人:浙江省城乡规划设计研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1