轨道交通工程项目结构数据标准化方法技术

技术编号:23851984 阅读:26 留言:0更新日期:2020-04-18 09:07
本发明专利技术公开一种轨道交通工程项目结构数据标准化方法,其步骤包括:提取轨道交通专业工程项目数据文件内分部分项名称内容的名称关键词,按标准将标准名称以父子层次结构划分,并且赋予code值,再将名称关键词匹配标准名称,最后根据code值进行归档管理并赋予标准的编码和名称。本设计的管理方法基于轨道交通16大专业标准的开项(分部分项)进行父子层次划分并编码,数据文件通过关键词匹配算法以及分词处理进行标准化,识别率和准确率高,相对于人工管理具有省时省力,成本低等优点,而且极大地方便了对轨道交通专业工程项目数据的分类和管理以及相同专业下,相同的分部分项的指标对比等。

Standardization method for structural data of Rail Transit Project

【技术实现步骤摘要】
轨道交通工程项目结构数据标准化方法
本专利技术涉及轨道交通造价分析办法,具体为一种轨道交通工程项目结构数据标准化方法。
技术介绍
随着我国经济实力不断增强,城市化发展的步伐也在逐渐加快,作为解决城市交通的重要手段——轨道交通建设也日益受到高度重视。目前,由于轨道交通建设历史积累的工程项目数量较多,种类繁杂,而且编撰数据的称呼、规范大都不统一,导致数据难以识别,归类。当前这些数据的应用和管理主要通过人的经验来判断和归类,耗时费力,造成企业管理成本居高不下。
技术实现思路
为了克服现有技术提及的缺点,本专利技术提供一种轨道交通工程项目结构数据标准化方法,实现对轨道交通专业工程项目数据快速识别和归类。本专利技术为解决上述问题采取的方案是:一种一种轨道交通工程项目结构数据标准化方法,其方法包括如下步骤:S1.基于分布式和高并发的计算机网络技术,获取各客户端上的轨道交通专业工程项目数据文件,并提取每个文件内的分部分项工程的名称关键词;S2.按照《城市轨道交通工程项目建设标准》(建标104-2008),将城市轨道交通工程的各项目的标准名称以父子层次结构划分(即轨道交通16大专业标准的分部分项结构层次),并且赋予每个标准名称一个单独的code值,该code值根据标准名称的父子层次结构关系,以层次编码法制定,最后将各项目的标准名称成立标准名称库;S3.将步骤S1中提取的分部分项工程的名称关键词进行规范化,将不规范字符替换为规范字符或者缺省处理;S4.将规范化后的名称关键词在步骤S2中的标准名称库中通过关键词匹配算法分析,初步确定该项目数据的标准名称,根据标准名称赋予其对于的code值;S5.检查该文件中的所有项目数据的赋予的code值是否符合标准名称的父子层次结构关系,如果符合,则依据该文件中对应的code值对项目数据进行归档;如果不符合,则返回步骤S4,将规范化后的名称关键词进行分词或者人工分词处理,再与步骤S2中的标准名称库中进行关键词匹配算法分析,二次确定该项目数据的标准名称,根据标准名称赋予其对应的code值,并进行归档。其中,步骤S4中所述的关键词匹配算法采用python-Levenshtein.ratio计算字串相似度的函数解析算法,依据算法结果,如果匹配度≥80%,则认定该名称关键词匹配标准名称,否则判断其为非法名称,需要对其作分词处理或者人工分词处理(即人为地将其赋予为特定的标准名称,系统将记录此行为,往后操作时遇到该非法名称时即可进行自动判定)。本专利技术的有益效果是:本设计的管理方法基于国家标准对项目类型进行父子层次划分并编码,数据文件通过关键词匹配算法以及分词处理进行标准化,识别率和准确率高,相对于人工管理具有省时省力,成本低等优点,而且极大地方便了对轨道交通专业工程项目数据的分类和管理,以及相同专业下,相同的分部分项的指标对比等。具体实施方式下面结合具体实施例对本专利技术进行进一步的说明。一种轨道交通工程项目结构数据标准化方法,其方法包括如下步骤:S1.基于分布式和高并发的计算机网络技术,获取各客户端上的轨道交通专业工程项目数据文件,并提取每个文件内的分部分项工程的名称关键词;S2.按照《城市轨道交通工程项目建设标准》(建标104-2008),将城市轨道交通工程的各项目的标准名称以父子层次结构划分(即轨道交通16大专业标准的分部分项结构层次),并且赋予每个标准名称一个单独的code值,该code值根据标准名称的父子层次结构关系,以层次编码法制定,最后将各项目的标准名称成立标准名称库;例如,市轨道交通工程的“车站”专业项目,“车站”项目又包括“地上车站”和“地下车站”,“地下车站”又包括“明挖地下车站”和“暗挖地下车站”,则赋予“车站”的code值为1,“地上车站”的code值为101,“地下车站”的code值为102,“明挖地下车站”的code值为10201,“暗挖地下车站”的code值为10202,如此类推;S3.将步骤S1中提取的分部分项工程的名称关键词进行规范化,将不规范字符替换为规范字符或者缺省处理;例如:“地下车(岗顶)站”,则将其规范为“地下车站”,如此类推;S4.将规范化后的名称关键词在步骤S2中的标准名称库中通过关键词匹配算法分析,初步确定该项目数据的标准名称,根据标准名称赋予其对于的code值;S5.检查该文件中的所有项目数据的赋予的code值是否符合标准名称的父子层次结构关系,如果符合,则依据该文件中对应的code值对项目数据进行归档;如果不符合,则返回步骤S4,将规范化后的名称关键词进行分词或者人工分词处理,再与步骤S2中的标准名称库中进行关键词匹配算法分析,二次确定该项目数据的标准名称,根据标准名称赋予其对应的code值,并进行归档。例如:某个工程的数据文件中获取了“地下车站(盖挖)”、“围护结构”和“竖井”这三个名称关键词,在步骤S4初步确定该项目数据的标准名称时,将“地下车站(盖挖)”匹配至“地下车站”上,但是“竖井”对应的code值并非与“地下车站”是在同一父子层次结构关系上,那么表示“地下车站(盖挖)”这一名称关键词匹配错误,需要进行分词处理或者人工分词处理。其中,步骤S4中所述的关键词匹配算法采用Levenshtein.ratio算法(计算字串相似度的函数),依据算法结果,如果匹配度≥80%,则认定该名称关键词匹配标准名称,否则判断其为非法名称,需要对其作分词处理或者人工分词处理(所谓“人工分词处理”即人为地将其赋予为特定的标准名称,系统将记录此行为,往后操作时遇到该非法名称时即可进行自动判定)。以上所述者,仅为本专利技术的较佳实施例而已,当不能以此限定本专利技术实施的范围,即大凡依本专利技术申请专利范围及专利技术说明内容所作的简单等效变化与修饰,皆仍属本专利技术专利涵盖的范围内。本文档来自技高网...

【技术保护点】
1.轨道交通工程项目结构数据标准化方法,其特征在于,包括如下步骤:/nS1.获取各客户端上的轨道交通专业工程项目数据文件,并提取每个文件内的分部分项工程的名称关键词;/nS2.将城市轨道交通工程的各项目的标准名称以父子层次结构划分,并且赋予每个标准名称一个单独的code值,该code值根据标准名称的父子层次结构关系,以层次编码法制定,最后将各项目的标准名称成立标准名称库;/nS3.将步骤S1中提取的分部分项工程的名称关键词进行规范化,将不规范字符替换为规范字符或者缺省处理;/nS4.将规范化后的名称关键词在步骤S2中的标准名称库中通过关键词匹配算法分析,初步确定该项目数据的标准名称,根据标准名称赋予其对于的code值;/nS5.检查该文件中的所有项目数据的赋予的code值是否符合标准名称的父子层次结构关系;/n如果符合,则依据该文件中对应的code值对项目数据进行归档;/n如果不符合,则返回步骤S4,将规范化后的名称关键词进行分词处理,再与步骤S2中的标准名称库中进行关键词匹配算法分析,二次确定该项目数据的标准名称,根据标准名称赋予其对于的code值,并进行归档。/n

【技术特征摘要】
1.轨道交通工程项目结构数据标准化方法,其特征在于,包括如下步骤:
S1.获取各客户端上的轨道交通专业工程项目数据文件,并提取每个文件内的分部分项工程的名称关键词;
S2.将城市轨道交通工程的各项目的标准名称以父子层次结构划分,并且赋予每个标准名称一个单独的code值,该code值根据标准名称的父子层次结构关系,以层次编码法制定,最后将各项目的标准名称成立标准名称库;
S3.将步骤S1中提取的分部分项工程的名称关键词进行规范化,将不规范字符替换为规范字符或者缺省处理;
S4.将规范化后的名称关键词在步骤S2中的标准名称库中通过关键词匹配算法分析,初步确定该项目数据的标准名称,根据标准名称赋予其对于的code值;
S5.检查该文件中的所有项目数据的赋予的code值是...

【专利技术属性】
技术研发人员:丁建隆何霖张志良竺维彬林志元谭文王健吴敏袁亮亮姚世峰孙成伟谢国胜李明亮曹明华周国鹏苟俊琴王斌兰闯刘铁民邱坤付亮艾凌博刘奎梁倩韵李平莫华广胡建廷陈红仙张涛肖美娜王志清梁能奇朱晓钰赖松应詹宇清陈汝炫
申请(专利权)人:广州地铁集团有限公司广东中建普联科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1