一种交通运行信息提取与态势预警方法及装置制造方法及图纸

技术编号:27686479 阅读:15 留言:0更新日期:2021-03-17 04:00
本发明专利技术涉及一种交通运行信息提取与态势预警方法及装置,属于交通预警技术领域,解决了现有的基于人工实现的交通预警方法造成的效率较低且可靠性较差的问题。方法包括:获取航空气象类数据文本、航空运输类数据文本和交通新闻类数据文本;对航空气象类数据文本和航空运输类数据文本进行预处理,得到结构化简报数据并存储;并基于双向长短期记忆网络对交通新闻类数据文本进行处理,得到结构化简报数据并存储;基于存储的结构化简报数据和简报模板生成交通运行态势预警报告,减轻了人工收集数据并撰写简报的工作量,填补了交通行业情况实时数据挖掘及分析研究领域的空缺,为相关管理决策人员提供高效参考。

【技术实现步骤摘要】
一种交通运行信息提取与态势预警方法及装置
本专利技术涉及交通预警
,尤其涉及一种交通运行信息提取与态势预警方法及装置。
技术介绍
交通行业运行及发展情况预警,是对交通运行态势的实时监测与预估,能够为国家与交通行业管理者、相关人员掌握交通行业态势,制定科学决策提供相应的支撑。目前,交通领域运行态势预警工作主要依靠人工完成,若不能保证快速、准确地挖掘并分析这些海量数据中有关交通运行及发展情况的重要信息,会对相关管理决策单位的高效、准确决策造成影响。同时,现阶段交通领域的信息获取方法大多基于人为实现,成本高昂且难度较大,使得获得交通领域运行态势预警的工作效率较低且可靠性较差。
技术实现思路
鉴于上述的分析,本专利技术实施例旨在提供一种交通运行信息提取与态势预警方法及装置,用以解决现有的基于人工实现的方法造成的效率较低且可靠性较差的问题。一方面,本专利技术实施例提供了一种交通运行信息提取与态势预警方法,包括下述步骤:获取航空气象类数据文本、航空运输类数据文本和交通新闻类数据文本;对所述航空气象类数据文本和航空运输类数据文本进行预处理,得到结构化简报数据并存储;并基于双向长短期记忆网络对所述交通新闻类数据文本进行处理,得到结构化简报数据并存储;基于存储的所述结构化简报数据和简报模板生成交通运行态势预警报告。进一步,所述航空气象类数据文本为航空塔台气象预报报文,所述航空运输类数据文本为HTML数据形式的网页。进一步,所述对所述航空气象类数据文本和航空运输类数据文本进行预处理,得到结构化简报数据,包括:基于报文要素匹配方法对所述航空塔台气象预报报文进行预处理,得到结构化简报数据;基于结构化文本提取方法对所述HTML形式数据的网页进行预处理,得到结构化简报数据。进一步,所述双向长短期记忆网络包括:输入字符嵌入层,用于对所述交通新闻类数据文本进行向量映射,得到所述交通新闻类数据文本对应的词向量矩阵;上下文表示层,用于对所述输入字符嵌入层输出的词向量矩阵进行上下文特征提取,得到上下文特征;字符层次自注意力机制层,用于对所述上下文表示层输出的上下文特征进行特征学习,得到句子经过自注意力机制后的隐层表示;句子层次自注意力机制层,用于对所述字符层次自注意力机制层输出的句子经过自注意力机制后的隐层表示进行特征学习,得到可观测序列;条件随机场层,用于对所述自注意力机制层输出的可观测序列进行分类,得到命名实体及分类结果。进一步,得到所述结构化简报数据后,将所述结构化简报数据以CSV格式存储至本地文件;或者,将所述结构化简报数据存储至MySQL或Oracle数据库。进一步,采用docxtpl包将所述结构化简报数据填充至简报模板中的相应位置,得到交通运行态势预警报告。另一方面,本专利技术实施例提供了一种交通运行信息提取与态势预警装置,包括:数据获取模块,用于获取航空气象类数据文本、航空运输类数据文本和交通新闻类数据文本;数据处理模块,用于对所述航空气象类数据文本和航空运输类数据文本进行预处理,得到结构化简报数据;并基于双向长短期记忆网络对所述交通新闻类数据文本进行处理,得到结构化简报数据;数据存储模块,用于存储得到的所述结构化简报数据;语料匹配及模板填充模块,用于根据存储的所述结构化简报数据和简报模板生成交通运行态势预警报告。进一步,所述航空气象类数据文本为航空塔台气象预报报文,所述航空运输类数据文本为HTML数据形式的网页。进一步,所述数据处理模块执行下述流程:基于报文要素匹配方法对所述航空塔台气象预报报文进行预处理,得到结构化简报数据;基于结构化文本提取方法对所述HTML形式数据的网页进行预处理,得到结构化简报数据。进一步,所述双向长短期记忆网络包括:输入字符嵌入层,用于对所述交通新闻类数据文本进行向量映射,得到所述交通新闻类数据文本对应的词向量矩阵;上下文表示层,用于对所述输入字符嵌入层输出的词向量矩阵进行上下文特征提取,得到上下文特征;字符层次自注意力机制层,用于对所述上下文表示层输出的上下文特征进行特征学习,得到句子经过自注意力机制后的隐层表示;句子层次自注意力机制层,用于对所述字符层次自注意力机制层输出的句子经过自注意力机制后的隐层表示进行特征学习,得到可观测序列;条件随机场层,用于对所述自注意力机制层输出的可观测序列进行分类,得到命名实体及分类结果。与现有技术相比,本专利技术至少可实现如下有益效果之一:1、一种交通运行信息提取与态势预警方法,通过爬虫技术获得航空气象类数据文本、航空运输类数据文本和交通新闻类数据文本,并对应得到结构化简报数据,并根据该结构化简报数据对依据语料数据库生成的动态简报模板进行填充,得到交通运行态势预警日报或交通运行态势预警月报,减轻了人工收集数据并撰写简报的工作量,填补了交通行业情况实时数据挖掘及分析研究领域的空缺,为相关管理决策人员提供了高效参考。2、双向长短期记忆网络包括输入字符嵌入层(Char-embedding)、上下文表示层(Bi-LSTM)、字符层次自注意力机制层(Charattention)、句子层次自注意力机制层(Sentenceattention)和条件随机场层(CRF),通过双向长短期记忆网络对新闻类数据文本进行训练学习,并分别从字符层次和句子层次提取特征,最终得到结构化的简报数据,提高了工作效率和可靠性。3、在得到关于交通气象类数据文本、交通运输类数据文本和交通新闻类数据文本对应的结构化简报数据后,可将其以CSV的格式保存在本地文件中,方便填充简报模板时的数据调用,或者,将其保存在MySQL、Oracle等数据库,为后续多平台数据的调用和处理提供了方便,具有较高的实用价值。本专利技术中,上述各技术方案之间还可以相互组合,以实现更多的优选组合方案。本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分优点可从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过说明书以及附图中所特别指出的内容中来实现和获得。附图说明附图仅用于示出具体实施例的目的,而并不认为是对本专利技术的限制,在整个附图中,相同的参考符号表示相同的部件。图1为一个实施例中交通运行信息提取与态势预警方法流程图;图2为一个实施例中基于航空塔台气象预报报文得到的结构化简报数据图;图3为一个实施例中基于HTML形式数据的网页得到的结构化简报数据图;图4为一个实施例中双向长短期记忆网络结构图;图5为另一个实施例中交通运行信息提取与态势预警装置结构图;附图标记:100-数据获取模块,200-数据处理模块,300-数据存储模块,400-语料匹配及模板填充模块。具体实施方式下面结合附图来具体描述本专利技术的优选实施例,其中,附图构成本申请一部分,并与本发本文档来自技高网...

【技术保护点】
1.一种交通运行信息提取与态势预警方法,其特征在于,包括下述步骤:/n获取航空气象类数据文本、航空运输类数据文本和交通新闻类数据文本;/n对所述航空气象类数据文本和航空运输类数据文本进行预处理,得到结构化简报数据并存储;并基于双向长短期记忆网络对所述交通新闻类数据文本进行处理,得到结构化简报数据并存储;/n基于存储的所述结构化简报数据和简报模板生成交通运行态势预警报告。/n

【技术特征摘要】
1.一种交通运行信息提取与态势预警方法,其特征在于,包括下述步骤:
获取航空气象类数据文本、航空运输类数据文本和交通新闻类数据文本;
对所述航空气象类数据文本和航空运输类数据文本进行预处理,得到结构化简报数据并存储;并基于双向长短期记忆网络对所述交通新闻类数据文本进行处理,得到结构化简报数据并存储;
基于存储的所述结构化简报数据和简报模板生成交通运行态势预警报告。


2.根据权利要求1所述的交通运行信息提取与态势预警方法,其特征在于,所述航空气象类数据文本为航空塔台气象预报报文,所述航空运输类数据文本为HTML数据形式的网页。


3.根据权利要求2所述的交通运行信息提取与态势预警方法,其特征在于,对所述航空气象类数据文本和航空运输类数据文本进行预处理,得到结构化简报数据,包括:
基于报文要素匹配方法对所述航空塔台气象预报报文进行预处理,得到结构化简报数据;
基于结构化文本提取方法对所述HTML形式数据的网页进行预处理,得到结构化简报数据。


4.根据权利要求3所述的交通运行信息提取与态势预警方法,其特征在于,所述双向长短期记忆网络包括:
输入字符嵌入层,用于对所述交通新闻类数据文本进行向量映射,得到所述交通新闻类数据文本对应的词向量矩阵;
上下文表示层,用于对所述输入字符嵌入层输出的词向量矩阵进行上下文特征提取,得到上下文特征;
字符层次自注意力机制层,用于对所述上下文表示层输出的上下文特征进行特征学习,得到句子经过自注意力机制后的隐层表示;
句子层次自注意力机制层,用于对所述字符层次自注意力机制层输出的句子经过自注意力机制后的隐层表示进行特征学习,得到可观测序列;
条件随机场层,用于对所述自注意力机制层输出的可观测序列进行分类,得到命名实体及分类结果。


5.根据权利要求1所述的交通运行信息提取与态势预警方法,其特征在于,得到所述结构化简报数据后,将所述结构化简报数据以CSV格式存储至本地文件;或者,
将所述结构化简报数据存储至MySQL或Oracle数据库。

【专利技术属性】
技术研发人员:佟路崔溪滢曹先彬郑磊杜文博朱熙
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1