基于树状结构的灾情信息编、解码方法和装置制造方法及图纸

技术编号:23709629 阅读:37 留言:0更新日期:2020-04-08 12:03
本发明专利技术公开了一种基于树状结构的灾情信息编、解码方法和装置,所述方法包括:根据灾情信息的获取来源所对应的树状结构中的根节点的第一定长码字,以及灾情信息的类型所对应的树状结构中第二层节点的第二定长码字,确定所述灾情信息的定长编码结果;对于所述类型对应的第二层节点的各子节点,依次将各子节点分别对应的灾情信息的各子类别的标识值拼接组成第一变长码字,依次将各子类别的取值拼接组成第二变长码字;将定长编码结果、第一变长码字、分界符、第二变长码字依次拼接得到所述灾情信息的编码结果。应用本发明专利技术能尽可能保存完整信息,尽量达到无信息缺失;且在信息结构各异的前提下,实现统一化、规范化并具有准确性的信息留存率高。

Method and device of encoding and decoding disaster information based on tree structure

【技术实现步骤摘要】
基于树状结构的灾情信息编、解码方法和装置
本专利技术涉及灾情信息编码
,特别是指一种基于树状结构的灾情信息编、解码方法和装置。
技术介绍
地震灾害是最为严重的自然灾害之一,每年造成的伤亡人数都十分庞大,各国都将对地震的预防和救援作为重要工作,其中震后救援工作更是重中之重。具有严重破坏力的地震发生之后,对地震灾情信息精准快速地获取对应急指挥决策过程将产生至关重要的影响。由于地震灾情信息包括来自于全国范围内的速报网络的信息和舆情信息等,结构、来源各异,缺乏规范性、可读性。因此对灾情信息进行编码将对地震灾情救援产生巨大现实的影响,它的意义在于规范化记录灾情信息,可以有利于信息存储、信息读取及信息利用。既可以使地震灾情信息的存储规范化为同一种格式,还可以降低读取地震灾情信息的难度,更合理地利用地震灾情信息,它无疑将极大促进地震灾情分析和地震救援事业的发展。国际上,针对突发自然灾害信息的规范化工作开展较早,欧盟制定了统一的紧急事件处置分类编码方法并设计了数据库规范,其内容包括数百个空间图层与数百个属性,对于每一种紧急事件情况给出相应编码;意大利民防部采用的地震灾情编码方式为数据及数据流交换编码,工作模式为地震现场-联动机构-指挥中心;美国地质调查局的灾情信息获取方式为通过网站接受民众上传的格式固定的灾情信息,在信息获取阶段即对灾情信息进行规范化和标准化编码;日本遍布全国各地的强震台网、地震测震台网、灾情监控仪器等都实现了编码式信息的识别和报送。地震灾情数据较之地震科学数据具有来源广和数量大等特点,然而地震灾情数据与地震科学数据不同,科学数据的科学性和精确性为其首要特点,而地震灾情信息往往由于其多源性具有一定程度的偏差,这决定了难以进行规范化的编码和相应的解码和分析。地震灾情信息编码方法是保证信息规范化的重要手段,编码方法最直接的目标不仅仅是对各个来源的信息进行合理的规范化表示,还相应地提高系统分析震害情况的能力、增加地震灾情救援反应速度等。因此研究地震灾情信息的编码具有重要意义。传统的信息编码方法已有很多,譬如矩阵结构编码方法,该方法由多个码位组成,数个码位按矩阵进行联用,这种编码方法的特点是包容的信息量大,但是对码字进行解码和分析的过程难度较大,不适合地震灾情信息需要进行解码及分析灾情的情况;链式结构编码,即将码字设定为链式结构,链式结构中的每个码位的数字具有独立的含义,结构单一且易于编码解码,但其包含的信息量远远小于地震发生后需要获取的地震灾情信息所包含的信息量,因此结构需要进一步优化。以上均为已存在的传统信息编码方法。而目前提出了一种应用于地震灾情信息的混合编码方法——专用灾情信息编码。该编码方法基于树式和链式编码技术,使用大类-子类-要素顺序的结构对信息进行编码,每条码字包含大类及其中某一个子类及相应的要素顺序值。然而在实际应用中,本专利技术的专利技术人发现该算法针对地震灾情信息编码存在以下三点问题:其一,是缺少灾情获取来源:灾情信息往往来源广,数量大,比如有些灾情信息来源于舆情,有些来源于速报人员上报,对于少量信息来说,来源统计可能不甚重要,然而对于数量庞大的灾情信息,对来源进行统计往往更有利于分析地震灾情情况,做出判断,辅助救援。因此缺少灾情信息来源码字会造成灾情信息的不完整性。其二,是容易造成信息丢失:专用灾情信息编码将码字划为三个关联区域分别表示大类、子类及要素顺序,三个区域之间具有相邻的父子关系。每个区域只能存放单一信息,然后下一区域存放该上一个区域的信息下的某一单一信息,最后每个区域的单一信息组合成整条码字所表示的单一信息,然而由于一条地震灾情信息可能具有许多属性,该种编码方法下,一条地震灾情信息会被编码为数个码字,解码时,无法将分散的码字一同解码为原始地震灾情信息,这不能很好地适应地震灾情信息的复杂性。比如当一条房屋地震灾情信息被编码为毁坏等级和房屋类型两个码字,解码时并不能确定这两个码字原始属于同一条地震灾情信息,造成信息的丢失。其三,是缺乏有效地解码手段:因灾情信息有数种类型,包括人员伤亡、房屋倒塌等,对于每一种灾情信息,其表达方式往往不同,如人员伤亡可能是一个很庞大的数字,而房屋倒塌只是一种程度,在对编码后的码字进行解码的时候,往往需要对于不同的类型的灾情信息读取相应不同的属性或值,而固定的编码格式使得很难直观地分辨码字表示属性或值的部分,至于读取其具体值进行处理更是需要花费大量时间与精力。上述的专用灾情信息编码场景较之传统信息编码,有两点不同:一是信息来源广、数量庞大、结构迥异。一般不止来自于舆情、网页统计、官方数据等,因此信息结构差别很大,往往两条信息表达的方面可能完全不同。二是,需要考虑对码字进行解码的手段。对灾情信息编码不仅仅是利于表达与存储,更偏向于对码字进行处理和解读,因此解码的难度和精确度要求较高。故而,上述现有的灾情信息编码方法中几乎没有针对多源异构灾情信息编码的需求特性而提供信息编码的解决方案:灾情信息具有多源性、异构性等特点,上述传统编码方法不能直接被应用。针对现代各种来源、各种类型的灾情信息,需要一种在信息结构各异的前提下,实现统一化、规范化并具有准确性的信息留存率高的编码方法。
技术实现思路
本专利技术提出了一种基于树状结构的灾情信息编、解码方法和装置,是针对多源异构灾情信息编码的需求特性而提供信息编解码的解决方案,编码后能尽可能保存完整信息,尽量达到无信息缺失;且在信息结构各异的前提下,可以实现统一化、规范化并具有准确性的信息留存率高的编解码方法。基于上述目的,本专利技术提供一种基于树状结构的灾情信息编码方法,包括:根据灾情信息的获取来源所对应的树状结构中的根节点的第一定长码字,以及所述灾情信息的类型所对应的所述树状结构中第二层节点的第二定长码字,确定所述灾情信息的定长编码结果;对于所述类型对应的第二层节点的各子节点,根据所述各子节点在所述树状结构的第三层节点中的先后排列顺序,依次将各子节点分别对应的所述灾情信息的各子类别的标识值拼接组成第一变长码字,依次将所述灾情信息的各子类别的取值拼接组成第二变长码字;将所述定长编码结果、第一变长码字、设定的分界符、第二变长码字依次拼接得到所述灾情信息的编码结果。其中,所述将所述灾情信息的各子类别的取值拼接组成第二变长码字,具体包括:在所述子类别的取值为变长码字的情况下,在依次拼接所述灾情信息的各子类别的取值时,在相邻子类别的取值之间插入间隔符,形成第二变长码字;在所述各子类别的取值均为定长码字的情况下,直接将所述灾情信息的各子类别的取值依次拼接,得到第二变长码字。本专利技术还提供一种基于树状结构的灾情信息解码方法,包括:根据所述树状结构中的根节点、第二层节点的码字长度,从灾情信息的编码结果中先后截取第一、二定长码字,并基于第一、二定长码字分别解析出所述灾情信息的获取来源、类型;对所述灾情信息的编码结果中剩余的变长编码结果,从中识别出设定的分界符后,获取所述分界符之前的第一变长码字,以本文档来自技高网
...

【技术保护点】
1.一种基于树状结构的灾情信息编码方法,其特征在于,包括:/n根据灾情信息的获取来源所对应的树状结构中的根节点的第一定长码字,以及所述灾情信息的类型所对应的所述树状结构中第二层节点的第二定长码字,确定所述灾情信息的定长编码结果;/n对于所述类型对应的第二层节点的各子节点,根据所述各子节点在所述树状结构的第三层节点中的先后排列顺序,依次将各子节点分别对应的所述灾情信息的各子类别的标识值拼接组成第一变长码字,依次将所述灾情信息的各子类别的取值拼接组成第二变长码字;/n将所述定长编码结果、第一变长码字、设定的分界符、第二变长码字依次拼接得到所述灾情信息的编码结果。/n

【技术特征摘要】
1.一种基于树状结构的灾情信息编码方法,其特征在于,包括:
根据灾情信息的获取来源所对应的树状结构中的根节点的第一定长码字,以及所述灾情信息的类型所对应的所述树状结构中第二层节点的第二定长码字,确定所述灾情信息的定长编码结果;
对于所述类型对应的第二层节点的各子节点,根据所述各子节点在所述树状结构的第三层节点中的先后排列顺序,依次将各子节点分别对应的所述灾情信息的各子类别的标识值拼接组成第一变长码字,依次将所述灾情信息的各子类别的取值拼接组成第二变长码字;
将所述定长编码结果、第一变长码字、设定的分界符、第二变长码字依次拼接得到所述灾情信息的编码结果。


2.根据权利要求1所述的方法,其特征在于,还包括:
在所述定长编码结果的前面添加所述灾情信息的地理位置所在区域的区域代码,形成所述灾情信息的最终编码结果。


3.根据权利要求1所述的方法,其特征在于,所述将所述灾情信息的各子类别的取值拼接组成第二变长码字,具体包括:
在所述子类别的取值为变长码字的情况下,在依次拼接所述灾情信息的各子类别的取值时,在相邻子类别的取值之间插入间隔符,形成第二变长码字;
在所述各子类别的取值均为定长码字的情况下,直接将所述灾情信息的各子类别的取值依次拼接,得到第二变长码字。


4.一种基于树状结构的灾情信息解码方法,其特征在于,包括:
根据所述树状结构中的根节点、第二层节点的码字长度,从灾情信息的编码结果中先后截取第一、二定长码字,并基于第一、二定长码字分别解析出所述灾情信息的获取来源、类型;
对所述灾情信息的编码结果中剩余的变长编码结果,从中识别出设定的分界符后,获取所述分界符之前的第一变长码字,以及所述分界符之后的第二变长码字;
根据所述树状结构中的第三层节点的码字长度,从第一变长码字中依次截取出所述类型下所述灾情信息的各子类别的标识值,进而从第二变长码字中依次截取出所述类型下的各子类别的取值;
根据截取出的各子类别的标识值,解析出所述灾情信息涉及到的子类别;根据截取出的各子类别的取值,解析出所述灾情信息涉及到的子类别的具体情况信息。


5.根据权利要求4所述的方法,其特征在于,在所述根据所述树状结构中的根节点、第二层节点的码字长度,从灾情信息的编码结果中先后截取第一、二定长码字之前,还包括:
从所述灾情信息的编码结果的前端截取区域代码,根据所述区域代码解析出所述灾情信息的地理位置。

<...

【专利技术属性】
技术研发人员:王晓湘张子玉王冬宇韩万江李琦王玉龙魏鹏
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1