居委标准代码转换系统及方法技术方案

技术编号:11204547 阅读:100 留言:0更新日期:2015-03-26 12:39
本发明专利技术揭示了一种居委标准代码转换系统及方法,所述系统包括:数据库模块、检索数据获取模块、匹配模块、智能学习模块。数据库模块用以存储设定数据;检索数据获取模块用以获取检索关键词;匹配模块用以将检索关键词与检索历史数据库中的历史检索数据进行匹配,若检索历史数据库中有与当前检索关键词相同的检索关键词,则输出对应的检索结果;智能学习模块用以跟踪历史检索事件中用户的行为,根据用户的行为判断其对匹配模块提供的匹配结果的满意度,以此确定匹配模块提供的匹配结果中各居委会对应属性在相应检索关键词下对应的权值。本发明专利技术可通过信息化手段将变更频繁的居委代码按统一标准提供给各业务系统,提高效率。

【技术实现步骤摘要】

本专利技术属于电子信息
,涉及一种代码转换系统,尤其涉及一种居委标准代码转换系统;同时,本专利技术还涉及一种居委标准代码转换方法。
技术介绍
随着中国城市信息化程度的深入,政府的各部门工作的电子化程度也不断增加,目前作为城市最基层的居委会是直接面向市民的关键角色,很多具体的工作和业务信息的实际管理都是以居委为主体在进行的,所以建立电子政务信息系统的时候,以居委为层面的信息管理、政策发布和工作业务上传管理是不可避免的。但是作为最小行政单位的居委会,也是变动最大,最难以管理的环节,实施标准化的信息区划管理存在一定的难度。以上海为例,行政区划的国家标准代码到街道、镇一级,居委会就是以地方标准代码为主了,而且和街道、镇的行政区划需要国家批准不同,居委会的变更较为简单、频繁;范围和名称的变更较为普遍。目前相当多的政务信息的管理界面仅到街道层面处理,而涉及到居委会的各级业务系统所采用的居委名称和区划代码也各不相同,同一个居委会在不同信息系统中的名称和区划代码存在普遍的差异,这就造成大量的业务数据之间存在交互的问题。同时具体掌握居民最及时信息的居委会层面无法对系统信息进行维护,随着民政局及下属各居委会和街道的工作的深入,随着近些年来上海城市经济和社会事业的快速发展,人口发展也进入一个新的时期。非上海户籍人口即外来人口在徐汇区居住、工作的数量将在今后几年内还会持续的增长;随着区城市改造的推进和住宅条件的改善,也使户籍人口中人户分离日趋增加,人员流动和市民办事业务的需求,对不同业务信息系统的信息交流、交互提出了更高的要求。但是不同业务系统中居委会信息的差异对信息的交互和整合带来了一定的影响。有鉴于此,如今迫切需要设计一种新的居委会代码解决方案,以克服现有居委会代码更新不及时的缺陷。
技术实现思路
本专利技术所要解决的技术问题是:提供一种居委标准代码转换系统,可通过信息化手段将变更频繁的居委代码按统一标准提供给各业务系统,各业务系统可以不需要修改本系统中原有的代码定义方式,便可直接使用居委标准代码,可以在此基础上实现原来较为复杂的居委会基础上的信息交互和沟通。此外,本专利技术还提供一种居委标准代码转换方法,可通过信息化手段将变更频繁的居委代码按统一标准提供给各业务系统,各业务系统可以不需要修改本系统中原有的代码定义方式,便可直接使用居委标准代码,可以在此基础上实现原来较为复杂的居委会基础上的信息交互和沟通。为解决上述技术问题,本专利技术采用如下技术方案:一种居委标准代码转换系统,将原有的逐个系统人工定制的工作方式通过本系统的学习记录和匹配流程成为自动化统一方案;系统流程为接收源数据和转换请求,通过匹配模块对源数据的分析和对比形成配对公式,最终输出标准代码数据;通过学习模块记录过程和结果公式记录下来,并跟踪用户多次提交源数据的转换结果确定配对权值;所述系统包括:非标历史学习库,用以记录源数据状态和分析情况,以长度、编码方式、标准关键字进行记录;供后续配对使用;配对公式库,用以记录结果公式,源数据能通过配对公式转化为标准代码;检索记忆库,用以存放用户历史所检索的居委名称,作为智能学习库和检索数据库的桥梁;居委会标准代码库,用以提供标准代码的基础数据库,本数据库通过自动爬网适配器,识别固定的网站标识符,自动从标准代码发布网站导入最新的标准代码,以提供给各业务系统使用;智能学习库,用以存放用户历史所转换的结果和配对权值;初始处理模块,用以接收服务对象,第三方业务系统的非标居委名称或/和代码,按关键字、排列、词库的方式进行整理,并在非标历史库中查询,如有相似的案例,直接作为配比方案提供下一流程,如无相似,则自动进行初步处理,并提供给人工审核界面,在人工处理完成后记录进入历史库,作为下次处理的案例,达到系统学习的目的;算法匹配模块,用以根据初始处理的数据情况,从所述配对公式库中选择不同的算法公式,比如常见的最简单转换公式:原字串+“街道”=>对应标准代码表(将缺少“街道”的简称如“徐家汇”转化为“徐家汇街道”,获得徐家汇街道的标准代码310104014输出);根据不同的数据分类按:中文连续、中文简称、英文完整、英文简称、数字型、非标自定义这几种类型选择不同的配对算法,异常情况下有提交至人工处理,通过人工干涉和处理,完成流程,并学习进入配对公式库;智能学习模块,用以跟踪历史申请转换事件中用户的行为,根据用户的提交频次和人工干涉结果判断其对匹配模块提供的匹配结果的满意度(如一次配对成功后续无提交和多次提交后还需人工干涉的配对结果权值相差极大),以此确定匹配模块提供的匹配结果中各居委会对应属性在相应转换公式下对应的权值;综合多次的用户行为分析,根据每次检索事件中各居委会对应属性的权值确定下次相同检索或检索关键词相似度在设定值范围内的相似检索中各居委会对应属性的排序;代码转换模块,用以根据前期流程的处理结果,本模块提供转换接口,第三方业务系统通过接口来查询、调用、转换、批处理居委会标准代码;行政区划模型辅助处理模块,用以提供辅助的信息关联,以使系统具备一定的扩展能力,除了对于代码的配对转换以外,还可以考虑将行政区划的信息作为转化配对的要素进行分析;本模块将居委会的行政区划方向类描述转换为详细的街道、门牌、楼宇为界限的信息;同时处理居委模型所有信息的查询和调用;处理居委行政区划的合并、拆分、调整,形成变更预案供业务系统和政府部门预处理;居委模型包括如下功能:居委会信息的代码地标和信息系统的转换、居委会地理信息的区划划分、居委会地理信息的采集、居委会地理信息和人口信息的运算、居委会地标代码和街道镇国标代码的混合使用;所述算法匹配模块的分词配对方法包括如下步骤:步骤A1、文字预处理过程、获取需要转换的原始业务系统的居委准备进行分析;步骤A2、首先系统确定数据的编码为中文、英文和数字中的哪一种;步骤A3、分析数据的编码的方式,是全称、简称,还是业务自定义;步骤A4、分析中文数据调用检索历史库,查询关键字符、历史匹配记录;步骤A5、判断是否有类似案例,如果有,直接采用;如果没有,系统显示并提交近似的方案,方案匹配度按编码、定义方式、业务类型的权重不同选型;步骤A6、智能或人工审核干涉,形成固定解决方案;步骤A7、方案记录进入学习历史库,提供给下次选型,检索历史库的内容通过积累,逐步覆盖大部分的业务类型;所述智能学习模块智能本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201410621040.html" title="居委标准代码转换系统及方法原文来自X技术">居委标准代码转换系统及方法</a>

【技术保护点】
一种居委标准代码转换系统,其特征在于:接收源数据和转换请求,通过匹配模块对源数据的分析和对比形成配对公式,最终输出标准代码数据;通过学习模块记录过程和结果公式记录下来,并跟踪用户多次提交源数据的转换结果确定配对权值;所述系统包括: 非标历史学习库,用以记录源数据状态和分析情况,以长度、编码方式、标准关键字进行记录;供后续配对使用; 配对公式库,用以记录结果公式,源数据能通过配对公式转化为标准代码; 检索记忆库,用以存放用户历史所检索的居委名称,作为智能学习库和检索数据库的桥梁; 居委会标准代码库,用以提供标准代码的基础数据库,本数据库通过自动爬网适配器,识别固定的网站标识符,自动从标准代码发布网站导入最新的标准代码,以提供给各业务系统使用; 智能学习库,用以存放用户历史所转换的结果和配对权值; 初始处理模块,用以接收服务对象,第三方业务系统的非标居委名称或/和代码,按关键字、排列、词库的方式进行整理,并在非标历史库中查询,如有相似的案例,直接作为配比方案提供下一流程,如无相似,则自动进行初步处理,并提供给人工审核界面,在人工处理完成后记录进入历史库,作为下次处理的案例,达到系统学习的目的; 算法匹配模块,用以根据初始处理的数据情况,从所述配对公式库中选择不同的算法公式;根据不同的数据分类按:中文连续、中文简称、英文完整、英文简称、数字型、非标自定义这几种类型选择不同的配对算法,异常情况下有提交至人工处理,通过人工干涉和处理,完成流程,并学习进入配对公式库; 智能学习模块,用以跟踪历史申请转换事件中用户的行为,根据用户的提交频次和人工干涉结果判断其对匹配模块提供的匹配结果的满意度,以此确定匹配模块提供的匹配结果中各居委会对应属性在相应转换公式下对应的权值;综合多次的用户行为分析,根据每次检索事件中各居委会对应属性的 权值确定下次相同检索或检索关键词相似度在设定值范围内的相似检索中各居委会对应属性的排序; 代码转换模块,用以根据前期流程的处理结果,本模块提供转换接口,第三方业务系统通过接口来查询、调用、转换、批处理居委会标准代码; 行政区划模型辅助处理模块,用以提供辅助的信息关联,以使系统具备一定的扩展能力,除了对于代码的配对转换以外,考虑将行政区划的信息作为转化配对的要素进行分析;本模块将居委会的行政区划方向类描述转换为详细的街道、门牌、楼宇为界限的信息;同时处理居委模型所有信息的查询和调用;处理居委行政区划的合并、拆分、调整,形成变更预案供业务系统和政府部门预处理;居委模型包括如下功能:居委会信息的代码地标和信息系统的转换、居委会地理信息的区划划分、居委会地理信息的采集、居委会地理信息和人口信息的运算、居委会地标代码和街道镇国标代码的混合使用; 所述算法匹配模块的分词配对方法包括如下步骤: 步骤A1、文字预处理过程、获取需要转换的原始业务系统的居委准备进行分析; 步骤A2、首先系统确定数据的编码为中文、英文和数字中的哪一种; 步骤A3、分析数据的编码的方式,是全称、简称,还是业务自定义; 步骤A4、分析中文数据调用检索历史库,查询关键字符、历史匹配记录; 步骤A5、判断是否有类似案例,如果有,直接采用;如果没有,系统显示并提交近似的方案,方案匹配度按编码、定义方式、业务类型的权重不同选型; 步骤A6、智能或人工审核干涉,形成固定解决方案; 步骤A7、方案记录进入学习历史库,提供给下次选型,检索历史库的内容通过积累,逐步覆盖大部分的业务类型; 所述智能学习模块智能学习的步骤包括: 步骤B1、用户输入设定的关键字作为一级检索关键字进行检索,智能学习库获取一级检索关键字; 步骤B2、在智能学习库中检索上一步骤所得的级别检索关键字,该级别 检索关键字是否已存在于智能学习库,存在则执行步骤B4;若不存在,则将该级检索关键字结合分词法继续分解成下一级别学习检索,转步骤B3; 步骤B3、继续执行步骤B2; 步骤B4、将在智能学习库检索到的关键字关联搜索经验库相关记录呈现给用户,同时将一级检索关键字与结果关键字进行学习对比,学习存储到智能学习库;经过大量学习后,以后有用户输入的关键字如果和学习结果一致,能直接检索出结果; 步骤B5、学习成功和配对过程也存储在记忆库中作为加权参数,配对成功越多的级别检索将优先提供给下一次的配对检索。...

【技术特征摘要】
1.一种居委标准代码转换系统,其特征在于:接收源数据和转换请求,通过匹配模块对源数据的分析和对比形成配对公式,最终输出标准代码数据;通过学习模块记录过程和结果公式记录下来,并跟踪用户多次提交源数据的转换结果确定配对权值;所述系统包括: 
非标历史学习库,用以记录源数据状态和分析情况,以长度、编码方式、标准关键字进行记录;供后续配对使用; 
配对公式库,用以记录结果公式,源数据能通过配对公式转化为标准代码; 
检索记忆库,用以存放用户历史所检索的居委名称,作为智能学习库和检索数据库的桥梁; 
居委会标准代码库,用以提供标准代码的基础数据库,本数据库通过自动爬网适配器,识别固定的网站标识符,自动从标准代码发布网站导入最新的标准代码,以提供给各业务系统使用; 
智能学习库,用以存放用户历史所转换的结果和配对权值; 
初始处理模块,用以接收服务对象,第三方业务系统的非标居委名称或/和代码,按关键字、排列、词库的方式进行整理,并在非标历史库中查询,如有相似的案例,直接作为配比方案提供下一流程,如无相似,则自动进行初步处理,并提供给人工审核界面,在人工处理完成后记录进入历史库,作为下次处理的案例,达到系统学习的目的; 
算法匹配模块,用以根据初始处理的数据情况,从所述配对公式库中选择不同的算法公式;根据不同的数据分类按:中文连续、中文简称、英文完整、英文简称、数字型、非标自定义这几种类型选择不同的配对算法,异常情况下有提交至人工处理,通过人工干涉和处理,完成流程,并学习进入配对公式库; 
智能学习模块,用以跟踪历史申请转换事件中用户的行为,根据用户的提交频次和人工干涉结果判断其对匹配模块提供的匹配结果的满意度,以此确定匹配模块提供的匹配结果中各居委会对应属性在相应转换公式下对应的权值;综合多次的用户行为分析,根据每次检索事件中各居委会对应属性的 权值确定下次相同检索或检索关键词相似度在设定值范围内的相似检索中各居委会对应属性的排序; 
代码转换模块,用以根据前期流程的处理结果,本模块提供转换接口,第三方业务系统通过接口来查询、调用、转换、批处理居委会标准代码; 
行政区划模型辅助处理模块,用以提供辅助的信息关联,以使系统具备一定的扩展能力,除了对于代码的配对转换以外,考虑将行政区划的信息作为转化配对的要素进行分析;本模块将居委会的行政区划方向类描述转换为详细的街道、门牌、楼宇为界限的信息;同时处理居委模型所有信息的查询和调用;处理居委行政区划的合并、拆分、调整,形成变更预案供业务系统和政府部门预处理;居委模型包括如下功能:居委会信息的代码地标和信息系统的转换、居委会地理信息的区划划分、居委会地理信息的采集、居委会地理信息和人口信息的运算、居委会地标代码和街道镇国标代码的混合使用; 
所述算法匹配模块的分词配对方法包括如下步骤: 
步骤A1、文字预处理过程、获取需要转换的原始业务系统的居委准备进行分析; 
步骤A2、首先系统确定数据的编码为中文、英文和数字中的哪一种; 
步骤A3、分析数据的编码的方式,是全称、简称,还是业务自定义; 
步骤A4、分析中文数据调用检索历史库,查询关键字符、历史匹配记录; 
步骤A5、判断是否有类似案例,如果有,直接采用;如果没有,系统显示并提交近似的方案,方案匹配度按编码、定义方式、业务类型的权重不同选型; 
步骤A6、智能或人工审核干涉,形成固定解决方案; 
步骤A7、方案记录进入学习历史库,提供给下次选型,检索历史库的内容通过积累,逐步覆盖大部分的业务类型; 
所述智能学习模块智能学习的步骤包括: 
步骤B1、用户输入设定的关键字作为一级检索关键字进行检索,智能学习库获取一级检索关键字; 
步骤B2、在智能学习库中检索上一步骤所得的级别检索关键字,该级别 检索关键字是否已存在于智能学习库,存在则执行步骤B4;若不存在,则将该级检索关键字结合分词法继续分解成下一级别学习检索,转步骤B3; 
步骤B3、继续执行步骤B2; 
步骤B4、将在智能学习库检索到的关键字关联搜索经验库相关记录呈现给用户,同时将一级检索关键字与结果关键字进行学习对比,学习存储到智能学习库;经过大量学习后,以后有用户输入的关键字如果和学习结果一致,能直接检索出结果; 
步骤B5、学习成功和配对过程也存储在记忆库中作为加权参数,配对成功越多的级别检索将优先提供给下一次的配对检索。 
2.一种居委标准代码转换系统,其特征在于,所述系统包括: 
数据库模块,用以存储设定数据;包括检索历史数据库、居委会标准代码数据库;历史数据库中存储有检索关键词,以及对应的检索结果,即居委会标准代码;居委会标准代码数据库存储有居委会标准代码及相关属性; 
检索数据获取模块,用以获取检索数据,即检索关键词; 
匹配模块,用以将检索关键词与检索历史数据库中的历史检索数据进行匹配,若检索历...

【专利技术属性】
技术研发人员:王志崴何峥
申请(专利权)人:上海南洋万邦软件技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1