本发明专利技术提供了一种用于稿件中的职务信息的检查方法,包括:利用人名数据库对稿件进行全文检索,以确定稿件中的人名;以确定的人名检索职务数据库,以确定人名所关联的职务;利用确定的职务判断人名在稿件中的相关信息是否正确。本发明专利技术还提供了一种用于稿件中的职务信息的检查装置,包括:人名模块,用于利用人名数据库对稿件进行全文检索,以确定稿件中的人名;职务模块,用于以确定的人名检索职务数据库,以确定人名所关联的职务;判断模块,用于利用确定的职务判断人名在稿件中的相关信息是否正确。本发明专利技术提高了稿件质量。
【技术实现步骤摘要】
用于稿件中的职务信息的检查方法和装置
本专利技术涉及信息处理领域,具体而言,涉及一种用于稿件中的职务信息的检查方法和装置。
技术介绍
稿件中经常出现人名及其职务信息,在稿件的编辑过程中要求该人名的职务信息,并且当多个人名并列出现时,应当按照其职务的排序将这些人名进行排序。目前稿件职务校对的工作可以采取人工校对方法,一般包括以下步骤:(1)从采编系统中打印需要校对的稿件。(2)人工阅读该纸面稿件,遇到有疑问的领导人职务,手动去查找相关的职务信息,或者咨询经验丰富的校对人员。(3)对错误的职务进行手工批注修改。(4)手动把修改的内容录入到采编系统中。人工校对的校对过程过多地依赖校对人员的知识经验,容易出现失误,导致报纸出现错误的职务信息,影响出版物的质量。
技术实现思路
本专利技术旨在提供一种用于稿件中的职务信息的检查方法和装置,以取代人工校对稿件中的人名信息。根据本专利技术的一个方面,提供了一种用于稿件中的职务信息的检查方法,包括:利用人名数据库对稿件进行全文检索,以确定稿件中的人名;以确定的人名检索职务数据库,以确定人名所关联的职务;利用确定的职务判断人名在稿件中的相关信息是否正确。根据本专利技术的另一方面,提供了一种用于稿件中的职务信息的检查装置,包括:人名模块,用于利用人名数据库对稿件进行全文检索,以确定稿件中的人名;职务模块,用于以确定的人名检索职务数据库,以确定人名所关联的职务;判断模块,用于利用确定的职务判断人名在稿件中的相关信息是否正确。本专利技术的用于稿件中的职务信息的检查方法和装置因为采用数据库来检查人名信息,所以克服了人工校对的失误问题,进而提高了稿件质量。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1示出了根据本专利技术实施例的用于稿件中的职务信息的检查方法的流程图;图2示出了根据本专利技术实施例的用于稿件中的职务信息的检查装置的示意图。具体实施方式下面将参考附图并结合实施例,来详细说明本专利技术。图1示出了根据本专利技术实施例的用于稿件中的职务信息的检查方法的流程图,包括:步骤S10,利用人名数据库对稿件进行全文检索,以确定稿件中的人名;步骤S20,以确定的人名检索职务数据库,以确定人名所关联的职务;步骤S30,利用确定的职务判断人名在稿件中的相关信息是否正确。现有技术中通过人工校对来检查稿件中的人名职务信息,而本实施例中,利用人名数据库和职务数据库来分析稿件中的人名职务信息,从而整个过程实现了软件自动化,所以克服了人工校对的失误问题,进而提高了稿件质量。优选地,本检查方法还包括:预先创建人名数据库,其中包括多条记录,各条记录包括用于记载人名的字段;其中,利用人名数据库对稿件进行全文检索包括:将各条记录中记载的人名与稿件的全文进行匹配;如果在稿件中匹配到与记录中记载的人名相同的词,则将匹配到的词确定为稿件中的人名。本实施例的人名数据库方案比较简单,容易实现。通过对人名数据库的维护,还可以实现人名数据库的动态更新。需要说明的是,本文中的词是指一个语言单位,可以是构成单词的一个字符,也可以是构成单词的多个字符,而且字符可以是标点,也可以是文字。优选地,本检查方法还包括:预先创建职务数据库,其中包括多条记录,各条记录包括用于记载人名的第一字段和用于记载职务的第二字段;其中,以确定的人名检索职务数据库包括:将确定的人名匹配各条记录;如果在记录的第一字段中匹配到人名,则提取当前记录中的第二字段中的职务;将提取的职务确定为人名所关联的职务。本实施例的职务数据库方案比较简单,容易实现。通过对职务数据库的维护,还可以实现职务数据库的动态更新。例如,校对人员如果发现职务数据库中的职务信息有误,可以手动修改职务数据库中的相关字段。优选地,步骤S30包括:提取人名在稿件中相邻的词;判断相邻的词是否为职务;如果相邻的词是职务,则确定相邻的词是否匹配以职务数据库确定的职务;如果不匹配,则标注相邻的词。本实施例通过简单的匹配操作,即可自动地判断职务信息是否准确,显著地节省了校对人员的工作量。例如稿件中的文字为“部长张三”,将“部长”与职务数据库进行匹配,发现职务数据库中的“张三”记录的第二字段是“副部长”,即可自动地标注“部长张三”,例如显示为红字,从而提醒校对人员判断稿件是否有误。优选地,预先创建职务数据库,其中包括多条记录,各条记录包括:用于记载人名的第一字段、用于记载职务的第二字段;以及用于记载职务的索引的第三字段,索引的大小与职务的级别线性相关;其中,以确定的人名检索职务数据库,在确定人名所关联的职务的同时,还确定所关联的职务的索引。本优选实施例将职务的级别在职务数据库中予以数字化,从而可以对职务自动检查级别信息。优选地,步骤S30包括:确定稿件中为并列关系的人名;判断并列的人名的索引在并列关系中的先后排序是否符合人名所关联的职级为从高到低;如果不符合,则标注并列的人名。因为职务的级别在职务数据库中已经数字化,所以通过对索引的排序,即可确定稿件中的人名是否按照职务级别予以排序。例如稿件中的文字为“局长李四、部长张三、科长王五”,在职务数据库中如果部长的索引是1、局长的索引是2、科长的索引是3,则上述文字得到的索引顺序是“2、1、3”,不符合“1、2、3”的顺序,本优选实施例可以自动地蓝字标注“局长李四、部长张三、科长王五”,从而提醒校对人员这段文字的人名是否排序有误。优选地,并列关系为以下模式:职务1、职务2......职务ml人名1、职务1、职务2......职务m2人名2、......、职务1、职务2......职务mn人名n,其中,n为大于等于2的自然数;m1、m2、......、mn均为非负整数,职务可有可无。例如,可以有以下几种:1)领导人12)领导人1,领导人23)职务1领导人14)职务1,职务2领导人15)职务1,职务2领导人1,领导人2。这包括了稿件中常见的人名次序。优选地,确定稿件中为并列关系的人名包括:A)判断当前的人名在稿件中上文相邻的词;B)如果无词或者词不是职务,则确定当前人名之前无并列的人名,结束当前人名的并列关系的判断;C)如果词是标点符号或词是职务,则对在上文相邻的字符循环执行步骤B和C;D)如果词是人名,则将判断得到的人名加入并列关系,并以判断得到的人名作为当前的人名循环执行上述判断并列关系的步骤。上述过程是简单的循环过程,很容易通过计算机变成来实现。图2示出了根据本专利技术实施例的用于稿件中的职务信息的检查装置的示意图,包括:人名模块10,用于利用人名数据库对稿件进行全文检索,以确定稿件中的人名;职务模块20,用于以确定的人名检索职务数据库,以确定人名所关联的职务;判断模块30,用于利用确定的职务判断人名在稿件中的相关信息是否正确。本装置克服了人名职务人工校对的失误问题,进而提高了稿件质量。优选地,判断模块30包括:提取模块,用于提取人名在稿件中相邻的词;职务判断模块,用于判断相邻的词是否为职务;匹配模块,用于如果相邻的词是职务,则确定相邻的词是否匹配以职务数据库确定的职务;标注模块,用于如果不匹配,则标注相邻的词。本实施例中,利用人名数据库和职务数据库来分析稿件中的人名职务信息,本文档来自技高网...
【技术保护点】
一种用于稿件中的职务信息的检查方法,其特征在于,包括:利用人名数据库对稿件进行全文检索,以确定所述稿件中的人名;以确定的所述人名检索职务数据库,以确定所述人名所关联的职务;利用确定的所述职务判断所述人名在所述稿件中的相关信息是否正确。
【技术特征摘要】
1.一种用于稿件中的职务信息的检查方法,其特征在于,包括:利用人名数据库对稿件进行全文检索,以确定所述稿件中的人名;以确定的所述人名检索职务数据库,以确定所述人名所关联的职务以及所关联职务的索引,其中,索引的大小与职务的级别线性相关;利用确定的所述职务判断所述人名在所述稿件中的相关信息是否正确,其中,本步骤包括:确定所述稿件中为并列关系的所述人名,其中,所述并列关系为以下模式:职务1、职务2……职务m1人名1、职务1、职务2……职务m2人名2、……、职务1、职务2……职务mn人名n,其中,n为大于等于2的自然数,m1、m2、……、mn均为非负整数,职务可有可无;判断所述并列的人名的索引在所述并列关系中的先后排序是否符合所述人名所关联的职级为从高到低。2.根据权利要求1所述的方法,其特征在于,还包括:预先创建所述人名数据库,其中包括多条记录,所述各条记录包括用于记载人名的字段;其中,利用人名数据库对稿件进行全文检索包括:将所述各条记录中记载的人名与所述稿件的全文进行匹配;如果在所述稿件中匹配到与所述记录中记载的人名相同的词,则将所述匹配到的词确定为所述稿件中的人名。3.根据权利要求1所述的方法,其特征在于,还包括:预先创建所述职务数据库,其中包括多条记录,所述各条记录包括用于记载人名的第一字段和用于记载职务的第二字段;其中,以确定的所述人名检索职务数据库包括:将确定的所述人名匹配所述各条记录;如果在所述记录的所述第一字段中匹配到所述人名,则提取当前所述记录中的第二字段中的职务;将所述提取的职务确定为所述人名所关联的职务。4.根据权利要求1所述的方法,其特征在于,利用确定的所述职务判断所述人名在所述稿件中的相关信息是否正确包括:提取所述人名在所述稿件中相邻的词;判断所述相邻的词是否为职务;如果所述相邻的词是职务,则确定所述相邻的词是否匹配以所述职务数据库确定的职务;如果不匹配,则标注所述相邻的词。5.根据权利要求1所述的方法,其特征在于,预先创建所述职务数据库,其中包括多条记录,所述各条记录包括:用于记载人名的第一字段、用于记载职务的第二字段;以及用于记载所述职务的索引的第三字段,所述索引的大小与所述职务的级别线性相关;其中,以确定的所述人名检索职务数据库,在确定所述人名所关联的职务的同时,还确定所述所关联的职务的索引。6.根据权利要求5所述的方法,其特征在于,利用确定的所述职务判断所述人名在所述...
【专利技术属性】
技术研发人员:周志扬,朱建波,
申请(专利权)人:北京大学, 北大方正集团有限公司, 北京北大方正电子有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。