【技术实现步骤摘要】
文件内容的评价方法、装置、电子设备及程序产品
[0001]本公开涉及计算机技术中的NLP技术,尤其涉及一种文件内容的评价方法、装置、电子设备及程序产品。
技术介绍
[0002]目前,在很多应用程序中设置有文件,当用户同意该文件中的相关条款时,可以使用应用程序所提供的功能。例如,该文件可以是涉及隐私政策等的文件。
[0003]通常,这些文件是通过工作人员编写的。同时,这些文件应当符合国家制定的相关法律法规。
[0004]工作人员将文件编写好以后,需要根据经验校验文件是否合规,但这种方式效率较低,且准确性差。
技术实现思路
[0005]本公开提供了一种文件内容的评价方法、装置、电子设备及程序产品,以快速且准确的确定文件内容是否合规。
[0006]根据本公开的第一方面,提供了一种文件内容的评价方法,包括:
[0007]接收用于对待处理文件进行评价的请求,并根据所述请求获取待处理文件,以及用于评价所述待处理文件的预设的第一文件;
[0008]根据所述第一文件,确定所述待处理文件的完整性分值,以及所述待处理文件的合法性分值;
[0009]根据所述待处理文件的完整性分值和所述合法性分值,确定所述待处理文件的评价结果,所述评价结果用于表征所述待处理文件是否合规。
[0010]根据本公开的第二方面,提供了一种文件内容的评价装置,包括:
[0011]接收单元,用于接收用于对待处理文件进行评价的请求;
[0012]获取单元,用于根据所述请求获取待处理 ...
【技术保护点】
【技术特征摘要】
1.一种文件内容的评价方法,包括:接收用于对待处理文件进行评价的请求,并根据所述请求获取待处理文件,以及用于评价所述待处理文件的预设的第一文件;根据所述第一文件,确定所述待处理文件的完整性分值,以及所述待处理文件的合法性分值;根据所述待处理文件的完整性分值和所述合法性分值,确定所述待处理文件的评价结果,所述评价结果用于表征所述待处理文件是否合规。2.根据权利要求1所述的方法,其中,所述根据所述预设法律文件,确定所述待处理文件的完整性分值,包括:获取所述第一文件中包括的章节信息;根据所述第一文件中包括的章节信息,确定所述待处理文件的完整性分值。3.根据权利要求2所述的方法,其中,所述根据所述第一文件中包括的章节信息,确定所述待处理文件的完整性分值,包括:根据所述第一文件中包括的章节信息,确定所述待处理文件中各语句所涉及的关联章节;比对所述待处理文件中涉及的全部关联章节,与所述第一文件中包括的章节信息;若所述全部关联章节中缺失任一所述章节信息,则在预设的完整性总分值基础上扣除与缺失的章节信息对应的分值,得到所述待处理文件的完整性分值。4.根据权利要求1所述的方法,其中,所述根据所述第一文件,确定所述待处理文件的合法性信息,包括:基于预设的信息抽取方法在所述第一文件的条文中,抽取第一要素信息;其中,一条第一要素信息与所述第一文件中的一个条文对应;基于所述预设的信息抽取方法在所述待处理文件的语句中,抽取与各所述语句对应的各第二要素信息;根据所述第一要素信息、所述第二要素信息,确定所述待处理文件的合法性分值。5.根据权利要求4所述的方法,其中,基于预设的信息抽取方法在待处理的文本内容中抽取要素信息,包括:对待处理的文本内容中识别实体,并确定实体之间的关系;所述待处理的文本内容包括所述第一文件中的条文、所述待处理文件中的语句;根据所述实体之间的关系,在所述实体中确定出所述要素信息;其中,所述要素信息包括行为主体、涉及的个人信息,以及以下任一种信息:权利、义务、法律责任。6.根据权利要求5所述的方法,其中,所述根据所述实体之间的关系,在所述实体中确定出所述要素信息,包括:根据所述实体之间的关系确定所述待处理的文本内容中的谓语;根据所述谓语在所述实体中确定出主语实体,并将所述主语实体确定为所述行为主体。7.根据权利要求5所述的方法,其中,所述根据所述实体之间的关系,在所述实体中确定出所述要素信息,包括:
根据所述实体之间的关系确定所述待处理的文本内容中的谓语;根据所述谓语在所述实体中确定出谓语作用的对象实体,并将所述谓语作用的对象实体确定为以下任一种信息:个人信息、权利、义务、法律责任。8.根据权利要求7所述的方法,其中,所述将所述谓语作用的对象实体确定为以下任一种信息:个人信息、权利、义务、法律责任,包括:将所述对象实体输入预设的信息分类模型,得到与所述对象实体对应的信息;或者,根据预设的关键词与信息之间的对应关系,以及所述对象实体中包括的词汇,确定所述对象实体对应的信息。9.根据权利要求4所述的方法,其中,所述要素信息包括行为主体、涉及的个人信息,以及以下任一种信息:权利、义务、法律责任;所述根据所述第一要素信息、所述第二要素信息,确定所述待处理文件的合法性分值,包括:根据各所述第一要素信息、所述第二要素信息,确定行为主体相同且涉及的个人信息相同的要素信息组;所述要素信息组中包括至少一个第一要素信息,以及至少一个第二要素信息;比对所述要素信息组中包括的第二要素信息与任一个第一要素信息,根据所述比对结果确定所述待处理文件的合法性分值。10.根据权利要求1
‑
9任一项所述的方法,其中,所述第一文件的数量为多个;所述根据所述待处理文件的完整性分值和所述合法性分值,确定所述待处理文件的评价结果,包括:针对每个第一文件确定出的所述待处理文件的完整性分值,以及所述待处理文件的合法性分值,确定所述待处理文件与所述预设第一文件对应的文件评价分值;若所述待处理文件与每个所述第一文件对应的文件评价分值总和,大于或等于预设阈值,则确定所述待处理文件的评价结果为合法;否则,确定所述待处理文件的评价结果为不合法。11.一种文件内容的评价装置,包括:接收单元,用于接收用于对待处理文件进行评价的请求;获取单元,用于根据所述请求获取待处理文件,以及用于评价所述待处理文件的预设的第一文件;分值确定单元,用于根...
【专利技术属性】
技术研发人员:侯柳平,王磊,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。