【技术实现步骤摘要】
一种计算机比较空间的自主学习方法及系统
本专利技术涉及人工智能领域,尤其涉及一种计算机比较空间的自主学习方法及系统。
技术介绍
当前,业内主要通过光学字符识别技术和全文检索技术实现档案开放鉴定数字化,但这种关键词过滤方法的覆盖率依然较低。随着人工智能技术的发展,业内通过神经网络技术可以将档案开放鉴定的水平实现一定程度的提高,但神经网络训练需要大量的人工标注、训练成本,而且,可移植性很差,因此也存在许多弊端。本申请专利技术人在实现本申请实施例中专利技术技术方案的过程中,发现上述技术至少存在如下技术问题:关键词检索的覆盖率较低,检索准确率较低,且开放鉴定方法难以复制,检索过程中机器运算效率较低。
技术实现思路
本申请实施例通过提供一种计算机比较空间的自主学习方法及系统,解决了现有技术中关键词检索的覆盖率较低,检索准确率较低,且开放鉴定方法难以复制,检索过程中机器运算效率较低的技术问题。实现了在关键词过滤基础上,基于语义分析技术,通过构架语义知识库达到提高关键词覆盖率及检索准确率,且通过赋予机器参数信息进行自主学习,提高机器运算效率的技术目的。鉴于上述问题,本申请实施例提供一种计算机比较空间的自主学习方法及系统。第一方面,本申请提供了一种计算机比较空间的自主学习方法,其中,所述方法包括:获得第一文件信息;将所述第一文件信息按照预设转化处理方法进行转化,获得第二文件信息,所述第二文件信息具有第一属性;将所述第二文件信息输入第一语义分析模型,获得第一语义信息;获得筛选要求信息 ...
【技术保护点】
1.一种计算机比较空间的自主学习方法,其中,所述方法包括:/n获得第一文件信息;/n将所述第一文件信息按照预设转化处理方法进行转化,获得第二文件信息,所述第二文件信息具有第一属性;/n将所述第二文件信息输入第一语义分析模型,获得第一语义信息;/n获得筛选要求信息,其中,所述筛选要求信息包括时间要求信息、内容要求信息、归属要求信息;/n根据所述时间要求信息,获得第一筛选条件;/n根据所述归属要求信息,获得第二筛选条件;/n根据所述内容要求信息,获得第三筛选条件;/n将所述第一筛选条件、所述第二筛选条件、所述第三筛选条件进行任意组合,获得组合筛选条件;/n根据所述第一、第二、第三筛选条件及所述组合筛选条件,获得筛选参数信息;/n根据所述第二文件信息对所述筛选参数信息进行匹配,获得第二文件匹配参数;/n根据所述第二文件匹配参数,获得匹配训练数据;/n对所述匹配训练数据进行深度学习,构建比较模型;/n根据所述第二文件匹配参数,获得第一筛选特征;/n将所述第一筛选特征、所述第一语义信息输入所述比较模型中,获得第一对比结果。/n
【技术特征摘要】
1.一种计算机比较空间的自主学习方法,其中,所述方法包括:
获得第一文件信息;
将所述第一文件信息按照预设转化处理方法进行转化,获得第二文件信息,所述第二文件信息具有第一属性;
将所述第二文件信息输入第一语义分析模型,获得第一语义信息;
获得筛选要求信息,其中,所述筛选要求信息包括时间要求信息、内容要求信息、归属要求信息;
根据所述时间要求信息,获得第一筛选条件;
根据所述归属要求信息,获得第二筛选条件;
根据所述内容要求信息,获得第三筛选条件;
将所述第一筛选条件、所述第二筛选条件、所述第三筛选条件进行任意组合,获得组合筛选条件;
根据所述第一、第二、第三筛选条件及所述组合筛选条件,获得筛选参数信息;
根据所述第二文件信息对所述筛选参数信息进行匹配,获得第二文件匹配参数;
根据所述第二文件匹配参数,获得匹配训练数据;
对所述匹配训练数据进行深度学习,构建比较模型;
根据所述第二文件匹配参数,获得第一筛选特征;
将所述第一筛选特征、所述第一语义信息输入所述比较模型中,获得第一对比结果。
2.如权利要求1所述的方法,其中,所述将所述第二文件信息输入第一语义分析模型,获得第一语义信息之前,包括:
获得关键词库;
根据所述关键词库对所述第二文件信息进行全文检索,获得第一检索结果;
判断所述第一检索结果是否存在;
当存在时,根据所述第一检索结果,获得第二语义信息。
3.如权利要求2所述的方法,其中,所述将所述第二文件信息输入第一语义分析模型,获得第一语义信息,包括:
当所述第一检索结果不存在时,获得预设句法分析方法;
根据所述预设句法分析方法对所述第二文件信息进行句法分析,获得文件句法信息;
获得预设语义模型库;
根据所述文件句法信息,获得句法特征;
根据所述句法特征、所述预设语义模型库进行模型匹配,获得所述第一语义分析模型;
将所述文件句法信息输入所述第一语义分析模型,获得所述第一语义信息。
4.如权利要求1所述的方法,其中,所述根据所述第二文件信息对所述筛选参数信息进行匹配,获得第二文件匹配参数,包括:
根据所述第二文件信息,获得第二文件属性信息;
根据所述第二文件属性信息,获得第二文件时间信息;
判断所述第二文件时间信息是否满足所述第一筛选条件;
当满足时,根据所述第二筛选条件、所述第三筛选条件,获得所述第二文件匹配参数;
当所述第二文件时间信息不满足所述第一筛选条件时,根据所述第一筛选条件、所述第二筛选条件,获得所述第二文件匹配参数。
5.如权利要求1所述的方法,其中,所述获得第二文件信息之后,包括:
获得预设格式语义库;
根据所述预设格式语义库,获得格式特征信息;
将所述格式特征信息、所述第二文件信息输入格式匹配模型中,获得第一匹配结果...
【专利技术属性】
技术研发人员:王楠,徐杰,张翔,张宇,
申请(专利权)人:江苏联著实业股份有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。