会议关键句提取方法及装置制造方法及图纸

技术编号:34458574 阅读:48 留言:0更新日期:2022-08-06 17:11
本申请提供会议关键句提取方法及装置,其中所述会议关键句提取方法包括:获取待处理会议文本和所述待处理会议文本的目标提取类型,根据所述目标提取类型,对所述待处理会议文本进行识别,获得所述目标提取类型对应的会议关键句。通过根据目标提取类型,对待处理会议文本进行识别,提高了获得的会议关键句的准确性。性。性。

【技术实现步骤摘要】
会议关键句提取方法及装置


[0001]本申请涉及人工智能
,特别涉及一种会议关键句提取方法。本申请同时涉及一种会议关键句提取装置、一种计算设备,以及一种计算机可读存储介质。

技术介绍

[0002]随着互联网技术的发展,文本推理越来越依赖于互联网进行,文本推理是对文本进行分析、理解、提取等处理的过程,文本推理能够帮助人们进行文本理解、集聚分析、文摘生成、信息提取等操作。因此,文本推理已被广泛地应用于人们日常生活的各个领域。
[0003]现有技术中,通常把文本分割成若干组单词或句子,基于分割获得的单词或句子建立图模型,利用投票机制对文本中的重要成分进行排序,实现文本关键内容的提取。然而,由于文本的数量过大,利用上述方法获得的文本关键内容准确性差。

技术实现思路

[0004]有鉴于此,本申请实施例提供了一种会议关键句提取方法,以解决现有技术中存在的技术缺陷。本申请实施例同时提供了一种会议关键句提取装置,一种计算设备,以及一种计算机可读存储介质。
[0005]根据本申请实施例的第一方面,提供了一种会议关键句提取方法,包括:
[0006]获取待处理会议文本和待处理会议文本的目标提取类型;
[0007]根据目标提取类型,对待处理会议文本进行识别,获得目标提取类型对应的会议关键句。
[0008]根据本申请实施例的第二方面,提供了一种会议关键句提取装置,包括:
[0009]获取模块,被配置为获取待处理会议文本和待处理会议文本的目标提取类型;
[0010]处理模块,被配置为根据目标提取类型,对待处理会议文本进行识别,获得目标提取类型对应的会议关键句。
[0011]根据本申请实施例的第三方面,提供了一种计算设备,包括:
[0012]存储器和处理器;
[0013]所述存储器用于存储计算机可执行指令,所述处理器执行所述计算机可执行指令时实现所述会议关键句提取方法的步骤。
[0014]根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述会议关键句提取方法的步骤。
[0015]根据本申请实施例的第五方面,提供了一种芯片,其存储有计算机程序,该计算机程序被芯片执行时实现所述会议关键句提取方法的步骤。
[0016]本申请提供的会议关键句提取方法,获取待处理会议文本和所述待处理会议文本的目标提取类型,根据所述目标提取类型,对所述待处理会议文本进行识别,获得所述目标提取类型对应的会议关键句。通过根据目标提取类型,对待处理会议文本进行识别,提高了获得的会议关键句的准确性。
附图说明
[0017]图1是本申请一实施例提供的一种会议关键句提取系统的结构示意图;
[0018]图2是本申请一实施例提供的第一种会议关键句提取方法的流程图;
[0019]图3是本申请一实施例提供的第二种会议关键句提取方法的流程图;
[0020]图4是本申请一实施例提供的第三种会议关键句提取方法的流程图;
[0021]图5是本申请一实施例提供的第四种会议关键句提取方法的流程图;
[0022]图6是本申请一实施例提供的第五种会议关键句提取方法的流程图;
[0023]图7是本申请一实施例提供的第六种会议关键句提取方法的流程图;
[0024]图8是本申请一实施例提供的一种会议关键句提取方法中句子分类模型的训练流程图;
[0025]图9是本申请一实施例提供的另一种会议关键句提取方法中句子分类模型的训练流程图;
[0026]图10是本申请一实施例提供的第七种会议关键句提取方法的流程图;
[0027]图11是本申请一实施例提供的第八种会议关键句提取方法的流程图;
[0028]图12是本申请一实施例提供的第九种会议关键句提取方法的流程图;
[0029]图13是本申请一实施例提供的一种会议关键句提取方法的示意图;
[0030]图14是本申请一实施例提供的一种会议关键句提取装置的结构示意图;
[0031]图15是本申请一实施例提供的一种计算设备的结构框图。
具体实施方式
[0032]在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其他方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
[0033]在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0034]应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。
[0035]首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
[0036]人工智能(AI,Artificial Intelligence;)是指已工程化(即设计并制造)的系统感知环境的能力,以及获取、处理、应用和表示知识的能力。自然语言处理、机器人、计算机视觉成为了人工智能最为热门的三个产业方向。人工智能领域关键技术的发展状况,包括机器学习、知识图谱、自然语言处理、计算机视觉、人机交互、生物特征识别、虚拟现实/增强现实等关键技术。自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及的领域较多,
主要包括机器翻译、机器阅读理解和文本提取等。
[0037]TextRank:TextRank算法是一种用于文本的基于图的排序算法。其基本思想来源于PageRank算法,通过把文本分割成若干组成单元(单词、句子)并建立图模型,利用投票机制对文本中的重要成分进行排序,仅利用单篇文档本身的信息即可实现关键词提取、文摘。TextRank不需要事先对多篇文档进行学习训练,因其简洁有效而得到广泛应用。
[0038]BERT(Bidirectional Encoder Representation from Transformers):是一种预训练语言模型,通过构造字预测任务与下一句预测任务,进行训练,学到语言知识。
[0039]BERTSUM(Fine

tune BERT forExtractive Summarization):使用BERT输出的句子表示,并经过网络层捕获文档特征进行对句子进行分类,判断是否为摘要中的句子。
[0040]在本申请中,提供了一种本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种会议关键句提取方法,其特征在于,包括:获取待处理会议文本和所述待处理会议文本的目标提取类型;根据所述目标提取类型,对所述待处理会议文本进行识别,获得所述目标提取类型对应的会议关键句。2.根据权利要求1所述的方法,其特征在于,所述目标提取类型包括主题类型、结论类型、待做类型和包含关键信息类型中的至少一种。3.根据权利要求1所述的方法,其特征在于,所述根据所述目标提取类型,对所述待处理会议文本进行识别,获得所述目标提取类型对应的会议关键句的步骤,包括:根据所述目标提取类型,获得所述目标提取类型对应的目标关键句模板;将所述待处理会议文本和所述目标关键句模板进行匹配,获得所述目标提取类型对应的会议关键句。4.根据权利要求3所述的方法,其特征在于,所述目标关键句模板包括第一目标关键句模板;所述根据所述目标提取类型,获得所述目标提取类型对应的目标关键句模板的步骤,包括:获取预先设置的关键句模板库,其中,所述关键句模板库中包括多种类型的关键句模板;在所述预先设置的关键句模板库中,查找所述目标提取类型对应的第一目标关键句模板。5.根据权利要求3所述的方法,其特征在于,所述目标关键句模板包括第二目标关键句模板;所述根据所述目标提取类型,获得所述目标提取类型对应的目标关键句模板的步骤,包括:获取预先设置的依存句法模板;基于所述目标提取类型,对所述依存句法模板进行关键词替换,获得所述第二目标关键句模板。6.根据权利要求1所述的方法,其特征在于,所述根据所述目标提取类型,对所述待处理会议文本进行识别,获得所述目标提取类型对应的会议关键句的步骤,包括:将所述待处理会议文本输入预先训练的句子分类模型中,获得所述待处理会议文本中各会议语句的句子类型;基于所述各会议语句的句子类型,获取所述目标提取类型对应的会议关键句。7.根据权利要求6所述的方法,其特征在于,所述基于所述各会议语句的句子类型,获取所述目标提取类型对应的会议关键句的步骤,包括:根据所述句子类型对所述各会议语句进行分类;获取所述目标提取类型对应的多个会议语句,将符合预设条件的会议语句作为所述目标提取...

【专利技术属性】
技术研发人员:郭馨泽李长亮
申请(专利权)人:北京金山数字娱乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1