本申请涉及计算机技术领域,公开一种用于生成事件脉络的方法,该方法包括:获取会话文本;根据会话文本获取事件信息;根据事件信息生成事件脉络。能够通过回话文本自动生成事件脉络,提高了用户梳理事件脉络的效率,进一步提高了用户获取事件脉络的体验。本申请还公开一种用于生成事件脉络的装置、电子设备及存储介质。
【技术实现步骤摘要】
用于生成事件脉络的方法、装置、电子设备及可读存储介质
本申请涉及计算机
,例如涉及一种用于生成事件脉络的方法、装置、电子设备及可读存储介质。
技术介绍
近年来,随着互联网技术的迅速发展,各类企业通讯软件层出不穷,在工作节奏快、人员流动十分频繁的今天,想要了解项目进展脉络状况,往往需要翻阅成千上万条会话记录,其中包括了大量琐碎、冗余、口语化、碎片化及与事件无关的会话信息,从这些会话记录中梳理出事件进展脉络状况是十分困难的。在实现本公开实施例的过程中,发现相关技术中至少存在如下问题:现有技术中,梳理事件脉络需要花费大量精力,效率很低。
技术实现思路
为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。本公开实施例提供了一种用于生成事件脉络的方法、装置、电子设备及可读存储介质,以能够提高梳理事件脉络的效率。在一些实施例中,所述用于生成事件脉络的方法,包括:获取会话文本;根据所述会话文本获取事件信息;根据所述事件信息生成事件脉络。在一些实施例中,所述用于生成事件脉络的装置包括:第一获取模块,被配置为获取会话文本;第二获取模块,被配置为根据所述会话文本获取事件信息;生成模块,被配置为根据所述事件信息生成事件脉络。在一些实施例中,所述电子设备包括处理器和存储有程序指令的存储器,所述处理器被配置为在运行所述程序指令时,执行上述的用于生成事件脉络的方法。在一些实施例中,所述可读存储介质,存储有可执行指令,所述可执行指令在运行时执行上述用于生成事件脉络的方法。本公开实施例提供的用于生成事件脉络的方法、装置、电子设备及可读存储介质,可以实现以下技术效果:通过获取会话文本,根据会话文本获得事件信息,并根据事件信息生成事件脉络。能够通过回话文本自动生成事件脉络,提高了用户梳理事件脉络的效率,进一步提高了用户获取事件脉络的体验。以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。附图说明一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:图1是本公开实施例提供的一个用于生成事件脉络的方法的示意图;图2是本公开实施例提供的一个时间-人物事件脉络的示意图;图3是本公开实施例提供的一个时间-主题事件脉络的示意图;图4是本公开实施例提供的一个用于生成事件脉络的装置的示意图;图5是本公开实施例提供的一个电子设备的示意图。具体实施方式为了能够更加详尽地了解本公开实施例的特点与
技术实现思路
,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或多个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开实施例的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。除非另有说明,术语“多个”表示两个或两个以上。本公开实施例中,字符“/”表示前后对象是一种“或”的关系。例如,A/B表示:A或B。术语“和/或”是一种描述对象的关联关系,表示可以存在三种关系。例如,A和/或B,表示:A或B,或,A和B这三种关系。结合图1所示,本公开实施例提供一种用于生成事件脉络的方法,包括:步骤S101,获取会话文本;步骤S102,根据会话文本获取事件信息;步骤S103,根据事件信息生成事件脉络。采用本公开实施例提供的用于生成事件脉络的方法,通过获取会话文本,根据会话文本获得事件信息,并根据事件信息生成事件脉络。能够通过回话文本自动生成事件脉络,提高了用户梳理事件脉络的效率,进一步提高了用户获取事件脉络的体验。可选地,会话文本包括若干条聊天记录。可选地,在根据会话文本获取事件信息前,包括:对会话文本进行预处理。可选地,预处理包括:去乱码、去停用词、去标点、去表情等。可选地,预处理还包括:从会话文本中获取各条聊天记录中不重复字符串的长度,在不重复字符串的长度低于第一预设阈值的情况下,将该不重复字符串对应的聊天记录确定为无效聊天记录,并对无效聊天记录进行过滤处理。在一些实施例中,从会话文本中获取的聊天记录为“啊哈哈哈哈哈哈”,则“啊哈哈哈哈哈哈”中的不重复字符串为“啊哈”,“啊哈”的长度为2,第一预设阈值为3,则将“啊哈”对应的“啊哈哈哈哈哈哈”确定为无效聊天记录,并将该条聊天记录“啊哈哈哈哈哈哈”进行过滤处理。可选地,根据会话文本获取事件信息,包括:根据会话文本获取备选事件信息;将不满足第一预设条件的备选事件信息进行替换,获得事件信息。可选地,根据会话文本获取备选事件信息,包括:将会话文本输入预设的深度学习模型,获得备选事件信息。可选地,备选事件信息包括事件开始时间、事件相关人物和事件主题信息中的一种或多种。可选地,获取若干个会话训练样本,会话训练样本包括带有标注的样本事件信息;将若干个会话训练样本输入预设的神经网络模型中进行预设次数的训练,获得深度学习模型。可选地,预设的神经网络模型为基于注意力机制的深度学习模型。通过带有标注的会话训练样本对深度学习模型进行训练,获得训练好的深度学习模型,这样能够利用深度学习技术实现了从会话文本中获取备选事件信息,从而更方便快捷的获取事件脉络。可选地,备选事件信息包括事件开始时间,不满足第一预设条件的备选事件信息包括事件开始时间的格式与预设格式不相同。可选地,将不满足第一预设条件的备选事件信息进行替换,获得事件信息,包括:从会话文本中获取包含事件开始时间的聊天记录,并获取该条聊天记录的记录时间,根据对应的聊天记录的记录时间对与预设格式不相同的事件开始时间按照预设格式进行替换,将与预设格式相同的事件开始时间确定为事件信息。可选地,事件开始时间的预设格式为“xxxx-yy-cc”。其中,“xxxx”为事件开始时间的年;“yy”为事件开始时间的月;“cc”为事件开始时间的日。在一些实施例中,获取到聊天记录包含的事件开始时间为“今天”,“今天”与预设格式“xxxx-yy-cc”不相同,获取包含“今天”的聊天记录的记录时间为2021年2月23日;根据该条聊天记录的记录时间2021年2月23日对与预设格式不相同的“今天”按照预设格式进行替换,获得与预设格式“xxxx-yy-cc”相同的事件开始时间为“2021-02-23”,本文档来自技高网...
【技术保护点】
1.一种用于生成事件脉络的方法,其特征在于,包括:/n获取会话文本;/n根据所述会话文本获取事件信息;/n根据所述事件信息生成事件脉络。/n
【技术特征摘要】
1.一种用于生成事件脉络的方法,其特征在于,包括:
获取会话文本;
根据所述会话文本获取事件信息;
根据所述事件信息生成事件脉络。
2.根据权利要求1所述的方法,其特征在于,根据所述会话文本获取事件信息,包括:
根据所述会话文本获取备选事件信息;
将不满足第一预设条件的所述备选事件信息进行替换,获得事件信息。
3.根据权利要求1所述的方法,其特征在于,根据所述会话文本获取事件信息,包括:
根据所述会话文本获取备选事件信息;
将满足第二预设条件的所述备选事件信息进行补全,获得事件信息。
4.根据权利要求1所述的方法,其特征在于,根据所述会话文本获取事件信息,包括:
根据所述会话文本获取备选事件信息;
将满足第三预设条件的所述备选事件信息进行过滤,获得事件信息。
5.根据权利要求2至4任一项所述的方法,其特征在于,根据所述会话文本获取备选事件信息,包括:
将所述会话文本输入预设的深度学习模型,获得...
【专利技术属性】
技术研发人员:王硕,徐凯波,孙泽懿,杨康,
申请(专利权)人:上海明略人工智能集团有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。