数据应用场景的推荐方法、装置、电子设备和存储介质制造方法及图纸

技术编号:32855214 阅读:17 留言:0更新日期:2022-03-30 19:24
本申请提供一种数据应用场景的推荐方法、装置、电子设备和存储介质,属于计算机信息处理技术领域。该方法包括:获取原始文本数据和对应原始文本数据的主题标签;对原始文本数据进行主题提取处理,得到第一主题信息;根据第一主题信息得到第一应用场景;根据主题标签得到第二应用场景;若第一应用场景与第二应用场景相同,则将第一应用场景或第二应用场景作为推荐应用场景;其中,第一应用场景、第二应用场景和推荐应用场景包括:高保密场景、中保密场景和低保密场景。通过结合第一应用场景和第二应用场景的方式,对主题模型得到的应用场景进行准确性判断,提高了得到的推荐应用场景的准确性。确性。确性。

【技术实现步骤摘要】
数据应用场景的推荐方法、装置、电子设备和存储介质


[0001]本申请涉及计算机信息处理
,尤其涉及一种数据应用场景的推荐方法、装置、电子设备和存储介质。

技术介绍

[0002]随着信息技术和大数据技术的不断发展,市场主题收集并掌握了大量的用户数据信息,但对于一般的市场主题来说,掌握大量的原生数据本身并没有价值,真正有价值的是对数据进行分析挖掘后得到的数据产品和具体的数据应用场景,因此如何从海量的数据中提取主题并得到其适配的应用场景是现阶段亟待解决的问题。
[0003]相关技术中大多通过主题模型(Topic Mode l)来得到数据信息中的主题信息,但主题模型是一种以非监督学习的方式对文档集中的隐含语义结构进行聚类的统计模型,其存在提取得到的主题与实际的主题不匹配的问题,因此得到的应用场景也不够准确。

技术实现思路

[0004]本申请实施例的主要目的在于提出一种数据应用场景的推荐方法、装置、电子设备和存储介质,以提高得到的应用场景的准确性。
[0005]为实现上述目的,本申请实施例的第一方面提出了一种数据应用场景的推荐方法,包括:获取原始文本数据和对应所述原始文本数据的主题标签;对所述原始文本数据进行主题提取处理,得到第一主题信息;根据所述第一主题信息得到第一应用场景;根据所述主题标签得到第二应用场景;若所述第一应用场景与所述第二应用场景相同,则将所述第一应用场景或所述第二应用场景作为推荐应用场景;其中,所述第一应用场景、所述第二应用场景和所述推荐应用场景均包括:高保密场景、中保密场景和低保密场景。
[0006]本申请实施例提出的数据应用场景的推荐方法,通过主题模型对原始文本数据进行主题提取,并根据提取得到的主题信息得到对应的第一应用场景,再与根据主题标签得到的第二应用场景进行比较,在比较结果相同的情况下,才会得到对应的推荐应用场景。通过结合第一应用场景和第二应用场景的方式,对主题模型得到的应用场景进行准确性判断,提高了得到的推荐应用场景的准确性。
[0007]在一些实施例中,所述对所述原始文本数据进行主题提取处理,得到第一主题信息,包括:对所述原始文本数据进行分词处理,得到分词文本数据;对所述分词文本数据进行去停用词处理,得到关键文本数据;将所述关键文本数据输入主题模型中进行主题提取,得到所述第一主题信息。
[0008]在一些实施例中,所述将所述关键文本数据输入主题模型中进行主题提取,得到所述第一主题信息,包括:将所述关键文本数据分别输入多个主题数量不同的初始模型中,得到多个初始主题信息;计算所述初始主题信息中任意两个主题之间的相似度,得到模型相似度信息;根据多个所述模型相似度信息得到最优模型;将所述关键文本数据输入所述最优模型中,得到所述第一主题信息。
[0009]在一些实施例中,所述计算所述初始主题信息中任意两个主题之间的相似度,得到模型相似度信息,包括:获取所述主题中预设数量的关键词信息,得到对应的待比较信息;分别构建所述待比较信息的词频向量;计算任意两个所述词频向量之间的相似度,得到所述模型相似度信息。
[0010]在一些实施例中,所述根据多个所述模型相似度信息得到最优模型,包括:根据多个所述模型相似度信息,得到多个所述初始模型,将多个所述初始模型作为备选模型组;选择所述备选模型组中主题数量最小的初始模型,作为所述最优模型。
[0011]在一些实施例中,所述根据所述第一主题信息得到第一应用场景,包括:通过第一应用场景对照表对所述第一主题信息进行匹配处理,得到所述第一应用场景;其中,所述第一应用场景对照表包括主题信息和对应所述主题信息的应用场景。
[0012]在一些实施例中,所述根据所述主题标签得到第二应用场景,包括:通过第二应用场景对照表对所述主题标签进行匹配处理,得到所述第二应用场景;其中,所述第二应用场景对照表包括主题标签和对应所述主题标签的应用场景。
[0013]为实现上述目的,本申请的第二方面提出了一种数据应用场景的推荐装置,包括:数据获取模块,所述数据获取模块用于获取原始文本数据和对应所述原始文本数据的主题标签;主题提取模块,所述主题提取模块用于对所述原始文本数据进行主题提取处理,得到第一主题信息;应用场景获取模块,所述应用场景获取模块用于根据所述第一主题信息得到第一应用场景,并根据所述主题标签得到第二应用场景;比较模块,所述比较模块用于在所述第一应用场景与所述第二应用场景相同的情况下,将所述第一应用场景或所述第二应用场景作为推荐应用场景;其中,所述第一应用场景、所述第二应用场景和所述推荐应用场景包括:高保密场景、中保密场景和低保密场景。
[0014]为实现上述目的,本申请的第三方面提出了一种电子设备,包括:至少一个存储器;至少一个处理器;至少一个程序;所述程序被存储在存储器中,处理器执行所述至少一个程序以实现本申请如上述第一方面所述的方法。
[0015]为实现上述目的,本申请的第四方面提出了一种存储介质,该存储介质是计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行:如上述第一方面所述的方法。
附图说明
[0016]图1是本申请实施例提供的数据应用场景的推荐方法的流程图;
[0017]图2是本申请实施例应用场景的分类示意图;
[0018]图3是图1中S200的流程图;
[0019]图4是图3中S230的流程图;
[0020]图5是图4中S232的流程图;
[0021]图6是图4中S233的流程图;
[0022]图7是本申请实施例模型相似度与主题数量的关系图;
[0023]图8是本申请实施例提供的电子设备的硬件结构示意图。
具体实施方式
[0024]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
[0025]需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
[0026]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
[0027]首先,对本申请中涉及的若干名词进行解析:
[0028]自然语言处理(Natural Language Processing,NLP):NLP用计算机来处理、理解以及运用人类语言(如中文、英文等),NLP属于人工智能的一个分支,是计算机科学与语言学的交叉学科,又常被称为计算语言学。自然语言处理包括语法分析、语义分析、篇章理解等。自然语言处理常用于机器翻译、手本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据应用场景的推荐方法,其特征在于,包括:获取原始文本数据和对应所述原始文本数据的主题标签;对所述原始文本数据进行主题提取处理,得到第一主题信息;根据所述第一主题信息得到第一应用场景;根据所述主题标签得到第二应用场景;若所述第一应用场景与所述第二应用场景相同,则将所述第一应用场景或所述第二应用场景作为推荐应用场景;其中,所述第一应用场景、所述第二应用场景和所述推荐应用场景均包括:高保密场景、中保密场景和低保密场景。2.根据权利要求1所述的方法,其特征在于,所述对所述原始文本数据进行主题提取处理,得到第一主题信息,包括:对所述原始文本数据进行分词处理,得到分词文本数据;对所述分词文本数据进行去停用词处理,得到关键文本数据;将所述关键文本数据输入主题模型中进行主题提取,得到所述第一主题信息。3.根据权利要求2所述的方法,其特征在于,所述将所述关键文本数据输入主题模型中进行主题提取,得到所述第一主题信息,包括:将所述关键文本数据分别输入多个主题数量不同的初始模型中,得到多个初始主题信息;计算所述初始主题信息中任意两个主题之间的相似度,得到模型相似度信息;根据多个所述模型相似度信息得到最优模型;将所述关键文本数据输入所述最优模型中,得到所述第一主题信息。4.根据权利要求3所述的方法,其特征在于,所述计算所述初始主题信息中任意两个主题之间的相似度,得到模型相似度信息,包括:获取所述主题中预设数量的关键词信息,得到对应的待比较信息;分别构建所述待比较信息的词频向量;计算任意两个所述词频向量之间的相似度,得到所述模型相似度信息。5.根据权利要求4所述的方法,其特征在于,所述根据多个所述模型相似度信息得到最优模型,包括:根据多个所述模型相似度信息,得到多个所述初始模型,将多个所述初始模型作为备选...

【专利技术属性】
技术研发人员:侯雨楠洪博然杜自然邵雷董传晔
申请(专利权)人:易成岐深圳市数聚湾区大数据研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1