一种数据排序方法、装置、电子设备及存储介质制造方法及图纸

技术编号:27262999 阅读:12 留言:0更新日期:2021-02-06 11:24
本发明专利技术提供了一种数据排序方法、装置、电子设备及存储介质。所述方法,包括:获取目标用户的用户标识,以及待排序的多个目标数据;针对任一所述目标数据,提取目标数据的关键词,并从用户情感评分矩阵中获取所述目标用户针对每个所述关键词的关键词评分值;基于所述目标用户针对每个所述关键词的关键词评分值,获取所述目标数据的情感评分值;根据所述情感评分值对每个所述目标数据进行排序,得到数据排序列表;其中,所述关键词评分值为根据所述用户发布的文本数据的情感倾向获取得到,所述情感倾向为通过对所述文本数据进行文本情感分析获取得到。从而将用户认同度更强的目标数据靠前排列,有效提升用户的点击转化率和用户信任感和使用粘性。任感和使用粘性。任感和使用粘性。

【技术实现步骤摘要】
一种数据排序方法、装置、电子设备及存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种数据排序方法、装置、电子设备及存储介质。

技术介绍

[0002]随着互联网的发展,各种网络应用油然而生。网民在互联网上可以发表各种言论,而且商家等业务数据提供方也可以提供多种数据以供用户浏览选择。而且各条数据在展示时的排序对相应数据是否被用户选择会产生较大影响。以搜索业务为例,搜索功能作为一个垂直业务,为各个业务线提供了一个重要的流量分发入口。各个搜索结果的排序会对用户的选择产生较大影响,排序越靠前用户选择的概率也更大,如果排序靠前的搜索结果中有对用户较为消极评价的内容,会一定程度上影响用户的点击率,反之,如果排序靠前的结果该用户基本都是正向评价的内容,则会一定程度上提高用户点击率和提升用户对搜索的可信度。
[0003]目前相关技术中主要是根据搜索词,返回跟搜索词匹配比较相近的结果,主要关注的是搜索词跟结果的匹配准确性这一维度,并未考虑到不同用户对于不同内容的情感差异特点,从而影响数据排序结果与用户情感需求的匹配度,以及数据的点击转化率和搜索排序结果的准确性。

技术实现思路

[0004]本专利技术实施例提供一种数据排序方法、装置、电子设备及存储介质,以解决现有的数据排序结果与用户情感需求的匹配度较低,从而影响数据的点击转化率和搜索排序结果的准确性的问题。
[0005]为了解决上述技术问题,本专利技术是这样实现的:
[0006]第一方面,本专利技术实施例提供了一种数据排序方法,包括:
[0007]获取目标用户的用户标识,以及待排序的多个目标数据;
[0008]针对任一所述目标数据,提取所述目标数据的关键词,并从用户情感评分矩阵中获取所述目标用户针对每个所述关键词的关键词评分值,所述用户情感评分矩阵中包含任一用户针对任一关键词的关键词评分值,所述关键词评分值用于标识所述目标用户针对所述关键词的情感倾向级别;
[0009]基于所述目标用户针对每个所述关键词的关键词评分值,获取所述目标数据的情感评分值,其中,所述情感评分值用于标识所述目标用户针对所述目标数据的情感倾向级别;
[0010]根据所述情感评分值对每个所述目标数据进行排序,得到数据排序列表;
[0011]其中,所述关键词评分值为根据所述用户发布的文本数据的情感倾向获取得到,所述情感倾向为通过对所述文本数据进行文本情感分析获取得到。
[0012]可选地,所述从用户情感评分矩阵中获取所述目标用户针对每个所述关键词的关
键词评分值的步骤之前,还包括:
[0013]针对任一用户,获取所述用户发布的文本数据;
[0014]针对所述文本数据中的任意一条文本内容,获取所述文本内容的情感倾向,并获取所述文本内容中的关键词;
[0015]根据所述文本数据中每个文本内容的情感倾向,确定所述用户针对每个所述关键词的关键词评分值,并构建所述用户情感评分矩阵。
[0016]可选地,所述根据所述文本数据中每个文本内容的情感倾向,确定所述用户针对每个所述关键词的关键词评分值的步骤,包括:
[0017]针对所述文本数据中任一文本内容,响应于所述文本内容的情感倾向为正向,在所述用户情感评分矩阵中,将从所述文本内容中提取到的每个关键词的关键词评分值增加第一数值;
[0018]响应于所述文本内容的情感倾向为负向,在所述用户情感评分矩阵中,将从所述文本内容中提取到的每个关键词的关键词评分值降低第二数值。
[0019]可选地,所述获取所述文本内容中的关键词的步骤,包括:
[0020]基于关键词数据集,获取所述文本内容中包含的初始关键词,所述关键词数据集中包含至少一个关键词;
[0021]统计每个所述初始关键词在所述文本内容中的出现次数,并获取出现次数最多的K个初始关键词,作为所述文本内容的关键词,K为正整数。
[0022]可选地,所述获取所述文本内容的情感倾向的步骤,包括:
[0023]对所述文本内容进行分词处理,得到所述文本内容的分词列表;
[0024]根据所述分词列表,获取所述文本内容的情感得分;
[0025]响应于所述情感得分为正值,确定所述文本内容的情感倾向为正向;
[0026]响应于所述情感得分为负值,确定所述文本内容的情感倾向为负向。
[0027]可选地,所述根据所述分词列表,获取所述文本内容的情感得分的步骤,包括:
[0028]过滤掉所述分词列表中的否定词,并筛选过滤后的分词列表中的目标分词,所述目标分词包括情感分词、停用分词、副词中的至少一种;
[0029]根据所述目标分词,获取所述文本内容的情感得分。
[0030]可选地,所述基于所述目标用户针对每个所述关键词的关键词评分值,获取所述目标数据的情感评分值的步骤,包括:
[0031]获取所述目标数据中每个关键词的关键词评分值的平均值,得到所述目标数据的情感评分值。
[0032]可选地,所述根据所述情感评分值对每个所述目标数据进行排序,得到数据排序列表的步骤,包括:
[0033]根据每个所述目标数据的情感评分值和默认的初始排序评分值,以及情感评分权重,获取每个所述目标数据的最终排序评分值;
[0034]按照每个所述目标数据的最终排序评分值从高到低的顺序,对每个所述目标数据进行排序,得到数据排序列表。
[0035]可选地,所述目标数据包括基于所述目标用户设置的查询词返回的搜索结果数据,所述搜索结果数据的初始排序评分值基于所述搜索结果数据与所述查询词之间的匹配
度确定得到,所述文本数据包括帖子、回帖、评论中的至少一种。
[0036]第二方面,本专利技术实施例提供了一种数据排序装置,包括:
[0037]排序数据获取模块,用于获取目标用户的用户标识,以及待排序的多个目标数据;
[0038]关键词评分获取模块,用于针对任一所述目标数据,提取所述目标数据的关键词,并从用户情感评分矩阵中获取所述目标用户针对每个所述关键词的关键词评分值,所述用户情感评分矩阵中包含任一用户针对任一关键词的关键词评分值,所述关键词评分值用于标识所述目标用户针对所述关键词的情感倾向级别;
[0039]情感评分获取模块,用于基于所述目标用户针对每个所述关键词的关键词评分值,获取所述目标数据的情感评分值,其中,所述情感评分值用于标识所述目标用户针对所述目标数据的情感倾向级别;
[0040]数据排序处理模块,用于根据所述情感评分值对每个所述目标数据进行排序,得到数据排序列表;
[0041]其中,所述关键词评分值为根据所述用户发布的文本数据的情感倾向获取得到,所述情感倾向为通过对所述文本数据进行文本情感分析获取得到。
[0042]可选地,所述装置,还包括:
[0043]文本数据获取模块,用于针对任一用户,获取所述用户发布的文本数据;
[0044]文本内容处理模块,用于针对所述文本数据中的任意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据排序方法,其特征在于,包括:获取目标用户的用户标识,以及待排序的多个目标数据;针对任一所述目标数据,提取所述目标数据的关键词,并从用户情感评分矩阵中获取所述目标用户针对每个所述关键词的关键词评分值,所述用户情感评分矩阵中包含任一用户针对任一关键词的关键词评分值,所述关键词评分值用于标识所述目标用户针对所述关键词的情感倾向级别;基于所述目标用户针对每个所述关键词的关键词评分值,获取所述目标数据的情感评分值,其中,所述情感评分值用于标识所述目标用户针对所述目标数据的情感倾向级别;根据所述情感评分值对每个所述目标数据进行排序,得到数据排序列表;其中,所述关键词评分值为根据所述用户发布的文本数据的情感倾向获取得到,所述情感倾向为通过对所述文本数据进行文本情感分析获取得到。2.根据权利要求1所述的方法,其特征在于,所述从用户情感评分矩阵中获取所述目标用户针对每个所述关键词的关键词评分值的步骤之前,还包括:针对任一用户,获取所述用户发布的文本数据;针对所述文本数据中的任意一条文本内容,获取所述文本内容的情感倾向,并获取所述文本内容中的关键词;根据所述文本数据中每个文本内容的情感倾向,确定所述用户针对每个所述关键词的关键词评分值,并构建所述用户情感评分矩阵。3.根据权利要求2所述的方法,其特征在于,所述根据所述文本数据中每个文本内容的情感倾向,确定所述用户针对每个所述关键词的关键词评分值的步骤,包括:针对所述文本数据中任一文本内容,响应于所述文本内容的情感倾向为正向,在所述用户情感评分矩阵中,将从所述文本内容中提取到的每个关键词的关键词评分值增加第一数值;响应于所述文本内容的情感倾向为负向,在所述用户情感评分矩阵中,将从所述文本内容中提取到的每个关键词的关键词评分值降低第二数值。4.根据权利要求2所述的方法,其特征在于,所述获取所述文本内容中的关键词的步骤,包括:基于关键词数据集,获取所述文本内容中包含的初始关键词,所述关键词数据集中包含至少一个关键词;统计每个所述初始关键词在所述文本内容中的出现次数,并获取出现次数最多的K个初始关键词,作为所述文本内容的关键词,K为正整数。5.根据权利要求2所述的方法,其特征在于,所述获取所述文本内容的情感倾向的步骤,包括:对所述文本内容进行分词处理,得到所述文本内容的分词列表;根据所述分词列表,获取所述文本内容的情感得分;响应于所述情感得分为正值,确定所述文本内容的情感倾向为正向;响应于所述情感得分为负值,确定所述文本内容的情感倾向为负向。6.根据权利要求5所述的方法,其特征在于,所述根据所述分词列表,获取...

【专利技术属性】
技术研发人员:廖露阳彭飞邓竹立
申请(专利权)人:北京五八信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1