话题评分方法、装置、服务器及计算机可读存储介质制造方法及图纸

技术编号：33294012 阅读：11 留言：0更新日期：2022-05-01 00:19

本发明专利技术实施例提出一种话题评分方法、装置、服务器及计算机可读存储介质，属于数据处理技术领域，方法包括：获取待评分的话题文本，对话题文本进行预处理，得到话题列表，利用预设的词向量生成模型，生成话题列表中的每个话题词的话题向量，根据所有话题向量，计算出包含所有话题向量的最小球，将最小球的半径作为广度评分，通过计算最小球能够考虑各个话题词之间的差异性，从而能够更为客观地反应话题的真实广度。真实广度。真实广度。

全部详细技术资料下载

【技术实现步骤摘要】
话题评分方法、装置、服务器及计算机可读存储介质

[0001]本专利技术涉及数据处理
，具体而言，涉及一种话题评分方法、装置、服务器及计算机可读存储介质。

技术介绍

[0002]播客应用是一种播放音频或视频的应用软件，用户既能收听他人录制上传的音视频节目，也可以将自己录制的音视频节目上传至播客上进行分享。随着播客应用的普及和商用化，网络上的播客话题(即播客内容)越来越多。一般的，播客应用对播客内容进行理解和质量评分之后，才能根据评分结果进行搜索或推荐。
[0003]目前，通常抽取播客内容话题文本的话题或关键词之后，对抽取的话题或关键词进行评分，并将评分结果作为播客内容的质量评分结果。但是，这种评分方法存在难以反应出话题广度质量的问题。

技术实现思路

[0004]有鉴于此，本专利技术的目的在于提供一种话题评分方法、装置、服务器及计算机可读存储介质，其能够改善现有的话题评分方法存在的难以反应出话题广度质量的问题。
[0005]为了实现上述目的，本专利技术实施例采用的技术方案如下。
[0006]第一方面，本专利技术实施例提供一种话题评分方法，采用如下的技术方案。
[0007]一种话题评分方法，所述方法包括：
[0008]获取待评分的话题文本；
[0009]对所述话题文本进行预处理，得到话题列表，所述话题列表包括所述话题文本的多个话题词；
[0010]利用预设的词向量生成模型，生成所述话题列表中的每个所述话题词的话题向量；
[0011]根据所...

【技术保护点】

【技术特征摘要】
1.一种话题评分方法，其特征在于，所述方法包括：获取待评分的话题文本；对所述话题文本进行预处理，得到话题列表，所述话题列表包括所述话题文本的多个话题词；利用预设的词向量生成模型，生成所述话题列表中的每个所述话题词的话题向量；根据所有所述话题向量，计算出包含所有所述话题向量的最小球，将所述最小球的半径作为广度评分。2.根据权利要求1所述的，其特征在于，所述根据所有所述话题向量，计算出包含所有所述话题向量的最小球的步骤，包括：基于所述所有话题向量，采用最小球覆盖算法，计算出包含所有所述话题向量的最小球。3.根据权利要求1所述的话题评分方法，其特征在于，所述对所述话题文本进行预处理，得到话题列表的步骤，包括：利用预设的文本分类模型，对所述话题文本进行分类，得到第一话题分类结果；对所述话题文本进行关键词抽取，得到第二话题分类结果；将所述第一话题分类结果和所述第二话题分类结果合并，得到话题列表。4.根据权利要求3所述的话题评分方法，其特征在于，所述对所述话题文本进行关键词抽取，得到第二话题分类结果的步骤，包括：对所述话题文本进行分词，得到多个词项；计算每个所述词项的词频，将所述词频大于预设值的词项作为话题词，以得到第二话题分类结果，所述第二话题分类结果包括话题词。5.根据权利要求1所述的话题评分方法，其特征在于，所述获取待评分的话题文本的步骤，包括：获取待评分的音频文件，对所述音频文件进行解码，得到待评分的话题文本。6.根据权利要求1至5中任一项所述的话题评分方法，其特征在于，所述方法还包括获得词向...

【专利技术属性】
技术研发人员：姚晓远，张炫，杭江南，颜杰，钟剑哲，未波波，罗欢，
申请(专利权)人：上海喜马拉雅科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人