本申请公开了一种对评论语句打标的方法、装置、设备和存储介质。该方法包括:获取产品的待分析评论语句集合;接收所述产品的标准标签和所述标准标签的解释语句;基于文本向量转换模型计算所述待分析评论语句和所述标准标签的解释语句的相关性;如果所述相关性大于预定阈值,则确定所述标准标签为所述待分析评论语句的标签,为所述待分析评论语句打标。根据相关性来确定待分析评论语句的标签,提高了对于待分析评论语句进行打标签的效率。待分析评论语句进行打标签的效率。待分析评论语句进行打标签的效率。
【技术实现步骤摘要】
对评论语句打标的方法、装置、设备和存储介质
[0001]本申请涉及计算机
,具体而言,涉及一种对评论语句打标的方法、装置、设备和存储介质。
技术介绍
[0002]电商时代,用户对于产品的评论对于产品的改进有重要作用。现有技术中,商家获取海量的评论的数据后,都是人工来对评论进行打标签,主观性比较强,误差比较大,效率低,数据集多为上万条评论,耗费大量的人力成本。
技术实现思路
[0003]本申请的主要目的在于提供一种对评论语句打标的方法、装置、设备和存储介质,以提高打标的效率。
[0004]为了实现上述目的,根据本申请的一个方面,提供了一种对评论语句打标的方法,包括:
[0005]获取产品的待分析评论语句集合;
[0006]接收所述产品的标准标签和所述标准标签的解释语句;
[0007]基于文本向量转换模型计算所述待分析评论语句和所述标准标签的解释语句的相关性;
[0008]如果所述相关性大于预定阈值,则确定所述标准标签为所述待分析评论语句的标签,为所述待分析评论语句打上所述标准标签。
[0009]在一种实施方式中,基于文本向量转换模型计算所述待分析评论语句和所述标准标签的解释语句的相关性,包括:
[0010]将标准标签和待分析评论语句输入基于文本向量的转换模型计算得到第一向量;
[0011]将标准标签和标准标签的解释语句输入基于文本向量的转换模型计算得到第二向量;
[0012]计算所述第一向量和所述第二向量的相关性。
[0013]在一种实施方式中,还包括:所述标准标签从预先存储的标签数据库中获取;所述标签数据库中存储了上下级标签的对应关系。
[0014]在一种实施方式中,为所述待分析评论语句打打上所述标准标签之后,还包括:
[0015]统计所述标准标签对应的评论语句数量;
[0016]统计所述待分析评论语句集合中评论语句的总数量;
[0017]根据所述总数量和所述标准标签对应的评论语句数量计算所述标准标签的召回率。
[0018]在一种实施方式中,确定所述标准标签为所述待分析评论语句的标签之后,所述方法还包括:
[0019]根据标签数据库中存储的上下级标签的对应关系,确定所述标准标签的子标签;
[0020]对于任意的一个标准标签的子标签,接收所述子标签和所述子标签的解释语句;
[0021]基于文本向量转换模型计算待分析的语句和所述子标签的解释语句的相关性;
[0022]如果所述相关性大于预定阈值,则确定所述子标签为所述待分析评论语句的标签。
[0023]在一种实施方式中,获取所述标准标签的解释语句,包括:
[0024]分别向多个不同的百科数据库中,输入所述标准标签;
[0025]接收每个百科数据库返回的所述标准标签的解释语句。
[0026]第二方面,本申请提供了一种对评论语句打标的装置,包括:获取模块,用于获取产品的待分析评论语句集合;
[0027]接收模块,用于接收所述产品的标准标签和所述标准标签的解释语句;
[0028]计算模块,用于基于文本向量转换模型计算所述待分析评论语句和所述标准标签的解释语句的相关性;
[0029]标签处理模块,用于如果所述相关性大于预定阈值,则确定所述标准标签为所述待分析评论语句的标签,为所述待分析评论语句打上所述标准标签。
[0030]在一种实施方式中,计算模块还用于:
[0031]将标准标签和待分析评论语句输入基于文本向量的转换模型计算得到第一向量;
[0032]将标准标签和标准标签的解释语句输入基于文本向量的转换模型计算得到第二向量;
[0033]计算所述第一向量和所述第二向量的相关性。
[0034]第三方面,本申请还提出了一种电子设备,包括:至少一个处理器和至少一个存储器;所述存储器用于存储一个或多个程序指令;所述处理器,用于运行一个或多个程序指令,用以执行上述任意一项所述的方法。
[0035]第四方面,本申请还提出了一种计算机可读存储介质,计算机可读存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于执行上述任意一项所述的方法。
[0036]在本申请上述的实施例中,获取产品的待分析评论语句集合;基于文本向量转换模型计算所述待分析评论语句和标准标签的解释语句的相关性;根据相关性来确定待分析评论语句的标签,提高了对于待分析评论语句进行打标签的效率和准确性。
附图说明
[0037]构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0038]图1是根据本申请实施例的一种洗发水的标签树的结构示意图;
[0039]图2是根据本申请实施例的一种对评论语句打标的方法的流程图;
[0040]图3是根据本申请实施例的计算模型结构示意图;
[0041]图4是根据本申请实施例的一种对评论语句打标的装置的结构示意图;
[0042]图5是根据本申请实施例的一种电子设备的结构示意图。
具体实施方式
[0043]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0044]需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0045]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0046]电商时代,商家都开通了用户对于产品的评论的功能,同样的一件产品,从网上可以获取对该产品的大量评论,数量成千上万。对于评论,每个评论打上标签,可以有利于对于评论进行分门别类,有利于厘清对于产品的认识。参见附图1所示的一种洗发水的标签树的结构示意图;其中,该标签树中,包括一级标签和二级标签。一级标签包括:品牌、产品成分质地、产品功效、种草原因;其中,品牌下属的二级标签包括:清扬、多芬。产品成分质地下属的二级标签包括:海盐、磨砂、泡沫、香味、硅油、精粹;产品功效下属的二级标签包括:控油、去屑、祛痘、柔顺;种草原因本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种对评论语句打标的方法,其特征在于,包括:获取产品的待分析评论语句集合;接收所述产品的标准标签和所述标准标签的解释语句;基于文本向量转换模型计算所述待分析评论语句和所述标准标签的解释语句的相关性;如果所述相关性大于预定阈值,则确定所述标准标签为所述待分析评论语句的标签,为所述待分析评论语句打上所述标准标签。2.根据权利要求1所述的对评论语句打标的方法,其特征在于,基于文本向量转换模型计算所述待分析评论语句和所述标准标签的解释语句的相关性,包括:将标准标签和待分析评论语句输入基于文本向量的转换模型计算得到第一向量;将标准标签和标准标签的解释语句输入基于文本向量的转换模型计算得到第二向量;计算所述第一向量和所述第二向量的相关性。3.根据权利要求1所述的对评论语句打标的方法,其特征在于,还包括:所述标准标签从预先存储的标签数据库中获取;所述标签数据库中存储了上下级标签的对应关系。4.根据权利要求1所述的对评论语句打标的方法,其特征在于,为所述待分析评论语句打上所述标准标签之后,还包括:统计所述标准标签对应的评论语句数量;统计所述待分析评论语句集合中评论语句的总数量;根据所述总数量和所述标准标签对应的评论语句数量计算所述标准标签的召回率。5.根据权利要求1所述的对评论语句打标的方法,其特征在于,确定所述标准标签为所述待分析评论语句的标签之后,所述方法还包括:根据标签数据库中存储的上下级标签的对应关系,确定所述标准标签的子标签;对于任意的一个标准标签的子标签,接收所述子标签和所述子标签的解释语句;基于文本向量转换模型计算待分析的...
【专利技术属性】
技术研发人员:王喆,范凌,
申请(专利权)人:特赞上海信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。