本申请公开了一种行为相似度的确定方法、装置、存储介质及电子装置,涉及智慧家庭技术领域,该行为相似度的确定方法包括:对获取到的智能设备与目标对象的语音交互数据进行解析,得到语音交互数据的分词结果,其中,目标对象至少包括:第一对象和第二对象;根据分词结果得到第一词汇表与第二词汇表,其中,第一词汇表包括分词结果中的所有词汇,第二词汇表包括第一词汇数据和第二词汇数据,其中,第一词汇数据表示所有词汇中与第一对象对应的词汇,第二词汇数据表示所有词汇中与第二对象对应的词汇;根据第一词汇表和第二词汇表确定第一对象与第二对象之间的行为相似度,采用上述技术方案,解决了如何确定出不同用户之间的行为相似度的问题。相似度的问题。相似度的问题。
【技术实现步骤摘要】
行为相似度的确定方法、装置、存储介质及电子装置
[0001]本申请涉及智慧家庭
,具体而言,涉及一种行为相似度的确定方法、装置、存储介质及电子装置。
技术介绍
[0002]目前,智能家电领域中,用户画像(家庭画像)作为描绘刻画用户家庭状况的重要机能一直都被认为是理解用户环节的关键。然而由于家电本身在市场环境与应用环境中的局限性,通常没有合适的手段收集准确的用户画像信息。这对于实现根据用户画像信息比较用户之间的相似度这一重要目标有着很大的限制。
[0003]不过伴随着家电智能化的进程不断加快,出现了一些用户相似度的度量方法,这些方法是基于用户与标准产品的互动数据实现的,这些互动数据包括用户购买电视机、电脑、手机、服装、鞋帽等产品时的用户数据,具有如尺寸、颜色、重量、产地、材质等的工业属性,这些工业属性多为数字或标准的枚举值,具备较好的数据特性。因此,相关技术中,可以利用余弦相似度等度量方法对这些互动数据的数据特性进行度量。但是这种方法具有很大的局限性,只能对与标准产品互动的用户的相似度进行度量,并不能真正实现对所有用户的相似度的度量。因此,相关技术中,存在如何确定出不同用户之间的行为相似度的问题。
[0004]针对相关技术中,如何确定出不同用户之间的行为相似度的问题,尚未提出有效的解决方案。
技术实现思路
[0005]本申请实施例提供了一种行为相似度的确定方法、装置、存储介质及电子装置,以至少解决相关技术中,如何确定出不同用户之间的行为相似度的问题。
[0006]根据本申请实施例的一个实施例,提供了一种行为相似度的确定方法,包括:对获取到的智能设备与目标对象的语音交互数据进行解析,得到所述语音交互数据的分词结果,其中,所述目标对象至少包括:第一对象和第二对象;根据所述分词结果得到第一词汇表与第二词汇表,其中,所述第一词汇表包括所述分词结果中的所有词汇,所述第二词汇表包括第一词汇数据和第二词汇数据,其中,所述第一词汇数据表示所述所有词汇中与所述第一对象对应的词汇,所述第二词汇数据表示所述所有词汇中与所述第二对象对应的词汇;根据所述第一词汇表和所述第二词汇表确定所述第一对象与所述第二对象之间的行为相似度。
[0007]在一个示例性实施例中,对获取到的智能设备与目标对象的语音交互数据进行解析,得到所述语音交互数据的分词结果,包括:确定用于分类的词汇列表,所述词汇列表至少包括:第三词汇表和第四词汇表,其中,所述第三词汇表包括停用词汇类型下的停用词,所述第四词汇表包括特定词汇类型下的特定词;根据所述第三词汇表对所述语音交互数据进行筛选,得到不包含所述停用词的筛选结果;在所述筛选结果中获取与所述第四词汇表中的特定词相匹配的词汇数据,并将所述与所述第四词汇表中的特定词相匹配的词汇数据
确定为所述语音交互数据的分词结果。
[0008]在一个示例性实施例中,根据所述分词结果得到第一词汇表与第二词汇表,包括:对所述分词结果进行去重操作,根据去重后的分词结果生成所述第一词汇表;按照所述目标对象的身份信息将所述第一词汇表中的词汇进行分类,分别得到不同身份信息对应的词汇数据;其中,所述目标对象的身份信息至少包括:所述第一对象的身份信息和所述第二对象的身份信息;基于所述不同身份信息对应的词汇数据得到所述第二词汇表。
[0009]在一个示例性实施例中,根据所述第一词汇表和所述第二词汇表确定所述第一对象与所述第二对象之间的行为相似度,包括:通过所述第一词汇表得到标准词汇矩阵;其中,所述标准词汇矩阵用于表示所述第一词汇表中的任两个词汇之间同时出现的概率;从所述第一词汇数据中确定出第一词汇,从所述第二词汇数据中确定出第二词汇;在所述标准词汇矩阵中查找所述第一词汇和所述第二词汇同时出现的第一概率;在查找成功的情况下,将所述第一概率确定为所述第一对象与所述第二对象之间的行为相似度。
[0010]在一个示例性实施例中,通过所述第一词汇表得到标准词汇矩阵,包括:使用投票算法构建所述第一词汇表中的词汇的上邻接矩阵,其中,所述上邻接矩阵中的每一元素值表示所述第一词汇表中的每一词汇与其他词汇同时出现的次数;对所述上邻接矩阵中的每一元素值进行取倒数处理,得到所述第一词汇表对应的邻接距离矩阵;将所述邻接距离矩阵确定为所述标准词汇矩阵。
[0011]在一个示例性实施例中,在对所述上邻接矩阵中的每一元素值进行取倒数处理,得到所述第一词汇表对应的邻接距离矩阵之前,所述方法还包括:依次对所述第一词汇表的每一词汇与其他词汇同时出现的次数进行计算,得到计算结果;根据所述计算结果更新所述上邻接矩阵中的每一元素值,直至所述上邻接矩阵中的所有元素值不为空;确定更新后的上邻接矩阵。
[0012]在一个示例性实施例中,根据所述第一词汇表和所述第二词汇表确定所述第一对象与所述第二对象之间的行为相似度之后,所述方法还包括:从所述第一对象与所述第二对象之间的行为相似度中确定出所述第一对象与所述第二对象在同一设备类型下的行为相似度;在确定所述行为相似度大于预设阈值的情况下,根据所述第一对象对所述智能设备的使用数据与所述第二对象对所述智能设备的使用数据生成所述同一设备类型下的行为场景模板,其中,所述行为场景模板用于面向所述第一对象和/或所述第二对象提供所述智能设备的服务数据。
[0013]根据本申请实施例的另一个实施例,还提供了一种行为相似度的确定装置,包括:解析模块,用于对获取到的智能设备与目标对象的语音交互数据进行解析,得到所述语音交互数据的分词结果,其中,所述目标对象至少包括:第一对象和第二对象;得到模块,用于根据所述分词结果得到第一词汇表与第二词汇表,其中,所述第一词汇表包括所述分词结果中的所有词汇,所述第二词汇表包括第一词汇数据和第二词汇数据,其中,所述第一词汇数据表示所述所有词汇中与所述第一对象对应的词汇,所述第二词汇数据表示所述所有词汇中与所述第二对象对应的词汇;确定模块,用于根据所述第一词汇表和所述第二词汇表确定所述第一对象与所述第二对象之间的行为相似度。
[0014]根据本申请实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述行为
相似度的确定方法。
[0015]根据本申请实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的行为相似度的确定方法。
[0016]在本申请实施例中,通过对获取到的智能设备与目标对象的语音交互数据进行解析,得到所述语音交互数据的分词结果,其中,所述目标对象至少包括:第一对象和第二对象;根据所述分词结果得到第一词汇表与第二词汇表,其中,所述第一词汇表包括所述分词结果中的所有词汇,所述第二词汇表包括第一词汇数据和第二词汇数据,其中,所述第一词汇数据表示所述所有词汇中与所述第一对象对应的词汇,所述第二词汇数据表示所述所有词汇中与所述第二对象对应的词汇;根据所述第一词汇表和所述第二词汇本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种行为相似度的确定方法,其特征在于,包括:对获取到的智能设备与目标对象的语音交互数据进行解析,得到所述语音交互数据的分词结果,其中,所述目标对象至少包括:第一对象和第二对象;根据所述分词结果得到第一词汇表与第二词汇表,其中,所述第一词汇表包括所述分词结果中的所有词汇,所述第二词汇表包括第一词汇数据和第二词汇数据,其中,所述第一词汇数据表示所述所有词汇中与所述第一对象对应的词汇,所述第二词汇数据表示所述所有词汇中与所述第二对象对应的词汇;根据所述第一词汇表和所述第二词汇表确定所述第一对象与所述第二对象之间的行为相似度。2.根据权利要求1所述的行为相似度的确定方法,其特征在于,对获取到的智能设备与目标对象的语音交互数据进行解析,得到所述语音交互数据的分词结果,包括:确定用于分类的词汇列表,所述词汇列表至少包括:第三词汇表和第四词汇表,其中,所述第三词汇表包括停用词汇类型下的停用词,所述第四词汇表包括特定词汇类型下的特定词;根据所述第三词汇表对所述语音交互数据进行筛选,得到不包含所述停用词的筛选结果;在所述筛选结果中获取与所述第四词汇表中的特定词相匹配的词汇数据,并将所述与所述第四词汇表中的特定词相匹配的词汇数据确定为所述语音交互数据的分词结果。3.根据权利要求1所述的行为相似度的确定方法,其特征在于,根据所述分词结果得到第一词汇表与第二词汇表,包括:对所述分词结果进行去重操作,根据去重后的分词结果生成所述第一词汇表;按照所述目标对象的身份信息将所述第一词汇表中的词汇进行分类,分别得到不同身份信息对应的词汇数据;其中,所述目标对象的身份信息至少包括:所述第一对象的身份信息和所述第二对象的身份信息;基于所述不同身份信息对应的词汇数据得到所述第二词汇表。4.根据权利要求1所述的行为相似度的确定方法,其特征在于,根据所述第一词汇表和所述第二词汇表确定所述第一对象与所述第二对象之间的行为相似度,包括:通过所述第一词汇表得到标准词汇矩阵;其中,所述标准词汇矩阵用于表示所述第一词汇表中的任两个词汇之间同时出现的概率;从所述第一词汇数据中确定出第一词汇,从所述第二词汇数据中确定出第二词汇;在所述标准词汇矩阵中查找所述第一词汇和所述第二词汇同时出现的第一概率;在查找成功的情况下,将所述第一概率确定为所述第一对象与所述第二对象之间的行为相似度。5.根据权利要求4所述的行为相似度的确定方法,其特征在于,通过所述第一词汇表得到标准词汇矩...
【专利技术属性】
技术研发人员:高扬,
申请(专利权)人:海尔智家股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。