一种用于自动更新房源数据的方法和装置制造方法及图纸

技术编号:28837424 阅读:18 留言:0更新日期:2021-06-11 23:34
本发明专利技术提供一种用于自动更新房源数据库的方法和装置,所述方法包括:获取用户提出的关于房源的用户问题;获取多个经纪人回答;判断所述房源信息数据是否缺失:如果是,则计算第一校正房源信息数据,并将所述第一校正房源信息数据补充至房源数据库,作为所述房源信息数据;如果否,则计算第二校正房源信息数据,并比较所述第二校正房源信息数据与所述房源信息数据是否相同:如果是,则保持所述房源信息数据不变;如果否,则将所述房源信息数据更新为所述第二校正房源信息数据。本发明专利技术的方法和装置能够形成数据的自动回流和校验,提升数据的有效性和利用价值。

【技术实现步骤摘要】
一种用于自动更新房源数据的方法和装置
本专利技术涉及数据更新领域,特别涉及一种用于自动更新房源数据库的方法和装置。
技术介绍
目前房产领域的用户与经纪人的线上问答,智能助手会根据已有的房源数据生成提示答案,并以提示卡片的形式展示给经纪人,经纪人根据所提供的提示答案是否正确来选择是否采纳,以便提升工作效率。但是,目前已有的房源数据由于来源复杂且未能及时更新,因而数据存在错误的情况,而且很多数据覆盖率低、缺失严重,这导致提示卡片被经纪人采纳的概率并不高。并且,由于在线上对话中,用户提问的表述方式各种各样,因此也不利于数据的利用和更新。因此需要对已有的房源数据进行不断的补充和校验,形成数据的自动回流和校验,从而提升数据的有效性和利用价值。同时,还需要对用户的问题进行引导,从而规范用户的提问方式,以便更好地实现数据回流和校验。需要说明的是,以上
技术介绍
部分所公开的信息仅用于增强对本专利技术背景的理解,因此其可能包含不构成对本领域技术人员已知的现有技术的信息。
技术实现思路
为了解决现有技术中存在的问题,本专利技术提供一种用于自动更新房源数据库的方法,其在提供房源数据自动补充及校验的同时,克服现有技术中存在的问题。本专利技术提供一种用于自动更新房源数据库的方法,包括以下步骤:获取用户提出的关于房源的用户问题;获取历史问答记录中关于所述房源的对应于所述用户问题的多个经纪人回答;从房源数据库中调取关于所述房源的对应于所述用户问题的房源信息数据,判断所述房源信息数据是否缺失:如果是,则计算所述多个经纪人回答的一致性,将一致性最高的回答作为第一校正房源信息数据,并将所述第一校正房源信息数据补充至房源数据库,作为所述房源信息数据;如果否,则计算所述房源信息数据和所述多个经纪人回答的一致性,将一致性最高者作为第二校正房源信息数据,并比较所述第二校正房源信息数据与所述房源信息数据是否相同:如果是,则保持所述房源信息数据不变;如果否,则将所述房源信息数据更新为所述第二校正房源信息数据。根据本专利技术一实施例,所述获取用户提出的关于房源的用户问题,包括以下步骤:抽取对话中用户提出的当前用户问题;识别所述当前用户问题所对应的当前用户询问意图;预测所述当前用户询问意图的下一用户询问意图;基于所预测的下一用户询问意图为用户推荐待选用户问题;基于用户从所述待选用户问题中的选择来确定所述关于房源的用户问题。根据本专利技术一实施例,识别所述当前用户问题所对应的当前用户询问意图通过用户意图识别模型来实现,所述用户意图识别模型基于对样本用户问题及其对应的样本用户询问意图的学习而创建,其中所述样本用户询问意图通过人工来标记。根据本专利技术一实施例,所述用户意图识别模型采用TextCNN算法来构建。根据本专利技术一实施例,预测所述当前用户询问意图的下一用户询问意图通过计算状态转移矩阵来实现。根据本专利技术一实施例,所述基于所预测的下一用户询问意图为用户推荐待选用户问题包括:收集所预测的下一用户询问意图所对应的标准用户问题;对所述标准用户问题进行筛选;将经过筛选的标准用户问题作为待选用户问题推荐给用户。根据本专利技术一实施例,所述收集所预测的下一用户询问意图所对应的标准用户问题包括:基于所述意图识别模型获得每个用户询问意图所对应的多个用户问题;对每个用户询问意图所对应的多个用户问题进行聚类,得到每个用户询问意图所对应的标准用户问题,由此获得所预测的下一用户询问意图所对应的标准用户问题。根据本专利技术一实施例,所述聚类采用k_means算法实现。根据本专利技术一实施例,对所述标准用户问题进行筛选包括:基于问题排序模型计算出每个输入的标准用户问题的推荐概率,并基于计算出的推荐概率对所述标准用户问题进行打分和排序,并基于所述打分和排序对所述标准用户问题进行筛选,其中,所述问题排序模型基于对样本标准问题的房源特征数据和推荐标签值的学习而创建,其中,所述房源特征数据包括热度、数据覆盖率、置信度、点击率和用途中的一个或多个,所述推荐标签值通过人工来标记。根据本专利技术一实施例,基于所述打分和排序对所述标准用户问题进行筛选包括:将推荐概率大于第一概率值且排序小于等于第一排序值的标准用户问题推荐给用户。根据本专利技术一实施例,所述问题排序模型采用GBDT算法来构建。根据本专利技术一实施例,所述获取历史问答记录中关于所述房源的对应于所述用户问题的多个经纪人回答包括:通过问答匹配模型计算输入的用户问题与经纪人回答之间的匹配概率,并基于所述匹配概率获得与所述用户问题匹配的多个经纪人回答,其中,所述问答匹配模型基于对正样本和负样本的学习而创建,所述正样本为所述历史问答记录中的样本用户问题及其对应的样本经纪人回答组成的样本问答对,所述负样本为所述样本用户问题及其上文的任一经纪人回答组成的样本非问答对。根据本专利技术一实施例,所述问答匹配模型采用bert算法来构建。根据本专利技术一实施例,所述方法还包括以下步骤:对所述多个经纪人回答进行实体抽取,并基于所抽取的实体来计算所述第一校正房源信息数据以及所述第二校正房源信息数据,其中,所述实体抽取基于实体识别模型来实现,所述实体识别模型基于对序列标注样本的学习而构建。根据本专利技术一实施例,所述实体识别模型采用bert-lstm-crf算法来构建。根据本专利技术一实施例,所述方法还包括以下步骤:从房源数据库中调取关于所述房源的对应于所述用户问题的房源特征数据,并对所述房源特征数据进行更新。根据本专利技术一实施例,当将所述第一校正房源信息数据补充至房源数据库,作为所述房源信息数据时,所述置信度更新为多个经纪人回答中一致性最高的回答的数目与总数的比值;当保持所述房源信息数据不变或者将所述房源信息数据更新为所述第二校正信息数据时,所述置信度更新为所述房源信息数据和所述多个经纪人回答组成的集合中一致性最高的内容的数目与总数的比值,其中,当置信度为1时,所述房源信息数据将不再更新。根据本专利技术的另一方面,还提供一种用于自动更新房源数据库的装置,包括:数据获取模块,其被配置为:获取用户提出的关于房源的用户问题;获取历史问答记录中关于所述房源的对应于所述用户问题的多个经纪人回答;数据判断模块,其被配置为:从房源数据库中调取关于所述房源的对应于所述用户问题的房源信息数据,判断所述房源信息数据是否缺失;数据更新模块,其被配置为:如果所述房源信息数据缺失,则计算所述多个经纪人回答的一致性,将一致性最高的回答作为第一校正房源信息数据,并将所述第一校正房源信息数据补充至房源数据库,作为所述房源信息数据;如果所述房源信息数据没有缺失,则计算所述房源信息数据和所述多个经纪人回答的一致性,将一致性最高者作为第二校正房源信息数据,并比较所述第二校正房源信息数据与所述房源信息数据是否相同:如果是,则保持所述房源信息数据不变;如果否,则将所述房源信息数据更新为所述第二校正房源信息数据。根据本专利技术一实施例,所述数据获取模块还包括:意图识别子模块,其被配置为:识别对话中用户提出的当前用户问题所对应的当前用户询本文档来自技高网...

【技术保护点】
1.一种用于自动更新房源数据库的方法,其特征在于,包括以下步骤:/n获取用户提出的关于房源的用户问题;/n获取历史问答记录中关于所述房源的对应于所述用户问题的多个经纪人回答;/n从房源数据库中调取关于所述房源的对应于所述用户问题的房源信息数据,判断所述房源信息数据是否缺失:/n如果是,则计算所述多个经纪人回答的一致性,将一致性最高的回答作为第一校正房源信息数据,并将所述第一校正房源信息数据补充至房源数据库,作为所述房源信息数据;/n如果否,则计算所述房源信息数据和所述多个经纪人回答的一致性,将一致性最高者作为第二校正房源信息数据,并比较所述第二校正房源信息数据与所述房源信息数据是否相同:/n如果是,则保持所述房源信息数据不变;/n如果否,则将所述房源信息数据更新为所述第二校正房源信息数据。/n

【技术特征摘要】
1.一种用于自动更新房源数据库的方法,其特征在于,包括以下步骤:
获取用户提出的关于房源的用户问题;
获取历史问答记录中关于所述房源的对应于所述用户问题的多个经纪人回答;
从房源数据库中调取关于所述房源的对应于所述用户问题的房源信息数据,判断所述房源信息数据是否缺失:
如果是,则计算所述多个经纪人回答的一致性,将一致性最高的回答作为第一校正房源信息数据,并将所述第一校正房源信息数据补充至房源数据库,作为所述房源信息数据;
如果否,则计算所述房源信息数据和所述多个经纪人回答的一致性,将一致性最高者作为第二校正房源信息数据,并比较所述第二校正房源信息数据与所述房源信息数据是否相同:
如果是,则保持所述房源信息数据不变;
如果否,则将所述房源信息数据更新为所述第二校正房源信息数据。


2.根据权利要求1所述的方法,其特征在于,所述获取用户提出的关于房源的用户问题,包括以下步骤:
抽取对话中用户提出的当前用户问题;
识别所述当前用户问题所对应的当前用户询问意图;
预测所述当前用户询问意图的下一用户询问意图;
基于所预测的下一用户询问意图为用户推荐待选用户问题;
基于用户从所述待选用户问题中的选择来确定所述关于房源的用户问题。


3.根据权利要求2所述的方法,其特征在于,识别所述当前用户问题所对应的当前用户询问意图通过用户意图识别模型来实现,所述用户意图识别模型基于对样本用户问题及其对应的样本用户询问意图的学习而创建,其中所述样本用户询问意图通过人工来标记。


4.根据权利要求2所述的方法,其特征在于,预测所述当前用户询问意图的下一用户询问意图通过计算状态转移矩阵来实现。


5.根据权利要求2所述的方法,其特征在于,所述基于所预测的下一用户询问意图为用户推荐待选用户问题包括:
收集所预测的下一用户询问意图所对应的标准用户问题;
对所述标准用户问题进行筛选;
将经过筛选的标准用户问题作为待选用户...

【专利技术属性】
技术研发人员:王宏王贺青孙林孙拔群卢新洁武晓飞
申请(专利权)人:北京房江湖科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1