【技术实现步骤摘要】
基于机器学习的问答方法、装置、电子设备及介质
[0001]本专利技术涉及人工智能
,尤其涉及一种基于机器学习的问答方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]在科技发达和信息爆炸的现代社会中,如何从大规模的信息中提取出人们想要的信息已成为了技术人员研究的目标,技术人员因此研发了问答模型,具体的,问答模型可以接收用户提出的问题并进行作答,可以满足用户的需求。
[0003]现有技术中,当用户提出的问题在现存的答案数据库中不存在时,无论如何对问答模型进行训练,都不能找到这些问题的正确答案,因此导致问答模型处于卡顿状态或者提供完全不相关的答案,降低问答的准确性,影响用户体验。
技术实现思路
[0004]本专利技术提供一种基于机器学习的问答方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高问答的准确性。
[0005]为实现上述目的,本专利技术提供的一种基于机器学习的问答方法,包括:
[0006]获取包含问题题库和答案题库的题库数据集,从所述题库数据集中选取存在正确候选答案的训练问题组成第一训练问题集;
[0007]从所述答案题库中获取所述第一训练问题集对应的候选答案集,提取所述候选答案集的特征,得到第一答案特征集,利用所述第一答案特征集训练预设的数学模型,得到第一数学模型,通过所述第一数学模型计算所述第一训练问题集的置信度,得到第一置信度;
[0008]利用关联度算法获取所述答案题库中与所述第一答案特征集相关的特征,得到第二答案特征集 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习的问答方法,其特征在于,所述方法包括:获取包含问题题库和答案题库的题库数据集,从所述题库数据集中选取存在正确候选答案的训练问题组成第一训练问题集;从所述答案题库中获取所述第一训练问题集对应的候选答案集,提取所述候选答案集的特征,得到第一答案特征集,利用所述第一答案特征集训练预设的数学模型,得到第一数学模型,通过所述第一数学模型计算所述第一训练问题集的置信度,得到第一置信度;利用关联度算法获取所述答案题库中与所述第一答案特征集相关的特征,得到第二答案特征集,利用所述第二答案特征集对所述预设的数学模型进行训练,得到第二数学模型,通过所述第二数学模型计算所述第一训练问题集的置信度,得到第二置信度;获取提问语句;若所述第一训练问题集中不存在与所述提问语句匹配的目标训练问题,则根据所述第一置信度和所述第二置信度将所述第一答案特征集和所述第二答案特征集进行细分,直至细分后的特征子集中出现和所述提问语句的特征相似度大于预设相似阈值的答案特征,并根据所述答案特征构建所述提问语句的答案;若所述第一训练问题集中存在与所述提问语句匹配的目标训练问题,则直接将所述目标训练问题对应的候选答案作为所述提问语句的答案。2.如权利要求1所述的基于机器学习的问答方法,其特征在于,所述根据所述第一置信度和所述第二置信度将所述第一答案特征集和所述第二答案特征集进行细分,直至细分后的特征子集中出现和所述提问语句的特征相似度大于预设相似阈值的答案特征,并根据所述答案特征构建所述提问语句的答案,包括:根据所述第一置信度将所述第一答案特征集划分为第一特征子集和第二特征子集,所述第一特征子集的置信度大于所述第一置信度,所述第二特征子集的置信度小于所述第一置信度;根据所述第二置信度将所述第二答案特征集划分为第三特征子集和第四特征子集,所述第三特征子集的置信度大于所述第二置信度,所述第四特征子集的置信度小于所述第二置信度;获取所述所述提问语句的语句特征;从所述第一特征子集、所述第二特征子集、所述第三特征子集和所述第四特征子集中查找是否存在和所述语句特征对应的答案特征;若不存在,则将所述第一特征子集、所述第二特征子集、所述第三特征子集和所述第四特征子集继续细分直至任一特征子集中存在和所述语句特征对应的答案特征,并根据所述答案特征构建所述提问语句的答案;若存在,则根据和所述语句特征对应的答案特征构建所述提问语句的答案。3.如权利要求1所述的基于机器学习的问答方法,其特征在于,所述若所述第一训练问题集中存在与所述提问语句匹配的目标训练问题,则直接将所述目标训练问题对应的候选答案作为所述提问语句的答案,包括:将所述提问语句和所述第一训练问题集中的训练问题向量化,得到提问语句向量和训练问题向量集;利用余弦相似度计算公式计算所述提问语句向量和所述训练问题向量集中各个训练
问题向量之间的相似度;若存在相似度大于预设阈值的训练问题向量,则确定所述第一训练问题集中存在和所述提问语句匹配的目标训练问题,并将相似度大于预设阈值的目标训练问题对应的候选答案作为所述提问语句的答案;若不存在相似度大于预设阈值的训练问题向量,则确定所述第一训练问题集中不存在与所述提问语句匹配的目标训练问题。4.如权利要求1所述的基于机器学习的问答方法,其特征在于,所述提取所述候选答案集的特征,得到第一答案特征集,包括:根据预设的停用词表将所述候选...
【专利技术属性】
技术研发人员:吴媚洁,
申请(专利权)人:平安普惠企业管理有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。