本发明专利技术公开了一种基于大数据的人车多因子评估方法及系统,对获取的人和车辆及所处环境的海量数据进行解析和特定的逻辑规则分析,产生标准变量、加工变量、多次加工变量、元变量集,通过多角度模型学习方法建立子模型,基于多个子模型进行逻辑加权运算,分别建立人车综合评分子系统08、车辆质保评估子系统09、车辆精估子系统10和车主信用分析子系统11。本发明专利技术提出的方法和系统可精准实现人和车辆及所处环境的碎片化信息处理和定位,从根本上解决二手车交易中买卖双方信息不对称的问题,颠覆二手车缺乏多次交易后质量保障的传统,提高车辆再次交易的价值,同时可在汽车保险、汽车金融、汽车维修保养、汽车设计及汽车相关领域提供创新型业务,市场价值巨大。
【技术实现步骤摘要】
本专利技术涉及汽车行业数据分析领域,具体而言,涉及一种基于大数据的人车多因子评估方法及系统。
技术介绍
车联网已成为物联网领域一个巨大金矿,然而,车联网经过多年的发展,成功的车联网应用十分有限,二手车市场仍处于传统的交易模式,无法形成大规模成熟的商业化应用。想要实现车联网及其应用的真正价值,开展基于电信网和互联网的汽车数据业务,就必须建立在一个车联网良性的网络生态系统上,车辆及其衍生数据的深层挖掘和精准分析是提供创新车联网产品和所有汽车服务的核心基础。“汽车大数据”并不仅限于海量结构化数据,它还包括博客、点击流数据、机器和传感数据和社交媒体等非结构数据。汽车大数据分析面临的最大挑战就是严重缺乏技术熟练的汽车及衍生行业的交叉学科专业人才,且新一代分析工具与传统BI和数据仓库所需要的熟练技能不尽相同。在现有的汽车行业及其衍生领域,存在以下亟待解决的问题和需求:1)二手车交易不透明问题。目前的二手车交易仅根据市场价格和不完善的车况检测评估,无法解决里程表篡改、报废车翻新卖出、二手车商垄断操控二手车市场价格、二手车质保无有效依据、非4S店的数据无法获取、二手车安全隐患巨大等突出问题。2)车险业务范围窄,评价体系待完善。目前车险主要业务范围是针对新车,新兴的针对二手车的延保服务产品仅以车辆使用年限、有无大事故等简单的二手车数据进行评估,评估风险相当大。目前某些保险公司尝试的UBI(基于用户使用习惯的车辆保险)业务处于早期阶段,评价体系待完善空间巨大。3)汽车金融业务类别单一,无有效评估体系。目前的汽车金融业务基本为单一的买车分期贷款业务,仅根据车主的征信记录等简单信息进行评估,且无法有效提供汽车信贷、汽车担保等新兴业务模式。要解决上述问题,一方面需要更加完善的数据支撑(如车辆历史数据、车主及其所处环境的衍生数据等),另一方面需要专门针对汽车及其衍生行业的大数据分析方法。目前已有的汽车大数据分析方法有以下问题和不足之处:1)没有对图片、视频、音频等非结构化汽车数据的专业分析方法;2)对汽车衍生数据(如车主背景信息、所处环境)的处理分析方法未考虑或考虑不完善,考虑不完善表现在,无法有效地针对某一特定分析目标分析人、车、环境之间的关联,大量碎片化的信息未有效形成贡献或无法区分有效信息造成大量的冗余问题。3)目前的汽车大数据分析日标未精准面向车辆生产厂商、经销商(包括二手车经销商)、保险公司、维修保养店、消费者五类群体的差异化定制化需求,无法产生高附加值的数据分析产品和数据分析价值。为了改变目前的汽车数据服务和分析方法滞后的状况,满足二手车交易、汽车保险、汽车金融、汽车维修保养、汽车设计及汽车相关领域对汽车数据分析的精细化需求和汽车相关业务的创新性需求,本专利技术提供了一种基于大数据的人车多因子评估方法及系统,建立人车综合评分子系统、车辆质保评估子系统、车辆精估子系统和车主信用分析子系统,以至少解决上述问题。
技术实现思路
本专利技术公开了一种基于大数据的人车多因子评估方法及系统,对获取的人和车辆及所处环境的海量数据进行解析和特定的逻辑规则分析,产生标准变量、加工变量、多次加工变量、元变量集,通过多角度模型学习方法建立子模型,基于多个子模型进行逻辑加权运算,分别建立人车综合评分子系统、车辆质保评估子系统、车辆精估子系统和车主信用分析子系统。根据本专利技术的一个方面,提供了一种基于大数据的人车多因子评估方法,如图1所示,其特征在于,包括:1)获取人车原始数据,所述人车原始数据的类型包括用户数据、环境数据、车辆数据。所述用户数据包括但不限于买方特征数据、卖方特征数据、买方行为数据、卖方行为数据;所述环境数据包括但不限于环境历史数据、监管政策数据;所述车辆数据包括但不限于车辆维修保养数据、车辆保险数据、车辆品牌数据。2)分析所述人车原始数据的含义,解析所述人车原始数据为标准变量,所述标准变量具有特定的数据格式,如变量名称缩写+变量值数字或编号代码等,便于数据的统一化处理。解析所述人车原始数据为标准变量的具体内容包括但不限于IP地址解析、身份证号码解析、车牌号码解析、发动机号码解析、非结构化数据解析。3)解析标准变量和/或分析多个标准变量之间的关系,根据特定的逻辑规则产生加工变量。所述加工变量包括但不限于多个所述标准变量的一致性对比结果、多个所述标准变量的等级分类结果、车辆是否曾召回、车辆出险程度分级。所述逻辑规则包括但不限于关键信息提取、差值计算、关联信息推导、信息分级。4)解析已有的所述加工变量,分析标准变量和已有的加工变量之间的关系,根据特定的逻辑规则产生多次加工变量,所述多次加工变量包括但不限于年龄与车龄的差值、召回严重程度、出险关联影响。所述逻辑规则包括但不限于关键信息提取、差值计算、关联信息推导、信息分级。5)组合所述标准变量、所述加工变量、所述多次加工变量为多个元变量集,每个所述元变量集表示用户、环境、车辆的一个特定方面。所述元变量集包括但不限于车辆召回变量集、车辆保养变量集、卖方驾驶习惯变量集、买卖双方及车辆所属地域对比变量集、车辆出险维修保养所属地域对比变量集、车辆出险维修保养时间对比变量集、卖方个人属性变量集、区域天气历史变量集、买卖双方及车辆所属地域对比变量集、用户用车习惯变量集、用户个人属性变量集、用户消费贷款信息变量集。6)基于所述标准变量、所述加工变量、所述多次加工变量、所述元变量集建立子模型,进行多角度模型学习。所述子模型包括但不限于新车市场价格预测子模型、车辆磨损程度评分子模型、车况历史评分子模型、车辆网络口碑评分子模型、车辆品牌满意度评分子模型、车辆磨损预测子模型、车辆出险预测子模型、车主画像评分子模型、用户延保意愿预测子模型、车主个人属性信用评估子模型、车主用车信用评估子模型、车主金融信用评估子模型。优选地,对所述子模型进行多角度模型学习的具体方法是,采用聚类分析方法将所述标准变量和/或多个所述元变量集放在特定的数据类型中,采用神经网络方法进行预测分析,基于所述特定的数据类型和所述预测分析结果进行关联分析,建立所述子模型的关联规则库、算法库和专家意见库。7)基于一个或多个子模型进行逻辑加权运算,分别建立人车综合评分模型、车辆质保模型、车辆精估模型、车主信用模型。优选地,所述人车综合评分模型基于车辆磨损程度评分子模型、车况历史评分子模型、车主画像评分子模型、车辆网络口碑评分子模型、车辆品牌满意度评分子模型输出的五个评分结果进行逻辑加权运算,输出人车综合评分结果,其中,每个所述评分结果的加权系数是每个所述子模型与所述人车综合评分模型的关联程度值的归一化数值,所述关联程度值由专家意见库给出。优选地,所述车主信用模型基于车主个人属性信用评估子模型、车主用车信用评估子模型、车主金融信用评估子模型输出的三个评估结果进行逻辑加权运算,输出车主信用评估结果,包括车主信用综合评估等级、车主个人属性信用等级、车主用车信用等级、车主金融信用等级。优选地,所述车辆质保模型基于车辆磨损预测子模型、车辆出险预测子模型、用户延保意愿预测子模型输出进行逻辑加权运算,输出车辆质保评估分析结果,包括车辆次年磨损等级和维修成本预测结果、车辆次年出险概率和出险等级预测结果、用户延保概率和倾向的延保方式预测结果。优选地,所述车辆精估本文档来自技高网...
【技术保护点】
一种基于大数据的人车多因子评估方法,其特征在于,包括:获取汽车原始数据,所述汽车原始数据的类型包括用户数据、环境数据、车辆数据;分析所述汽车原始数据的含义,解析所述汽车原始数据为标准变量,所述标准变量具有特定的数据格式;解析标准变量和/或分析多个标准变量之间的关系,根据特定的逻辑规则产生加工变量;解析已有的所述加工变量,分析标准变量和已有的加工变量之间的关系,根据特定的逻辑规则产生多次加工变量;组合所述标准变量、所述加工变量、所述多次加工变量为多个元变量集,每个所述元变量集表示用户、环境、车辆的一个特定方面;基于所述标准变量、所述加工变量、所述多次加工变量、所述元变量集建立子模型,进行多角度模型学习;基于一个或多个子模型进行逻辑加权运算,分别建立人车综合评分模型、车辆质保模型、车辆精估模型、车主信用模型。
【技术特征摘要】
1.一种基于大数据的人车多因子评估方法,其特征在于,包括:获取汽车原始数据,所述汽车原始数据的类型包括用户数据、环境数据、车辆数据;分析所述汽车原始数据的含义,解析所述汽车原始数据为标准变量,所述标准变量具有特定的数据格式;解析标准变量和/或分析多个标准变量之间的关系,根据特定的逻辑规则产生加工变量;解析已有的所述加工变量,分析标准变量和已有的加工变量之间的关系,根据特定的逻辑规则产生多次加工变量;组合所述标准变量、所述加工变量、所述多次加工变量为多个元变量集,每个所述元变量集表示用户、环境、车辆的一个特定方面;基于所述标准变量、所述加工变量、所述多次加工变量、所述元变量集建立子模型,进行多角度模型学习;基于一个或多个子模型进行逻辑加权运算,分别建立人车综合评分模型、车辆质保模型、车辆精估模型、车主信用模型。2.基于权利要求1所述的人车多因子评估方法,其特征在于:所述用户数据包括但不限于买方特征数据、卖方特征数据、买方行为数据、卖方行为数据;所述环境数据包括但不限于环境历史数据、监管政策数据;所述车辆数据包括但不限于车辆维修保养数据、车辆保险数据、车辆品牌数据;所述加工变量包括但不限于多个所述标准变量的一致性对比结果、多个所述标准变量的等级分类结果、车辆是否曾召回、车辆出险程度分级;所述多次加工变量包括但不限于年龄与车龄的差值、召回严重程度、出险关联影响;所述元变量集包括但不限于车辆召回变量集、车辆保养变量集、卖方驾驶习惯变量集、买卖双方及车辆所属地域对比变量集、车辆出险维修保养所属地域对比变量集、车辆出险维修保养时间对比变量集、卖方个人属性变量集、区域天气历史变量集、买卖双方及车辆所属地域对比变量集、用户用车习惯变量集、用户个人属性变量集、用户消费贷款信息变量集;所述子模型包括但不限于新车市场价格预测子模型、车辆磨损程度评分子模型、车况历史评分子模型、车辆网络口碑评分子模型、车辆品牌满意度评分子模型、车辆磨损预测子模型、车辆出险预测子模型、车主画像评分子模型、用户延保意愿预测子模型、车主个人属性信用评估子模型、车主用车信用评估子模型、车主金融信用评估子模型。3.基于权利要求1所述的人车多因子评估方法,其特征在于,解析所述汽车原始数据为标准变量的具体内容包括但不限于IP地址解析、身份证号码解析、车牌号码解析、发动机号码解析、非结构化数据解析。4.基于权利要求1所述的人车多因子评估方法,其特征在于,根据特定的逻辑规则产生加工变量利根据特定的逻辑规则产生多次加工变量的所述逻辑规则包括但不限于关键信息提取、差值计算、关联信息推导、信息分级。5.基于权利要求1所述的人车多因子评估方法,其特征在于,对所述子模型进行多角度模型学习的具体方法是:采用聚类分析方法将所述标准变量和/或多个所述元变量集放在特定的数据类型中,采用神经网络方法进行预测分析,基于所述特定的数据类型和所述预测分析结果进行关联分析,建立所述子模型的关联规则库、算法库和专...
【专利技术属性】
技术研发人员:刘楚,简伟,王琳,
申请(专利权)人:王琳,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。