一种基于机器学习的二手车估价方法技术

技术编号：35075504 阅读：11 留言：0更新日期：2022-09-28 11:40

本发明专利技术涉及二手车估价技术领域，尤其涉及一种基于机器学习的二手车估价方法，包括以下步骤：获取大量二手车交易数据作为原始训练数据，进行数据预处理；计算原始数据对应的保值率，建立线性回归预测模型，并且计算保值率阈值进而划分高低保值率数据；分别建立XGBoost预测模型；当需要预测任意二手车价格时，本发明专利技术使用线性回归算法对于该数据进行初步分类，分类为高保值率或低保之旅数据；再导入对应的XGBoost预测模型，进行价格的预测。相比于使用其他的机器学习算法，本发明专利技术将保值率概念，线性回归算法，XGBoost算法三者相结合对于价格预测问题可有效减小预测误差。差。差。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于机器学习的二手车估价方法

[0001]本专利技术涉及二手车估价
，尤其涉及一种基于机器学习的二手车估价方法。

技术介绍

[0002]二手车作为一种特殊的“电商商品”，因为其“一车一况”的特性比一般电商商品的交易要复杂得多，究其原因是二手车价格难于准确估计和设定，不但受到二手车本身基础配置，如品牌、排量、国别等的影响，还受到使用情况如使用年限、机身受损和维修情况等的影响，甚至新车价格的变化也会对二手车价格带来影响。目前国家并没有出台一个评判二手车资产价值的标准。一些二手车交易平台和第三方估价平台都从自身的角度建立了一系列估价方法用于评估二手车资产的价值。传统的二手车估价主要依靠门店的估价师进行估价，最终确定的价格受到估价师的主观影响大，且没有一个较为客观统一的标准。
[0003]目前用于二手车估价的算法较为简单，且许多关键参数仍然需要人为设置，无法有效避免主观性强的问题。近年来，随着机器学习算法的进步发展，帮助我们对大量数据进行分析预测，本专利技术所提出的一种基于机器学习的二手车估价方法只需提供对应数据集，即可较为精确输出二手车预测价格，且误差在允许范围内，为购车者选购二手车时提供价格参考的依据，填补了国内此方面的空白。

技术实现思路

[0004]针对现有技术存在的不足，本专利技术的目的是提供一种基于机器学习的二手车估价方法，用于解决：二手车预估价格受到估价师的主观影响大，且目前二手车市场评估没有一个较为客观统一的标准，为购车者选购二手车时提供价格参考的依据。
[0005]...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的二手车估价方法，包括以下步骤：S1.数据处理获取一批二手车的特征参数以及成交价格，记为原始数据集；将原始数据集中的二手车的价格特征参数进行数据预处理，缺失值采用平均值代替，当某数据大于平均数据10倍以上时判断其为异常数据，并且对其剔除；S2.线性模型训练以及阈值计算计算原始数据集中的二手车对应保值率，保值率＝成交价/新车价；利用计算完保值率的原始数据，进行线性回归模型的训练，步骤如下：步骤(1)：根据二手车特征变量作为自变量，保值率作为因变量，建立线性回归方程。设U
p
表示第p个自变量，t
i
为第i个二手车的保值率，则可建立t
i
＝β0+β1U1+β2U2+
…
+β
p
U
p
+ε，其中p≥2，ε为误差且ε～(0，σ2)，β
i
为系数；步骤(2)：设(U
i1
，U
i2
，
…
U
ip
，t
i
)是(U1，U2，...U
p
，t)的独立观测值，其中i＝1，2，
…
n，则多元线性模型t
i
＝β0+β1U
i1
+β2U
i2
…
+β
p
U
ip
+ε
i
；步骤(3)：求最小二乘函数，Q(β)＝(t
‑
Uβ)
T
(t
‑
Uβ)当β最小时，线性经验回归为步骤(4)：将二手车原始数据导入线性经验回归公式中，拟合出系数β
i
，即可求解出保值率线性预测模型；将计算保值率阈值k，其中数据总量表示为n，x
i
表示各条数据对应保值率，公式中的u为常量，默认选取0.4；依据数据对应保值率是否大于阈值k，将数据划分...

【专利技术属性】
技术研发人员：戴敏，沈雨田，陈建，王礼星，缪宏，张思瑞，葛永成，张燕军，张善文，刘思幸，杨坚，李芳芳，曾英，卞雯静，
申请(专利权)人：扬州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人