基于社交媒体大数据的三维客户需求动态挖掘方法及系统技术方案

技术编号:38472626 阅读:10 留言:0更新日期:2023-08-11 14:49
本发明专利技术涉及数据处理技术领域,具体地说,涉及一种基于社交媒体大数据的三维客户需求动态挖掘方法及系统。该方法具有:S1、数据预处理;S2、构建目标产品的特征词典;S3、获取评论数据中对目标产品每个属性特征的评价倾向数据;S4、建立需求分类模型。该系统用于实现上述方法。本发明专利技术能够较佳地通过面向实际生产中的客户需求挖掘,使制造商能够全面考虑客户的关注度、满意度以及产品特征对客户的重要性,为下一代产品的设计和投资提供建议。下一代产品的设计和投资提供建议。下一代产品的设计和投资提供建议。

【技术实现步骤摘要】
基于社交媒体大数据的三维客户需求动态挖掘方法及系统


[0001]本专利技术涉及数据处理
,具体地说,涉及一种基于社交媒体大数据的三维客户需求动态挖掘方法及系统。

技术介绍

[0002]在竞争激烈、充满挑战的市场环境中,产品制造商不仅要丰富产品的功能,提高产品质量,还要满足客户需求。设计的产品能否满足目标客户群体的实际需求,对产品销售和新产品设计起着至关重要的作用。然而,客户需求是模糊和隐式的。问卷和在线评论中包含的客户需求都是隐含的,难以直接为新一代产品的设计和制造提供帮助。因此,如何基于海量在线评论,从多个角度明确、细致地挖掘客户需求成为亟待解决的问题。另外,客户需求是可变和多样的。客户需求往往会随着产品的迭代更新而变化,并可能受到多种因素的影响,例如产品类别、目标客户群体的社会地位和经济实力等。此外,客户对不同产品特征的关注程度也会随着时间的推移而变化。制造商不仅要准确把握不同客户群体之间的偏好差异,还要在面对整个市场环境时关注他们需求的变化。因此,如何准确及时地识别客户需求,并分析目标客户群体的需求变化规律已成为制造商难以解决的难题。

技术实现思路

[0003]本专利技术提供了一种基于社交媒体大数据的三维客户需求动态挖掘方法,其能够克服现有技术的某种或某些缺陷。
[0004]根据本专利技术的基于社交媒体大数据的三维客户需求动态挖掘方法,其用于对目标产品的客户需求进行分析,具体包括如下步骤:
[0005]S1、数据预处理
[0006]该步骤中,首先获取对目标产品的评论数据,之后获取评论数据中的评论词,之后获取评论词的词向量;
[0007]S2、构建目标产品的特征词典
[0008]该步骤中,特征词典包括多个特征集合,不同的特征集合分别对应目标产品的不同属性特征,每个特征集合均具有至少一个特征词,特征词自评论词中选取;
[0009]S3、获取评论数据中对目标产品每个属性特征的评价倾向数据
[0010]该步骤中,根据产品特征词典将评论数据划分为评论子句,每个评论子句有且仅与一个相关的属性特征对应;通过对评论子句的分析,获取评价倾向数据;
[0011]S4、建立需求分类模型
[0012]该步骤中,所建立的需求分类模型包括属性特征的重要度、不同的两代目标产品的属性特征满意度变化率以及不同的两代目标产品的属性特征关注度变化率。
[0013]通过本专利技术的方法,能够自社交媒体大数据中提取目标产品的评论数据(步骤S1),通过从评论数据中提取出相关的特征词汇(步骤S2),能够实现通过属性特征对目标产品的概括;而后通过获取评论数据中对每个属性特征的评价倾向数据(步骤S3),能够实现
不同的两代目标产品之间的对比(步骤S4),进而实现需求分类模型的建立;从而能够有效地挖掘具体产品的客户需求、监测客户需求的变化情况,对新产品的重设计有重要意义。
[0014]作为优选,步骤S2包括如下步骤,
[0015]S21、自评论词中提取原始特征词;
[0016]S22、对原始特征词进行聚类处理,经聚类处理后的每个类别即为一个特征集合;
[0017]S23、对特征集合进行扩充,加入扩充特征词。
[0018]基于上述,即可较佳地实现从评论数据中提取客户所关注的产品属性特征。
[0019]作为优选,步骤S21中,选取长度不低于设定词长阈值、词性为名词且在评论数据中出现的频次不低于设定词频值的评论词作为原始特征词。故而能够较佳地实现原始特征词的提取。
[0020]作为优选,基于词向量间的余弦相似度值衡量原始特征词间的相似程度,并基于层次聚类方法对原始特征词进行聚类。故而能够较佳地根据聚类结果对每个类进行概括,形成多个类别的特征词汇集合(即特征集合)。
[0021]作为优选,对于任一特征集合,自评论词中选取最大相似程度不低于设定文本相似度阈值且词性为名词的相关评论词作为扩充特征词。从而能够较佳地实现对特征集合的扩展,故而能够较佳地实现对特征词典的丰富。
[0022]作为优选,步骤S3中,所述的根据产品特征词典将评论数据划分为评论子句,基于S1中所获取的评论词进行;将每个相关评论词按照对应单条评论的语句顺序进行排序,对于每个单条评论,逐个地计算每个相关的评论词与每个特征集合的相似度,若该相似度大于设定的特征集合相似度阈值,则在该评论词最近的标点符号处对相关单条评论进行分割,即可获取相应的评论子句。故而能够较佳地实现评价倾向数据的获取。
[0023]作为优选,属性特征的重要度基于如下公式获取,作为优选,属性特征的重要度基于如下公式获取,其中,IoPF
m
即为第m个属性特征重要度,为与第m个属性特征对应的第m个特征集合中的第p个特征词在评论数据中出现的次数,n
m
为第m个特征集合中的特征词的总数,M表示特征集合的总数。
[0024]基于上述,能够获取每个特征集合中的每个特征词在评论数据中出现的总数,通过对该总数的归一化处理,即可较佳地以所获取的数据作为属性特征的重要度。
[0025]作为优选,属性特征满意度变化率的计算公式为,作为优选,属性特征满意度变化率的计算公式为,其中,为第g+1代产品与第g代产品在属性特征m上,客户满意度的变化率;和即为第g代和第g+1代产品的第m个属性特征的满意度;
[0026]对于任一代产品,其满意度的计算公式为,对于任一代产品,其满意度的计算公式为,其中,表示,第g代产品的第m个属性特征的满意度,表示第g代产品与第m个产品属性特征相匹配的积极评论子句的数量,表示第g代产品与第m个产品特征相匹配的中性评论子句的数量,表示第g代产品与第m个产品属性特征相匹配的评论子句的数量。
[0027]故而能够较佳地实现对不同的两代产品之间的性特征满意度变化的分析。
[0028]作为优选,属性特征关注度变化率的计算公式为,作为优选,属性特征关注度变化率的计算公式为,其中,即为第g+1代产品与第g代产品在属性特征m上,客户关注度的变化率,和即为第g代和第g+1代产品的第m个属性特征的关注度;
[0029]对于任一代产品,其关注度的计算公式为,对于任一代产品,其关注度的计算公式为,其中,表示,第g代产品的第m个属性特征的关注度,表示第g代产品与第m个产品属性特征相匹配的评论子句的数量,表示第g代产品中与相关产品属性特征相匹配的评论子句的最大值。
[0030]故而能够较佳地实现对不同的两代产品之间的性特征关注度变化的分析。
[0031]此外本专利技术还提供了一种基于社交媒体大数据的三维客户需求动态挖掘系统,用于实现任一上述的方法,其包括:
[0032]采集单元,其用于实现步骤S1;
[0033]构建单元,其用于实现步骤S2;
[0034]处理单元,其用于实现步骤S3;以及
[0035]展示单元,其用于实现步骤S4。
[0036]故而能够较佳地通过面向实际生产中的客户需求挖掘,使制造商本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于社交媒体大数据的三维客户需求动态挖掘方法,用于对目标产品的客户需求进行分析,具体包括如下步骤:S1、数据预处理该步骤中,首先获取对目标产品的评论数据,之后获取评论数据中的评论词,之后获取评论词的词向量;S2、构建目标产品的特征词典该步骤中,特征词典包括多个特征集合,不同的特征集合分别对应目标产品的不同属性特征,每个特征集合均具有至少一个特征词,特征词自评论词中选取;S3、获取评论数据中对目标产品每个属性特征的评价倾向数据该步骤中,根据产品特征词典将评论数据划分为评论子句,每个评论子句有且仅与一个相关的属性特征对应;通过对评论子句的分析,获取评价倾向数据;S4、建立需求分类模型该步骤中,所建立的需求分类模型包括属性特征的重要度、不同的两代目标产品的属性特征满意度变化率以及不同的两代目标产品的属性特征关注度变化率。2.根据权利要求1所述的基于社交媒体大数据的三维客户需求动态挖掘方法,其特征在于:步骤S2包括如下步骤,S21、自评论词中提取原始特征词;S22、对原始特征词进行聚类处理,经聚类处理后的每个类别即为一个特征集合;S23、对特征集合进行扩充,加入扩充特征词。3.根据权利要求2所述的基于社交媒体大数据的三维客户需求动态挖掘方法,其特征在于:步骤S21中,选取长度不低于设定词长阈值、词性为名词且在评论数据中出现的频次不低于设定词频值的评论词作为原始特征词。4.根据权利要求3所述的基于社交媒体大数据的三维客户需求动态挖掘方法,其特征在于:基于词向量间的余弦相似度值衡量原始特征词间的相似程度,并基于层次聚类方法对原始特征词进行聚类。5.根据权利要求4所述的基于社交媒体大数据的三维客户需求动态挖掘方法,其特征在于:对于任一特征集合,自评论词中选取最大相似程度不低于设定文本相似度阈值且词性为名词的相关评论词作为扩充特征词。6.根据权利要求1所述的基于社交媒体大数据的三维客户需求动态挖掘方法,其特征在于:步骤S3中,所述的根据产品特征词典将评论数据划分为评论子句,基于S1中所获取的评论词进行;将每个相关评论词按照对应单条评论的语句顺序进行排序,对于每个单条评论,逐个地计算每个相关的评论词与每个特征集合的相似度,若该相似度大于设定的特征集...

【专利技术属性】
技术研发人员:赵爽耀张强蔡正阳陈彬彬唐春华桂屏屏
申请(专利权)人:合肥工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1