本发明专利技术涉及一种评价分析和报告生成的方法、装置、电子设备及存储介质。评价分析和报告生成的方法,包括步骤:S1、菜品和差评关键词库进行配置;S2、数据准备和预处理,形成基础的评价内容数据表;S3、数据导入;S4、基础数据统计;S5、菜品统计和分析,请求通用NLP平台,将根据返回结果的情绪正向或负向分析;S6、差评关键词分析,根据关键词库内容自动匹配评价内容并进行计数和内容索引定位,生成差评反馈的问题;S7、NLP评论分析;S8、手动标记;S9、合并整理,对于前面步骤的所有标记结果进行相似的分析结果进行合并;S10、生成和输出分析报告。本发明专利技术通过基于关键词库和自然语言对评价进行处理、分析和生成报告,其耗时短、效率高。效率高。效率高。
【技术实现步骤摘要】
评价分析和报告生成的方法、装置、电子设备及存储介质
[0001]本专利技术涉及数据处理
,具体而言,涉及一种评价分析和报告生 成的方法、装置、电子设备及存储介质。
技术介绍
[0002]本地生活领域,普通消费者到店消费后往往会在互联网平台如点评APP (Application,应用软件)上,对商户的菜品、价格、服务和环境等方面进 行全面评价,第三方平台会依据评价内容计算商户的星级和排名,而商户通 过收集这些评价内容并进行追条整理,能够精准挖掘出店铺经营过程中遇到 关键问题,并进行针对性改进。
[0003]通常情况一家店铺每周的评价数量非常有限,但对于热度较高的商户或 者连锁商户,一周内能产生评论量能达到百条甚至更多,那么人工分析和整 理的时长也会大大增加,实测单次处理百条评论可能耗时在4小时以上,所 消耗时间长。因此,亟需利用AI(人工智能)技术对评价进行自动分析和 整理。
技术实现思路
[0004]本专利技术要解决的技术问题是评价分析耗时过长问题。
[0005]为解决上述技术问题,根据本专利技术的一个方面,提供一种评价分析和报 告生成的方法,方法基于第三方平台的APP或者管理后台上对于目标商户 的评价而进行的智能评价分析和报告生成,方法包括如下步骤:S1、菜品和 差评关键词库进行配置,录入菜品名称和差评关键词;S2、数据准备和预处 理,通过第三平台的APP或者管理后台下载所需评价内容的列表,进行内 容清洗去除无效内容,无效内容包括表情的特殊字符,形成基础的评价内容 数据表;S3、数据导入,导入标准格式评价数据,其中,数据导入过程中自 动过滤掉没有评论内容的评价,减少无效数据干扰;S4、基础数据统计,统 计基础数据包括总评论数、好评数、中差评数;S5、菜品统计和分析,根据 步骤S1菜品名称词库,进行统计菜品出现次数,截取菜品所在位置的文本 句子,根据词库的菜品名称搜索过滤掉未提及菜品名称的评论内容,并根据 常用标点切分成语句形成菜品语句库;请求通用NLP(Natural LanguageProcessing,自然语言处理)平台,将根据返回结果的情绪正向或负向分析, 分别统计为菜品的正向次数、负向次数,其中,对菜品语句进行情绪分析, 输入为具体语句数据,输出为语句的分词情绪值或切词后的分词情绪值列 表,对于其中只要出现一例负向情绪值即记录为负面提及,逐句处理后汇总 每个菜品提及的次数以及正负向提及次数;S6、差评关键词分析,根据关键 词库内容自动匹配评价内容并进行计数和内容索引定位,生成差评反馈的问 题;S7、NLP评论分析,将评论的内容发往自然语言分析平台,对于评论内 容较长的,需要根据段落切分后再分别请求处理;将第三方平台反馈的问题 分类,所分类的类型包括菜品、价格、服务、环境和其他;S8、人工分析、 手动标记,对前面步骤处理过程可能会出现遗漏,进行人为补充额外的差评 问题,或者隐藏不需的反馈内容;S9、合并整理,对于前面步骤的所有标记 结果进行合并整理,将相似的分析结果进行合并;如前面步骤处理过程存
在 概率不准确时,进行人工修正负面关键词和分类;S10、生成分析报告,根 据以上步骤生成分析报告内容,输出报告。
[0006]根据本专利技术的实施例,步骤S2中,可从第三方平台APP后台下载的数 据,确保其中至少包含一条中差评内容。
[0007]进一步地,步骤S2中,可对评价内容进行结构化处理,确保格式按照 标准格式录入,格式包括评论内容、星级、评论时间、用户名的字段。
[0008]根据本专利技术的实施例,步骤S5中,NLP平台可包括BERT模型 (Bidirectional Encoder Representation from Transformers,预训练的语言表征 模型)和神经网络模型。
[0009]根据本专利技术的实施例,步骤S5中,NLP平台可具有利用第三方云平台 的NLP接口,NLP接口包括阿里云或腾讯云平台。
[0010]根据本专利技术的实施例,步骤S6还可包括:S61、将基础评论的评价数据, 根据常用标点切分成语句后构成基础的语句库;S62、确定负面语句库,利 用NLP技术处理基础语句库,其中,负面语句为出现负面情绪词数量>0。
[0011]进一步地,步骤S7中,可根据TextCNN(TextCNN是指将卷积神经网 络CNN应用到文本分类任务,利用多个不同size的kernel来提取句子中的 关键信息,从而能够更好地捕捉局部相关性)算法对负面语句进行分类,分 别划分到不同的负面问题分类中。
[0012]根据本专利技术的第二个方面,提供一种评价分析和报告生成的装置,包括:
[0013]数据预处理模块,数据预处理模块通过第三平台的APP或者管理后台 下载所需评价内容的列表,进行内容清洗去除无效内容,无效内容包括表情 的特殊字符,形成基础的评价内容数据表。菜品正负向统计模块,菜品正负 向统计模块用于对评价数据进行情绪分析,请求通用NLP平台,将根据返 回结果的情绪正向或负向分析,分别统计为菜品的正向次数、负向次数,其 中,对菜品语句进行情绪分析,输入为具体语句数据,输出为语句的分词情 绪值或切词后的分词情绪值列表,对于其中只要出现一例负向情绪值即记录 为负面提及,逐句处理后汇总每个菜品提及的次数以及正负向提及次数,其 中,NLP平台包括BERT模型和神经网络模型,或者具有利用包括阿里云或 腾讯云平台的第三方云平台的NLP接口。差评分类统计模块,用于将基础 评论的评价数据根据常用标点切分成语句后构成基础的语句库,确定负面语 句库,其中,负面语句为出现负面情绪词数量>0;能够利用NLP技术处理 基础语句库,根据TextCNN算法对负面语句进行分类,分别划分到不同的 负面问题分类中,分类类型包括菜品、价格、服务、环境和其他。
[0014]根据本专利技术的第三个方面,提供一种电子设备,包括:存储器、处理器 及存储在存储器上并可在处理器上运行的评价分析和报告生成程序,评价分 析和报告生成程序被处理器执行时实现上述的评价分析和报告生成方法的 步骤。
[0015]根据本专利技术的第四个方面,提供一种计算机存储介质,其中,计算机存 储介质上存储有评价分析和报告生成程序,评价分析和报告生成程序被处理 器执行时实现上述的评价分析和报告生成方法的步骤。
[0016]与现有技术相比,本专利技术的实施例所提供的技术方案至少可实现如下有 益效果:
[0017]本专利技术通过基于关键词库和自然语言处理,进行自然语言处理、文本情 绪分析和数据挖掘,利用AI技术对评价进行自动分析和整理的处理,从而 完成评价分析和报告生
成,其耗时短、效率高。
[0018]本
技术实现思路
结合自然语言处理技术和自定义的差评关键词库,构建一套 标准评价反馈处理流程,包括对评价内容进行语义分析、关键问题提取分类 以及菜品正负向提及计数等,使评价分析更为全面和准确。
附图说明
[0019]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例的附本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种评价分析和报告生成的方法,所述方法基于第三方平台的APP或者管理后台上对于目标商户的评价而进行的智能评价分析和报告生成,所述方法包括如下步骤:S1、菜品和差评关键词库进行配置,录入菜品名称和差评关键词;S2、数据准备和预处理,通过第三平台的APP或者管理后台下载所需评价内容的列表,进行内容清洗去除无效内容,所述无效内容包括表情的特殊字符,形成基础的评价内容数据表;S3、数据导入,导入标准格式评价数据,其中,数据导入过程中自动过滤掉没有评论内容的评价,减少无效数据干扰;S4、基础数据统计,统计基础数据包括总评论数、好评数、中差评数;S5、菜品统计和分析,根据步骤S1菜品名称词库,进行统计菜品出现次数,截取菜品所在位置的文本句子,根据词库的菜品名称搜索过滤掉未提及菜品名称的评论内容,并根据常用标点切分成语句形成菜品语句库;请求通用NLP平台,将根据返回结果的情绪正向或负向分析,分别统计为菜品的正向次数、负向次数,其中,对菜品语句进行情绪分析,输入为具体语句数据,输出为语句的分词情绪值或切词后的分词情绪值列表,对于其中只要出现一例负向情绪值即记录为负面提及,逐句处理后汇总每个菜品提及的次数以及正负向提及次数;S6、差评关键词分析,根据关键词库内容自动匹配评价内容并进行计数和内容索引定位,生成差评反馈的问题;S7、NLP评论分析,将评论的内容发往自然语言分析平台,对于评论内容较长的,需要根据段落切分后再分别请求处理;将第三方平台反馈的问题分类,所分类的类型包括菜品、价格、服务、环境和其他;S8、人工分析、手动标记,对前面步骤处理过程可能会出现遗漏,进行人为补充额外的差评问题,或者隐藏不需的反馈内容;S9、合并整理,对于前面步骤的所有标记结果进行合并整理,将相似的分析结果进行合并;如前面步骤处理过程存在概率不准确时,进行人工修正负面关键词和分类;S10、生成分析报告,根据以上步骤生成分析报告内容,输出报告。2.如权利要求1所述的方法,其中,步骤S2中,从第三方平台APP后台下载的数据,确保其中至少包含一条中差评内容。3.如权利要求2所述的方法,其中,步骤S2中,对评价内容进行结构化处理,确保格式按照标准格式录入,所述格式包括评论内容、星级、评论时间、用户名的字段。4.如权利要求1所述的方法,其中,步骤S5中,所述N...
【专利技术属性】
技术研发人员:陈振华,李晓捷,朱辰昊,王海兵,
申请(专利权)人:再惠上海网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。