System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于计算机人工智能领域,尤其涉及一种基于游客情感的文旅场景舆情分析、预警与归因方法。
技术介绍
1、现有文旅场景情感分析进行三分类(积极、消极、中性)的粗粒度情感检测,在实际应用中难以捕获游客丰富的情感表达。这样的分析方法大多仅限于情感的基础分类,在实际场景使用时提供的有效信息非常有限。
2、现有技术中存在,针对微博中出现的文旅文章不能快速有效的提取关键信息,并加以分析的问题。
技术实现思路
1、本专利技术的目的是针对现有技术对基于游客评论的文旅场景舆情分析的缺陷与不足进行相应的改进。本专利技术提出了一种基于游客情感的文旅场景舆情分析、预警与归因方法,通过深度学习算法和自然语言处理技术,实现了对文旅相关微博图文数据的爬取和分析。本方法采用了python编程语言和pytorch框架,集成大语言模型以进行归因分析和多维度分析,实现了微博数据处理和分析的功能。本专利技术的突出贡献在于针对文化旅游场景的定制化的解决方案。通过应用机器学习模型,我们不仅能够实现对微博数据的力度情感七级度分析和原因分析,还能提供舆情预警和归因分析,为文旅行业提供了决策支持工具。
2、一种基于游客情感的文旅场景舆情分析、预警与归因方法,包括以下步骤:
3、s1.数据爬取:使用scrapy库构建爬虫,根据输入信号动态调整爬取时间段,针对“旅游”关键词,将用户名、评论内容和发布日期信息存储在结构化的jsonl文件中;
4、s2.七级度分析:结合bert、res
5、s3.多维度分析:结合文本评论分析模型,构建提示词指导分析过程,将步骤s1的评论归类为多个类别,表示对旅游景区产品或服务的评分;
6、s4.归因分析:采用步骤s3的文本评论分析模型对步骤s1中评论内容整理原因。
7、进一步的,还包括可视化处理:结合mysql数据库和java后端操作,通过数据可视化展示步骤s2七级度分析结果。
8、进一步的,步骤s1中的数据爬取包括如下步骤:
9、利用scrapy库构建爬虫进程,根据不同输入信号动态调整微博数据的爬取时间段;
10、通过所述爬取时间段的设置,得到期望时间内的文旅相关微博数据;
11、在数据解析阶段,提取网页中用户名、评论内容和发布日期信息,存储在一个结构化的jsonl文件中。
12、进一步的,步骤s2中的七级度分析步骤:
13、利用中文文本预训练的bert模型对微博文本内容编码,对输入的相应图像采用resnet模型编码,并将图像编码结果输入到vision transformer中进一步得到图像特征;
14、对于resnet模型编码及vision transformer的图像特征数据进行空间维度的调整,使得其具有相同的特征维度;
15、利用多层transformer编码器模块将文本、图像信息融合,得到多模态特征,所述多模态特征经过全连接层计算,使用softmax函数得到情感分数。
16、进一步的,所述七级度划分步骤为:
17、根据情感分数,划分为粗粒度的三个类别“积极”、“中性”和“消极”,
18、粗粒度的三个类别划分为细粒度的七个级别,对应为“很满意”、“满意”、“较满意”、“一般”、“不太满意”、“不满意”、“很不满意”。
19、进一步的,步骤s3中的所述文本评论分析模型为:
20、llama3-8b-chinese-chat大语言模型。
21、进一步的,步骤s4中的归因分析内容包括“交通”、“环境”、“安全”以及“其他”。
22、本专利技术实施例中的上述一个或多个技术方案,至少具有如下技术效果之一:
23、本专利技术不仅可以帮助文旅行业(包括旅游景点、酒店、餐饮等)监控和理解消费者对其服务或产品的反馈,还能及时发现并处理负面评价,实现多个角度分析用户情感。
24、通过分析游客的情绪和意见,可以快速识别出问题点,如服务质量、设施条件等,并及时进行改进。这不仅可以提升现有客户的满意度,也可能转化为口碑推广,从而吸引更多的新客户。
25、本专利技术可以提供丰富的情绪数据和用户反馈,这些信息可以作为决策制定的依据,帮助企业更好地了解市场趋势、消费者的需求和偏好,从而做出更加准确和有效的决策。
26、本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
本文档来自技高网...【技术保护点】
1.一种基于游客情感的文旅场景舆情分析、预警与归因方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的 一种基于游客情感的文旅场景舆情分析、预警与归因方法,其特征在于,还包括可视化处理:结合MySQL数据库和Java后端操作,通过数据可视化展示步骤S2七级度分析结果。
3.根据权利要求1所述的 一种基于游客情感的文旅场景舆情分析、预警与归因方法,其特征在于,步骤S1中的数据爬取包括如下步骤:
4.根据权利要求1所述的 一种基于游客情感的文旅场景舆情分析、预警与归因方法,其特征在于,步骤S2中的七级度分析步骤:
5.根据权利要求4所述的 一种基于游客情感的文旅场景舆情分析、预警与归因方法,其特征在于,所述七级度划分步骤为:
6.根据权利要求1所述的 一种基于游客情感的文旅场景舆情分析、预警与归因方法,其特征在于,步骤S3中的所述文本评论分析模型为:
7.根据权利要求1所述的 一种基于游客情感的文旅场景舆情分析、预警与归因方法,其特征在于,
【技术特征摘要】
1.一种基于游客情感的文旅场景舆情分析、预警与归因方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的 一种基于游客情感的文旅场景舆情分析、预警与归因方法,其特征在于,还包括可视化处理:结合mysql数据库和java后端操作,通过数据可视化展示步骤s2七级度分析结果。
3.根据权利要求1所述的 一种基于游客情感的文旅场景舆情分析、预警与归因方法,其特征在于,步骤s1中的数据爬取包括如下步骤:
4.根据权利要求1所述的 ...
【专利技术属性】
技术研发人员:杨巨峰,周锐,王志伟,李皓,吴大威,张知诚,
申请(专利权)人:南开大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。