System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及粮食数据分析评估领域,具体涉及一种基于数据分析的粮食形势智能评估系统。
技术介绍
1、传统的粮食形势评估主要依赖于经验判断和人工调查,存在主观性高、信息滞后、评估周期长等问题。随着信息技术和数据分析的快速发展,利用大数据和人工智能技术进行粮食形势评估成为可能。
2、公开号为cn108694584a的专利技术专利申请公开了一种基于区块链的粮食溯源与激励的方法以及系统。该方法包括:建立由监管平台、收购平台、收储平台、生产企业平台以及消费者组成的区块链网络;消费者基于智能合约根据获取的溯源数据做出评价反馈。该方法解决的技术问题是:市面上的粮食产品基本无法溯源使得消费者无法对该产品的原来来源产生信心。
技术实现思路
1、本申请实施例的目的在于提供了一种基于数据分析的粮食形势智能评估系统,利用大数据和人工智能技术进行粮食形势评估。
2、第一方面,本申请实施例提供了一种基于数据分析的粮食形势智能评估系统,包括以下模块:
3、数据收集模块,用于进行数据收集,收集的数据包括第一数据和第二数据,所述第一数据为粮食统计机构向公众发布的数据,所述第二数据为粮食设备采集的数据,第一数据包括:农业生产数据、市场价格数据、气象数据、农田覆盖数据、粮食质量数据;第二数据包括:无人机航拍数据、物联网实时追踪和监控数据、区块链可信生产数据、消费者对粮食的关注度数据;所述第一数据和第二数据为按照时间顺序排列的数据,具有时间标记;
4、数据处理模块,用于对采
5、数据分析模块,用于对消费者对粮食的关注度数据进行分析,获取消费者对粮食的关注度评分;具体包括:
6、构建粮食相关关键词数据集合,包括:构建粮食语境词语集合、构建情感语境词语集合;
7、对获取到的移动互联网媒体数据和互联网搜索数据中的文章数据进行分词处理,获取文章词语向量,计算各个文档的词语向量与情感词语数据集的相关度,获取语料属性类别分数;
8、基于文章的播放量对各篇文章与情感词语数据集的对应语料属性类别分数进行加权方式的处理,最终导出消费者对粮食的关注度;
9、智能评估模块,用于对数据收集模块采集的数据、数据处理模块处理后的数据和数据分析模块产生的评分数据进行建模评估,获取粮食形势评估分。
10、优选地,所述数据预处理包括对机构统计数据和现实统计数据的融合具体包括,针对第一数据和第二数据中同样类别的条目:在一定时段内,如果第一数据对应条目的数据不存在,则将第二数据对应条目的数据作为最终的融合数据输出;如果第二数据对应条目的数据不存在,则将第一数据对应条目的数据作为最终的融合数据输出;如果第一数据对应条目的数据和第二数据对应条目的数据都存在,则将二者进行加权平均作为最终的融合数据输出;
11、优选地,所述预处理包括对第一数据和第二数据进行融合的计算方式为:
12、,
13、其中, a(t n )为 t n时刻的第一数据值, a(t n )为 t n时刻的第二数据值, nan表示该数据为异常值, a out (t n )为 t n时刻的融合值。
14、优选地,构建粮食语境词语集合包括:对涉及粮食方面的中文词语进行收集;构建情感语境词语集合包括:对表示情感态度的词语进行收集归纳,分为5个类别:积极、较积极、普通、较消极、消极,形成情感词语词库;词语集合的获取方式包括:人工筛选标注,机器自动标注。
15、优选地,对获取到的移动互联网媒体数据和互联网搜索数据中的文章数据进行分词处理,获取文章词语向量,计算各个文档的词语向量与情感词语数据集的相关度,获取语料属性类别分数具体包括:
16、针对获取到的移动互联网媒体数据和互联网搜索数据中的文章数据,使用jieba分词工具,将整篇文章进行全部分词,统计分词后各个词语出现的频次,获取词频最高的前100个词语,使用bert算法计算这100个词语的词语向量,每个向量长度为1x512,即含有512个浮点数,
17、在此基础上用以下公式计算文章的词语向量:
18、,
19、其中为第n个词语向量,d为文章的词语向量,表示文章的词语向量中的512个浮点数;
20、所述语料属性类别分数m的计算方式为:
21、,
22、其中,
23、,
24、以上公式中,c1~c5表示文章与所述情感语境词语集合中5个类别的各词语向量计算余弦相关度, score[max()]为获取最大的余弦相关度的词语向量所属的语料属性类别的语料属性类别分数,d为当前文章的词语向量,s1~s5为预先设置的5个类别的标准情感词语向量,为点积运算,分别表示向量d和的模长。
25、优选地,所述基于文章的播放量对各篇文章与情感词语数据集的对应语料属性类别分数进行加权方式的处理,最终导出消费者对粮食的关注度具体包括:
26、消费者对粮食的关注度p的计算方式为:
27、,
28、其中,各篇文章的情感分数分别为(m1,m2,m各mn), 各篇文章的浏览量分别为(w1,w2,w文wn)。
29、优选地,获取粮食形势评估分具体包括:基于卷积神经网络对评估过程进行建模,经过深度学习训练,最终获取粮食形势评估分;
30、优选地,卷积神经网络具体结构为:将某一时间段内的第一数据和第二数据各项条目作为多个特征通道输入;采用卷积层包含通道数为32的3x3卷积核与最大池化层完成特征提取与特征筛选,选择卷积层包含通道数64的3x3卷积核以及最大池化层进一步提取数值特征与减小权重参数,最后经过扁平化一维展开,输入3层全连接层,最后使用softmax分类器。
31、与现有技术相比,本专利技术收集了粮食统计机构向公众发布的数据和粮食设备采集的数据,包括权威机构发布的数据和真实环境中设备采集的数据,有效提高了统计数据的全面性;本专利技术还采用了消费者对粮食的关注度数据,通过了解消费者对粮食的情感和关注度,可以提供更全面和多维度的信息,帮助更准确地评估粮食形势;统计数据信息可能存在滞后性,而现实统计数据信息的及时性较高,本专利技术将二者进行时间尺度融本文档来自技高网...
【技术保护点】
1.一种基于数据分析的粮食形势智能评估系统,其特征在于,包括以下模块:
2.如权利要求1所述的智能评估系统,其特征在于:所述预处理包括对第一数据和第二数据进行融合具体包括,针对第一数据和第二数据中同样类别的条目:在一定时段内,如果第一数据对应条目的数据不存在,则将第二数据对应条目的数据作为最终的融合数据输出;如果第二数据对应条目的数据不存在,则将第一数据对应条目的数据作为最终的融合数据输出;如果第一数据对应条目的数据和第二数据对应条目的数据都存在,则将二者进行加权平均作为最终的融合数据输出。
3.如权利要求2所述的智能评估系统,其特征在于:所述预处理包括对第一数据和第二数据进行融合的计算方式为:
4.如权利要求1所述的智能评估系统,其特征在于:构建粮食语境词语集合包括:对涉及粮食方面的中文词语进行收集;构建情感语境词语集合包括:对表示情感态度的词语进行收集归纳,分为5个类别:积极、较积极、普通、较消极、消极,形成情感词语词库;词语集合的获取方式包括:人工筛选标注,机器自动标注。
5.如权利要求1所述的智能评估系统,其特征在于:对获取
6.如权利要求1所述的智能评估系统,其特征在于:所述基于文章的播放量对各篇文章与情感词语数据集的对应语料属性类别分数进行加权方式的处理,最终导出消费者对粮食的关注度具体包括:
7.如权利要求1所述的智能评估系统,其特征在于:获取粮食形势评估分具体包括:基于卷积神经网络对评估过程进行建模,经过深度学习训练,最终获取到粮食形势评估分。
8.如权利要求7所述的智能评估系统,其特征在于:卷积神经网络具体结构为:将某一时间段内的第一数据和第二数据各项条目作为多个特征通道输入;采用卷积层包含通道数为32的3x3卷积核与最大池化层完成特征提取与特征筛选,选择卷积层包含通道数64的3x3卷积核以及最大池化层进一步提取数值特征与减小权重参数,最后经过扁平化一维展开,输入3层全连接层,最后使用softmax分类器。
...【技术特征摘要】
1.一种基于数据分析的粮食形势智能评估系统,其特征在于,包括以下模块:
2.如权利要求1所述的智能评估系统,其特征在于:所述预处理包括对第一数据和第二数据进行融合具体包括,针对第一数据和第二数据中同样类别的条目:在一定时段内,如果第一数据对应条目的数据不存在,则将第二数据对应条目的数据作为最终的融合数据输出;如果第二数据对应条目的数据不存在,则将第一数据对应条目的数据作为最终的融合数据输出;如果第一数据对应条目的数据和第二数据对应条目的数据都存在,则将二者进行加权平均作为最终的融合数据输出。
3.如权利要求2所述的智能评估系统,其特征在于:所述预处理包括对第一数据和第二数据进行融合的计算方式为:
4.如权利要求1所述的智能评估系统,其特征在于:构建粮食语境词语集合包括:对涉及粮食方面的中文词语进行收集;构建情感语境词语集合包括:对表示情感态度的词语进行收集归纳,分为5个类别:积极、较积极、普通、较消极、消极,形成情感词语词库;词语集合的获取方式包括:人工筛选标注,机器自动标注。
5.如权...
【专利技术属性】
技术研发人员:谢小良,胡一鸿,李文莎,刘彦,李迎,李赛佳,
申请(专利权)人:湖南工商大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。