System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及机器学习,具体为一种融合tf-idf与贝叶斯算法的电网违章行为预警方法。
技术介绍
1、传统的电网违章行为预警方法主要依赖于人工的经验判断,能够在一定程度上有效地识别出违章行为,但由于依赖个人经验和专业知识,在实际应用中存在明显的局限性,人工判断的主观性导致了判断结果的不一致性,不同的人员可能会因为个人认知差异而得出不同的结论,人工检查的滞后性使得预警系统无法及时捕捉到潜在的违章行为,延误了采取相应措施的最佳时机,随着业务规模的增长,人工检查的工作量变得非常繁重,不仅增加了人力成本,而且降低了工作效率,此外,在处理大量数据时,人工检查很难保证不遗漏任何细节,可能导致重要的违章行为未能被及时发现,因此,传统的电网违章行为预警方法在当前的大数据环境下已经不能满足高效、快速的需求。
2、通过对文本数据进行tf-idf加权,突出在特定文档中出现频率高而在其他文档中出现频率低的词语,从而更好地捕捉到关键信息,有效地筛选出与违章行为相关的关键词汇,提高模型的识别能力,增强贝叶斯算法,结合tf-idf的结果与先验概率,使用贝叶斯定理更新后验概率,使得模型能够更准确地评估违章行为发生的可能性,利用历史数据中的统计信息,通过概率推理来提高预警的准确性和可靠性,此外,通过集成对文本数据进行tf-idf加权和增强贝叶斯算法,实现对违章行为的实时监控,并在预测到潜在违章行为时立即发出警报,最终,能够及时发现潜在的违章行为,提高预警的时效性和响应速度。
技术实现思路
1、鉴于上述存
2、因此,本专利技术解决的技术问题是:现有的电网违章行为预警方法存在主观性高,滞后性高,效率低,遗漏风险高,以及如何有效提高违章行为预警的准确性和实时性,降低人工判断的主观性和滞后性,提高预警系统的整体效能的问题。
3、为解决上述技术问题,本专利技术提供如下技术方案:一种融合tf-idf与贝叶斯算法的电网违章行为预警方法,包括构建违章行为预测数据库,基于深度学习提取关键词并使用tf-idf算法对关键词进行加权;通过计算关键词的先验概率和条件概率矩阵,构建权重矩阵计算关键词之间的权重;将新数据输入到数据库中,通过权重矩阵和贝叶斯算法计算最终预警概率。
4、作为本专利技术所述的融合tf-idf与贝叶斯算法的电网违章行为预警方法的一种优选方案,其中:所述基于深度学习提取关键词包括使用多头注意力机制,通过注意力增强的双向长短期记忆网络从电网历史违章数据中提取关键词,使用双向lstm层捕获输入序列的双向上下文信息。
5、作为本专利技术所述的融合tf-idf与贝叶斯算法的电网违章行为预警方法的一种优选方案,其中:所述使用tf-idf算法对关键词进行加权包括结合词频统计计算每个关键词在文档中的出现频率,和计算每个关键词在数据库总文档集中的逆文档频率,设计改进的tf-idf评分算法,表示为:
6、tfidf(t,d,d)=(1-β+β·tf(t,d))·idf(t,d)
7、其中,t为文档中的任意词,d为文档,d为数据库总文档集,β为平滑因子,β取值范围为[0,1];基于神经网络的动态tf-idf评分方法,表示为:
8、dynamic tfidf(t,d,d)=nn(vt,tf(t,d),idf(t,d))
9、其中,nn为一个神经网络模型,vt为词向量。
10、作为本专利技术所述的融合tf-idf与贝叶斯算法的电网违章行为预警方法的一种优选方案,其中:所述计算关键词的先验概率和条件概率矩阵包括使用dirichlet分布作为关键词的先验概率分布,通过变分推断方法学习超参数α,将每个关键词的词频进行归一化,采用logistic归一化和神经网络模型来拟合词频与概率,构建共现矩阵和条件概率矩阵,使用隐马尔科夫模型来捕捉关键词间的顺序依赖关系,并采用bi-rnn捕捉关键词序列的双向上下文信息。
11、作为本专利技术所述的融合tf-idf与贝叶斯算法的电网违章行为预警方法的一种优选方案,其中:所述构建权重矩阵包括基于先验概率和条件概率矩阵,使用pagerank算法来计算关键词之间的权重,表示为:
12、
13、其中,pr(k)为关键词k的pagerank值,b为阻尼因子,ik为指向关键词k的关键词集合,l(i)为关键词i指向的关键词数量;构建关键词之间的权重矩阵,表示为:
14、
15、其中,w为关键词之间的权重矩阵,pr(wi→wj)为关键词wi到关键词wj的加权边的值,j为不同于关键词i的关键词。
16、作为本专利技术所述的融合tf-idf与贝叶斯算法的电网违章行为预警方法的一种优选方案,其中:所述将新数据输入到数据库中包括通过新数据的先验数据设定,使用dirichlet分布对先验概率进行建模,表示为:
17、
18、其中,p为先验概率,π为混合系数,α为dirichlet分布超参数,m为混合成分的数量,为第m个混合成分中的违章类型集合,γ为伽玛函数,fc为违章类型c的概率;设计动态更新超参数,表示为:
19、αr=αr-1+η(fc,r-αr-1)
20、其中,αr为在时间r的超参数,fc,r为在时间r观测到的违章类型c的频率,η为学习率。
21、作为本专利技术所述的融合tf-idf与贝叶斯算法的电网违章行为预警方法的一种优选方案,其中:所述计算最终预警概率包括提取当前作业的特征向量,基于特征向量和权重矩阵,计算违章类型的似然概率,表示为:
22、
23、其中,p′为似然概率,x为特征向量,m为混合成分的数量,πcm为第m个混合成分的权重,μcm为违章类型c下第m个混合成分的均值向量,σcm为违章类型c下第m个混合成分的协方差矩阵,t为转置操作;基于先验概率和似然概率,计算违章类型的后验概率,表示为:
24、
25、其中,p″为后验概率,p′(x|c,m)为违章类型c和混合成分m时的似然概率,p为证据概率;设计动态更新后验概率,表示为:
26、
27、其中,xr为在时间r观测到的数据,p″(c|xr-1)为违章类型c在时间r-1的后验概率;基于权重矩阵对后验概率进行加权计算,表示为:
28、
29、其中,pfinal为最终的预警概率,wch为违章类型c和h之间的权重,h为不同于违章类型c的违章类型;通过图卷积网络捕捉违章类型间的相互影响,对图卷积网络加权融合,表示为:
30、
31、其中,h(l)为第l层的特征矩阵,σ为激活函数,为归一化的邻接矩阵,w(l)为第l层的权重矩阵;设计动态更新权重矩阵,表示为:
32、w(r)=lstm(w(r-1),x)
33、其中,w(r)为在时间r的权重矩阵;通过多尺度注意力机制,自动调整不同违章类型之间的权重,表示为:
34、w=mul本文档来自技高网...
【技术保护点】
1.一种融合TF-IDF与贝叶斯算法的电网违章行为预警方法,其特征在于,包括:
2.如权利要求1所述的融合TF-IDF与贝叶斯算法的电网违章行为预警方法,其特征在于:所述基于深度学习提取关键词包括使用多头注意力机制,通过注意力增强的双向长短期记忆网络从电网历史违章数据中提取关键词,使用双向LSTM层捕获输入序列的双向上下文信息。
3.如权利要求2所述的融合TF-IDF与贝叶斯算法的电网违章行为预警方法,其特征在于:所述使用TF-IDF算法对关键词进行加权包括结合词频统计计算每个关键词在文档中的出现频率,和计算每个关键词在数据库总文档集中的逆文档频率,设计改进的TF-IDF评分算法,表示为:
4.如权利要求3所述的融合TF-IDF与贝叶斯算法的电网违章行为预警方法,其特征在于:所述计算关键词的先验概率和条件概率矩阵包括使用Dirichlet分布作为关键词的先验概率分布,通过变分推断方法学习超参数α,将每个关键词的词频进行归一化,采用Logistic归一化和神经网络模型来拟合词频与概率,构建共现矩阵和条件概率矩阵,使用隐马尔科夫模型来捕捉关键词间的
5.如权利要求4所述的融合TF-IDF与贝叶斯算法的电网违章行为预警方法,其特征在于:所述构建权重矩阵包括基于先验概率和条件概率矩阵,使用PageRank算法来计算关键词之间的权重,表示为:
6.如权利要求5所述的融合TF-IDF与贝叶斯算法的电网违章行为预警方法,其特征在于:所述将新数据输入到数据库中包括通过新数据的先验数据设定,使用Dirichlet分布对先验概率进行建模,表示为:
7.如权利要求6所述的融合TF-IDF与贝叶斯算法的电网违章行为预警方法,其特征在于:所述计算最终预警概率包括提取当前作业的特征向量,基于特征向量和权重矩阵,计算违章类型的似然概率,表示为:
8.一种采用如权利要求1~7任一所述的融合TF-IDF与贝叶斯算法的电网违章行为预警方法的系统,其特征在于:包括关键词加权模块,先验概率矩阵模块,预测预警模块;
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的融合TF-IDF与贝叶斯算法的电网违章行为预警方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的融合TF-IDF与贝叶斯算法的电网违章行为预警方法的步骤。
...【技术特征摘要】
1.一种融合tf-idf与贝叶斯算法的电网违章行为预警方法,其特征在于,包括:
2.如权利要求1所述的融合tf-idf与贝叶斯算法的电网违章行为预警方法,其特征在于:所述基于深度学习提取关键词包括使用多头注意力机制,通过注意力增强的双向长短期记忆网络从电网历史违章数据中提取关键词,使用双向lstm层捕获输入序列的双向上下文信息。
3.如权利要求2所述的融合tf-idf与贝叶斯算法的电网违章行为预警方法,其特征在于:所述使用tf-idf算法对关键词进行加权包括结合词频统计计算每个关键词在文档中的出现频率,和计算每个关键词在数据库总文档集中的逆文档频率,设计改进的tf-idf评分算法,表示为:
4.如权利要求3所述的融合tf-idf与贝叶斯算法的电网违章行为预警方法,其特征在于:所述计算关键词的先验概率和条件概率矩阵包括使用dirichlet分布作为关键词的先验概率分布,通过变分推断方法学习超参数α,将每个关键词的词频进行归一化,采用logistic归一化和神经网络模型来拟合词频与概率,构建共现矩阵和条件概率矩阵,使用隐马尔科夫模型来捕捉关键词间的顺序依赖关系,并采用bi-rnn捕捉关键词序列的双向上下文信息。
5.如权利要求4所述的融合tf-idf与贝叶斯算法的电网违...
【专利技术属性】
技术研发人员:张梅,徐敏,黄祖源,李辉,高宇豆,朱延杰,
申请(专利权)人:云南电网有限责任公司信息中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。