System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于烟草管理,具体涉及烟草专卖精益化市场监管预防性案例智能生成系统。
技术介绍
1、当前烟草专卖精益化市场监管机制下,监管人员依法收集采证,撰写司法文件。案件结束之后,将收集到的监管案例数据,作为分析对象,即对已有案例数据进行统计,分析,从而发现其中的重点监察对象,并对零售户进行精确监管。
2、在公开号为cn114493442a的中国专利中,提到了一种基于涉烟情报数据的综合查询方法。包括以下步骤:数据管理步骤:服务器获取烟草行业数据,存储至数据库;关系分析步骤:对数据库中的烟草行业数据进行关联性分析,将具有关联关系的烟草行业数据标记为关联数据;数据查询步骤:服务器接收前端设备的查询请求,根据前端设备的查询请求,调用数据库中被请求的数据,以及所请求数据的关联数据,反馈给前端设备。相比于现有技术,能够对烟草数据进行全方位的分析和探索,尽管上述方案有益效果诸多,但是该方案中在采证,文档撰写,信息提取过程中,难免出现人为因素的错误。分析的案例对象,作为过往案例,往往会导致已有案例模板,类似或相关案例及处罚手段记录,引用法律法规内容等案例相关信息,无法针对最新市场行为,做出有效监管。
3、对此,专利技术人提出烟草专卖精益化市场监管预防性案例智能生成系统,用以解决上述问题。
技术实现思路
1、本专利技术的目的在于提供烟草专卖精益化市场监管预防性案例智能生成系统,以解决上述
技术介绍
中提出的问题。
2、为实现上述目的,本专利技术提供如下技术方案:
>3、烟草专卖精益化市场监管预防性案例智能生成系统,包括:
4、数据处理模块,利用自然语言处理nlp技术和视频、音频识别技术,从现场采集到的笔录中自动提取并格式化案件相关要素;
5、文本校核模块,基于现场采集到的案件相关要素,采用文本校核,使用文本处理和校对软件,结合法律专用语料库,自动校核、修正并纠正司法文书中的语法、拼写和事实错误;
6、建立案例模板模块,应用信息抽取方法,从大量案例数据中抽取关键要素,生成结构化的案例模板;
7、案例覆盖率分析与预警推送模块,利用数据分析和预测模型,计算案件要素的覆盖率,并基于此生成预警信息,推送给相关监管人员;
8、新案例生成模块,结合cnn深度学习算法,分析现有数据并生成新的案例情景,模拟出现的违法情况;
9、案例模板库分析与制度审查模块,使用数据挖掘和统计分析方法,定期对案例模板库进行分析,识别长期问题并生成相应的制度审查建议。
10、优选的,所述相关要素包括违规销售时间、地点、金额。
11、优选的,所述案例模板包括时间、地点、零售商、货物、违规内容、处罚措施。
12、优选的,所述自然语言处理用于从文本中提取案例要素,使用词频-逆文档频率,衡量词语在文档中的重要性,表示为:
13、tf-idf(t,d,d)=tf(t,d)×idf(t,d)
14、其中,tf(t,d)是词语t在文档d中出现的频率,idf(t,d)是词语t在语料库d中的逆文档频率。
15、优选的,所述文本校核使用编辑距离,用于计算两个字符串之间的最小编辑操作数,表示为:
16、
17、其中d(i,j):字符串s和t的前i个字符和前j个字符之间的编辑距离;
18、cost(s i,tj):字符s i和tj之间的替换成本;
19、如果s i=tj,则cost(s i,tj)=0,否则为1;
20、语法校正,基于统计语言模型n-gram模型,表示为:
21、
22、其中p(wi∣wi-n+1,…,wi-1):在已知前n-1个词的情况下,词wi出现的概率;
23、用于自动校核和修正文本中的语法和拼写错误,提高文档质量。
24、优选的,所述信息抽取方法为基于tf-idf,从大量案例数据中抽取关键信息,并生成标准化的案例模板。
25、优选的,所述覆盖率的计算表示为:
26、
27、coverage:覆盖率,r:有关个案数目;t:案例总数;
28、预警模型采用基于时间序列分析和ari ma预测模型,表示为:
29、yt=α+βt+e
30、yt:时间t时的观测值,α:常数项,β:时间趋势系数,e:误差项;
31、用于计算案件要素的覆盖率,并基于此生成预警信息,推送给相关监管人员。
32、优选的,所述cnn深度学习算法用于图像和视频数据的处理,表示为:
33、f(x)=relu(w*x+b)
34、其中w:卷积核,x:输入特征图,b:偏置,relu:激活函数;
35、
36、其中d:判别器,g:生成器,x:真实数据,z:噪声向量;
37、深度学习技术用于生成新的案例情景,模拟出现的违法情况,提高监管的前瞻性。
38、优选的,所述数据挖掘采用apr i or i关联规则挖掘,其支持度表示为:
39、
40、其中count(x∪y):包含x和y的事务数;
41、n:事务总数;
42、置信度表示为:
43、
44、count(x):包含x的事务数;
45、用于定期分析案例数据,识别长期问题,并生成相应的制度审查建议。
46、与现有技术相比,本专利技术的有益效果是:
47、本专利技术使用大模型技术,从采证环节开始,完成自动格式化,分类等一系列司法程序,案件整理结束后,自动提取其关键因素,形成案例模板,定期收集整理已有案例数据,利用n l p技术,抽取已有案例的关键词,形成可能发生的新案例,作为主动防范对象,对于案例要素覆盖率较大的案例,主动推送,使得执法人员有成例可依,且可以形成定期制度审核机制。
本文档来自技高网...【技术保护点】
1.烟草专卖精益化市场监管预防性案例智能生成系统,其特征在于,包括:
2.根据权利要求1所述的烟草专卖精益化市场监管预防性案例智能生成系统,其特征在于:所述相关要素包括违规销售时间、地点、金额。
3.根据权利要求1所述的烟草专卖精益化市场监管预防性案例智能生成系统,其特征在于:所述案例模板包括时间、地点、零售商、货物、违规内容、处罚措施。
4.根据权利要求1所述的烟草专卖精益化市场监管预防性案例智能生成系统,其特征在于:所述自然语言处理用于从文本中提取案例要素,使用词频-逆文档频率,衡量词语在文档中的重要性,表示为:
5.根据权利要求1所述的烟草专卖精益化市场监管预防性案例智能生成系统,其特征在于:所述文本校核使用编辑距离,用于计算两个字符串之间的最小编辑操作数,表示为:
6.根据权利要求1所述的烟草专卖精益化市场监管预防性案例智能生成系统,其特征在于:所述信息抽取方法为基于TF-IDF,从大量案例数据中抽取关键信息,并生成标准化的案例模板。
7.根据权利要求1所述的烟草专卖精益化市场监管预防性案例智能生成系
8.根据权利要求1所述的烟草专卖精益化市场监管预防性案例智能生成系统,其特征在于:所述CNN深度学习算法用于图像和视频数据的处理,表示为:
9.根据权利要求1所述的烟草专卖精益化市场监管预防性案例智能生成系统,其特征在于:所述数据挖掘采用Apriori关联规则挖掘,其支持度表示为:
...【技术特征摘要】
1.烟草专卖精益化市场监管预防性案例智能生成系统,其特征在于,包括:
2.根据权利要求1所述的烟草专卖精益化市场监管预防性案例智能生成系统,其特征在于:所述相关要素包括违规销售时间、地点、金额。
3.根据权利要求1所述的烟草专卖精益化市场监管预防性案例智能生成系统,其特征在于:所述案例模板包括时间、地点、零售商、货物、违规内容、处罚措施。
4.根据权利要求1所述的烟草专卖精益化市场监管预防性案例智能生成系统,其特征在于:所述自然语言处理用于从文本中提取案例要素,使用词频-逆文档频率,衡量词语在文档中的重要性,表示为:
5.根据权利要求1所述的烟草专卖精益化市场监管预防性案例智能生成系统,其特征在于:所述文本校核使用编...
【专利技术属性】
技术研发人员:吴丽镐,陈孝均,陈依萍,陈雪松,沈博,马秋德,李骞,
申请(专利权)人:广州城市理工学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。