System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于人工智能的数据采集分析方法及系统技术方案_技高网

基于人工智能的数据采集分析方法及系统技术方案

技术编号:41871504 阅读:6 留言:0更新日期:2024-07-02 00:22
本公开提供一种基于人工智能的数据采集分析方法及系统,通过获取企业业务数据样本库,确定包括业务数据样本Sample1和业务数据样本Sample2的业务数据集合,依据基础数据采集分析网络的特征向量提取组件,能获得业务数据样本Sample1的业务状态特征向量Vector1和业务数据样本Sample2的业务状态特征向量Vector2,基于相似性评估要求和两个业务状态特征向量间的向量空间度量系数生成特征代价值,对基础数据采集分析网络进行网络参数调试,帮助网络对近似业务状态的业务数据样本进行较好地鉴别,得到的业务状态特征向量的表征效果高,帮助引导续业务状态分类组件对业务状态的分类,从而提高调试获得的目标数据采集分析网络的分类准确性,尤其提高对可能误识别的业务状态的识别精度。

【技术实现步骤摘要】

本公开涉及数据处理领域,并且更具体地,涉及一种基于人工智能的数据采集分析方法及系统


技术介绍

1、随着企业数据量的不断增长,如何有效地采集、整合和分析这些数据成为了企业数据管理的重要环节。商业智能(bi)技术的出现,为企业数据管理提供了新的手段。然而,传统的数据采集和分析方法在处理大量、多样化的企业数据时,往往存在准确性不高、效率低下等问题。

2、在传统的数据采集与分析流程中,数据源的选择、数据整合、可视化设计和开发等环节都需要人工参与,这不仅增加了人力成本,而且容易因为人为因素导致数据误差。尤其是在数据分析环节,传统的分析方法往往无法深入挖掘数据中的潜在价值,也无法对复杂业务状态进行精准识别。为了提高数据采集与分析的准确性和效率,许多研究者开始探索基于人工智能的数据采集与分析方法。然而,目前的人工智能技术在处理企业数据时,仍然面临着一些挑战。例如,在面对业务状态复杂且多变的企业数据时,现有的人工智能模型往往难以准确识别各种业务状态,尤其是那些近似的、易于混淆的业务状态。

3、因此,如何提高数据采集与分析的准确性和效率,是当前企业数据管理领域亟待解决的问题。


技术实现思路

1、有鉴于此,本公开实施例至少提供一种基于人工智能的数据采集分析方法及系统。

2、根据本公开实施例的一个方面,提供了一种基于人工智能的数据采集分析方法,应用于计算机系统,所述方法包括:

3、获取企业业务数据样本库,所述企业业务数据样本库中的业务数据样本具有对应的业务状态;

4、在所述企业业务数据样本库中确定业务数据集合,所述业务数据集合包括业务数据样本sample1和业务数据样本sample2,所述业务数据样本sample1对应业务状态state1,所述业务数据样本sample2对应业务状态state2,所述业务状态state1和所述业务状态state2为近似业务状态;

5、基于所述业务数据集合确定基础数据采集分析网络的网络输入,依据所述基础数据采集分析网络中的特征向量提取组件,获得所述业务数据样本sample1的业务状态特征向量vector1和所述业务数据样本sample2的业务状态特征向量vector2;

6、基于相似性评估要求,以及所述业务状态特征向量vector1和所述业务状态特征向量vector2的向量空间度量系数,构建与所述业务数据样本sample1相关的特征代价值;

7、基于所述特征代价值,沿着令所述向量空间度量系数符合所述相似性评估要求的方向,对所述基础数据采集分析网络进行网络参数调试获得目标数据采集分析网络,所述目标数据采集分析网络中包括所述特征向量提取组件和业务状态分类组件,所述业务状态分类组件用于基于所述特征向量提取组件获得的拟采集分析业务数据的业务状态特征向量,确定所述拟采集分析业务数据的推理业务状态。

8、根据本公开实施例的一个示例,其中,所述业务数据集合还包括业务数据样本sample3,所述业务数据样本sample3对应业务状态state3,所述业务状态state1和所述业务状态state3为同类业务状态中的不同业务状态程度,所述业务数据样本sample3依据所述特征向量提取组件获得的为业务状态特征向量vector3;

9、所述基于相似性评估要求,以及所述业务状态特征向量vector1和所述业务状态特征向量vector2的向量空间度量系数,构建与所述业务数据样本sample1相关的特征代价值,包括:

10、基于所述相似性评估要求、所述业务状态特征向量vector1和所述业务状态特征向量vector2的向量空间度量系数,以及所述业务状态特征向量vector1和所述业务状态特征向量vector3的向量空间度量系数,构建与所述业务数据样本sample1相关的特征代价值;

11、其中,所述相似性评估要求包括所述业务状态特征向量vector1和所述业务状态特征向量vector2的向量空间度量系数,与所述业务状态特征向量vector1和所述业务状态特征向量vector3的向量空间度量系数间的差值大于相似性差值临界值。

12、根据本公开实施例的一个示例,其中,所述业务数据集合还包括业务数据样本sample4和业务数据样本sample5,所述业务数据样本sample4对应业务状态state4,所述业务状态state1和所述业务状态state4为同类业务状态,所述业务数据样本sample4依据所述特征向量提取组件获得的为业务状态特征向量vector4,业务数据样本sample5对应业务状态state5,所述业务状态state1和所述业务状态state5为对立的业务状态,所述业务数据样本sample5依据所述特征向量提取组件获得的为业务状态特征向量vector5;

13、所述方法还包括:

14、将所述业务数据集合中的5个业务数据样本划分为多个样本子集,所述样本子集中包括业务数据样本sample1、第一业务数据样本和第二业务数据样本,其中,所述业务数据样本sample1和所述第一业务数据样本的业务状态差值小于所述业务数据样本sample1和所述第二业务数据样本的业务状态差值,所述第一业务数据样本和所述第二业务数据样本为所述业务数据集合中除了所述业务数据样本sample1外的业务数据样本,同时所述业务数据样本sample2和业务数据样本sample3在多个所述样本子集中出现的次数不少于1次;

15、对于任一所述样本子集,所述基于所述相似性评估要求、所述业务状态特征向量vector1和所述业务状态特征向量vector2的向量空间度量系数,以及所述业务状态特征向量vector1和所述业务状态特征向量vector3的向量空间度量系数,构建与所述业务数据样本sample1相关的特征代价值,包括:

16、基于所述相似性评估要求、所述业务状态特征向量vector1和所述第一业务数据样本的业务状态特征向量的第一向量空间度量系数,以及所述业务状态特征向量vector1和所述第二业务数据样本的业务状态特征向量的第二向量空间度量系数,构建所述特征代价值中的分支代价值;其中,所述相似性评估要求包括所述第一向量空间度量系数和第二向量空间度量系数之间的差值大于所述相似性差值临界值。

17、根据本公开实施例的一个示例,其中,多个所述样本子集为三个所述样本子集,分别为第一样本子集、第二样本子集和第三样本子集,所述第一样本子集包括业务数据样本sample1、业务数据样本sample4和业务数据样本sample3,所述第二样本子集包括业务数据样本sample1、业务数据样本sample4和业务数据样本sample2,所述第三样本子集包括业务数据样本sample1、业务数据样本sample3和业务数据样本sample5。

18、根据本公开实施例的一个示例,其中,所述相似性差值临界值包括第一相似性差值临界值、第二相似性差值临界值和第三相似性差值临界本文档来自技高网...

【技术保护点】

1.一种基于人工智能的数据采集分析方法,其特征在于,应用于计算机系统,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述业务数据集合还包括业务数据样本Sample3,所述业务数据样本Sample3对应业务状态State3,所述业务状态State1和所述业务状态State3为同类业务状态中的不同业务状态程度,所述业务数据样本Sample3依据所述特征向量提取组件获得的为业务状态特征向量Vector3;

3.根据权利要求2所述的方法,其特征在于,所述业务数据集合还包括业务数据样本Sample4和业务数据样本Sample5,所述业务数据样本Sample4对应业务状态State4,所述业务状态State1和所述业务状态State4为同类业务状态,所述业务数据样本Sample4依据所述特征向量提取组件获得的为业务状态特征向量Vector4,业务数据样本Sample5对应业务状态State5,所述业务状态State1和所述业务状态State5为对立的业务状态,所述业务数据样本Sample5依据所述特征向量提取组件获得的为业务状态特征向量Vector5;p>

4.根据权利要求3所述的方法,其特征在于,多个所述样本子集为三个所述样本子集,分别为第一样本子集、第二样本子集和第三样本子集,所述第一样本子集包括业务数据样本Sample1、业务数据样本Sample4和业务数据样本Sample3,所述第二样本子集包括业务数据样本Sample1、业务数据样本Sample4和业务数据样本Sample2,所述第三样本子集包括业务数据样本Sample1、业务数据样本Sample3和业务数据样本Sample5。

5.根据权利要求4所述的方法,其特征在于,所述相似性差值临界值包括第一相似性差值临界值、第二相似性差值临界值和第三相似性差值临界值,其中,第一相似性差值临界值小于第二相似性差值临界值,第二相似性差值临界值小于第三相似性差值临界值;

6.根据权利要求1~5任一项所述的方法,其特征在于,所述业务数据样本包括状态先验标记,所述状态先验标记用以表示所对应业务数据样本的业务状态,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,所述目标数据采集分析网络是所述基础数据采集分析网络依据t次网络参数调试获得的,所述基于所述特征代价值,沿着令所述向量空间度量系数符合所述相似性评估要求的方向,并基于所述分类代价值,对所述基础数据采集分析网络进行网络参数调试获得目标数据采集分析网络,包括:

8.根据权利要求6所述的方法,其特征在于,当所述业务数据集合还包括所述业务数据样本Sample3时,所述业务数据样本Sample1的第一状态先验标记和所述业务数据样本Sample3的第三状态先验标记为不同的状态先验标记;或者,所述第一状态先验标记和所述第三状态先验标记为相同状态先验标记、且用以表示业务状态程度的标记数值不同。

9.根据权利要求1~5任一项所述的方法,其特征在于,所述方法还包括:

10.一种计算机系统,其特征在于,包括:

...

【技术特征摘要】

1.一种基于人工智能的数据采集分析方法,其特征在于,应用于计算机系统,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述业务数据集合还包括业务数据样本sample3,所述业务数据样本sample3对应业务状态state3,所述业务状态state1和所述业务状态state3为同类业务状态中的不同业务状态程度,所述业务数据样本sample3依据所述特征向量提取组件获得的为业务状态特征向量vector3;

3.根据权利要求2所述的方法,其特征在于,所述业务数据集合还包括业务数据样本sample4和业务数据样本sample5,所述业务数据样本sample4对应业务状态state4,所述业务状态state1和所述业务状态state4为同类业务状态,所述业务数据样本sample4依据所述特征向量提取组件获得的为业务状态特征向量vector4,业务数据样本sample5对应业务状态state5,所述业务状态state1和所述业务状态state5为对立的业务状态,所述业务数据样本sample5依据所述特征向量提取组件获得的为业务状态特征向量vector5;

4.根据权利要求3所述的方法,其特征在于,多个所述样本子集为三个所述样本子集,分别为第一样本子集、第二样本子集和第三样本子集,所述第一样本子集包括业务数据样本sample1、业务数据样本sample4和业务数据样本sample3,所述第二样本子集包括业务数据样本sample1、业务数据样本sample4和业务数据样本...

【专利技术属性】
技术研发人员:张晓如黄雪松邬德荣刘勇杨霖
申请(专利权)人:成都万维图新信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1