一种数据挖掘方法技术

技术编号：33541067 阅读：48 留言：0更新日期：2022-05-21 09:49

本发明专利技术涉及数据处理技术领域，具体公开了一种数据挖掘方法，所述方法包括获取区域物流信息，根据所述区域物流信息确定区域购买力，根据所述区域购买力确定采集指标；随机获取预设数量的由区域人员上传的含有用户信息的文件数据；其中，所述预设数量由所述采集指标确定；对所述文件数据进行内容识别，根据所述内容识别结果生成目标数据；将所述目标数据输入训练好的数据分析模型，生成评价报告；其中，所述评价报告至少包括关键词。本发明专利技术通过物流数据定位用户，基于用户意愿进行文件数据获取，根据获取到的文件数据进行数掘挖掘，提高数据挖掘过程中用户的参与度，真实性较高。真实性较高。真实性较高。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据挖掘方法

[0001]本专利技术涉及数据处理
，具体是一种数据挖掘方法。

技术介绍

[0002]数据挖掘是人工智能和数据库领域研究的热点问题，所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程，它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等，高度自动化地分析企业的数据，做出归纳性的推理，从中挖掘出潜在的模式，帮助决策者调整市场策略，减少风险，做出正确的决策。
[0003]现有的数据挖掘技术一般是基于用户数据进行挖掘的，对于这种挖掘过程，实际上很依赖用户的数据，这就不可避免的会造成用户的反感，基于用户反感的反式挖掘到的数据，其真实性很难保证。

技术实现思路

[0004]本专利技术的目的在于提供一种数据挖掘方法，以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的，本专利技术提供如下技术方案：
[0006]一种数据挖掘方法，所述方法包括：
[0007]获取区域物流信息，根据所述区域物流信息确定区域购买力，根据所述区域购买力确定采集指标；
[0008]随机获取预设数量的由区域人员上传的含有用户信息的文件数据；其中，所述预设数量由所述采集指标确定；
[0009]对所述文件数据进行内容识别，根据所述内容识别结果生成目标数据；
[0010]将所述目标数据输入训练好的数据分析模型，生成评价报告；其中，所述评价报告至少包括关键词。
[0011]...

【技术保护点】

【技术特征摘要】
1.一种数据挖掘方法，其特征在于，所述方法包括：获取区域物流信息，根据所述区域物流信息确定区域购买力，根据所述区域购买力确定采集指标；随机获取预设数量的由区域人员上传的含有用户信息的文件数据；其中，所述预设数量由所述采集指标确定；对所述文件数据进行内容识别，根据所述内容识别结果生成目标数据；将所述目标数据输入训练好的数据分析模型，生成评价报告；其中，所述评价报告至少包括关键词。2.根据权利要求1所述的数据挖掘方法，其特征在于，所述获取区域物流信息，根据所述区域物流信息确定区域购买力，根据所述区域购买力确定采集指标的步骤包括：获取任一物流服务提供商的以该区域为目的地的物流数据，获取该物流服务提供商的市场份额；根据所述物流数据和所述市场份额计算区域物流数据；所述区域物流数据包括总价值、总重量和运输成本；根据所述区域物流数据确定区域购买力，根据所述区域购买力确定采集指标。3.根据权利要求1所述的数据挖掘方法，其特征在于，所述随机获取预设数量的由区域人员上传的含有用户信息的文件数据的步骤包括：根据统计好的反馈比例生成含有奖励的文件获取请求，随机向该区域中的区域人员发送；接收区域人员上传含有用户信息的文件数据，并计算文件数量，将所述文件数量与参考数量进行比对，确定修正数量；其中，所述修正数量包含符号；根据所述修正数量确定修正文件，根据所述修正文件修正所述文件数据；其中，所述奖励与文件类型相关，所述区域人员属于物流信息中接收方。4.根据权利要求3所述的数据挖掘方法，其特征在于，所述接收区域人员上传含有用户信息的文件数据，并计算文件数量，将所述文件数量与参考数量进行比对，确定修正数量的步骤包括：接收区域人员上传含有用户信息的文件数据，对所述文件数据进行格式识别，并根据所述文件数据的格式确定单位值；获取各类型文件数据的数量，根据所述数量和所述单位值计算文件数量；计算所述文件数量与预设的参考数量的差值，得到修正数量；其中，所述文件数据的类型包括文本数据、图像数据和音频数据。5.根据权利要求1所述的数据挖掘方法，其特征在于，所述对所述文件数据进行内容识别，根据所述内容识别结果生成目标数据的步骤包括：当所述文件数据为文本数据时，遍历文本文件中的文本信息，获取分隔符位置；基于所述分隔符位置将所述文本信息转换为字符串数组，并计算字符串总数；根据所述字符串总数对所述字符串数组进行内容识别，根据所述内容识别结果生成目标...

【专利技术属性】
技术研发人员：王肖嵬，刘晓雨，张新宇，祁志鹏，周桐，
申请(专利权)人：华能信息技术有限公司华能山东发电有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人