一种数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号：27191552 阅读：19 留言：0更新日期：2021-01-31 11:32

本公开实施例公开了一种数据处理方法、装置、设备及存储介质，所述方法包括：获取源数据，通过对所述源数据进行分词，从所述源数据中提取出多个知识点数据；对所述知识点数据进行关联分析，确定知识点数据之间的逻辑关系数据；基于知识点数据之间的逻辑关系数据，构建知识点数据库。本公开实施例所提供的方法实现了自动提取出学科的知识点数据并构建知识点数据之间的逻辑关系，进而简化了知识点数据库的构建过程。的构建过程。的构建过程。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法、装置、设备及存储介质

[0001]本公开实施例涉及信息
，尤其涉及一种数据处理方法、装置、设备及存储介质。

技术介绍

[0002]知识点是知识体系当中最基本的单元，以它为基础开展教学活动可以使教学活动的开展更加有效。但是，目前学科知识点的提取仍然由人工完成，费时费力效率低，进而，基于知识点的题库构建也相对繁琐。

技术实现思路

[0003]本公开提供一种数据处理方法、装置、设备及存储介质，以实现自动提取出学科的知识点数据并构建知识点数据之间的逻辑关系，进而简化知识点数据库的构建过程。
[0004]第一方面，本公开实施例提供了一种数据处理方法，包括：
[0005]获取源数据，通过对所述源数据进行分词，从所述源数据中提取出多个知识点数据；
[0006]对所述知识点数据进行关联分析，确定知识点数据之间的逻辑关系数据；
[0007]基于知识点数据之间的逻辑关系数据，构建知识点数据库。
[0008]第二方面，本公开实施例还提供了一种数据处理装置，包括：
[0009]知识点提取模块，用于获取源数据，通过对所述源数据进行分词，从所述源数据中提取出多个知识点数据；
[0010]知识点关系确定模块，用于对所述知识点数据进行关联分析，确定知识点数据之间的逻辑关系数据；
[0011]知识点数据库构建模块，用于基于知识点数据之间的逻辑关系数据构建知识点数据库。
[0012]第三方面，本公开实施例还提供了一种终端设备，所述终端设备包括...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：获取源数据，通过对所述源数据进行分词，从所述源数据中提取出多个知识点数据；对所述知识点数据进行关联分析，确定知识点数据之间的逻辑关系数据；基于知识点数据之间的逻辑关系数据，构建知识点数据库。2.根据权利要求1所述的方法，其特征在于，所述通过对所述源数据进行分词，从所述源数据中提取出多个知识点数据，包括：基于前缀字典分词方法，生成与所述源数据对应的有向无环图；通过动态规划算法确定所述有向无环图中的最大概率路径，获得基于词频的最大切分组合；基于所述最大切分组合确定所述源数据中的知识点数据。3.根据权利要求2所述的方法，其特征在于，还包括：通过隐马尔可夫模型确定所述源数据中的未登录词，并提取出所述未登录词中包含的知识点数据。4.根据权利要求1所述的方法，其特征在于，所述对所述知识点数据进行关联分析，确定知识点数据之间的逻辑关系数据，包括：采用关联规则挖掘算法确定所述知识点数据中任意两个知识点数据之间的关系，构建知识点数据关系图。5.根据权利要求4所述的方法，其特征在于，所述关联规则挖掘算法包括Apriori算法。6.根据权利要求1-5任一...

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人