基于智能语义理解的可视化建模方法技术

技术编号：35515094 阅读：48 留言：0更新日期：2022-11-09 14:31

本发明专利技术涉及基于智能语义理解的可视化建模方法，包括步骤：用户输入建模任务目标，进行分词处理，得到分词结果；用户输入源数据集，获取源数据集的特征；基于分词结果确定测试模型范围；从源数据集中选择m条测试数据对测试模型范围进行测试，得到模型测试结果；从预置算法模型中选择n个预置算法模型作为备选方案，并确定对应的n组算法模型超参；将n个预置算法模型及其对应的n组算法模型超参，和源数据集的特征进行神经网络学习；学习后根据模型评估指标对n个预置算法模型进行排序后并推荐。本发明专利技术提供以智能推荐的形式，针对用户给出的建模任务目标，推荐算法模型的形式，提供给用户可以直接解决其任务目标的多种模型方案。可以直接解决其任务目标的多种模型方案。可以直接解决其任务目标的多种模型方案。

全部详细技术资料下载

【技术实现步骤摘要】
基于智能语义理解的可视化建模方法

[0001]本专利技术涉及智能推荐、人工可视化建模
，特别涉及一种基于智能语义理解的可视化建模方法。

技术介绍

[0002]随着云时代的到来，大数据也吸引了越来越多的关注，大数据通常用来形容一个公司创造的大量非结构化和半结构化数据，这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。为了探求企业海量数据更深层次的价值，机器学习模型被应用于各个行业，各种智能系统。
[0003]目前，机器学习对用户仍有很高理论及编程技术门槛，越来越多的可视化建模平台都视图降低机器学习算法、模型使用的门槛。如拖拉拽式的可视化建模方法，虽然降低了用户的编程技术门槛，但是依然对用户有很强的理论要求，其原因在于：
①
可视化建模平台，以算法和模型功能的最小粒度，将算法、模型封装成一个个可以被直接使用的组件，无形之中要求用户必须掌握机器学习理论知识，了解数据的处理流程，包括对不同类型的数据需要进行不同的数据预处理、数据清洗；要求用户清楚特征处理工程知识，还要求用户明白各种神经网络的优劣势；
②
建立机器学习模型是服务于特定的应用场景，实现特定目标，组件式的可视化建模方法看似降低了用户的使用门槛，却因为在拖拉拽后，数据处理流、组件执行流的环环相扣，导致通过可视化建立的模型调试周期变长；
③
神经网络的种类及变体数量非常多，且神经网络的组合不同、网络参数不同，都会对最优模型的生成有直接影响，即使有可视化的建模方法，也需要大量实验，才能验证是否满足建...

【技术保护点】

【技术特征摘要】
1.基于智能语义理解的可视化建模方法，其特征在于：包括以下步骤：步骤S1，用户输入建模任务目标，对建模任务目标进行分词处理，得到分词结果；用户输入源数据集，并获取源数据集的特征；步骤S2，基于分词结果确定测试模型范围；从源数据集中选择m条测试数据对测试模型范围进行测试，得到模型测试结果，所述模型测试结果中包括N个预置算法模型；步骤S3，从N个预置算法模型中选择n个预置算法模型作为备选方案，并确定对应的n组算法模型超参，1<n≤N；步骤S4，将n个预置算法模型及其对应的n组算法模型超参，和源数据集的特征进行神经网络学习；学习后根据模型评估指标对n个预置算法模型进行排序后并推荐。2.根据权利要求1所述的基于智能语义理解的可视化建模方法，其特征在于：所述基于分词结果确定测试模型范围的步骤，包括：基于分词结果，对算法模型库中的模型标签进行相似度计算，从而确定测试模型范围；所述算法模型库包括模型ID、模型标签、模型名称、模型描述字段，所述模型标签包括分类、聚类、预测、回归。3.根据权利要求1所述的基于智能语义理解的可视化建模方法，其特征在于：所述从源数据集中选择m条测试数据对测试模型范围进行测试，得到模型测试结果的步骤，包括：基于源数据集的特征，从模型超参库中获取测试模型范围中各模型ID所对应的超参列表；从源数据集中选择m...

【专利技术属性】
技术研发人员：姚苗，詹永川，沈杰，谭亚军，李硕，赵磊，杨李伟，
申请(专利权)人：成都数联铭品科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人