多模态数据集成管理方法、装置及介质制造方法及图纸

技术编号：37678615 阅读：12 留言：0更新日期：2023-05-26 04:44

本发明专利技术提供一种多模态数据集成管理方法、装置及介质，该多模态数据集成管理方法包括：对接入的第一多模态数据执行临时存储；对第一多模态数据执行预处理，得到第二多模态数据；对第二多模态数据执行提取，得到包括有数据特征、数据来源及存储位置的元数据；采用对应的数据存储方式对元数据执行存储。使用可定制算法来实现文本、声音及视觉数据的统一集成，通过使用本体模型/元模型的方式统一提取文本、声音和视觉数据的元数据，并通过对象存储辅以结构化存储方式，来实现多模态的统一存储，借助元数据和对象存储技术，实现多模态数据的高可靠、高性能访问的统一管理，使得多模态数据分析效率和准确性大大提升。分析效率和准确性大大提升。分析效率和准确性大大提升。

全部详细技术资料下载

【技术实现步骤摘要】
多模态数据集成管理方法、装置及介质

[0001]本专利技术涉及计算机
，尤其涉及一种多模态数据集成管理方法、装置及介质。

技术介绍

[0002]在信息技术飞速发展的今天，多模态数据正在成为大数据的主要形式，因此通过对于多模态数据的接入、存储和管理方法，赋予计算机处理和管理多模态数据的能力具有重要价值。
[0003]当前的数据存储管理都是针对单模态数据的，随着多模态技术的发展，需要处理包含声音的图像、包含文字和图片等多种模态数据的消息，在传统的单模态处理方式，无法实现多模态数据的统一管理，从而在处理多模态数据时候难以保证效率。

技术实现思路

[0004]本专利技术实施例的主要目的在于提出一种多模态数据集成管理方法、装置及介质，提高了多模态数据的提取、存储及管理效率。
[0005]本专利技术的一方面提供了一种多模态数据集成管理方法，包括：响应于多模态数据管理请求，对接入的第一多模态数据执行临时存储，所述第一多模态数据用于表征数据源，所述数据源包括文本数据、声音数据及视觉数据中的至少一种；对所述第一多模态数据执行预处理，得到第二多模态数据，所述预处理包括数据清洗及冗余数据清除中的至少一种；对所述第二多模态数据执行提取，得到包括有数据特征、数据来源及存储位置的元数据；根据所述元数据的类型，采用对应的数据存储方式对所述元数据执行存储。
[0006]根据所述的多模态数据集成管理方法，其中对接入的第一多模态数据执行临时存储，包括：
[0007]通过ETL过程将所述数据源中的所述...

【技术保护点】

【技术特征摘要】
1.一种多模态数据集成管理方法，其特征在于，包括：响应于多模态数据管理请求，对接入的第一多模态数据执行临时存储，所述第一多模态数据用于表征数据源，所述数据源包括文本数据、声音数据及视觉数据中的至少一种；对所述第一多模态数据执行预处理，得到第二多模态数据，所述预处理包括数据清洗及冗余数据清除中的至少一种；对所述第二多模态数据执行提取，得到包括有数据特征、数据来源及存储位置的元数据；根据所述元数据的类型，采用对应的数据存储方式对所述元数据执行存储。2.根据权利要求1所述的多模态数据集成管理方法，其特征在于，所述对接入的第一多模态数据执行临时存储，包括：通过ETL过程将所述数据源中的所述文本数据、所述声音数据及所述视觉数据抽取到临时中间层，所述数据源为分布式数据源及异构数据源中的至少一种。3.根据权利要求1所述的多模态数据集成管理方法，其特征在于，所述对所述第一多模态数据执行预处理，得到第二多模态数据，包括：所述文本数据的所述预处理包括删除特殊符号、去除字符中多余的空格、删除连续出现的标点符号、删除不出现中文字符的数据行、删除长度较短的无用文本及对每一行文本进行切分中的至少一种，通过正则表达式及文本切分函数中的一种将经过所述预处理的所述文本数据逐行存储在文件中；所述声音数据的所述预处理采用k
‑
means聚类方法检测噪声数据，以及，采用端点检测算法进行去掉噪声数据；所述视觉数据的所述预处理包括基于OPENCV的拉普拉斯算子检测并执行去除已损坏的图片、去除模糊图片及去除相似图片中的至少一种处理。4.根据权利要求1所述的多模态数据集成管理方法，其特征在于，所述文本数据的提取包括获取所述文本数据的关键词频及长度中的至少一种；所述关键词频使用词频
‑
倒排文档频次算法进行停用词进行过滤，并进行文档关键词词频的统计；所述文本数据的长度是使用统计函数计算文本长度得到。5.根据权利要求1所述的多模态数据集成管理方法，其特征在于，所述声音数据的提取包括声音的语类识别、音量识别、过零率识别及音高识别中的至少一种处理；所述语类识别包括对所述声音数据进行端点处理，使用MFCC进行声音的特征提取，再将这些特征作为参数传入到分类器中进行声音特征的识别、分类及输出，得到语种识别结果；所述音量识别包括确定所述声音数据的每一个音帧的分贝值；所述过零率识别包括确定所述声音数据的每一个音帧声音信号的采样值通过零点的次数；所述音高识别通过pitch＝69+12*log2(F/440)进行确定，其中pitch为音高，F为基本频率。6.根据权利要求1所述的多模态数据集成管理方法，其特征在于，所述视觉数...

【专利技术属性】
技术研发人员：张建军，王文重，刘立峰，王麟东，刁海峰，母健康，
申请(专利权)人：珠海高凌信息科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人