本发明专利技术实施例公开了一种音视频处理方法、装置、计算机设备及存储介质。本发明专利技术实施例涉及人工智能领域,所述方法包括:从音视频中提取至少一个类型的数据;根据各所述类型的数据,在所述音视频中确定至少一组划分节点,并确定所述音视频的目标节点;在所述音视频中标注各所述目标节点,并为各所述目标节点添加文本描述内容。本发明专利技术实施例可以提高音视频处理效率。效率。效率。
【技术实现步骤摘要】
音视频处理方法、装置、计算机设备及存储介质
[0001]本专利技术实施例涉及人工智能领域领域,尤其涉及一种音视频处理方法、装置、计算机设备及存储介质。
技术介绍
[0002]对音视频数据进行分析,可以实现对音视频中特定类型事件的识别,识别到的事件对后续处理流程具有着重要意义。
[0003]目前,人工对音视频进行浏览和记录划分的时间点,将音视频按照事件进行划分。
[0004]上述方式需要人工操作,导致效率低下。
技术实现思路
[0005]本专利技术实施例提供一种音视频处理方法、装置、计算机设备及存储介质,可以提高音视频处理效率。
[0006]第一方面,本专利技术实施例提供了一种音视频处理方法,包括:
[0007]从音视频中提取至少一个类型的数据;
[0008]根据各所述类型的数据,在所述音视频中确定至少一组划分节点,并确定所述音视频的目标节点;
[0009]在所述音视频中标注各所述目标节点,并为各所述目标节点添加文本描述内容。
[0010]第二方面,本专利技术实施例还提供了一种音视频处理装置,包括:
[0011]音视频降维模块,用于从音视频中提取至少一个类型的数据;
[0012]节点确定模块,用于根据各所述类型的数据,在所述音视频中确定至少一组划分节点,并确定所述音视频的目标节点;
[0013]音视频标注模块,用于在所述音视频中标注各所述目标节点,并为各所述目标节点添加文本描述内容。
[0014]第三方面,本专利技术实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序所述处理器执行所述程序时实现如本专利技术实施例中任一所述的音视频处理方法。
[0015]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例中任一所述的音视频处理方法。
[0016]本专利技术实施例通过从音视频中提取多个类型的数据,并分别确定对应划分节点,并融合至少一个类型对应的划分节点,确定目标节点,最终在音视频中标注目标节点,可以在音视频中划分特定事件,解决了现有技术中人工划分音视频效率低下的问题,可以提高音视频处理效率,提高音视频划分的准确率。
附图说明
[0017]图1是本专利技术实施例一中的一种音视频处理方法的流程图;
[0018]图2a是本专利技术实施例二中的一种音视频处理方法的流程图;
[0019]图2b是本专利技术实施例二中的一种音视频处理方法的流程图;
[0020]图3是本专利技术实施例三中的一种音视频处理装置的结构示意图;
[0021]图4是本专利技术实施例四中的一种计算机设备的结构示意图。
具体实施方式
[0022]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0023]实施例一
[0024]图1为本专利技术实施例一中的一种音视频处理方法的流程图的示意图,本实施例可适用于在区块链中存储标识音视频数据的标识信息的情况,该方法可以由本专利技术实施例提供的音视频处理装置来执行,该装置可采用软件和/或硬件的方式实现,并一般可集成计算机设备中。如图1所示,本实施例的方法具体包括:
[0025]S110,从音视频中提取至少一个类型的数据。
[0026]音视频是一种多媒体数据,可以提取多种类型的数据。示例性的,音视频可以提取出音频数据、文本数据和图像数据。可选的,音视频为多个事件的录制音视频,示例性的,所述音视频为金融授信审批会议音视频,所述金融授信审批会议视频包括多个项目的金融授信审批会议。每个项目的金融授信审批会议可以作为一个事件。将音视频添加节点,划分为多个事件,便于快速找到任意一个项目的金融审批会议,便于后续处理或取证等。
[0027]可选的,所述从音视频中提取至少一个类型的数据,包括下述至少一项:获取所述音视频中音频数据,并进行语音识别,得到文本数据,所述文本数据标注有时间信息;采用设定时间间隔,对所述音视频进行图像采集,得到多个图像。
[0028]其中,音视频可以是指音视频文件。可以直接从音视频文件中提取音频数据。音频数据标注有时间信息。对音频数据进行语音识别,得到对应的文本数据。其中,语音识别方法可以包括基于动态时间规整的算法、基于参数模型的隐马尔可夫模型的算法、基于非参数模型的矢量量化的算法和神经网络模型算法等。可以对应音频数据的时间信息,为文本数据标注时间信息。具体的,文本数据包括至少一个语句,可以为语句标注起始时间信息和/或结束时间信息。
[0029]按照设定时间间隔对音视频进行采样,得到至少一个图像。设定时间间隔用于在音视频中确定图像,设定时间间隔可以根据需要进行设定,例如,设定时间间隔为0.2秒。音视频配置有时间轴,图像在音视频的时间轴上对应的时间点,确定为图像的时间信息。
[0030]通过从音视频中提取音频,并进行语音识别,获取文本数据,从而确定音视频中的文本数据,并且从音视频中采样得到图像,从而确定音视频中的图像数据,增加处理过程中数据类型的多样性,从而增加音视频处理的准确率。
[0031]此外,还可以直接从音视频中提取音频,得到音频数据,并根据音频数据,确定至少一组划分节点。
[0032]S120,根据各所述类型的数据,在所述音视频中确定至少一组划分节点,并确定所述音视频的目标节点。
[0033]各类型的数据可以分别确定至少一组划分节点。实现针对多个维度信息,对音视频进行划分,可以提高音视频划分的准确率。同时根据各组划分节点,确定音视频的目标节点,实际是综合考虑多个划分结果,进行融合,得到音视频的最终划分的节点,可以准确提高音视频划分的准确率。
[0034]可选的,所述在所述音视频中确定至少一组划分节点,包括:获取文本数据;将所述文本数据输入到预先训练的句类别检测模型中,确定所述文本数据中各语句的类型,所述语句的类型包括起始句、结束句和中间句;根据各所述语句的类型,在所述文本数据中确定句节点;获取所述文本数据的时间信息,并确定各所述句节点对应的时间节点,并作为第一组划分节点。
[0035]从音视频中提取的至少一个类型的数据包括文本数据。文本数据中包括至少一个语句。句类别检测模型用于检测语句的类型,语句的类型用于描述语句与音视频包括的每个事件的关系,也即语句的类型可以是指语句位于任意一个事件的位置的类型。起始句表明该语句位于一个事件的起始位置,起始句代表一个事件的起点;结束句表明该语句位于一个事件的结束位置,结束句代表一个事件的终点。中间句表明该语句位于一个事件的除起始位置和结束位置之外的位置。
[0036]可以理解的是,起始句之前存在节点和结束句之后存在节点。句节点可以是指起始句之前的节点或结束句之后的节点。根据各语句的类型,在文本数据中确定句节点,可以本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种音视频处理方法,其特征在于,包括:从音视频中提取至少一个类型的数据;根据各所述类型的数据,在所述音视频中确定至少一组划分节点,并确定所述音视频的目标节点;在所述音视频中标注各所述目标节点,并为各所述目标节点添加文本描述内容。2.根据权利要求1所述的方法,其特征在于,所述从音视频中提取至少一个类型的数据,包括下述至少一项:获取所述音视频中音频数据,并进行语音识别,得到文本数据,所述文本数据标注有时间信息;采用设定时间间隔,对所述音视频进行图像采集,得到多个图像。3.根据权利要求1所述的方法,其特征在于,所述在所述音视频中确定至少一组划分节点,包括:获取文本数据;将所述文本数据输入到预先训练的句类别检测模型中,确定所述文本数据中各语句的类型,所述语句的类型包括起始句、结束句和中间句;根据各所述语句的类型,在所述文本数据中确定句节点;获取所述文本数据的时间信息,并确定各所述句节点对应的时间节点,并作为第一组划分节点。4.根据权利要求3所述的方法,其特征在于,在将所述文本数据输入到预先训练的句类别检测模型中之前,还包括:获取文本样本,所述文本样本标注有至少一个项目的起始句、结束句和中间句;采用所述文本样本对深度学习模型进行训练,得到句类别检测模型。5.根据权利要求3所述的方法,其特征在于,在所述文本数据中确定句节点之后,还包括:根据各所述句节点,将所述文本数据划分为文本片段;获取至少一个项目的元数据;分别计算各所述文本片段与各所述项目的元数据之间的相似值,并确定各所述文本片段匹配的项目。6.根据权利要求5所述的方法,其特征在于,所述元数据包括下述至少一项:支行名称、授信申请的公司名称、授信类型、授信金额、地名和审批人名称。7.根据权利要求3所述的方法,其特征在于,还包括:根据各所述句节点,将所述文本数据划分为文本片段;将各所述文本片段输入到预先训练的内容分类模型中,分别对所述文本片段进行划分,获取各所述文本片段对应的文本单元;在各所述文本片段中,根据所述文本片段包括的文本单元,确定段落节点;获取所述文本数据的时间信息,并确定各所述段落节点对应的时间节点,并作为第二组划分节点。8.根据权利要求1所述的方法,其特征在...
【专利技术属性】
技术研发人员:万聪,丁诗璟,沈文俊,高明,胡德清,余刚,赵琴,刘维安,袁园,欧阳明,李亮,李金灵,沈冰华,姚琛,谢传聪,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。