并发进行语音识别、说话者分段和分类的方法技术

技术编号：3047471 阅读：257 留言：0更新日期：2012-04-11 18:40

说明了一种方法和装置，用于从音频－视频源自动转换声音信息及并发地辨识说话者。所说明的声音转换和说话者分类系统包括一个语音识别系统、一个说话者分段系统和一个说话者辨识系统。一个公共前端处理器计算特征矢量，这些特征矢量由语音识别系统、说话者分段系统和说话者分类系统在一个多线程环境中沿平行分支进行处理，例如使用一个共享存储器结构，它以类似于服务器的方式工作，把计算出的特征矢量分配给与每个平行分支对应的通道。（*该技术在2020年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】本申请是序列号为09／288，724的美国专利申请(1999年4月9日提交，它被授予本专利技术的受让人并包括在这里作为参考)的部分继续。一般而言，本专利技术涉及声音信息分类系统，更具体而言，涉及转换声音信息和在声音文件中标识说话者的方法和装置。许多组织，如广播新闻组织和信息检索(retrieve)服务部分，为了存储和检索(retrieve)的目的，必须处理大量声音信息。常常是这些声音信息必须按主题或说话者名字或按二者进行分类。为了按主题对声音信息分类，语音识别系统首先把声音信息转换成文本供自动分类或编索引。然后，该索引能被用于完成询问报告匹配(query-document matching)以向使用者返回相关报告。这样，对声音信息的分类过程已基本上成为完全自动的。然而，按说话者对声音信息进行分类的过程往往留下需要大量人力的任务，特别是对于实时应用，如广播新闻。尽管已提出了若干需要大量计算的离线(off-line)技术。利用说话者登录信息根据声音源自动识别说话者，但说话者分类过程最经常的是由操作人员定成，他辨识每次说话者变化并提供相应的说话者辨识结果。本专利技术的父申请说明了基于声音内容(主题)检索(retrieve)声音信息以及辨识说话者的方法和装置。一个编索引系统对声音信息进行转换和编索引以创建有时间标记的内容索引文件和说话者索引文件。所产生的内容索引和说话者索引在其后能用于根据声音内容和说话者标识完成询问报告匹配。需要一种方法和装置，它能实时地从声音源自动转换声音信息并同时辨认说话者。还需要一种装置和方法，它提供改进的说话者分段和基于贝叶斯信息判据(BI...

【技术保护点】
从一个或多个声音源转换声音信息的方法，所述方法包含以下步骤：转换所述声音源以建立该声音源的文本版本；与所述转换步骤基本上并发地在所述声音源中辩识可能的段边界；以及对每个识别出的段赋予一个说话者标签。

【技术特征摘要】
【国外来华专利技术】US 1999-6-30 09/345,2371．从一个或多个声音源转换声音信息的方法，所述方法包含以下步骤转换所述声音源以建立该声音源的文本版本；与所述转换步骤基本上并发地在所述声音源中辩识可能的段边界；以及对每个识别出的段赋予一个说话者标签。2．权利要求1的方法，这里所述转换步骤产生所述声音源中每个词的有时间对位的转换副本。3．权利要求1的方法，这里所述辩识步骤辩识存在非同一语音部分之间的段边界的所有可能帧。4．权利要求1的方法，这里所述赋予步骤利用登录的说话者数据库将说话者标签赋予每个识别出的段。5．权利要求1的方法，这里所述赋予步骤还包含赋予一评分的步骤，所述评分指出对所述赋予的说话者标签的置信度。6．权利要求1的方法，这里所述赋予步骤还包含对所述赋予的说话者标签再赋予至少一个另一种选择的步骤。7．权利要求1的方法，这里所述转换、辩识和赋予步骤在一个多线程环境中的平行处理分支上进行。8．权利要求1的方法，这里所述辩识步骤使用BIC模型选择判据以辩识段边界。9．从一个或多个声音源转换声音信息的方法，所述方法包含以下步骤由所述声音信息计算特征矢量；以及把所述特征矢量应用于三个平行处理分支，以转换所述声音源以建立该声音源的文本版本；在所述声音源中辩识可能的段边界；以及对每个识别出的段赋予一个说话者标签。10．权利要求9的方法，这里将所述特征矢量应用于使用共享存储器结构的所述平行分支。11．权利要求10的方法，这里所述共享存储器结构把计算出的特征矢量分配给与所述平行处理分支中每一个相对应的一个通道。12．权利要求9的方法，这里所述转换步骤产生所述声音源中每个词的有时间对位的转换付本。13．权利要求9的方法，这里所述辩识步骤辩识存在非同一语音部分之间的段边界的所有可能帧。14．权利要求9的方法，这里所述赋予步骤利用登录的说话者数据库将说话者标签赋予每个识别出的段。15．权利要求9的方法，这里所述赋予步骤还包含赋予一评分的步骤，该评分指出对所述赋予的说话者标签的置信度。16．权利要求9的方法，这里所述赋予步骤还包含对所述赋予的说话者标签再赋予至少一个另一种选择的步骤。17．权利要求9的方法，这里所述辩识步骤使用BIC模型选...

【专利技术属性】
技术研发人员：赫马永萨德莫哈马德贝吉，阿兰查尔斯露易斯特里西勒，马赫西维斯瓦纳山，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人