听写系统语音到文本转换用户性能的测量方法和系统技术方案

技术编号:7136022 阅读:317 留言:0更新日期:2012-04-11 18:40
一种计算机实现的系统和方法,用于评估使用听写系统的用户的性能。该系统和方法包括接收由用户音频生成的文本或转录文件。基于该转录文件生成例如每分钟字数或错误数的性能量度。该性能量度被提供给管理员,使得该管理员能够评估使用该听写系统的用户的性能。

【技术实现步骤摘要】
【国外来华专利技术】
本申请的技术一般涉及听写系统的语音到文本转换,尤其涉及提供用于测量用户 性能(performance)的基线(base line)和量度(metric)的方法和系统。
技术介绍
许多公司为客户提供了使用呼叫中心联系本公司的能力,以便当场回复客户的呼 叫、纠正客户的问题,或为客户指派合理的资源来解决引起呼叫的问题。常规地,呼叫中心 通过将呼叫从客户指引到可用的代理或代表进行操作。除电话呼叫装置以外,代理或代表 通常还具有公司已授权或专门设计的便于帮助客户的客户关系管理屏。现在参考图1,示出了在呼叫中心100内的系统的概念性表示。呼叫中心100包括 语音技术设备和基于IP的技术设备,其中语音技术设备位于信令和音频路径中,并终止于 代理的电话(或头戴式耳麦),基于IP的技术设备支持CRM(也称为客户关系管理)应用程 序,CRM应用程序的图形用户界面(GUI)在代理的诸如个人计算机或类似装置这样的处理 器上运行。为支持这点,呼叫中心100包括自动呼叫分配(A⑶)102,其具有与代理的电话 106的音频连接104。A⑶102还具有与交互语音应答(IVR) 110的音频连接108。音频连接 104和108可重叠、完全分离或合并到一起。IVRllO具有与计算机电话界面(CTI)的数据 连接112。CTI114典型地为A⑶102提供呼叫控制116,和向代理的计算机120提供数据和 应用程序控制118。因此,当客户使用电话122或者类似的装置通过诸如所示的公共交换电 话网(PSTN)之类的常规网络IM呼叫该呼叫中心时,向代理提供用来帮助呼叫者所必要的 音频、数据和应用程序。尽管图1标识出如图所示的通过常规的PSTN进行的客户呼叫,但来自客户的呼叫 可从计算机或基于电缆的VoIP网络发起。例如当客户使用常规的陆上通信线或蜂窝电话 时,该网络IM可以是如图所示的常规PSTN网络。或者,网络IM可以是计算网络,例如 LAN、WAN、WLAN、ffffAN、WiFi、因特网、以太网或其它私有区域网络。当网络1 是计算网络 时,来自客户的呼叫可从例如计算机电话的能够实现IP语音技术(VoIP)的设备发起。注 意,可使用常规技术将VoIP电话转接到常规PSTN网络,此外例如,常规陆上通信线可被连 接到使用软电话(soft phone)或媒体网关的计算机网络。一旦与客户服务代表间的呼叫建立起来,并且CRM应用程序在代表的用户界面上 运行,客户服务代表将请求客户的输入。这种输入可包括诸如客户名、地址、问题性质以及 类似内容的信息。传统地,代表通过将信息键入各自的输入信息区来输入这种信息。在通 话结束时,经常是客户服务代表填写CRM应用程序中的通常熟知为注释或通话结束的注释 的信息区。这种信息区通常由代表来键入确认信息,例如对客户投诉或类似事件的处理。虽然CRM应用程序和信息生成是有用的工具,但许多客户服务代表并非是高效率 的打字员。而且,即使对于高效率打字员,已经被公认的是大多数人说话速度也大大快于他 们的打字速度。因此,近来使用例如Nuance通信公司的Dragon Naturally Speaking听写 系统进行听写,来代替将信息键入各种信息区已经成为一种趋势。然而,使用听写系统作为工具来向CRM应用程序中的信息区添加信息,到目前为 止是麻烦而不方便的。此外,很难提供量度,来衡量与基于打字的系统相对比基于听写的系 统的性能。因此依据这种背景,需要提供一种听写系统的语音到文本转换的用户性能的测 量方法和系统。
技术实现思路
一种测量使用转录机的用户性能的计算机实现的方法被提供。该方法包括接收转 录文件,该转录文件包含由被评估的用户生成的音频文件的转录文本。该系统基于转录文 件确定例如每分钟字数、每分钟错误数、每字错误、每分钟有效字数,或类似量度的至少一个 性能量度。该性能量度可指示用户性能。该性能量度被发送给能够评估用户性能的管理员。依照在此描述的一般原理,任意上述实施例的特征可彼此相结合地来使用。在结 合附图和权利要求书阅读了下面的详细描述后,能更完整地理解这些以及其它的实施例、 特征和优点。在某些配置中,该方法和系统可被提供以相当的(comparative)性能量度。例如, 可提供或生成相当的打字性能量度,以便与更多常规领域的打字系统相对比地来评估使用 听写和转录系统的用户的性能。还提供了被配置成获得关于听写系统的使用的性能信息的计算机系统。该系统包 括处理器和与该处理器电子通信的存储器。该处理器被配置为接收由用户的音频文件生成 的转录文件,并基于该转录文件确定至少一个听写性能量度,该至少一个听写性能量度指 示了用户性能。该处理器被配置成将该至少一个听写性能量度发送给管理员,由此该管理 员可评估用户的性能。还提供了用于评估使用听写系统的用户的性能的计算机程序产品,该计算机程序 产品包括其上具有指令的计算机可读媒介。该计算机编程产品由介质携带,并可加载到处 理器。介质上的代码被编程为接收用户的由转录机从该用户的音频文件产生的转录文件。 而且,介质上的代码被编程为从转录文件确定至少一个听写性能量度,该至少一个听写性 能量度指示用户性能。介质上的代码被编程为将被确定的至少一个听写性能量度发送给管 理员。由此该管理员可评估用户的性能。附图说明图1是呼叫中心系统的功能框5图2是与本申请的技术的示范性实施例一致的评估系统的功能性框图;图3是与本申请的技术实施例相关联的示范性方法的示范性操作流程图;图4是与本申请的技术的示范性实施例相关联的评估屏幕的示范性显示;图5是与本申请的技术的示范性实施例相关联的评估屏幕的示范性显示;图6是与本申请的技术的评估相关联的表格;图7是与本申请的技术的实施例相关联的选项的示范性表格;图8是与本申请的技术相关联的示范性数据表格。具体实施例方式将参考客户呼叫中心应用程序来解释本申请的技术。该技术大体上被描述为将音 频从用户引导向将音频转换为文本并返回转录(transcription)文本的远程服务器。本 领域的普通技术人员在阅读了本公开内容后将能够认识到本申请的技术在其它环境中也 是有用的。例如,代替由远程服务器提供转录,转录可被直接加载到用户处理器。此外,本 申请的技术可用在不同于呼叫中心的环境中,以提供与听写系统有关的基线和公制计量 (metric measurement) 0而且,本申请的技术将参考示范性实施例来描述。在此使用措辞 “示范性”来表示“用作示例、举例或说明”。此处描述为“示范性”的任意实施例不必被理解 为优选或优于其它实施例。此外,除非明确指出,否则此处描述的所有实施例都应被认为是 示范性的。如上面所解释的,基于听写的语音到文本转换软件已经存在了一段时间。该听写 可在本地处理器执行,以便为用户提供实时的或接近实时的口述转录(transcription)。或 者,可将口述批量加载到中央处理器或服务器,而在稍后返回转录文本。听写系统可采用自 由形式、语法语音识别机或模式匹配语音识别。在其它实施例中,语音到文本的转换可在实 时或接近实时地工作的分布式听写系统中提供。一种这样的分布式听写系统在提交于2008 年 12 月 19 日,标题为“distributed dictation/tr本文档来自技高网
...

【技术保护点】
一种计算机实现的方法,用于测量使用转录机的用户性能,其包括:  接收由转录机从用户的音频文件生成的所述用户的转录文件;  从所述转录文件确定至少一个听写性能量度,所述至少一个听写性能量度指示所述用户的性能;并且  将确定出的至少一个听写性能量度发送给管理员,由此该管理员能够评估所述用户的性能。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:布赖恩·马奎特
申请(专利权)人:NVOQ股份有限公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1