通信业务使用量的校准方法和装置制造方法及图纸

技术编号:12618092 阅读:75 留言:0更新日期:2015-12-30 15:14
本发明专利技术提供了一种通信业务使用量的校准方法和装置。其中通信业务使用量的校准方法包括:获取来自于提供通信业务的运营商的文本信息;对文本信息使用第一条件随机场识别模型进行识别,以从文本信息中提取出至少一个被标注业务类型的短文本,其中第一条件随机场识别模型以通信业务的业务类型名称作为语料训练得出;对短文本分别使用与其业务类型对应的第二条件随机场识别模型进行识别,以得到标注为业务使用量的数值,其中第二条件随机场识别模型以业务类型的业务使用量的名称作为语料训练得出;以及按照被标注数据类型的数值对已保存的业务使用量数据进行校准计算。使用本发明专利技术的方案,提高了通信业务使用量的监测准确性。

【技术实现步骤摘要】

本专利技术涉及移动通信技术,特别是涉及一种通信业务使用量的校准方法和装置
技术介绍
移动通信已经成为日常生活工作中必不可少的业务,移动运营商会通过移动终端实际使用的业务进行收费,例如统计移动终端的通话、数据流量、增值服务等各种业务的实际使用量,定期收取费用。—般而言,通信业务的使用用户会对各种移动业务的使用量进行限制,特别是在使用按月计费的通信套餐的情况下,用户一般希望使用量不要超过套餐中规定的限额。因此用户希望准确及时地了解通信业务的使用量。移动服务的运营商提供通信业务的实时查询功能,可以通过短信、电话、客户端等多种方式进行查询,但是查询需要用户进行大量的操作,而且实时性较差,不能满足用户的要求。因此在现有技术中,出现了大量的在终端侧进行使用量监测的技术,以及时向用户报告。然而这些在终端侧进行使用量监测的方法,经常会出现与运营商侧的统计数据不一致的情况,因此现有的通信业务使用量的监控方法需要定期例使用运营商的统计数据进行校准。现有技术中经常使用的通信业务使用的校准方法的一种方式是截取运营商发送的通信业务使用量的报告短信或信息,利用预设的文本模板提取对应的数据,以用于数据校准。然而由于不同运营商的报告短信或信息的格式存在差别,而且经常进行更改,如果使用错误的文本模板进行数据提取,经常会出现提取错误的数据,导致使用量的校准异常,影响了用户的正常使用。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的通信业务使用量的校准方法和装置。本专利技术一个进一步的目的是要提高通信业务使用量校准的准确程度。依据本专利技术的一个方面,提供了一种通信业务使用量的校准方法。该通信业务使用量的校准方法包括:获取来自于提供通信业务的运营商的文本信息;对文本信息使用第一条件随机场识别模型进行识别,以从文本信息中提取出至少一个被标注业务类型的短文本,其中第一条件随机场识别模型以通信业务的业务类型名称作为语料训练得出;对短文本分别使用与其业务类型对应的第二条件随机场识别模型进行识别,以得到标注为业务使用量的数值,其中第二条件随机场识别模型以业务类型的业务使用量的名称作为语料训练得出;以及按照被标注数据类型的数值对已保存的业务使用量数据进行校准计算。可选地,获取来自于提供通信业务的运营商的文本信息的步骤包括:获取来自于用户界面上预设触发按钮被操作而生成的用于触发通信业务使用量校准的触发信号;按照触发信号向运营商发送通信业务使用量查询请求;以及接收运营商响应于查询请求的文本?目息O可选地,对文本信息使用第一条件随机场识别模型进行识别的步骤包括:将文本信息进行语义拆分处理,得到多个短句;以及对多个短句分别使用第一条件随机场识别模型进行识别,以对短句中描述业务使用情况的短文本进行业务类型标注。可选地,对短文本分别使用与其业务类型对应的第二条件随机场识别模型进行识别的步骤包括:提取短文本被标注的业务类型;查询得到业务类型对应的第二条件随机场识别模型;以及使用第二条件随机场对短文本中的数值进行数据类型标注。可选地,在得到标注为业务使用量的数值之后还包括:识别数值的单位是否为业务类型的设定单位;以及若否,将数值换算为设定单位。可选地,按照被标注数据类型的数值对已保存的业务使用量数据进行校准计算的步骤包括:按照数据类型查找本地保存的业务使用量数据;判断本地保存的业务使用量数据是否小于或等于被标注数据类型的数值;若是,使用被标注数据类型的数值更新本地保存的业务使用量数据;以及若否,将被标注数据类型的数值置为无效状态。可选地,在按照被标注数据类型的数值对已保存的业务使用量数据进行校准计算的步骤之后还包括:判断业务使用量数据是否已超过预设的使用量阈值;以及若是,发出业务使用提醒信息。可选地,通信业务的业务类型包括以下任意一项或多项:数据流量、电话、短信、彩信、以及定制服务。根据本专利技术的另一个方面,还提供了一种通信业务使用量的校准装置。该通信业务使用量的校准装置包括:信息获取模块,配置成获取来自于提供通信业务的运营商的文本信息;第一识别模块,配置成对文本信息使用第一条件随机场识别模型进行识别,以从文本信息中提取出至少一个被标注业务类型的短文本,其中第一条件随机场识别模型以通信业务的业务类型名称作为语料训练得出;第二识别模块,配置成对短文本分别使用与其业务类型对应的第二条件随机场识别模型进行识别,以得到标注为业务使用量的数值,其中第二条件随机场识别模型以业务类型的业务使用量的名称作为语料训练得出;以及数据更新模块,配置成按照被标注数据类型的数值对已保存的业务使用量数据进行校准计算。可选地,信息获取模块还配置成:获取来自于用户界面上预设触发按钮被操作而生成的用于触发通信业务使用量校准的触发信号;按照触发信号向响应于运营商发送通信业务使用量查询请求;以及接收运营商响应于查询请求的文本信息。可选地,第一识别模块还配置成:将文本信息进行语义拆分处理,得到多个短句;对多个短句分别使用第一条件随机场识别模型进行识别,以对短句中描述业务使用情况的短文本进行业务类型标注。可选地,第二识别模块配置成包括:提取短文本被标注的业务类型;查询得到业务类型对应的第二条件随机场识别模型;使用第二条件随机场对短文本中的数值进行数据类型标注。可选地,上述通信业务使用量的校准装置还包括:数值换算模块,配置成识别数值的单位是否为业务类型的设定单位;以及若否,将数值换算为设定单位。可选地,数据更新模块还配置成:按照数据类型查找本地保存的业务使用量数据;判断本地保存的业务使用量数据是否小于或等于被标注数据类型的数值;若是,使用被标注数据类型的数值更新本地保存的业务使用量数据;以及若否,将被标注数据类型的数值置为无效状态。可选地,上述通信业务使用量的校准装置还包括:提醒模块,配置成判断业务使用量数据是否已超过预设的使用量阈值;以及若是,发出业务使用提醒信息。可选地,通信业务的业务类型包括以下任意一项或多项:数据流量、电话、短信、彩信、以及定制服务。本专利技术的通信业务使用量的校准方法和校准装置,对提供通信业务的运营商的文本信息执行两次条件随机场识别(Condit1nal Random Fields,简称CRF),其中第一次识别使用的第一条件随机场识别模型以通信业务的业务类型名称作为语料训练得出,可以用于从文本信息中提取出至少一个被标注业务类型的短文本,确定出文本信息中包含的各种通信业务的业务类型;第二次识别使用的第二条件随机场识别模型以业务类型的业务使用量的名称作为语料训练得出,可以用于各种业务使用量的具体数值。该方法可以用于对运营商提供的各种业务使用量短信进行处理,并不局限于特定格式的文本,提高了通信业务使用量的监测准确性。进一步地,本专利技术的通信业务使用量的校准方法和校准装置,可以使用CRF识别出的数据对本地的监测数据进行更新,便于对用户提示,满足了用户使用通信业务的要求。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的【具体实施方式】。根据下文结合附图对本专利技术具体实施例的详细描述,本领域技术人员将会更加明了本专利技术的上本文档来自技高网...

【技术保护点】
一种通信业务使用量的校准方法,包括:获取来自于提供所述通信业务的运营商的文本信息;对所述文本信息使用第一条件随机场识别模型进行识别,以从所述文本信息中提取出至少一个被标注业务类型的短文本,其中所述第一条件随机场识别模型以所述通信业务的业务类型名称作为语料训练得出;对所述短文本分别使用与其业务类型对应的第二条件随机场识别模型进行识别,以得到标注为业务使用量的数值,其中所述第二条件随机场识别模型以所述业务类型的业务使用量的名称作为语料训练得出;以及按照被标注数据类型的数值对已保存的业务使用量数据进行校准计算。

【技术特征摘要】

【专利技术属性】
技术研发人员:马璇师争明秦吉胜常富洋
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1