【技术实现步骤摘要】
金融非结构化文本分析系统及其方法
本专利技术乃涉及一种金融非结构化文本分析系统及其方法,特别涉及一种能够将非结构化信息转换为结构化指针的金融非结构化文本分析系统及其方法。
技术介绍
于目前的金融分析领域中,针对股票市场的分析大多是以结构化信息为依据,如:于等时间间隔内对成交量或者股价波动进行分析,这类的分析结果均可以用一个结构化指针(即,量化的数值)来表示。将结构化信息转换为结构化指针是目前对于股票市场进行分析的主要手法,即,将等时间间隔内成交量或者股价波动表示成多种0-9的不同定义的指标。然而,实际影响未来成交量或者股价波动的因素并不在于已发生的成交量或者股价波动,而是在于不断发生于各产业中的时事新闻。虽说如此,要利用发生于相关产业中的时事新闻来对股票市场进行分析是困难的,原因在于,发生于相关产业中的时事新闻属于非结构化信息,而要将属于非结构化信息的时事新闻转换为结构化指针并不容易。
技术实现思路
为了能够根据不断发生于各产业中的时事新闻,更有效地对未来的股票成交量或者股价波动进行分析,本专利技术提供了一种能够将非结构化信息转换为结构化指针的金融非结构化文本分析系统及其方法。于本专利技术所提供的金融非结构化文本分析系统包括用户接口、服务器、内存与处理器。用户接口设置以输入关键词与显示分析结果。服务器设置以运行至少一数据库。内存设置以储存一分析程序。处理器连接于用户接口、服务器与内存,并设置以执行所述分析程序以执行以下操作:根据关键词,通过服务器于数据库中搜寻默认时间区段内与关键词相关的多篇新闻;以及针对所述多个新闻,进行词性分析运算,以计算出预设时间区段内每 ...
【技术保护点】
1.一种金融非结构化文本分析系统,其特征在于,包括:一用户接口,设置以输入一关键词与显示一分析结果;一服务器,设置以运行至少一数据库;一内存,设置以储存一分析程序;以及一处理器,连接于所述用户接口、所述服务器与所述内存,设置以执行所述分析程序以执行以下操作:根据所述关键词,通过所述服务器于所述数据库中搜寻一默认时间区段内与所述关键词相关的多篇新闻;以及针对所述多个新闻,进行一词性分析运算,以计算出所述预设时间区段内每个时间点的一整体乐观指数与一整体激励指数作为所述分析结果;其中,所述整体乐观指数代表所述多个新闻的整体情绪程度,且所述整体激励指数代表所述多个新闻的整体期望程度。
【技术特征摘要】
2017.10.13 TW 1061351251.一种金融非结构化文本分析系统,其特征在于,包括:一用户接口,设置以输入一关键词与显示一分析结果;一服务器,设置以运行至少一数据库;一内存,设置以储存一分析程序;以及一处理器,连接于所述用户接口、所述服务器与所述内存,设置以执行所述分析程序以执行以下操作:根据所述关键词,通过所述服务器于所述数据库中搜寻一默认时间区段内与所述关键词相关的多篇新闻;以及针对所述多个新闻,进行一词性分析运算,以计算出所述预设时间区段内每个时间点的一整体乐观指数与一整体激励指数作为所述分析结果;其中,所述整体乐观指数代表所述多个新闻的整体情绪程度,且所述整体激励指数代表所述多个新闻的整体期望程度。2.如权利要求1所述的金融非结构化文本分析系统,其特征在于,所述整体乐观指数为介于1至9的一实数值,所述整体乐观指数越高,表示所述多个新闻的整体情绪越乐观,而所述整体乐观指数越低,表示所述多个新闻的整体情绪越悲观,且所述整体激励指数亦为介于1至9的一实数值,所述整体激励指数越高,表示所述多个新闻的整体期望越迫切,而所述整体激励指数越低,表示所述多个新闻的整体期望越平淡。3.如权利要求2所述的金融非结构化文本分析系统,其特征在于,当所述处理器针对所述多个新闻进行所述词性分析运算,以计算出所述整体乐观指数与所述整体激励指数时,所述处理器执行所述分析程序以进一步执行以下操作:针对每篇新闻,计算出一乐观指数与一激励指数;以及将所述多个新闻的所述多个乐观指数与所述多个激励指数分别平均,以计算出所述整体乐观指数与所述整体激励指数。4.如权利要求3所述的金融非结构化文本分析系统,其特征在于,所述处理器以执行所述分析程序以进一步执行以下操作:判断所述新闻的所述乐观指数是否大于等于一第一预设指数或是否小于一第二预设指数,以计算出所述预设时间区段内每个时间点的一正文数与一负文数以作为所述分析结果;若所述新闻的所述乐观指数是大于等于所述第一预设指数,则将所述正文数加一;以及若所述新闻的所述乐观指数是小于所述第二预设指数,则将所述负文数加一。5.如权利要求1所述的金融非结构化文本分析系统,其特征在于,所述关键词为一股票代码,当所述处理器通过所述服务器搜寻与所述关键词相关的所述多个新闻时,所述处理器通过所述服务器搜寻存在有对应所述股票代码的一公司名称的所述多个新闻。6.如权利要求1所述的金融非结构化文本分析系统,其特征在于,所述关键词为一公司名称,当所述处理器通过所述服务器搜寻与所述关键词相关的所述多个新闻时,所述处理器通过所述服务器搜寻存在所述公司名称的所述多个新闻。7.如权利要求5项或权利要求6所述的金融非结构化文本分析系统,其特征在于,所述处理器执行所述分析程序以进一步执行以下操作:针对所述多个新闻,计数所述公司名称出现的次数,并根据所述公司名称出现的次数计算出一曝光指数以作为所述分析结果。8.如权利要求1所述的金融非结构化文本分析系统,其特征在于,所述用户接口更设置以输入一特定时间区段,以使所述处理器根据所述关键词,通过所述服务器于所述数据库中搜寻所述特定时间区段内与所述关键词相关的所述多个新闻。9.如权利要求1所述的金融非结构化文本分析系统,其特征在于,当所述处理器根据所述关键词于所述数据库中搜寻所述默认时间区段内与所述关键词相关的所述多个新闻后,所述处理器执行所述分析程序以进一步执行以下操作:根据所述多个新闻,计算并产生一文字云以作为所述分析结果。10.如权利要求1所述的金融非结构化文本分析系统,其特征在于,当所述处理器根据所述关键词于所述数据库中搜寻所述默认时间区段内与所述关键词相关的所述多个新闻后,所述处理器执行所述分析程序以进一步执行以下操作:根据所述预设时间区段内一指定时间区段,通过所述服务器撷取于所述指定时间区段内与所述关键词相关的所述多个新闻...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。