本发明专利技术提供一种响应于新闻文章与股票价格变动的相关性来提供预测性模型的方法、系统和软件。本发明专利技术分析事件的导数或比率,以便通过响应性方式驱动预测。本发明专利技术考虑过去的较小窗口内的新闻元数据相对于过去的新闻项目的更大窗口导数或比率。本发明专利技术可以利用情绪引擎并且应用情绪的导数来预测证券价格的波动性和/或趋势方向。本发明专利技术可以审视内容、情境和情绪导数以便根据预定分类法对新闻报道进行加权,以把近期性、关键性、重复性、可信度等等作为因数计入来预测股票价格行为。此外,本发明专利技术可以被用来预告给定股票价格变动的事件以及新闻,从而预测即将发生的报道或显著发布。
【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】本专利技术提供一种响应于新闻文章与股票价格变动的相关性来提供预测性模型的方法、系统和软件。本专利技术分析事件的导数或比率,以便通过响应性方式驱动预测。本专利技术考虑过去的较小窗口内的新闻元数据相对于过去的新闻项目的更大窗口导数或比率。本专利技术可以利用情绪引擎并且应用情绪的导数来预测证券价格的波动性和/或趋势方向。本专利技术可以审视内容、情境和情绪导数以便根据预定分类法对新闻报道进行加权,以把近期性、关键性、重复性、可信度等等作为因数计入来预测股票价格行为。此外,本专利技术可以被用来预告给定股票价格变动的事件以及新闻,从而预测即将发生的报道或显著发布。【专利说明】基于新闻和情绪分析来预测市场行为的方法和系统
本专利技术一般地涉及金融服务,并且涉及从新闻文章和其他内容来源挖掘信息以辨 识情绪。本专利技术提供一种利用机器学习能力、新闻情绪专长以及智能分析法的动态工具,其 实现对由常规媒体和新媒体所感知到的公司的情绪和预测性企业估值行为的测量和/或 评分。
技术介绍
随着印刷机、排版、打字机、计算机实施的文字处理和大容量数据存储的出现,人 类所生成的信息数量急剧地并且以越来越快的速度增多。其结果是针对收集和存储、标识、 跟踪、分类和编目具有持续且增长的需求,以便获取及分发这一不断增大的信息/内容的 海洋。此外,随着例如因特网之类的高速网络的发展、普及以及对其的可访问性,存在对于 适当且高效地处理可以在这样的网络上获得的数量不断增多的内容以帮助做出决策的不 断增长的需求。具体来说,存在如下需求:快速地处理与当前事件有关的信息以便实现根据 当前事件或有关情绪的效应做出明达的决策,并且考虑到这样的事件和情绪对所交易的证 券或其他产品的价格可能具有的效应。 在例如包括金融服务业在内的许多领域和行业中,存在内容和增强体验提供商, 比如汤森路透公司、华尔街日报、道琼斯新闻社、彭博社、金融新闻、金融时报、新闻集团、 Zawya、纽约时报。这样的提供商标识、收集、分析并且处理关键数据,以用于生成供对应 行业内所涉及的专业人士和其他人士(例如理财顾问和投资者)消费的诸如报告和文章之 类的内容。在一种内容递送方式中,这些金融新闻服务提供实时的和归档的金融新闻馈送 (news feed),其包括发表了对投资者感兴趣的近来发生的事件的文章和其他报告。许多这 些文章和报告(并且当然还有底层事件)对于与公开交易的公司相关联的交易股票价格可 能具有相当大的影响。虽然这里常常是在公开交易的股票(在诸如纳斯达克和纽约股票交 易所之类的市场上交易的)方面进行讨论,但是本专利技术不限于股票并且包括对其他形式的 投资和投资工具的适用。各个领域和行业内的专业人士和提供商持续寻求增强为订户、客 户和其他顾客提供的内容、数据和服务的方式,并且寻求在竞争当中与众不同的方式。这样 的提供商致力于创建并且提供包括搜索和排序工具在内的增强工具,以便使客户能够更加 高效并且有效地处理信息以及做出明达的决策。 包括数据库挖掘和管理、搜索引擎、语言识别和建模在内的技术进步提供了用以 搜索和处理大量数据和文档(例如新闻文章、金融报告、博客、SEC和其他所要求的企业公 开、法律判决、法令、法律以及规章的数据库)的越来越精密的方法,这些大量数据和文档可 能会影响经营业绩并且因此影响与由这样的股权构成的股票、证券或基金有关的价格。投 资和其他金融专业人士和其他用户越来越依赖于数学模型和算法来做出专业和经营决定。 特别在投资领域内,提供对与企业业绩有关的(准确)新闻和其他信息的更快访问和处理的 系统对于专业人士来说将是高度有价值的工具,并且将导致更加明达、并且更加成功的决 策制定。 除了传统媒体来源和递送手段之外,近来"社交媒体"已变得越来越受欢迎和受关 注。社交媒体的能力添加了远远超出常规媒体形式的新的信息共享和收集层。由于不受传 统模型和工作流程的限制,博客和其他形式社交媒体已变成实时新闻和情况最新信息的非 常容易得到并且范围广泛的来源。在投资领域,例如寻找阿尔法(Seeking Alpha)之类的 新兴公司以及传统的金融新闻提供商正以指数速率进入博客圈和社交媒体。近来由ING实 施的调查表明,博客已经超过传统来源变成针对其Sharebuilder顾客的投资建议的首要 来源。"社交媒体"被定义为来源于群众的数据和内容。社交媒体的实例包括:新闻网站; (reuters. com、bloomberg. com 等等);在线论坛(livegreenforum. com);政府机关的网站 (epa. gov);学术机构、政党的网站(mcgill. ca/mse、www. democrats, org等等);在线杂志网 站(emagazine. com/);博客网站(Blogger、ExpressionEngine、LiveJournal、Open Diary、 TypePad、Vox、WordPress、Xanga 等等);微博网站(Twitter、FMyLife、Foursquare、Jaiku、 Plurk、Posterous、Tumblr、Qaiku、Google Buzz、Identi. ca Nasza-Klasa. pi 等等);社交 和专业人士网站(facebook、myspace、ASmallWorld、Bebo、Cyworld、Diaspora、Hi5、Hyves、 Linkedln、MySpace、Ning、Orkut、Plaxo、Tagged、XING、IRC、Yammer 等等);在线支持和筹 款网站(Greenpeace、Causes、Kickstarter);信息集合商(Netvibes、Twine 等等);以及 Twitter。 "新闻分析"或"新闻分析法"指的是包含并且涉及信息获取、机器学习、统计学习 理论、网络理论以及合作过滤的广阔领域。新闻分析法包括被用来汇集、概括、分类以及以 其他方式分析信息来源(其常常是公开的"新闻"信息)的技术、公式和统计学以及有关的工 具和量度的集合。对于新闻分析法示例性使用的是如下系统:该系统汇集(即阅读和分类) 金融信息以便确定与这样的信息有关的市场影响并且同时针对其他效应规范化数据。新闻 分析指的是测量和分析文本新闻报道的各种定性和定量属性,比如出现在正式的基于文本 的文章中以及出现在比如博客和其他在线媒介之类的较非正式的递送中的所述属性。更具 体来说,本专利技术涉及电子内容的情境中的分析。所述属性包括:情绪、相关性和新颖性。把 新闻报道表达或表示为"数字"或其他数据点使得系统能够将传统的信息表达法变换成更 容易分析的数学和统计表达。新闻分析技术和量度可以被使用在金融情境中,并且更加特 别的是使用在过去的和预测的投资业绩的情境中。 新闻分析法系统可以被用来测量和预测:波动性,如在Antweiler和Frank(2004) 中那样;新闻影响的反转,Antweiler和Frank (2005);新闻和留言板信息的关系,Das、 Martinez-Jerez和Tufano (2005);年报中与风险有关的文字对于预测负回报率的相关性, Li(2006);用于情绪提取,参见Das和C本文档来自技高网...
【技术保护点】
一种具有可执行代码集合的计算机可用介质,其包括:第一计算机程序代码集合,被适配成接收包括第一新闻报道的新闻内容;第二计算机程序代码集合,被适配成处理第一新闻报道以便标识关于第一家公司的信息;第三计算机程序代码集合,被适配成应用情绪分析并且当第一新闻报道涉及第一家公司时得到与第一新闻报道相关联的第一情绪分数;以及第四计算机程序代码集合,被适配成确定与第一家公司有关的导数情绪数值。
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:J西斯克,
申请(专利权)人:汤姆森路透社全球资源公司,
类型:发明
国别省市:瑞士;CH
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。