信息排序方法技术

技术编号:10021982 阅读:156 留言:0更新日期:2014-05-09 03:34
本发明专利技术提出两种信息排序方法,其中一种方法包括:确定信息的匹配词;针对需要排序的每条信息,统计信息中匹配词出现的次数,采用下式计算该信息的权值;其中,lengthNorm为信息的权值;numTerms为匹配词出现的次数;TERM_VERTEX_NUM为预先设置的极值点,L1、L2、L3、L4和L5均为常数;根据各条信息的权值对信息进行排序。本发明专利技术能够快速客观地实现信息排序。

【技术实现步骤摘要】
信息排序方法
本专利技术涉及计算机互联网
,尤其涉及信息排序方法。
技术介绍
互联网用户在搜索网络论坛中的信息时,对于符合搜索条件的多个信息,通常优先读取排序在前的信息。现有的论坛信息排序方式一般有两种:第一种,按照信息产生的先后顺序进行排序,即产生时间越晚的信息排序越靠前,这种方式无法体现信息的重要性。第二种,通过人工的方式筛选出认为流行性和热度高的信息,但是一旦选定后信息的排序就固定下来,直到下次人工筛选之后再进行更改,这样用户在一段时间内重复获取信息时将会获得重复的信息,并请如果信息数量非常大,人工筛选的工作量将会很大。可见,现有的网络论坛信息的排序方法无法快速客观地实现信息排序。
技术实现思路
本专利技术提供了两种信息排序方法,能够快速客观地实现信息排序。本专利技术的技术方案是这样实现的:一种信息排序方法,包括:确定信息的匹配词;针对需要排序的每条信息,统计信息中匹配词出现的次数,采用下式计算该信息的权值;其中,lengthNorm为信息的权值;numTerms为匹配词出现的次数;TERM_VERTEX_NUM为预先设置的极值点;L1为大于0小于10的常数,L2为大于0小于1的常数,L3为大于1小于10的常数,L4为大于0小于100的常数,L5为大于0小于1的常数;根据各条信息的权值对信息进行排序。上述方法中,所述信息可以为交易评论信息,上述方法可以进一步包括:获取包含用户要求查看时段的信息;显示所述用户要求查看时段的交易行情图,查找所述用户要求查看时段的交易评论信息,获取所述交易评论信息的权值,将所述交易评论信息映射到所述交易行情图中,并在交易行情图中显示所述交易评论信息的权值。一种信息排序方法,包括:针对需要排序的每条信息,采用下式计算该信息的热度权值;其中,xRank为信息的热度权值;_INNER_SCORE为Lucene相似度评分,Lucene相似度评分是以向量空间模型算法来计算的评分;A为用户投票数,其中,A=R×X1+C×X2+F×X3,R为该信息被用户转推的次数,C为该信息被用户评论的次数,F为该信息被用户收藏的次数,X1、X2和X3均为大于0小于10的常数;Pt为该信息发表时刻距离标准时刻的时间长度;S1为大于1小于86400×n的常数,n为自然数;根据各条信息的热度权值对信息进行排序。上述方法中,所述信息可以为交易评论信息,上述方法可以进一步包括:获取包含用户要求查看时段的信息;显示所述用户要求查看时段的交易行情图,查找所述用户要求查看时段的交易评论信息,获取所述交易评论信息的热度权值,将所述交易评论信息映射到所述交易行情图中,并在交易行情图中显示所述交易评论信息的热度权值。可见,本专利技术提出的两种信息排序方法,通过预先设置的权值计算方法计算信息的权值,可以实现快速客观地对信息进行排序。附图说明图1为本专利技术提出的第一种信息排序方法流程图;图2为本专利技术提出的第二种信息排序方法流程图。具体实施方式本专利技术提出两种信息排序方法,能够对网络论坛信息进行排序;对于交易评论信息,还可以将信息映射到交易行情图中。如图1为本专利技术提出的第一种信息排序方法流程图,包括:步骤101:确定信息的匹配词。步骤102:针对需要排序的每条信息,统计信息中匹配词出现的次数,采用下式计算该信息的权值;其中,lengthNorm为信息的权值;numTerms为匹配词出现的次数;TERM_VERTEX_NUM为预先设置的极值点,表示这个长度的信息的评分权值最高,同时匹配词出现的次数越多权值越高;L1、L2、L3、L4和L5均为常数,是为了使倒抛物线函数所表示的图形更为平滑或者更为陡峭,来确定所计算的内容之间得分的差距的大小。L1、L2、L3、L4和L5的范围分别为:L1(0-10),L2(0-1),L3(1-10),L4(0-100),L5(0-1)。可见,上述权值算法是一个倒抛物线型函数。步骤103:根据各条信息的权值对信息进行排序。以上信息可以是交易(如股票交易)评论信息,本专利技术可以将交易评论信息映射到交易行情图上进行显示,同时显示该交易评论信息的权值。具体方式为:获取包含用户要求查看时段的信息;显示所述用户要求查看时段的交易行情图,查找所述用户要求查看时段的交易评论信息,获取所述交易评论信息的权值,将所述交易评论信息映射到所述交易行情图中,并在交易行情图中显示所述交易评论信息的权值。需要说明的是,一般的交易行情图只显示交易时段的数据,在本专利技术中,由于需要显示用户的交易评论信息,而用户产生的交易评论信息不止在交易时段才有,故本专利技术加入了非交易时段的显示。从显示上,交易时段的行情图用实线表示,非交易时段的行情图用虚线表示,以使二者明确区分;从实现上,将一天分为三个时段:开市前、开市中、闭市后,可以将这三个时段采用1:1:1的比例在图形上进行显示,以减少非交易时段图形对交易时段过多的影响。如图2为本专利技术提出的第二种信息排序方法流程图,包括:步骤201:针对需要排序的每条信息,采用下式计算该信息的热度权值;其中,xRank为信息的热度权值;_INNER_SCORE为Lucene相似度评分,Lucene相似度评分是以向量空间模型算法来计算的评分;A为用户投票数,其中,A=R×X1+C×X2+F×X3,R为该信息被用户转推的次数,C为该信息被用户评论的次数,F为该信息被用户收藏的次数,X1、X2和X3均为大于0小于10的常数;Pt为该信息发表时刻距离标准时刻的时间长度;具体可以为:Pt=PublishTime-St,其中,PublishTime为信息发表时刻,St=T1,T1为第一条信息发表的时刻;S1为大于1小于86400×n的常数,n为自然数;是用于确定信息随时间衰减的程度,S1越小衰减的越快,S1越大衰减的越慢。86400为一天的秒数,也就是说这个值可以是任意秒/分钟/小时/天。上式中,用户投票的函数log(A),用户投票越多,该信息得分越多,但增速逐渐减缓;时间函数新发表的信息得分高于以往的信息,分母S1为以秒为单位的常数。步骤202:根据各条信息的热度权值对信息进行排序。以上信息可以是交易(如股票交易)评论信息,本专利技术可以将交易评论信息映射到交易行情图上进行显示,同时显示该交易评论信息的热度权值。具体方式与方法一中的显示方式相同。综上可见,本专利技术提出的信息排序方法,能够通过预先设定的算法对自动计算信息的权重,从而快速客观地实现信息排序,避免了人工筛选处理信息数量非常多时无法及时准确处理的问题。进一步地,从展示信息的角度,本专利技术可以将筛选出的信息与交易行情图中的相应时间点进行匹配并显示权重,这样可以直观地在行情涨跌过程中展示用户进行的集中的热门讨论,易于观察回溯历史上任何时段中用户随着行情波动进行的讨论。以上所述仅为本专利技术的较佳实施例而已,并不用以限制本专利技术,凡在本专利技术的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本专利技术保护的范围之内。本文档来自技高网...
信息排序方法

【技术保护点】

【技术特征摘要】
1.一种信息排序方法,其特征在于,所述方法包括:确定信息的匹配词;针对需要排序的每条信息,统计信息中匹配词出现的次数,采用下式计算该信息的权值;其中,lengthNorm为信息的权值;numTerms为匹配词出现的次数;TERM_VERTEX_NUM为预先设置的极值点;L1为大于0小于10的常数,L2为大于0小于1的常数,L3为大于1小于10的常数,L4为大于0小于100的常数,L5为大于0小于1的常数;根据各条信息的权值对信息进行排序。2.根据权利要求1所述的方法,其特征在于,所述信息为交易评论信息,所述方法进一步包括:获取包含用户要求查看时段的信息;显示所述用户要求查看时段的交易行情图,查找所述用户要求查看时段的交易评论信息,获取所述交易评论信息的权值,将所述交易评论信息映射到所述交易行情图中,并在交易行情图中显示所述交易评论信息的权值。3.一种信息排序方法,其特征在于,所述...

【专利技术属性】
技术研发人员:占晓炜王栋廖智海
申请(专利权)人:北京雪球信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1