System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及媒体传播领域,具体涉及一种基于数据中台的融合传播力评价指数方法及系统。
技术介绍
1、传统媒体转型新媒体之后,随着新媒体的影响力逐渐增大,新媒体的平台越来越多,各种账号日渐增多,对新媒体平台的传播力和影响力也有综合评价的需求。
2、当前的新媒体评价方式是分账号分平台并着重于传播量的评价,没有结合内容生产和内容质量的考评,没有统一团队账号管理,另一方面评价的细化指标也没有进行标准的定制,同时媒体领域对不同等级媒体转发自身内容也与其传播力、影响力息息相关,应是评价的重要指标之一,然而当前的评价方式较少考虑到这些因素,导致评价准确度较低。
技术实现思路
1、本专利技术提供一种基于数据中台的融合传播力评价指数的方法和系统,其主要目的是解决新媒体领域融合传播力评价准确度较低的问题。
2、为实现上述目的,本专利技术提供一种基于数据中台的融合传播力评价指数的系统,包括:
3、该系统基于数据中台设计,在数据中台中集成了数据管理、数据治理、数据服务等多个方面的平台,该系统的新媒体数据采集、数据处理以及数据存储均建立在数据中台之上,该系统包括账号管理模块、数据获取模块、数据处理模块、多维指标计算模块、综合传播力指数模块、数据可视化模块,利用该系统可实现账号统一管理、数据集中获取、数据智能处理、多维指标综合评价及数据可视化呈现。其中:
4、账号管理模块,用于创建及管理团队账号或运营人账号,其中团队账号支持多级团队账号管理;所述管理包括向团队账
5、数据获取模块,用于获取所述团队账号或运营人账号中各新媒体账号数据,其中,在数据中台中通过官方接口进行授权获取数据或通过爬虫进行结构化数据、半结构化数据和非结构化数据等收集。
6、数据处理模块,在数据中台中对获取的数据进行数据清洗和预处理,对于视频类内容先进行语音识别后获取文字数据,所述数据清洗包括文本去重、缺失值填充、异常值处理、数据转换、敏感词检测、原创性判断、文本分类中的一种或多种,得到发布次数、发布篇数、是否原创、是否含敏感词、错字率、点赞数、评论数、分享数、阅读数、粉丝数,新增粉丝数、话题关注数、讨论数、央媒转发数,省媒转发数等所关注的数据指标。其中,对文本内容可采用k近邻算法进行文本分类得到文章类型;可通过n-gram的分词方法进行分词后与敏感词库匹配判断每篇文章出现的敏感词并进行统计数量和概率;可通过自定义作者名规则对文本内容进行原创性判定;通过基于深度学习的错字检测方法检查文本内容的错字出现数或出现率。另外通可过账号授权及爬虫获取到文章点赞数、阅读数、评论数、转发(分享)数、粉丝数、发布次数、发布篇数等数据存入数据库中。
7、多维指标计算模块,用于根据多维评价模型对所评估团队或运营人账号下所有新媒体渠道从不同维度进行评价指数计算得到多维度的评价指标。
8、综合传播力评价模块,用于对各团队账号或运营人账号的多维指标基于熵值法的评价模型进行归一化处理得出综合传播力评价指数。
9、数据可视化模块,用于对所有团队账号或运营人账号的多维度评价指标及综合传播力评价指数进行数据可视化展示,包括指数雷达图、指数排行榜及作品排行榜中的一种或多种。
10、上述技术方案中,进一步地,所述的多维评价模型包括:内容生产指数、内容质量指数、用户互动指数、用户规模指数、话题运营指数、省媒央媒转发指数模型,分别对应内容生产指标、内容质量指标、用户互动指标、用户规模指标、话题运营指标、省媒央媒转发指标。具体的:
11、内容生产指标包括所评价时段如当月发文次数、当月发文篇数及文字内容为主的新媒体渠道如微信、z视介等app的当月多媒体内容生产量,即这些发布的渠道中包含视频、音频的发文数量。
12、内容生产指数由以下公式确定:
13、
14、其中,ci表示所评价账号的内容生产指数,k1表示所评价时段内发文次数的系数,ni表示该账号所评价时段内发文次数,max(n1,n2,…,nm)表示系统中所有账号中所评价时段内发文次数最多的次数,k2表示所评价时段内发文篇数的系数,pi表示该账号所评价时段内发文篇数,max(p1,p2,…,pm)表示系统中所有账号中所评价时段内发文篇数最多的篇数,k3表示所评价时段内多媒体内容生产量的系数,mi表示该账号所评价时段内多媒体内容生产量,max(m1,m2,…,mm)表示系统中所有账号中所评价时段内多媒体内容生产量最多的生产量。
15、内容质量指标包括文章基础分、当月原创数、当月包含敏感词文章数、当月错字篇数。文章基础分及当月原创数为正向得分,当月包含敏感词文章数及当月错字篇数为负向得分。
16、内容质量指数由以下公式确定:
17、
18、其中,qi表示所评价账号的内容质量指数,s表示所评价时段内创作基础得分,s1表示所评价时段内原创分数系数,oi表示该账号所评价时段内原创数,max(o1,i2,…,om)表示所有账号中所评价时段内原创数最多的次数,s2表示所评价时段内敏感词篇数的系数,wi表示该账号所评价时段内包含敏感词文章数,max(w1,w2,…,wm)表示所有账号中所评价时段内包含敏感词文章数最多的篇数,s3表示所评价时段内错字篇数的系数,ri表示该账号所评价时段内错字篇数,max(r1,r2,…,rm)表示所有账号中所评价时段内错字篇数最多的篇数。
19、不同新媒体平台传播互动指标不同,数据进行统一处理之后,对点赞、评论、转发、阅读进行传播评价,根据牛顿热度冷却定律进行热度计算。用户互动指标包括点赞数、评论数、转发数、阅读数、发文篇数、传播时间。
20、用户互动指数公式由以下公式确定:
21、
22、bi表示所评价账号的用户互动指数,h1表示点赞数的评价系数,n表示所评价时间内的发文篇数,lm表示某一篇内容所得到的点赞数,h2表示评论数的评价系数,cm表示某一篇内容所得到的评论数,h3表示转发数的评价系数,fm表示某一篇内容所得到的转发数,h4表示阅读数的评价系数,rm表示某一篇内容所得到的阅读数,e表示自然常数2.718,k表示冷却系数,(t-t0)表示时间间隔,t为当前时间,t0为起始时间,k越大,衰减越快;k越小,衰减越慢;假设新闻热度全衰期为7天168小时,即(t-t0)为168,假设热度衰减最小值为0.01即计算得到k值为0.0241。
23、用户规模指数,引入度中心性概念,根据账号的粉丝数量、粉丝账号数据,确定出用户规模指数,包括:
24、提取新媒体账号的粉丝数据;
25、构建用户关注联系矩阵;
26、利用下述算法计算单个用户的影响力指数:
27、
28、其中,cp(vi)表示用户vi的影响力指数,ui,j为用户关注矩阵,为用户vj的本文档来自技高网...
【技术保护点】
1.一种基于数据中台的融合传播力评价指数的系统,其特征在于,包括:
2.根据权利要求1所述的基于数据中台的融合传播力评价指数的系统,其特征在于,数据处理模块中所述的所关注的数据指标包括发布次数、发布篇数、是否原创、是否含敏感词、错字率、点赞数、评论数、分享数、阅读数、粉丝数,新增粉丝数、话题关注数、讨论数、央媒转发数、省媒转发数中的一种或多种。
3.根据权利要求1所述的基于数据中台的融合传播力评价指数的系统,其特征在于,多维指标计算模块中所述的多维评价模型包括:内容生产指数、内容质量指数、用户互动指数、用户规模指数、话题运营指数、省媒央媒转发指数模型,分别对应内容生产指标、内容质量指标、用户互动指标、用户规模指标、话题运营指标、省媒央媒转发指标。
4.根据权利要求3所述的基于数据中台的融合传播力评价指数的系统,其特征在于,内容生产指标包括所评价时段内发文次数、所评价时段内发文篇数及文字内容为主的新媒体渠道的所评价时段内多媒体内容生产量即视频或音频发文数量;
5.根据权利要求3所述的基于数据中台的融合传播力评价指数的系统,其特征在于,
6.根据权利要求3所述的基于数据中台的融合传播力评价指数的系统,其特征在于,不同新媒体平台传播互动指标不同,数据中台对接各平台的数据源,包括业务系统、数据库、互联网数据;对各平台数据经过人工综合分析之后,对点赞、评论、转发、阅读进行传播评价,根据牛顿热度冷却定律进行热度计算;
7.根据权利要求3所述的基于数据中台的融合传播力评价指数的系统,其特征在于,引入度中心性概念,根据账号的粉丝数量、粉丝账号数据,确定出用户规模指数,包括:
8.根据权利要求3所述的基于数据中台的融合传播力评价指数的系统,其特征在于,话题运营指数,根据账号发布的话题是否登上平台热搜榜及占榜时间,确定所述账号的话题运营指数,包括:
9.根据权利要求3所述的基于数据中台的融合传播力评价指数的系统,其特征在于,央媒省媒转发指数,根据稿件在转载平台上的阅读量、点赞量、收藏量,确定出央媒省媒转发指数,包括:
10.根据权利要求1所述的基于数据中台的融合传播力评价指数的系统,其特征在于,将多维指标基于熵值法的评价模型进行归一化处理得出综合传播力评价指数,具体包括:
...【技术特征摘要】
1.一种基于数据中台的融合传播力评价指数的系统,其特征在于,包括:
2.根据权利要求1所述的基于数据中台的融合传播力评价指数的系统,其特征在于,数据处理模块中所述的所关注的数据指标包括发布次数、发布篇数、是否原创、是否含敏感词、错字率、点赞数、评论数、分享数、阅读数、粉丝数,新增粉丝数、话题关注数、讨论数、央媒转发数、省媒转发数中的一种或多种。
3.根据权利要求1所述的基于数据中台的融合传播力评价指数的系统,其特征在于,多维指标计算模块中所述的多维评价模型包括:内容生产指数、内容质量指数、用户互动指数、用户规模指数、话题运营指数、省媒央媒转发指数模型,分别对应内容生产指标、内容质量指标、用户互动指标、用户规模指标、话题运营指标、省媒央媒转发指标。
4.根据权利要求3所述的基于数据中台的融合传播力评价指数的系统,其特征在于,内容生产指标包括所评价时段内发文次数、所评价时段内发文篇数及文字内容为主的新媒体渠道的所评价时段内多媒体内容生产量即视频或音频发文数量;
5.根据权利要求3所述的基于数据中台的融合传播力评价指数的系统,其特征在于,内容质量指标包括文章基础分、所评价时段内原创数、所评价时段内包含敏感词文章数、所评价时段内错字篇数;文章...
【专利技术属性】
技术研发人员:潘宁宁,蒋逸铭,汤振华,陆盈嘉,樊旗,叶灵,
申请(专利权)人:浙江广播电视集团,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。