System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及网站管理,具体涉及一种基于大数据的门户网站动态管理系统。
技术介绍
1、在互联网技术日新月异的今天,门户网站已经逐渐演变成为人们获取信息、分享观点和互动交流的重要平台。其作为数字时代的信息集散地,扮演着至关重要的角色。门户网站动态管理的质量直接关系到用户体验的满意度和信息的传递效率。然而,现实中,许多传统的门户网站管理系统在数据更新、用户行为分析以及数据安全性等方面存在明显的不足。
2、传统的门户网站管理系统往往面临着数据更新不及时的问题。在信息爆炸的时代,信息的时效性和准确性至关重要。然而,由于技术限制或管理疏忽,许多门户网站无法做到实时更新,导致用户获取到的信息可能已经过时或失去价值。这不仅影响了用户的体验,也损害了门户网站的声誉和公信力。
3、此外,用户行为分析的准确性也是门户网站管理的重要方面。通过深入了解用户的喜好、行为模式和消费习惯,门户网站可以提供更加个性化和精准的内容推荐,从而提升用户黏性和满意度。然而,现有的许多系统在这方面表现不佳,往往无法准确捕捉用户的真实需求和行为特征,导致推荐内容的质量参差不齐。
4、数据安全性是门户网站管理不可忽视的一环。随着网络攻击和数据泄露事件的频发,用户对于个人信息保护的需求日益强烈。门户网站作为用户信息的重要存储和传输平台,必须采取严格的安全措施来保障用户数据的安全。然而,现实中,许多门户网站在数据保护方面存在漏洞,使得用户数据面临泄露和滥用的风险。
技术实现思路
1、本专利技术的
2、门户网站作为用户信息的重要存储和传输平台,必须采取严格的安全措施来保障用户数据的安全。然而,现实中,许多门户网站在数据保护方面存在漏洞,使得用户数据面临泄露和滥用的风险。
3、本专利技术的目的可以通过以下技术方案实现:
4、一种基于大数据的门户网站动态管理系统,包括:
5、内容采集模块,用于根据网站url获取网站用户的收藏数据,所述收藏数据包括但不限于文档、音乐、网页和视频;
6、内容分析模块,用于统计用户对任一收藏数据的浏览次数和浏览时长,将浏览次数和浏览时长均超过对应预设阈值的收藏数据标记为重点数据,并生成文档和网页的简介内容,并将失效的收藏数据进行删除;
7、数据管理模块,用于将重点数据转移存储至独立分区中,并将所述独立分区划分为第一分区和第二分区,所述重点数据仅存储在第一分区中,并筛选用户浏览次数和浏览时长倒数的收藏数据存储在第二分区中,所述第一分区和第二分区的收藏数据数量相同;
8、常态监测模块,用于当任一非原用户ip试图访问独立分区时,先对访问者验证独立分区的账号和密码;若账号密码验证错误,则拒绝访问;若账号密码验证正确,则对访问者验证原用户的身份信息和验证问题;若身份信息和验证问题回答错误,则仅允许访问者访问第二分区;若身份信息和验证问题回答正确,则仅允许用户访问第一分区。
9、作为本专利技术进一步的方案:所述数据管理模块中,若第二分区的收藏数据中的文档与第一分区的收藏数据中的文档的领域完全相同,所述领域为学科分类,则将第二分区中50%的收藏数据进行删除,并顺延倒数次序采集与第一分区领域不同的文档。
10、作为本专利技术进一步的方案:所述数据管理模块中,若第二分区的文档数量无法达到与第一分区的文档数量相同,则从网站中随机选取与第一分区领域不同的文档进行填充。
11、作为本专利技术进一步的方案:当采集到账号密码、身份信息或验证问题回答错误的访问记录时,将对应的访问记录发送至用户端。
12、作为本专利技术进一步的方案:所述内容分析模块中,生成简介的过程为:
13、将文档和网页的内容按照每个段落和句子进行划分,剔除干扰元素,基于自然语言处理方法检测文本开头前三段落,若文本段落小于三,则全部检测,查找与其余部分文本格式不同的段落,所述文本格式包括但不限于字体、字号和颜色,通过实体识别模型在该段落中提取关键词,将包含关键词的语句进行组合,对上下文信息进行nlp修正,生成简介内容。
14、作为本专利技术进一步的方案:所述干扰元素包括页眉、页脚、广告和dock栏。
15、作为本专利技术进一步的方案:提取关键词的过程为:
16、将段落内容经过位置编码后输入所述实体识别模型,所述实体识别模块包括bilstm层和crf层,通过所述bilstm层对字向量上下文特征信息进行深度学习,输出每个文本信息对应标签的概率,生成标签序列,将所述标签序列输入所述crf层中进行排序,获得使目标函数最优化的标签序列,提取标签序列中的内容特征,聚类生成待定关键词,并利用待定关键词反向传播更新模型,获取反复更新若干次后的关键词。
17、作为本专利技术进一步的方案:所述常态监测模块中,将访问失败的用户标记为待定用户,对于任一待定用户,计算该用户访问所有个人分区的总次数与注册时长的比值,若该比值小于预设阈值,且该用户并未生成自身的个人分区,则判定为异常用户,限制该用户访问个人分区的权限
18、本专利技术的有益效果:
19、本专利技术通过分析用户对收藏数据的浏览次数和时长,系统能够识别用户更感兴趣的重点内容,将重点数据存储于独立分区,并与普通数据分开管理,有助于提升数据处理效率及系统响应速度;通过设置访问验证机制,包括账号密码验证和身份信息验证,系统的安全性得到加强,保护用户的私人数据不被未授权访问;监测并记录错误的访问尝试,并将这些信息反馈给用户,有助于用户及时了解账户安全状况。
本文档来自技高网...【技术保护点】
1.一种基于大数据的门户网站动态管理系统,其特征在于,包括:
2.根据权利要求1所述的一种基于大数据的门户网站动态管理系统,其特征在于,所述数据管理模块中,若第二分区的收藏数据中的文档与第一分区的收藏数据中的文档的领域完全相同,所述领域为学科分类,则将第二分区中50%的收藏数据进行删除,并顺延倒数次序采集与第一分区领域不同的文档。
3.根据权利要求2所述的一种基于大数据的门户网站动态管理系统,其特征在于,所述数据管理模块中,若第二分区的文档数量无法达到与第一分区的文档数量相同,则从网站中随机选取与第一分区领域不同的文档进行填充。
4.根据权利要求2所述的一种基于大数据的门户网站动态管理系统,其特征在于,当采集到账号密码、身份信息或验证问题回答错误的访问记录时,将对应的访问记录发送至用户端。
5.根据权利要求1所述的一种基于大数据的门户网站动态管理系统,其特征在于,所述内容分析模块中,生成简介的过程为:
6.根据权利要求5所述的一种基于大数据的门户网站动态管理系统,其特征在于,所述干扰元素包括页眉、页脚、广告和DOCK栏。
7.根据权利要求5所述的一种基于大数据的门户网站动态管理系统,其特征在于,提取关键词的过程为:
8.根据权利要求1所述的一种基于大数据的门户网站动态管理系统,其特征在于,所述常态监测模块中,将访问失败的用户标记为待定用户,对于任一待定用户,计算该用户访问所有个人分区的总次数与注册时长的比值,若该比值小于预设阈值,且该用户并未生成自身的个人分区,则判定为异常用户,限制该用户访问个人分区的权限。
...【技术特征摘要】
1.一种基于大数据的门户网站动态管理系统,其特征在于,包括:
2.根据权利要求1所述的一种基于大数据的门户网站动态管理系统,其特征在于,所述数据管理模块中,若第二分区的收藏数据中的文档与第一分区的收藏数据中的文档的领域完全相同,所述领域为学科分类,则将第二分区中50%的收藏数据进行删除,并顺延倒数次序采集与第一分区领域不同的文档。
3.根据权利要求2所述的一种基于大数据的门户网站动态管理系统,其特征在于,所述数据管理模块中,若第二分区的文档数量无法达到与第一分区的文档数量相同,则从网站中随机选取与第一分区领域不同的文档进行填充。
4.根据权利要求2所述的一种基于大数据的门户网站动态管理系统,其特征在于,当采集到账号密码、身份信息或验证问题回答错误的访问记录时,将对...
【专利技术属性】
技术研发人员:兰佳福,黄小能,高璇,
申请(专利权)人:福建省政务门户网站运营管理有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。