System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于云平台的多源数据融合分析推送系统及方法技术方案_技高网

一种基于云平台的多源数据融合分析推送系统及方法技术方案

技术编号:43292680 阅读:5 留言:0更新日期:2024-11-12 16:11
本发明专利技术公开了一种基于云平台的多源数据融合分析推送系统及方法,属于人工智能技术领域。本发明专利技术通过若干数据源获取艺术品数据,通过云平台提供艺术品的虚拟展览和交互式展示;使用自然语言处理算法分析艺术品,整合形成艺术品特征;收集不同用户在云平台上的访问数据,实时生成不同用户参观的热度和趋势,对管理员进行可视化展示;分析用户的访问数据,进行数据预处理和特征提取,建立用户画像;通过协同过滤算法,基于用户画像和艺术品特征训练个性化推荐模型,实现个性化推荐;根据来自不同地域和文化背景的艺术品数据,在云平台上建立多语言支持功能,结合不同地域和文化的艺术品特点,设计展览和解说服务。

【技术实现步骤摘要】

本专利技术涉及人工智能,具体为一种基于云平台的多源数据融合分析推送系统及方法


技术介绍

1、传统的艺术品展示平台往往只提供简单的图片展示和文字介绍,用户无法获得丰富的艺术品体验;此外,用户在面对海量的艺术品时往往难以找到符合自己兴趣的作品,现有技术缺乏交互性和个性化的艺术品推荐功能,不能满足用户对于艺术品欣赏的多样化需求。

2、在全球化背景下,用户对于不同文化背景的艺术品也表现出了越来越广泛的兴趣。然而,现有平台往往局限于特定地域或语言,无法有效促进跨文化的艺术交流和合作。在现有平台中无法快速直观查看到高质量碑帖、字帖或者绘画作品的全貌,操作上要不断的切换图片,无法对书法作品中的内容进行快速定位,继而无法提供在作品中的搜索功能。在现有平台中,艺术品图片的切片图片的分辨率太小,则文件数量太多;切片图片的分辨率太大,则无法保证清晰度。


技术实现思路

1、本专利技术的目的在于提供一种基于云平台的多源数据融合分析推送系统及方法,以解决上述
技术介绍
中提出的问题。

2、为了解决上述技术问题,本专利技术提供如下技术方案:

3、一种基于云平台的多源数据融合分析推送方法,所述方法包括以下步骤:

4、s100、通过若干数据源获取艺术品数据,所述艺术品数据包括艺术品展示数据、艺术家背景资料、艺术品收藏价值和艺术品评论,整合进入云平台,通过云平台提供艺术品的虚拟展览和交互式展示;使用自然语言处理算法分析艺术品的历史背景、文化内涵、风格特点和艺术表现手法,整合形成艺术品特征;

5、s200、收集不同用户在云平台上的访问数据,所述访问数据包括展览页面的浏览量、停留时间、点击热点、收藏偏好和用户互动行为,实时生成不同用户参观的热度和趋势,对管理员进行可视化展示;

6、s300、分析用户的访问数据,进行数据预处理和特征提取,建立用户画像;通过协同过滤算法,基于用户画像和艺术品特征训练个性化推荐模型,模型训练的目标是根据用户的兴趣和需求,预测用户对未浏览过的艺术品的喜好程度,以实现个性化推荐;

7、s400、根据来自不同地域和文化背景的艺术品数据,在云平台上建立多语言支持功能,结合不同地域和文化的艺术品特点,设计展览和解说服务,提供文化解说和交流论坛的功能。

8、根据步骤s100,通过三维建模在云平台上设计虚拟展览的展览空间,根据不同的展览主题和艺术品特点进行布局设计,展览空间能够模拟传统美术馆的展厅或者设计成与艺术品风格相匹配的场景;

9、展览空间的设计内容包括:展览厅的大小、形状、墙面、地面、灯光照明、艺术品展示架和展示柜、导航和路径、交互式元素、声音效果和用户行为跟踪;用户能够通过点击、缩放、旋转或拖动的方式与艺术品互动,在展览空间中为每件艺术品设置独立的展示区域,提供艺术品的历史背景、文化内涵、风格特点和艺术表现手法的介绍;用户能够自由浏览虚拟展览空间,选择感兴趣的展览区域进行探索和观看。

10、根据步骤s100,使用自然语言处理算法分析艺术品的历史背景、文化内涵、风格特点和艺术表现手法,通过预处理,进行文本清洗、分词与词性标注、停用词过滤词形还原和词干提取;

11、针对历史背景和文化内涵,使用预训练的ner模型识别和提取文本中的时间、地点、人物的实体,使用lda模型分析文本,提取主要的主题和关键词,分析文本中的情感倾向,使用vader情感分析模型获取艺术品和艺术家的文化内涵和历史背景的情感色彩;

12、ner模型是一种用于识别文本中命名实体的模型,预训练的ner模型基于深度学习技术,通过大规模标记的文本数据进行训练,能够自动识别和提取文本中的实体,如人名、地名、组织名等,在本专利技术中使用循环神经网络,经过训练能够准确地识别出文本中的实体,并且可以根据上下文进行语义理解。

13、lda是一种用于文档主题建模的生成式概率模型,它将每篇文档视为多个主题的混合,每个主题又由多个单词组成。lda模型通过分析文档中的单词分布,自动地从文档集合中发现主题,并且为每个主题分配一组关键词。

14、vader是一种用于情感分析的预训练模型,它基于规则和词典的方法,能够对文本中的情感进行分类,包括积极、消极和中性等情感极性。vader模型使用了一个包含了情感词汇和它们的情感强度的词典,并且考虑了否定词、程度副词和情感表达方式等因素,从而能够准确地判断文本的情感倾向。

15、针对风格特点和艺术表现手法,使用tf-idf提取描述艺术风格和表现手法的关键词,使用句法分析工具spacy解析文本的句法结构,获取艺术品描述中的关系;

16、将提取的实体、主题、情感、关键词和句法结构转化为特征向量,使用词嵌入模型word2vec将文本特征转化为特征向量;将特征向量进行拼接和加权平均,形成艺术品特征。

17、tf-idf是一种用于文本特征提取的常用技术,它衡量了一个词在文档中的重要性。spacy是一个开源的自然语言处理库,提供了丰富的文本处理功能,包括分词、词性标注、命名实体识别、句法分析等。word2vec是一种词嵌入技术,用于将文本中的词语转换为稠密的向量表示,它基于神经网络模型,通过学习词语的上下文信息来生成词向量。word2vec模型可以将具有相似语境的词语映射到相似的向量空间中,从而实现了语义上的相似性。

18、根据步骤s200,所述浏览量记录每个展览页面的浏览次数,所述停留时间记录用户在每个页面上停留的时间,所述点击热点记录用户在页面上的点击行为,确定热点区域,所述收藏偏好记录用户收藏的艺术品和展览,所述互动行为记录用户在展览中的互动行为;

19、在收集数据时,使用javascript代码嵌入到前端页面中,捕捉用户的浏览和互动行为,通过服务器日志记录用户请求的数据,使用google analytics收集用户行为数据。

20、步骤s300包括:

21、s301、收集用户的访问数据,分析用户的访问数据,进行数据预处理和特征提取,生成用户的访问数据特征向量,建立用户画像;

22、s302、构建用户-艺术品评分矩阵,其中,矩阵中每个元素对应用户对艺术品的评分;

23、s303、使用余弦相似度计算两个用户之间的相似度,形成用户相似度矩阵;基于用户相似度矩阵,预测用户对未访问过的艺术品的评分;

24、s304、使用余弦相似度计算两个艺术品之间的相似度,形成艺术品相似度矩阵;基于艺术品相似度矩阵,预测用户对未访问过的艺术品的评分;

25、s305、通过矩阵分解,将用户-艺术品评分矩阵分解为两个低秩矩阵,所述两个低秩矩阵包括用户特征矩阵和艺术品特征矩阵;

26、s306、通过最小化损失函数,求解用户特征矩阵和艺术品特征矩阵;

27、s307、使用梯度下降法更新用户特征矩阵和艺术品特征矩阵;

28、s308、利用训练好的用户特征矩阵和艺术品特征矩阵,预测用本文档来自技高网...

【技术保护点】

1.一种基于云平台的多源数据融合分析推送方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种基于云平台的多源数据融合分析推送方法,其特征在于:根据步骤S100,通过三维建模在云平台上设计虚拟展览的展览空间,根据不同的展览主题和艺术品特点进行布局设计,展览空间能够模拟传统美术馆的展厅或者设计成与艺术品风格相匹配的场景;

3.根据权利要求1所述的一种基于云平台的多源数据融合分析推送方法,其特征在于:根据步骤S100,使用自然语言处理算法分析艺术品的历史背景、文化内涵、风格特点和艺术表现手法,通过预处理,进行文本清洗、分词与词性标注、停用词过滤词形还原和词干提取;

4.根据权利要求1所述的一种基于云平台的多源数据融合分析推送方法,其特征在于:根据步骤S200,所述浏览量记录每个展览页面的浏览次数,所述停留时间记录用户在每个页面上停留的时间,所述点击热点记录用户在页面上的点击行为,确定热点区域,所述收藏偏好记录用户收藏的艺术品和展览,所述互动行为记录用户在展览中的互动行为;

5.根据权利要求1所述的一种基于云平台的多源数据融合分析推送方法,其特征在于:步骤S300包括:

6.根据权利要求5所述的一种基于云平台的多源数据融合分析推送方法,其特征在于:根据步骤S302,构建用户-艺术品评分矩阵R,其中每个元素表示用户u对艺术品i的评分,所述评分根据用户的用户画像中浏览量、停留时间、点击热点、收藏偏好和用户互动行为的特征向量进行加权计算,其中用户-艺术品评分矩阵R的表示形式如下:

7.根据权利要求5所述的一种基于云平台的多源数据融合分析推送方法,其特征在于:根据步骤S303,使用余弦相似度计算用户u和v之间的相似度,公式如下:

8.根据权利要求5所述的一种基于云平台的多源数据融合分析推送方法,其特征在于:根据步骤S305,通过矩阵分解,将用户-艺术品评分矩阵R分解为两个低秩矩阵P和Q,其中P是用户特征矩阵,Q是艺术品特征矩阵,公式如下:

9.根据权利要求5所述的一种基于云平台的多源数据融合分析推送方法,其特征在于:根据步骤S309,使用均方根误差评估模型的性能,公式如下:

10.一种基于云平台的多源数据融合分析推送系统,使用权利要求1-9中任一项所述的一种基于云平台的多源数据融合分析推送方法,其特征在于,包括:

...

【技术特征摘要】

1.一种基于云平台的多源数据融合分析推送方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种基于云平台的多源数据融合分析推送方法,其特征在于:根据步骤s100,通过三维建模在云平台上设计虚拟展览的展览空间,根据不同的展览主题和艺术品特点进行布局设计,展览空间能够模拟传统美术馆的展厅或者设计成与艺术品风格相匹配的场景;

3.根据权利要求1所述的一种基于云平台的多源数据融合分析推送方法,其特征在于:根据步骤s100,使用自然语言处理算法分析艺术品的历史背景、文化内涵、风格特点和艺术表现手法,通过预处理,进行文本清洗、分词与词性标注、停用词过滤词形还原和词干提取;

4.根据权利要求1所述的一种基于云平台的多源数据融合分析推送方法,其特征在于:根据步骤s200,所述浏览量记录每个展览页面的浏览次数,所述停留时间记录用户在每个页面上停留的时间,所述点击热点记录用户在页面上的点击行为,确定热点区域,所述收藏偏好记录用户收藏的艺术品和展览,所述互动行为记录用户在展览中的互动行为;

5.根据权利要求1所述的一种基于云平台的多源数据融合分析推送方法,其特征在于:步骤...

【专利技术属性】
技术研发人员:邓定明
申请(专利权)人:江苏盛美塾信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1