一种基于页面分析的SPU获取方法及存储介质技术

技术编号：36432858 阅读：33 留言：0更新日期：2023-01-20 22:45

一种基于页面分析的SPU获取方法及存储介质，其中方法包括如下步骤，获取第一页面中的页面展示内容，所述页面展示内容包括文字；识别所述页面展示内容中的文字内容，对所述文字内容进行语义分割，得到所述文字内容的分词结果；将所述分词结果送入SPU识别神经网络，所述SPU识别神经网络被训练为根据知识图谱识别所述第一页面属于不同的SPU的分类结果。上述方案能够对网页等信息页面进行信息读取，并进行分类，通过神经网络进行分类，最终达到分析页面中的SPU相关性的技术效果。提升SPU的识别准确率。确率。确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于页面分析的SPU获取方法及存储介质

[0001]本专利技术涉及数据分析领域，尤其涉及一种识别页面内容数据分析其中包含的SPU名称等信息的方法及存储介质。

技术介绍

[0002]随着互联网技术的发展，云计算、大数据、分布式应用等技术为我们提供更敏捷的产品交付、更创新的业务模式和更优质的客户体验，但同时也给数据分析带来了新的分析和挑战。
[0003]在现有的网络社区中，存在各种各样去中心化的用户发布内容，需要对用户发布内容进行内容提取，以及相关数据的分析解析，因此需要能够对任意的页面内容进行分析。传统的SPU提取的方法，仅是通过分析搜索关键词的方式将搜索结果定位到特定SPU页面上。并没有针对任意页面内容进行内容提取分析的技术方案。无法对任意页面内容分析出合适的对其进行分类的方式。

技术实现思路

[0004]因此，需要提供一种能够对系统中的资源进行自动化配置的方法及存储介质。
[0005]为实现上述目的，专利技术人提供了一种基于页面分析的SPU获取方法，包括如下步骤，
[0006]获取第一页面中的页面展示内容，所述页面展示内容包括文字；
[0007]识别所述页面展示内容中的文字内容，对所述文字内容进行语义分割，得到所述文字内容的分词结果；
[0008]将所述分词结果送入SPU识别神经网络，所述SPU识别神经网络被训练为根据知识图谱识别所述第一页面属于不同的SPU的分类结果。
[0009]本申请的一实施例中，还包括步骤，将所述第一页面的页面关联数据信息进...

【技术保护点】

【技术特征摘要】
1.一种基于页面分析的SPU获取方法，其特征在于，包括如下步骤，获取第一页面中的页面展示内容，所述页面展示内容包括文字；识别所述页面展示内容中的文字内容，对所述文字内容进行语义分割，得到所述文字内容的分词结果；将所述分词结果送入SPU识别神经网络，所述SPU识别神经网络被训练为根据知识图谱识别所述第一页面属于不同的SPU的分类结果。2.根据权利要求1所述的基于页面分析的SPU获取方法，其特征在于，还包括步骤，将所述第一页面的页面关联数据信息进行分析整合，得到第一SPU的分析整合数据。3.根据权利要求2所述的基于页面分析的SPU获取方法，其特征在于，所述第一页面的页面关联数据信息包括点击率、留存时间、用户名称、用户年龄、用户性别中的一个或多个。4.根据权利要求1所述的基于页面分析的SPU获取方法，其特征在于，还包括步骤，识别所述页面展示内容中的第一符号信息，对所述第一符号信息指向的第一分词结果，提升所述第一分词结果的相应权重。5.根据权利要求1所述的基于页面分析的SPU获取方法，其特征在于，还包括步骤，建立知识图谱，所述知识图谱包括如下节点：品牌名、别名、第一描述词、SPU名，还包括所述品牌名与所述描述词之间的第一边，所述品牌名与所述别名之间的第二边，以及所述第一描述词与所述别名之间的第三边，以及所述第一描述词与SPU名之间的第四边，和别名与SPU名之间的第五边。6.根据权利要求5所述的基于页面分析的SPU获取方法，其特征在于，...

【专利技术属性】
技术研发人员：李在灼，胡长春，郑舒丹，姜豪，
申请(专利权)人：福州果集信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人