本发明专利技术实施例公开了一种网站转化设置的检测方法、处理方法和装置。所述检测方法包括:获取待判别的网站转化设置信息;获取与所述网站转化设置信息对应的网站的第一访问量数据;根据预设的特征提取规则对所述待判别的网站转化设置信息以及所述第一访问量数据进行特征提取,得到待判别特征向量数据;根据所述待判别特征向量数据和预设的网站转化模型对所述待判别的网站转化设置信息是否正确进行判别,得到判别结果。采用本发明专利技术实施例,可以提高对网站转化设置信息的检测效率。
【技术实现步骤摘要】
本专利技术设及计算机
,特别设及一种网站转化设置的检测方法、处理方法 和装置。
技术介绍
当前对于用户数据的分析越来越深入,从用户数据可W得到很多用户的个人信 息,如浏览网页的数量、浏览网页的类型等。 目前网站统计工具记录的网站的数据越来越细化、越来越深入,其中,网站的转化 设置信息成为一项重要的信息。然而网站转化设置信息的收集极大地依赖于网站站长的自 主设置,而运样会使得网站转化设置信息经常地出现失效或错误的情况,为此,可通过人工 标注排查的方法对用户设置的网站转化设置信息是否正确进行检测。 前述网站转化设置的检测方法至少存在W下问题: 通过人工标注排查的方法对用户设置的网站转化设置信息是否正确进行检测,需 要消耗大量的人力物力,而且人工标注的处理时间较长,会使得对网站转化设置信息的检 测效率较低。
技术实现思路
本专利技术的实施例提供一种网站转化设置的检测方法、处理方法和装置,通过对获 取的待判别的网站转化设置信息及相应网站的第一访问量数据进行特征提取,得到待判别 特征向量数据,并通过预设的网站转化模型对所述待判别的网站转化设置信息是否正确进 行判别,得到判别结果,从而提高对网站转化设置信息的检测效率。 为达到上述目的,本专利技术的实施例提供了一种网站转化设置的检测方法。所述检 测方法包括,获取待判别的网站转化设置信息;获取与所述网站转化设置信息对应的网站 的第一访问量数据;根据预设的特征提取规则对所述待判别的网站转化设置信息W及所述 第一访问量数据进行特征提取,得到待判别特征向量数据;根据所述待判别特征向量数据 和预设的网站转化模型对所述待判别的网站转化设置信息是否正确进行判别,得到判别结 果。 可选地,所述第一访问量数据包括所述待判别的网站转化设置信息中转化网页的 访问量数据、网站的访问量数据、不同深度的网页的访问量数据和/或所述转化网页的前 一网页的访问量数据。 可选地,所述根据预设的特征提取规则对所述待判别的网站转化设置信息W及所 述第一访问量数据进行特征提取,得到待判别特征向量数据的处理包括:根据预设的网页 链接成分分析规则对所述待判别的网站转化设置信息中的网页链接数据进行特征提取,得 到基于网页链接成分数据的待判别特征向量数据;根据预设的访问量特征提取规则对所述 第一访问量数据进行特征提取,得到基于访问量数据的待判别特征向量数据。 可选地,所述网页链接数据中还包括文字数据,所述根据预设的特征提取规则对 所述待判别的网站转化设置信息w及所述第一访问量数据进行特征提取,得到待判别特征 向量数据的处理还包括:根据预设的词语语义分析规则对所述待判别的网站转化设置信 息中的网页链接数据中的文字数据进行特征提取,得到基于文字数据的待判别特征向量数 据。 可选地,所述词语语义分析规则是基于切词、词语组合和/或语义词包匹配处理 的分析规则。 为达到上述目的,本专利技术的实施例提供了一种网站转化设置的处理方法。所述处 理方法包括,获取带有正确或错误标注的多个网站转化设置信息;获取与标注的网站转化 设置信息对应的网站的第二访问量数据;根据预设的特征提取规则对所述带有正确或错误 标注的多个网站转化设置信息W及所述第二访问量数据进行特征提取,得到标注特征向量 数据;根据所述标注特征向量数据建立网站转化模型。 可选地,所述第二访问量数据包括所述标注的网站转化设置信息中转化网页的访 问量数据、网站的访问量数据、不同深度的网页的访问量数据和/或所述转化网页的前一 网页的访问量数据。 可选地,所述根据预设的特征提取规则对所述带有正确或错误标注的多个网站转 化设置信息W及所述第二访问量数据进行特征提取,得到标注特征向量数据的处理包括: 根据预设的网页链接成分分析规则对所述标注的网站转化设置信息中的网页链接数据进 行特征提取,得到基于网页链接成分数据的标注特征向量数据;根据预设的访问量特征提 取规则对所述第二访问量数据进行特征提取,得到基于访问量数据的标注特征向量数据。 可选地,所述网页链接数据中还包括文字数据,所述根据预设的特征提取规则对 所述带有正确或错误标注的多个网站转化设置信息W及所述第二访问量数据进行特征提 取,得到标注特征向量数据的处理还包括:根据预设的词语语义分析规则对所述标注的网 站转化设置信息中的网页链接数据中的文字数据进行特征提取,得到基于文字数据的标注 特征向量数据。 为达到上述目的,本专利技术的实施例还提供了一种网站转化设置的检测装置。所述 检测装置包括:转化设置获取模块,用于获取待判别的网站转化设置信息;访问量获取模 块,用于获取与所述网站转化设置信息对应的网站的第一访问量数据;特征向量获取模块, 用于根据预设的特征提取规则对所述待判别的网站转化设置信息W及所述第一访问量数 据进行特征提取,得到待判别特征向量数据;判别结果获取模块,用于根据所述待判别特征 向量数据和预设的网站转化模型对所述待判别的网站转化设置信息是否正确进行判别,得 到判别结果。 可选地,所述第一访问量数据包括所述待判别的网站转化设置信息中转化网页的 访问量数据、网站的访问量数据、不同深度的网页的访问量数据和/或所述转化网页的前 一网页的访问量数据。 可选地,所述特征向量获取模块包括:网页链接获取单元,用于根据预设的网页链 接成分分析规则对所述待判别的网站转化设置信息中的网页链接数据进行特征提取,得到 基于网页链接成分数据的待判别特征向量数据;访问量获取单元,用于根据预设的访问量 特征提取规则对所述第一访问量数据进行特征提取,得到基于访问量数据的待判别特征向 量数据。 可选地,所述网页链接数据中还包括文字数据,所述特征向量获取模块还包括:文 字数据获取单元,用于根据预设的词语语义分析规则对所述待判别的网站转化设置信息中 的网页链接数据中的文字数据进行特征提取,得到基于文字数据的待判别特征向量数据。 可选地,所述词语语义分析规则是基于切词、词语组合和/或语义词包匹配处理 的分析规则。 为达到上述目的,本专利技术的实施例还提供了一种网站转化设置的处理装置。所述 处理装置包括:标注转化获取模块,用于获取带有正确或错误标注的多个网站转化设置信 息;标注访问量获取模块,用于获取与标注的网站转化设置信息对应的网站的第二访问量 数据;标注特征向量获取模块,用于根据预设的特征提取规则对所述带有正确或错误标注 的多个网站转化设置信息W及所述第二访问量数据进行特征提取,得到标注特征向量数 据;转化模型建立模块,用于根据所述标注特征向量数据建立网站转化模型。 可选地,所述第二访问量数据包括所述标注的网站转化设置信息中转化网页的访 问量数据、网站的访问量数据、不同深度的网页的访问量数据和/或所述转化网页的前一 网页的访问量数据。 可选地,所述标注特征向量获取模块包括:标注网页链接获取单元,用于根据预设 的网页链接成分分析规则对所述标注的网站转化设置信息中的网页链接数据进行特征提 取,得到基于网页链接成分数据的标注特征向量数据;标注访问量获取单元,用于根据预设 的访问量特征提取规则对所述第二访问量数据进行特征提取,得到基于访问量数据的标注 特征向量数据。 可选地,所述网页链接数据中还包括文字数据,所述标注特征向量获取模块还包 括:标注文字数据本文档来自技高网...
【技术保护点】
一种网站转化设置的检测方法,其特征在于,所述检测方法包括:获取待判别的网站转化设置信息;获取与所述网站转化设置信息对应的网站的第一访问量数据;根据预设的特征提取规则对所述待判别的网站转化设置信息以及所述第一访问量数据进行特征提取,得到待判别特征向量数据;根据所述待判别特征向量数据和预设的网站转化模型对所述待判别的网站转化设置信息是否正确进行判别,得到判别结果。
【技术特征摘要】
【专利技术属性】
技术研发人员:余韬,叶峻,王晓元,赵继承,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。