本发明专利技术涉及一种网页页面定位识别系统及定位识别方法,该系统包括初始化模块、类型识别模块、标记模块、碰撞检测模块、坐标转换模块和输入输出接口,通过初始化网页元素和识别网页元素类型后生成中间检测列表,将其中的元素与监听到的当前用户视线聚焦区域进行碰撞,将重叠的网页元素本身及其ID标记、位置/时间数据一并列表输出以供用户及技术实施者操作。可精确对应具体网页中具体元素的具体位置,根据当前用户关注焦点展示相关信息或触发相关事件,从而使信息展示更具针对性,位置信息采用相对位置,不受网页元素位置/大小、载体的尺寸和分辨率的影响,输出的位置信息始终正确且唯一。
【技术实现步骤摘要】
本专利技术涉及一种网页页面的定位识别方法,以及一种网页页面的定位识别系统。
技术介绍
网络作为信息传输、接收、共享的虚拟平台,把各个点、面、体的信息联系到一起,从而实现这些资源的共享。它是人们信息交流使用的工具,也是资源共享的通道。随着网络的迅猛发展,它的功能越来越多,内容也越来越丰富。网络借助文字阅读、图片查看、影音播放、下载传输、游戏聊天等软件工具从文字、图片、声音、视频,等方面给人们带来极其丰富和美好的使用和享受,极大的丰富了人们的生活。网页是构成网站的基本元素,是承载各种网站应用的平台。文字与图片是构成一个网页的两个最基本的元素。除此之外,网页的元素还包括动画、音乐、程序等等。一个网页可能包含丰富的内容,往往需要用户通过横向/竖向的滚动/滑动方式才能完整浏览。如何在一个文字、图片、视频、音频单一 /相互混合的网页中,当用户滚动/滑动网页/网页中的一部分时,向用户展示其正在关注内容的相关信息,触发动画/音/视频播放,促进用户参与评论,标记,进而知晓用户更关注哪一块内容,甚至是内容中的哪一部分是本领域亟需解决的技术难题。目前对于网页页面的定位识别方法或是基于图片的评论展示方案,即用户选择一张图片发表评论,系统将评论通过左右/上下滚动,或随机的方式展示在图片上。或是采用图片标记方案,即用户通过上一张,下一张,或图片列表,选择一张图片,选择图片上的位置发表评论或进行标记,然后系统将评论或标记展示按照坐标展示在图片上。或是采用基于播放时间的视频评论方案,即用户打开一个视频,在视频播放当前位置处发表评论后,系统将评论按照视频播放时间展示。亦或是采用网页弹幕方案,即用户进入一个网页发表评论,系统将评论以横向/竖向滚动等其他方式展现。基于图片的评论展示方案评论不能与图片的具体位置对应,且图片上直接展示评论,将影响图片本身观感。图片标记方案一屏只展现一张图片,且在图片上直接展示评论,不但影响图片本身观感,也无法适应大多数网页图文混排情况,多图混合时,需要将多张图片合成整体;而且该法提取的位置为相对图片坐标,但未考虑到图片尺寸变化情况,在开发网页的手机/平板等版本时,开发者需要手动或编写程序由系统对坐标进行换算,产生额外的开发成本及资源消耗。基于播放时间的视频评论方案当网页中存在多个视频时,用户需要自己选择一个视频评论,无法适应图文、音频、视频混排的网页,且在视频中直接显示评论,可能影响视频观感。网页弹幕方案用户评论的对象是整个网页,而网页中往往存在多个元素,每个用户的关注点并不完全相同。鉴于网页弹幕(即滚动评论)会影响用户观看网页,大多数情况,需要用户刻意地去打开网页弹幕观看。
技术实现思路
针对现有技术的缺陷,本专利技术的目的是提供一种将识别和定位融入到用户日常滚动浏览网页中、适应一屏多图、图文混排、多媒体混排,储存信息唯一的网页页面定位识别方法。本专利技术的另一目的是提供一种网页页面定位识别系统。为达上述目的,本专利技术采用了以下技术方案:一种网页页面定位识别方法,其包括如下步骤:(I)网页元素初始化:遍历网页或指定网页上某一区域中的全部网页元素,生成初始化检测列表,并创建对该网页或指定网页上的某一区域被滚动/滑动的监听,设定屏幕上的某一区域为用户视线聚焦区域;(2)识别网页元素类型:判断全部网页元素类型,去除广告和噪音元素;(3)生成中间检测列表:将识别完类型的网页元素分别进行唯一身份识别的元素ID标记,并将标记后的网页元素生成中间检测列表;(4)碰撞检测:将中间检测列表中的元素与监听到的当前用户视线聚焦区域进行碰撞,判断并输出重叠元素ID标记、图片/文字位置或音/视频时间,生成最终输出列表。本专利技术还可采用以下技术方案进一步实现:所述的网页页面定位识别方法,其中,所述步骤(4)采用以下方式确定中间检测列表与监听到的当前用户视线聚焦区域相重叠:A.将中间检测列表中的元素在网页中的坐标、宽度、高度构成一个矩形区域;B.设定当前用户视线聚焦区域与A中元素矩形区域中心的水平间距为L,竖直间距为L’;视线聚焦区域与元素对角相切时,两者中心的水平间距为U,两者中心的竖直间距V ;C.当IXLtl且L’ <L0?时,判定用户视线聚集区域与网页元素相碰撞,即两者重叠。所述的网页页面定位识别方法,其中,判定用户视线聚集区域与网页元素相碰撞后,对于图片和文字元素,获取其在网页中的绝对坐标,将其转化为相对坐标后,与图片/文字元素以及各自的元素ID形成最终图文输出列表;对于音/视频元素,获取当前时间并与网页元素中的音/视频元素及其对应的元素ID共同形成最终音/视频输出列表。所述的网页页面定位识别方法,其中,所述用户视线聚焦区域的相对纵坐标以下列公式(I)计算获得:H3= H !+H0-H2,(I)其中,Htl为垂直滚动/滑动时被滚动网页的顶端到屏幕最上部的高度,H1为用户视线聚焦区域距离屏幕上方的高度,4为与用户视线聚焦区域相碰撞的网页元素顶部到被滚动/滑动网页最上部的高度,H3为用户视线聚焦区域的相对重叠元素的纵坐标;所述用户视线聚焦区域的相对横坐标以下列公式(2)计算获得:W3= W !+W0-W2(2)其中,Wtl为水平滚动/滑动时被滚动网页的最左端到屏幕最左侧的长度,W i为用户视线聚焦区域距离屏幕左侧的长度,W2为与用户视线聚焦区域相碰撞的网页元素左侧到被滚动/滑动网页左侧的长度,W3为用户视线聚焦区域的相对重叠元素的纵坐标。所述的网页页面定位识别方法,其中,设定与用户视线聚焦区域相碰撞的网页元素的当前高度为H,当前宽度为W,先将用户视线聚焦区域的相对坐标转换为其相对于网页元素的百分比坐标(X,Y),再与图片/文字元素以及各自的元素ID形成最终图文输出列表,所述用户视线聚焦区域的百分比坐标(X,Y)通过下列公式(3)和(4)计算获得:Y = H3/H*100(3)X = ff3/ff*100(4)。所述的网页页面定位识别方法,其中,所述步骤(I)中用户视线聚焦区域由人为设定,或者由鼠标/眼球追踪器等输入设备实时设定或传入;所述步骤(2)中识别网页元素类型先检查接收到的网页元素是否已经存在标记,且标记中能够提取出类型信息,如是,跳过判断,如否,通过该元素的HTML标签、所加载的文件路径、扩展名或content-type头来判断类型;所述步骤(3)中唯一身份识别的元素ID通过如下方式标记:接收识别完类型的网页元素,检查该元素是否存在标记且标记中能够提取出唯一身份识别标识符,若是,将其类型与唯一身份识别标识符组合标记到元素上,记做元素ID ;如否,按网页元素传送的先后顺序或日期时间生成元素唯一身份识别标识符并与其类型组合标记到元素上,记做元素ID0本专利技术还提供了一种网页页面定位识别系统,包括初始化模块、类型识别模块、标记模块、碰撞检测模块、坐标转换模块和输入输出接口,其中,初始化模块,用以监听当前用户对指定网页/网页中的某一区域的滚动或滑动操作,遍历提取指定网页/网页中的某一区域中的全部网页元素,生成初始化检测列表,设定屏幕上的某一区域为用户视线聚焦区域;类型识别模块,用以接收初始化化模块提取的全部网页元素,判断网页元素类型,去除广告和噪音元素,将图片、文字及音/视频网页元素及元素类型提交给标记模块;标记模块,本文档来自技高网...
【技术保护点】
一种网页页面定位识别方法,其特征在于:包括如下步骤:(1)网页元素初始化:遍历网页或指定网页上的某一区域中的全部网页元素,生成初始化检测列表,创建对该网页或指定网页上的某一区域被滚动/滑动的监听,设定屏幕上的某一区域为用户视线聚焦区域;(2)识别网页元素类型:遍历初始化检测列表中的网页元素,判断其类型,去除广告和噪音元素;(3)生成中间检测列表:将识别完类型的网页元素分别以唯一身份识别的元素ID标记,并将标记后的网页元素生成中间检测列表;(4)碰撞检测:随着网页滚动/滑动,实时将中间检测列表的元素与监听到的当前用户视线聚焦区域进行碰撞检测,判断重叠的元素,若重叠元素为图片/文字,则输出其ID标记、用户视线聚焦在图片/文字上的位置,若重叠元素为音/视频,则输出其ID标记、用户当前观看到的音/视频时间,生成最终输出列表。
【技术特征摘要】
【专利技术属性】
技术研发人员:吴小宇,
申请(专利权)人:吴小宇,
类型:发明
国别省市:山西;14
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。