本发明专利技术公开了一种基于用户心智模型的网站分类优化分析方法。该方法首先对网站日志数据进行预处理,所述日志数据是包含用户基于对网站分类目录的认知而提交的关于网站分类目录优化的概念的数据,通过预处理从日志数据中提取出概念;然后利用用户心智模型分类理论,确定其与网站分类目录中的概念之间的共现关系,所述概念是指网站分类目录具体名称,例如图书、生活用品;之后将共现关系转换为共现矩阵;再利用pearson系数算法将共现矩阵转换为相似性矩阵;最后进行聚类分析和多维尺度分析,以分析用户关于网站分类目录认知的概念间的相似性和空间性。利用上述六个步骤就可基于网站用户心智模型,从定量角度为网站分类优化提供决策支持。
【技术实现步骤摘要】
本专利技术涉及一种网站分类优化分析方法,特别是。
技术介绍
网站信息分类体系优化是在评估网站已有信息分类体系的基础上,决定是否需要调整网站已有信息分类体系,若需要调整则确定如何调整。目前针对网站信息分类体系优化方法的研究还很欠缺,主要集中在分类依据、标准、原则等理论研究和分类的层次、粒度等具体问题现象的研究上,还仅仅关注于从已有的分类方法中找缺陷,较少有研究在一定的理论方法的支持下进行深层次的探索。Norman在他的《The Design ofEveryday Things)) 一书中首次提出了交互设计中存在3种心智模型,即表现模型、用户心智模型、系统模型,他认为表现模型和用户心智模型越接近时,用户更能理解网站组织结构,能更高效地进行信息获取。因此在进行网站信息分类体系优化时应该尽量考查用户的心智模型,即用户对网站分类体系的认知。在网站用户的心智模型测量中,心理近似数据是由个体感知的概念之间关系的主观评估,其中“相似性”、“空间性”是主要测量角度。心智模型的定量测量大多都是以概念相似性为出发点,提取研究主题中的相关概念,采用不同的分类方法设计实验,获取被试对概念的相似性评估数据,对数据进行分析,表征用户关于相关研究主题的心智模型。聚类分析通常就是用来处理概念相似性数据,依据概念相似性将概念进行分类。而概念的空间性是指不同的概念在被试心理空间中的相对位置(Rusbult C. E, Onizuka R. K, Lipkus I. What Do We Really Want :MentalModels of Ideal Romantic Involvement Explored through Multidimensional Scaling. Journal ofExperimental Social Psychology, 1993,29(9) :493_527),多维尺度法可用于概念空间性的测量,得到用户关于概念的空间表征,直观地观察用户关于某一领域概念的心智模型。而当前将两者结合起来用于网站分类目录优化中用户心智模型测量的研究还没有。当前对网站用户的研究还都是停留在传统的用户调研阶段,采用的用户调研方式主要包括场景法、焦点小组、可用性测试、深度访谈、观察法等,但是这些方法都存在局限性,能够获取到的有效数据十分有限,耗费成本高且采用这些方式进行用户调查时,涉及问题不能太多,因此获得信息太宏观,很难获得对用户行为研究真正有用的细节信息。因此网站分类体系优化方法还是存在一些问题(1)很难进行有效的用户研究, 很难全面地搜集用户对网站的认知;(2)很少“以用户为中心”进行网站分类体系优化。
技术实现思路
本专利技术所解决的技术问题在于提供。实现本专利技术目的的技术解决方案为,步骤如下步骤I、对网站日志数据进行预处理,具体为步骤1-1、对网站日志数据进行净化,删除日志文件中与分析目的无关或存在错误的数据,所述与分析目的无关的数据包括包含分类目录中概念的数据、包含产品用代码表示的数据;所述存在错误的数据包括拼写错误、产品描述错误;之后选择数据处理中需要的属性,所述属性包括用户名称、用户地域、用户认知概念、产品类别,所述的用户认知概念为用户基于对网站分类目录的认知而提交的关于网站分类目录优化的概念;步骤1-2、对步骤1-1中净化过的数据进行格式转化,将提取的用户认知概念及地域、名称三个属性的格式进行统一,具体为去除编号、大小写统一、单复数统一;步骤1-3、确定用户认知概念出现的频次,之后设定阈值,阈值根据实际数据量及提取用户认知概念数量确定,选取频次大于该阈值的用户认知概念,并记录频次;步骤2、确定用户认知概念与网站分类目录中的概念是否共现,具体是利用心智模型分类理论,将用户认知概念作为检索关键词到网站进行检索,统计检索结果中出现的分类目录中的概念及频次;步骤3、生成共现矩阵,所述共现矩阵为对称矩阵,第一行和第一列为概念,包括用户认知概念和网站分类目录中的概念,其余单元格均为概念间的共现频次,具体为单元格对应的第一行和第一列中概念间的共现频次;步骤4、在步骤3中共现矩阵的基础上生成相似度矩阵;步骤5、在步骤4的基础上进行聚类分析,具体利用谱系聚类法对相似度矩阵进行聚类,之后根据聚类的统计量,确定概念的聚类结果,所述概念包括提取的用户认知概念和网站分类目录中的概念;步骤6、利用多维尺度分析对步骤4中的相似度矩阵进行分析,得到相应维数的多维尺度分析空间图,从而完成网站分类优化分析。本专利技术与现有技术相比,其显著优点为(1)本专利技术直接利用网站日志数据进行用户研究,节约用户调研的成本,可以全面的获取用户信息;(2)采用定量计算方法,结果准确,分析得到的最终结果可直接为网站分类体系优化提供依据;(3)聚类分析和多维尺度分析两者展现用户心智模型的两个关键点“相似性”和“空间性”,且两者的分析结果可相互验证,直观地展现可视化结果。下面结合附图对本专利技术作进一步详细描述。附图说明图I是本专利技术的基于用户心智模型的网站分类优化分析方法流程图。图2是二级分类目录中概念与自定义组名聚类树。图3是二级分类目录中概念与自定义组名的多维尺度分析空间图。具体实施方式,步骤如下步骤I、对网站日志数据进行预处理,具体为步骤1-1、对网站日志数据进行净化,删除日志文件中与分析目的无关或存在错误的数据,所述与分析目的无关的数据包括包含分类目录中概念的数据、包含产品用代码表示的数据;所述存在错误的数据包括拼写错误、产品描述错误;之后选择数据处理中需要的属性,所述属性包括用户名称、用户地域、用户认知概念、产品类别,所述的用户认知概念为用户基于对网站分类目录的认知而提交的关于网站分类目录优化的概念,即用户利用网站分类目录进行浏览时,找不到最合适的概念时,在网站交互界面提交的自己认为更合适的概念;例如用户在卓越网上利用分类目录查找数据挖掘的书籍,发现该类书籍属于分类目录“数据库”类别,认为这样不合适,用户认为数据挖掘应该直接出现在分类目录类别中, 这时“数据挖掘”就是所述的用户认知概念。步骤1-2、对步骤1-1中净化过的数据进行格式转化,将提取的用户认知概念及地域、名称三个属性的格式进行统一,具体为去除编号、大小写统一、单复数统一;步骤1-3、确定用户认知概念出现的频次,之后设定阈值,阈值根据实际数据量及提取用户认知概念数量确定,例如,在实际数据量和用户认知概念数量均较小的情况下,为了获取一定的数据量,可设定较小的阈值。选取频次大于该阈值的用户认知概念,并记录频次;步骤2、确定用户认知概念与网站分类目录中的概念是否共现,具体是利用心智模型分类理论,将用户认知概念作为检索关键词到网站进行检索,统计检索结果中出现的分类目录中的概念及频次;根据心智模型分类理论,用户在网站利用分类目录进行信息获取时,主要采用水平、垂直和水平垂直均等的点击方式,点击过程中根据分类目录中概念间的相关性,选择相关性高的概念进行点击,利用这一原理,将用户认知概念作为检索关键词到网站进行检索, 统计检索结果中出现的分类目录中的概念及其频次,以分析用户认知概念与网站分类目录中概念间的相关性。心智模型分类理论是Charles Cole, Yang Lin等人通过实验发现人的心智模型最常见的三种是垂本文档来自技高网...
【技术保护点】
一种基于用户心智模型的网站分类优化分析方法,其特征在于,步骤如下:步骤1、对网站日志数据进行预处理,具体为:步骤1?1、对网站日志数据进行净化,删除日志文件中与分析目的无关或存在错误的数据,所述与分析目的无关的数据包括:包含分类目录中概念的数据、包含产品用代码表示的数据;所述存在错误的数据包括:拼写错误、产品描述错误;之后选择数据处理中需要的属性,所述属性包括用户名称、用户地域、用户认知概念、产品类别,所述的用户认知概念为用户基于对网站分类目录的认知而提交的关于网站分类目录优化的概念;步骤1?2、对步骤1?1中净化过的数据进行格式转化,将提取的用户认知概念及地域、名称三个属性的格式进行统一,具体为去除编号、大小写统一、单复数统一;步骤1?3、确定用户认知概念出现的频次,之后设定阈值,选取频次大于该阈值的用户认知概念,并记录频次;步骤2、确定用户认知概念与网站分类目录中的概念是否共现,具体是利用心智模型分类理论,将用户认知概念作为检索关键词到网站进行检索,统计检索结果中出现的分类目录中的概念及频次;步骤3、生成共现矩阵,所述共现矩阵为对称矩阵,第一行和第一列为概念,包括用户认知概念和网站分类目录中的概念,其余单元格均为概念间的共现频次,具体为单元格对应的第一行和第一列中概念间的共现频次;步骤4、在步骤3中共现矩阵的基础上生成相似度矩阵;步骤5、在步骤4的基础上进行聚类分析,具体利用谱系聚类法对相似度矩阵进行聚类,之后根据聚类的统计量,确定概念的聚类结果,所述概念包括提取的用户认知概念和网站分类目录中的概念;步骤6、利用多维尺度分析对步骤4中的相似度矩阵进行分析,得到相应维数的多维尺度分析空间图,从而完成网站分类优化分析。...
【技术特征摘要】
【专利技术属性】
技术研发人员:吴鹏,张佩佩,
申请(专利权)人:南京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。