本发明专利技术公开了一种基于社交评论的酒店竞争力评价方法,本发明专利技术将竞争力评价问题表示成一个子空间检测问题,而整体的技术方案能分为四个步骤:S1.从多个旅游网站和不同的软件平台上获取酒店的客户评论以形成关于该酒店的评论数据集;S2.将某一酒店的评论数据集映射成所对应的酒店特征以进行评分;S3.在获取了多个酒店的评论数据集并对其评分后,根据规则来构建竞争力评价酒店集合;S4.使用核密度估计算法来确定目标酒店在酒店集合中的酒店特征空间里,其最具竞争力的特征子空间,从而给出目标酒店的酒店竞争力。本发明专利技术是以酒店客户的评论来作为基础,在经算法转换得出可作为比对的数据后,供酒店管理者了解自身与他人的差异,以精益求精。以精益求精。以精益求精。
【技术实现步骤摘要】
一种基于社交评论的酒店竞争力评价方法
[0001]本专利技术涉及产业分析
,尤其涉及一种基于社交评论的酒店竞争力评价方法,适用于同类型酒店或不同类型酒店之间的竞争力评价方法、装置及计算机刻度存储介质。
技术介绍
[0002]旅游产业是世界上发展最快的新兴产业之一,是国民经济中第三产业的重要组成部分,被誉为“朝阳产业”,其中作为重要环节的酒店是旅游产业的三大支柱之一,旅游业的蓬勃发展也带动了酒店数量的与日俱增。
[0003]据携程网站2019年的数据显示,北京市、上海市、广州市的酒店数量近1万家,同一区域内酒店存在数量过多会导致竞争异常激烈,在如此高竞争的环境下,对酒店行业的发展也产生了一定冲击,而酒店行业则需要识别并不断提升自身的竞争力才能应对强而有力的竞争环境。如果一家酒店了解其自身的竞争力,那么该酒店就可以根据竞争力制定有效的营销策略,以吸引更多旅客入店,提高其业务量。
[0004]关于竞争力评价,在过去的十几年里因其所潜在的商业和应用价值吸引了许多研究者的关注,其中传统的酒店竞争力评价是采取定性与定量分析相结合的方法,主要的评价算法有层次分析法、因子分析法、主成分分析法、SWOT分析法和熵值法等。传统评价算法大多基于酒店从业人员角度,研究数据源于调查问卷、酒店内部资料或统计年鉴数据,研究目标亦主要集中在确定影响酒店竞争力的决定特征,属于自顶向下来制定诸如品牌、距离、客户满意度等评价的特征和规则。这些评估方法大多来源于某个或少数几个酒店数据,而且以酒店的业绩结果来反推其竞争力的决定特征,是不具有泛化性的,无法推广给更多的酒店进行竞争力评估。
[0005]随着现代社交网络及移动端等Web 2.0技术的发展,可让我们以旅客的视角在网络平台上对所住的酒店分享自己的感受并进行评分和评价。而基于旅客的评分和评论,除了可帮助酒店管理者改进不足之处以提高旅客的满意度,还能更好地了解自家酒店与其他酒店的不同之处,且在线评论还会成为其它旅客选择酒店的重要参考,不同群体的旅客对酒店的功能考虑各不相同。了解了这些差异以后,可以让酒店管理者为这些不同的需求做好准备,以提高酒店竞争力,也能有助于旅客对酒店进行选择。所以,相关的评分和评价能成为酒店竞争力评估的一种重要数据源,能供研究人员更好地了解客户的体验和期望,从而制定更好的商业策略来提高酒店的竞争力。
[0006]但目前基于评论的酒店竞争力算法大多是使用酒店特征中评分最高的来作为酒店的竞争力,然而,当存在多家评分或评价相似的酒店时,这类算法是无法有效识别他们之间的不同竞争力,且无法对评分或评价差别巨大的不同类型酒店之间的竞争力进行有效识别。例如,廉价酒店在很多特征上没有商务酒店或者奢侈酒店的评分高,但是其性价比、位置等可能是其独特的优势,可以吸引潜在的非商务酒店旅客。
[0007]所以酒店竞争力的评价有助于酒店适应时代发展需求,可帮助酒店在激烈的竞争
环境中实现效益的最大化,但由于现有的竞争力评价算法在现实场景上无法对相同类型和不同类型的酒店竞争力进行识别,且旅客的群体具有多样性和个性化的特点,所以很难在实际复杂的现实环境中使用现有的酒店竞争力评价算法来得到竞争力特征,进而导致酒店不能有效地吸引到目标客户群体。
[0008]因此本专利技术提出一种基于社交评论的机器学习方法来识别酒店的独特特征以作为酒店的竞争力。
技术实现思路
[0009]了解决上述问题,本专利技术提供一种基于社交评论的酒店竞争力评价方法,目的是提出一种贴近实际应用的酒店竞争力算法。
[0010]为了实现上述目的,本专利技术采用了如下技术方案:
[0011]一种基于社交评论的酒店竞争力评价方法,其特征在于,包括以下步骤:
[0012]S1.从多个旅游网站和不同的软件平台上获取酒店的客户评论以形成关于该酒店的评论数据集;
[0013]S2.将某一酒店的评论数据集映射成所对应的酒店特征以进行评分;
[0014]S3.在获取多个酒店的评论数据集并对其评分后,根据规则来构建竞争力评价酒店集合;
[0015]S4.使用核密度估计算法来确定目标酒店在酒店集合中的酒店特征空间里,其最具竞争力的特征子空间,从而给出目标酒店的酒店竞争力;
[0016]所述目标酒店可记为h0,要与之对比的酒店集合中的n个酒店则能记为G={h1,h2,
…
,h
n
},而多个酒店特征所组成的酒店特征空间便可通过X={x1,x2,
…
,x
m
}来表示;
[0017]酒店竞争力的识别是要从酒店特征空间X中识别出特征子空间使得目标酒店h0与酒店集合G中的其他酒店均在特征子空间X
s
上。
[0018]优选的,所述评论数据集是通过网络爬虫在获取某一酒店的客户评论文本时构建而成的。
[0019]优选的,所述网络爬虫能从客户评论文本中提取关键词或酒店特征词以进一步映射成酒店特征。
[0020]优选的,所述酒店特征包括酒店位置、酒店品牌、酒店设施、房间整洁度、房间舒适度、酒店服务。
[0021]优选的,所述酒店特征X
m
的评分是使用模板匹配从评论文本中所提取的酒店特征词以及与其对应的情感词后形成酒店特征情感词对,然后根据设立的情感词典来量化当中的情感词。
[0022]优选的,所述酒店特征情感词对在量化后使用Yeo
‑
Johnson变换算法对数据进行处理。
[0023]优选的,所述情感词典量化的规则是:
[0024]积极情绪的情感词量化为四分,若带有加重语气的副词则量化为五分;
[0025]中性词或评论中没出现对应的酒店特征评论,则量化为三分;
[0026]消极情绪的情感词量化为两分,若带有加重语气的副词则量化为一分。
[0027]优选的,所述目标酒店h0通过概率密度公式来衡量其在特征子空间X
s
的独特性。
[0028]优选的,所述概率密度公式中的K(
·
)是用于计算目标酒店h0与酒店集合G中的其他酒店在特征子空间X
s
中距离的核函数,其中核函数选用高斯函数。
[0029]优选的,为了在不同特征子空间X
s
进行比较,需要对所述概率密度公式中的进行归一化,而采用Z值对不同特征子空间X
s
的进行归一化的计算公式为:
[0030]优选的,所述概率密度公式中的B是特征子空间X
s
上的平滑向量,对于特征子空间X
s
中的某个特征X
j
,其平滑参数B
j
可通过下式子计算得到:
[0031][0032]优选的,所述式子中的σ
j
是目标酒店h0与酒店集合G中的其他酒店在特征X
j
上评分的标准方差,其中x
j[0.75n]和x
j[0.25n]分别表示评分的第三本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于社交评论的酒店竞争力评价方法,其特征在于,包括以下步骤:S1.从多个旅游网站和不同的软件平台上获取酒店的客户评论以形成关于该酒店的评论数据集;S2.将某一酒店的评论数据集映射成所对应的酒店特征以进行评分;S3.在获取多个酒店的评论数据集并对其评分后,根据规则来构建竞争力评价酒店集合;S4.使用核密度估计算法来确定目标酒店在酒店集合中的酒店特征空间里,其最具竞争力的特征子空间,从而给出目标酒店的酒店竞争力;所述目标酒店可记为h0,要与之对比的酒店集合中的n个酒店则能记为G={h1,h2,
…
,h
n
},而多个酒店特征所组成的酒店特征空间便可通过X={x1,x2,
…
,x
m
}来表示;酒店竞争力的识别是要从酒店特征空间X中识别出特征子空间使得目标酒店h0与酒店集合G中的其他酒店均在特征子空间X
s
上。2.根据权利要求1所述的一种基于社交评论的酒店竞争力评价方法,其特征在于,所述酒店特征X
m
的评分是使用模板匹配从评论文本中所提取的酒店特征词以及与其对应的情感词后形成酒店特征情感词对,然后根据设立的情感词典来量化当中的情感词。3.根据权利要求2所述的一种基于社交评论的酒店竞争力评价方法,其特征在于,所述情感词典量化的规则是:积极情绪的情感词量化为四分,若带有加重语气的副词则量化为五分;中性词或评论中没出现对应的酒店特征评论,则量化为三分;消极情绪的情感词量化为两分,若带有加重语气的副词则量化为一分。4.根据权利要求1所述的一种基于社交评论的酒店竞争力评价方法,其特征在于,所述目标酒店h0通过概率密度公式来衡量其在特征子空间X
s
的独特性。5.根据权利要求4所述的一种基于社交评论的酒...
【专利技术属性】
技术研发人员:易锋,
申请(专利权)人:电子科技大学中山学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。