作品赏析
基于百度指数的广西旅游网络关注度
时空特征研究
(节选)
摘要
采用季节性(时间)强度指数、高峰指数、地理集中指数、变异系数、基尼系数、周内分布偏度系数、赫芬达尔-赫希曼指数、相关系数及SWOT战略矩阵模型,分析研究了广西旅游网络关注度的时空分布特征。结果表明:①年际变化呈现出先升后降的发展趋势;年度中各月的变化总体上趋于平缓并表现为“宝盖头结构、小高峰穿插”的形状,“中间旺平期长、两头淡季期短”;网络关注度的时间分配比较均匀,时间差异较小但集中于年中某些月份;月份网络关注度的变化差异程度和聚集程度都处于不显著的水平状态;全年的周时段网络关注度偏向集中分布在周后期,“十一”国庆假期及其前后的网络关注度偏向集中分布在假期前期。②关注度较高的省区主要分布在华南、华北、西南、华东地区,网民来源趋于分散多元化且空间差异较大;人口规模和经济发展水平是决定网络关注度和市场潜力最为稳定的关键因素;旅游客源市场营销战略分为扩张型、先稳定后发展型、多种经营、紧缩。
1研究现状
第46次《中国互联网络发展状况统计报告》的主要数据显示,我国网民的数量规模截至2020年6月已经达到9.40亿人,与2020年3月相比增长了3625万人,互联网普及率提升了2.5个百分点,达到67.0%。数据表明,互联网作为获取和传播信息的便捷工具,已经成为网民生活需求与商业资讯交互作用的枢纽。在“互联网+旅游”的产业融合背景下,“百度”作为全球最大的中文搜索引擎,以其强大的网络搜索功能,为网民提供了丰富的旅游文字、图片、视频及行程参考信息,极大地提升了旅游决策的效果和旅游者的满意度。“百度指数(Baidu index)”是互联网时代最重要的数据分享平台之一,以海量网民搜索数据为基础,记录的旅游者需求特征、集中热点趋势、行为时空分布、搜索时间差异等模块数据具有实用的商业统计分析意义,体现了数据决策的生活方式。目前,国内学者将百度指数应用于旅游分析的研究主要表现在三个方面。①针对旅游景区:如孙晓蓓等对百度指数收录的我国64个A级旅游洞穴景区网络关注度的分布特征进行了研究;季国斌等基于百度指数探讨了西溪国家湿地公园网络关注度的时空特征与影响因素;许艳等利用百度指数数据共享平台获取乌镇景区网络搜索指数并结合区域经济差异测算指标研究分析了乌镇景区网络关注度的空间差异特征及其影响因素;方叶林等利用百度指数构建国家重点风景名胜区关注度网络结构特征并进一步分析了网络关注度与现实游客量之间“错位”特征及其影响机理等。②针对旅游目的地:如康俊锋等选取中国各省级行政区与上海市旅游相关的百度指数数据和上海市国内游客数据构建了旅游趋势预测模型;陆利军等以与湖南旅游目的地城市旅游活动密切相关的共计103个关键词的百度指数构建而成的网络关注度指数为分析数据对湖南旅游目的地城市的网络关注度及其空间格局进行了系统分析;秦梦等根据混频模型的建模理论分别构建基于百度指数周数据的单变量和多变量MIDAS模型并对三亚市月度旅游需求进行了预测;丁鑫等采用季节性集中指数、周内分布偏度指数和地理集中指数等指标研究了厦门市旅游网络关注度的时空分布特征等。③针对旅游业态:如曹咪等基于百度指数揭示了中国邮轮旅游网络关注度的空间分异特征并在此基础上运用地理探测器对其影响因子进行探测;舒丽等以百度指数为主要数据源对我国体育旅游网络关注度的时间、空间差异、人群结构及影响消费者选择体育旅游的因素进行了探索分析;何小芊等基于百度指数研究了我国温泉旅游网络关注度的时空特征等。据《广西统计年鉴(2020)》的数据,广西2019年共接待国内游客86995万人次,国内旅游消费达9998.8亿元,A级旅游景区达557个,其中4A级以上景区为254个,占景区总数的45.6%,是国内重要的旅游目的地省区。鉴于利用百度指数研究广西整体旅游状况较少,在参考现有成果的基础上进行相关研究,旨在促进广西旅游市场营销策略优化,为广西旅游发展提供理论与实践支撑。
2 数据来源与研究方法
2.1
数据来源
百度指数(https://index.baidu.com/)是关键词在互联网上不同时间段内搜索量变化过程最直观的反映。基于百度指数搜索平台,时间段设定为“十三五”时期的2016年1月1日至2020年的12月31日,分别以“广西旅游+旅游景区+旅游线路”、“广西旅游+旅游景区+旅游攻略”及“广西旅游”为关键词进行搜索,以此得到搜索指数数据,即“网络关注度”。因“广西旅游+旅游景区+旅游线路”的网络关注度较高(表1),本次研究将以其搜索到的数据指数作为计算分析的观测值。
表1 基于百度指数平台搜索三种关键词的网络关注度整体日均值对比
2.2
研究方法
旅游需求一般情况下呈现出两个显著特点:一是需求随着时间的变化而出现变化,二是每一个目的地都有相对稳定的客源地,从数量上度量旅游需求的时间变化及空间分布,对旅游规划和经营决策是很有帮助的,网络关注度在一定程度上反映了旅游需求的量化情况.围绕时空特征两个角度,引入旅游地理学的有关旅游需求的度量概念,相应的研究方法如下:
①季节性强度指数。旅游需求的时间分布集中性是由旅游的季节性引起的,可以用季节性强度指数R来定量测度,计算公式为:
(1)
公式(1)中,R表示季节性强度指数,xi表示各月网络关注度的整体日均值占全年的比重,R越接近于0则表示网络关注度的时间分配越均匀,反之则说明网络关注度的时间分配变动越大,时间差异越大。
②高峰指数。高峰指数度量的是某一时期相对于其它时期利用网络关注某旅游目的地的趋势,计算公式为:
(2)
公式(2)中,Pn表示高峰指数,V1表示网络关注度最高月份的数量,Vn表示第n个月的网络关注度,n为参照时段(1=最高峰时期),当网络关注度在所有月份都相同时,Pn等于0,当网络关注度集中于某些月份时,则Pn值会增大。
③地理集中指数。旅游需求的空间分布结构主要是指网络关注度的地理来源和强度,其集中性可以用地理集中指数来定量分析,计算公式为:
(3)
公式(3)中,G表示网络关注度来源地的地理集中指数,xi表示第i个来源地的网络关注度,T表示所有来源地的网络关注度总量,n表示网络关注度来源地的总数.当G值越接近于100时,网络关注度来源越少越集中,反之则越多越分散,G值的取值范围为0至100。
④变异系数。变异系数衡量的是一组数据的变化程度,即其标准差与平均数的比值,计算公式为:
(4)
公式(4)中,CV表示变异系数,xi表示第i个月的网络关注度,表示月份网络关注度的平均值,CV越大说明月份网络关注度的变化差异程度越大,反之越小,公式中的分子值即为标准差。
⑤基尼系数。基尼系数反映的是网络关注度来源地的空间差异特征,其值越小差异越小,反之越大,取值范围为0至1,计算公式为:
(5)
公式(5)中,Gn表示基尼系数,n表示国内31个省级地理单元(不含港澳台地区)的数量,表示所有省区网络关注度的均值,y1,y2,y3,…,yn分别表示网络关注度由大到小排序的各省区的数量。
⑥周内分布偏度系数。周内分布偏度系数用于测度旅游目的地的网络关注度在周时段内的集中分布状况,计算公式为:
(6)
公式(6)中,T表示周内分布偏度系数,Pi表示周内第i日网络关注度与周网络关注度总数的百分比,若T小于0,说明网络关注度偏向集中分布在周前期,若大于0说明网络关注度偏向集中分布在周后期,等于0则说明网络关注度周内分布均匀。
⑦赫芬达尔-赫希曼指数。赫芬达尔-赫希曼指数反映了网络关注度的聚集程度,取值范围为0至1,其值越小则表明网络关注度的集中程度越低,反之越高,计算公式为:
(7)
公式(7)中,Hn表示赫芬达尔-赫希曼指数,Pi表示各月的网络关注度占总数的比值。
⑧相关系数。相关分析的目的是揭示两个要素之间相互关系的密切程度。因网络关注度与影响旅游需求的要素具有某种程度的相关性,可以通过相关系数的计算与检验来判定。对于两个要素x与y,如果它们的样本值分别为xi与yi(i=1,2,…,n),则两者之间的相关系数被定义为:
(8)
在公式(8)中,rxy表示要素x与y的相关系数,取值范围是[-1,1],当其大于0时表明两个要素同向相关,即正相关,当其小于0时说明两个要素异向相关,即负相关,其绝对值越趋近于1则说明两个要素的相关性越强,其绝对值等于0时表明两个要素不相关、等于1时完全相关。
5 结论与讨论
5.1 结论
本次研究以从时间和空间两个维度出发,利用百度指数平台搜索的2016—2020年广西旅游网络关注度及《中国统计年鉴2020》的相关数据,采用综合研究方法分析研究了广西旅游网络关注度的时空分布特征与演变规律,结论如下。①时间差异特征方面:年际变化呈现出先升后降的发展趋势,关注群体中以青壮年为主,女性多于男性;1~12月各月的变化总体上趋于平缓并表现为“宝盖头结构、小高峰穿插”的形状,“中间旺平期长、两头淡季期短”;季节性强度指数处在较低水平,网络关注度的时间分配比较均匀,时间差异较小;高峰指数较大,网络关注度集中于某些月份;变异系数和赫芬达尔-赫希曼指数的值都很小,月份网络关注度的变化差异程度和聚集程度都处于不显著的水平状态;全年的周时段网络关注度偏向集中分布在周后期,“十一”国庆假期及其前后的网络关注度偏向集中分布在假期前期.②空间差异特征方面:广西旅游网络关注度较高的省区主要分布在华南、华北、西南、华东地区,网民来源趋于分散多元化;地理集中指数年际变化微小,维持在稳定的水平线上且处于比较低的水平,网络关注度来源地多而分散;基尼系数的变动情况与地理集中指数的特征相似,但基尼系数处于比较高的水平,网络关注度来源地的空间差异较大,比较有利于广西旅游市场的发展;影响因素的相关分析表明,人口规模和经济发展水平是决定网络关注度和市场潜力最为稳定的关键因素;网络关注度客源地的市场营销战略可以分为4种类型,即扩张型战略(一级重点市场)、先稳定后发展型战略(二级潜在市场)、多种经营战略(三级机会市场)、紧缩型战略(四级边缘市场)
5.2 讨论
①旅游网络关注度的数据反映了潜在的旅游需求大小,属于行为倾向性的范畴,但根据著名心理学家科特·勒温(Kurt Lewin)的观点,行为是人的特性与所处环境共同作用的函数,因此也可以认为旅游网络关注度是潜在客源在闲暇时间和经济收入等条件得到满足的前提下旅游动机最直接的网上证明,从这个角度而言,旅游网络关注度的分析研究是具有统计学意义和实践指导价值的。②本次研究探讨了“十三五”期间近五年时段的全国对广西旅游整体的网络关注度时空变化特征,从省区旅游目的地的角度提出关于市场营销的对策战略及划分依据,对于旅游景区、旅游产业、旅游城市等方面的具体研究仍需要进一步地深入挖掘,以不断丰富相关主题的研究内容。③值得思考的是,对广西旅游网络关注度较低的省区中,一部分集中分布在交通距离较远且经济发展较为后进的东北和西北地区,旅游成本因素可能降低了潜在客源的旅游需求,而另一部分则是分布在广西周边,原因则很有可能是旅游资源的同质性,存在一定程度的竞争替代关系.因此,只有充分依托广西得天独厚的气候优势,创新发展旅游产业,打造旅游产品品牌,才能赢得更多的旅游客源市场。
文章来源:《数学的实践与认识》2021年第16期
黄荣娟
黄荣娟,女,广西酒店行业专家库专家,高级经济师、副教授、河池学院旅游管理专业教师,主要讲授课程为饭店管理、餐饮服务与管理、前厅客房服务与管理,主要研究领域为旅游经济、旅游企业管理。著有专著《广西旅游产业差异演变与区域耦合协调发展关系研究》、教材《饭店经营管理》;主持或参与课题8项并发表多篇论文;获得2014年广西壮族自治区第十三次社会科学优秀成果奖三等奖、2017年河池市第二次社会科学优秀成果奖二等奖、2017年第六届广西社会科学学术年会论文三等奖、2017年第十九期广西发展论坛论文三等奖、2019年河池市第三次社会科学优秀成果奖二等奖、2019年第八届广西青年学术年会论文二等奖、2020年河池市第四次社会科学优秀成果奖二等奖和三等奖等荣誉、2022年获河池市第五次社会科学优秀成果二等奖。
HOTEL THINK TANK
酒店智库
联系人:秘书处
版权所有:广西酒店管理学会、广西亚太酒店管理研究院 地址:广西壮族自治区南宁市青秀区教育路6号 电话:0771-5503760/5503769 邮箱:362032276@qq.com
扫码关注公众号