旅游大数据采集及分析项目Tourismdataacquisitionandanalysisproject全维度,开启旅游大数据时代游行前行中行中行中行后行后思维的改变关联创造价值Bigadata海量游客数据游客统计数据数据与数据关联线上与线下关联需求与行动关联产品与区域关联7全面的游客信息洞察、行为跟踪10合作伙伴:百度413百度在游客行为跟踪领域领先行业每日60亿次定位数据线上购物行为数据线上社交行为数据移动端下载APP行为数据其他20多个产品线数据14百度既拥有大数据也具备大数据分析能力拥有大数据具备大数据能力BAIDUIBM银行电信保险OracleSAPGoogleAmazonSplunkSalesforce传统企业软件厂商互联网厂商传统企业PrincelineQunar跨界创新企业合作、渗透、创新创新升级学习Microsoft强弱弱强15百度在数据采集和应用方面经验丰富数据能力应用互联网移动互联网InternetofEverything可穿戴设备摄像头图片信息化交易记录行为记录地理信息语音图像设备状态BigtableHadoopDeepLearning图像识别语音识别大规模分布式存储与计算自然语言理解知识发现MachineLearning搜索翻译广告预测公共安全智慧生活智慧城市智慧家庭新医疗新教育个性化推荐智能制造新商业文字8数据服务:旅游预测城市旅游热度预测模型准确性超过90%旅游预测助力出游景点拥挤度预测17数据服务:游客人群属性分布模型准确性超过90%游客地域分布热力图黄金眼游客人群属性分析,优化经营策略游客属性:兴趣、职业、年龄段分布等精确到地级市线下广告18数据服务:景点游客分布数据模型准确性超过90%服务区选址景区规划道路修建节目演出时间减少拥挤利于生态保护3.5W游客珙桐:4000人3W游客景点游客分布数据高效整合资源,优化景区设施19中智游在数据领域的合作伙伴国内数据合作伙伴国外数据合作伙伴百度谷歌同程GFK中青旅CNBC去哪儿中国国家旅游局南方航空集奥(GEO)26需求分析大数据时代…………………………大数据的行业价值…………………数据研究潜力………………27随着互联网和数据时代的融合发展,游客行为数据分析领域迎来了发展高峰。据大数据中心统计,游客每次出行都要经过35-55次的互联网检索,游客行为数据被全程记录。互联网旅游大数据,从市场(游客、投资)角度真实的诠释了其行为轨迹,所以对旅游大数据的研究和分析,对区域旅游组织开展相关工作具有极高的指导价值。在消费者洞察,游客行为分析,品牌竞争力分析,营销策略与评估方面,能够给出最为精确的建议和指导。旅游大数据洞察14大数据的行业价值15科技推动,游客行为数据海量积累百度搜索“中秋节去哪里玩”。浏览去哪网,选择目的地在蚂蜂窝浏览青岛旅游攻略。在百度搜索“青岛旅游必去的景点”。在去哪儿网订购来回机票。在艺龙网预订奇青岛酒店。踏上中秋旅游的飞机,飞往青岛游玩。STARTEND结束旅行,回到温暖的家中。行为数据、搜索数据、产品交易数据等类型数据,清晰描绘游客出行全过程。30比“游客”更了解“游客”自由行用户性别均衡文化程度较高年龄20-35岁都市小白领收入5000到10000乐于网络分享、偏好摄影、户外小清新、文艺范、热爱新鲜事物跟团游用户女性稍多有家庭有子女年龄30-50岁三四线城市居多收入3000到8000多以家庭为单位出行、稳健安逸、喜欢购物、注重生活质量31旅游大数据研究的潜力18《大数据报告》开启大数据时代充分了解游客通过适当的方法和科技技术汇聚和分析数据,并且从中获取游客洞察,并且使用这些洞察力来重塑对游客体验。开启游客新互动纪元:•游客行为报告•旅游市场开发报告•媒体传播方案•旅游大数据体系构建提供个性服务利用对游客的了解,为游客提供个性化的服务;满足不同类型游客出行过程中的不同诉求,并创造市场价值。智能的旅游服务:•APP智能服务•派送礼物与惊喜•提供个性化游览体验产业决策支持检测产业运行状态,推动产业布局调整,产品创新,市场研究等综合策略,针对市场变化与优化提供策略指导。数据指导规划:•产业运行数据检测•旅游产品创新方案33服务方案数据方案…………………………研究方法……………………….研究报告………………………..数据接口服务……………………34数据方案总体思路数据源采集模式定位技术21总体思路:多元整合、关联分析、价值可视理论应用分析方法过滤、筛选、清理、整理旅游统计数据交通数据运营商数据酒店数据OTA数据旅行社数据网站数据垂直媒体数据综合媒体数据搜索数据百度LBS数据移动应用数据社交网络数据其他网络数据及其他社会化数据数据源:大数据来源旅游宏观经济数据旅游客源地数据游客消费行为数据国内入境大数据服务平台旅游游客信息数据整合多渠道的数据类型,结合传统数据和新兴媒体数据形成大数据服务平台模型,经过数据清理、过滤、筛选和整理,开展分析环节,结合多重分析方法以理论为基础,全面分析国内和入境旅游。可视化数据报告多元整合36数据来源:多维数据来源搜索引擎新媒体和移动数据旅游局及公开数据垂直旅游国内入境37多元数据来源,关联旅游不同价值点①数据来源渠道以互联网和移动互联网技术为主。②例如搜索引擎、LBS、社交媒体等;以旅游局和社会公开数据为补充渠道。垂直旅游百度LBS和GFK新媒体和移动旅游局和社会公开数据以往数据记录游客体验、评价和消费旅游信息、交易和预订来源、行为路径、到达方式游客基本信息、基本诉求搜索引擎38核心数据提供商——百度1000多台机器同时处理数据能力基于海量数据建立的分析模型每日60亿次游客定位数据39线上线下对应,建立一对一的数据分析UE码Cookies信息账户信息搜索倾向媒体倾向行为分析位置信息行为路径停留时间利用LBS游客定位信息,打通线上线下各环节,分析每位进入游客互联网诉求40采集方案:四种途径进行数据采集百度LBS百度大搜游客行为游客位置游客属性游客活动点游客兴趣媒体接触目的地诉求预订方式到达方式GFK机票邮轮旅游产品酒店国内入境调研旅游收入游客兴趣游客属性游客信息来皖原因消费数据采集方式采用新型互联网和物联技术结合传统调研方式进行。41数据采集技术:百度LBS跟踪识别游客地理位置百度地图定位SDK是利用设备当前的GPS信息(GPS定位),基站信息(基站定位)和Wi-Fi信息(Wi-Fi定位)完成定位的。百度地图Android定位SDK提供GPS,基站,Wi-Fi等多种定位方式,适用于室、内外多种定位场景,具有出色的定位性能:定位精度高、覆盖率广、网络定位请求流量小、定位速度快。混合定位反地理编码功能地理围栏借助GPS、基站、Wi-Fi和传感器信息,实现高精度的混合定位服务。提供把当前所处地点的位置坐标转换为详细地址描述信息的能力,支持省,市,区县的结构化地址描述。地理围栏服务提供基于位置的提醒服务,可实现当用户进入、离开或处在开发者设定的某个虚拟地理区域时,可自动接收相关提醒。基于游客应用需求,实现跨终端定位锁定。精确定位游客所处省域、城市、街道、建筑等坐标。实现游客移动位置的连续性跟踪。42数据采集技术:百度大搜,提供游客需求分析Spider是百度搜索引擎的一个自动程序。它的作用是访问互联网上的html网页(当然动态页面也可以抓取),建立索引数据库,使用户能在百度搜索引擎中搜索到您网站的网页、图片、视频等内容。中国是全球仅有的4个拥有搜索引擎核心技术的国家之一,而百度搜索引擎是开创者和领先者。蜘蛛互联网蜘蛛控制网络蜘蛛URL数据库URL提取链接信息提取文本索引网页数据库索引数据库链接数据库网页评级查询服务器用户43数据采集技术:综合数据采集平台平台全渠道消费者预订轨迹与消费者固定样组(提供更全面的行为、态度与属性信息)融合CivilAviationAuthorityOperatorsTravelAgentsAirlines&LCCOTACruiseHotelLivechannelforwardbookings实时预订信息来源及渠道3rdpartydatasources&marketextrapolation市场推总※第三方数据ConsumerInsights消费者洞察AOGflightdatabasePassengerShippingAssociationFinancialReportsIPSdataExpertiseSegments细分领域Package包团Cruise游轮Accomodation住宿Flight航空Ancillary其他配套44数据采集方式:综合调研数据采集对象确定研究目的确定数据采集类型设计调查方案确定信息获得方法设计数据获得工具设计抽样方案,确定样本辨别信息类型及可能来源现场实施--数据收集大数据平台录入现场实施--数据初步审核数据复核界定阶段设计阶段实施阶段数据整理阶段调研采集方式:个别访谈集体访谈文献法试点调查法(线上线下)问卷调查法45研究方法数据运算模型竞争力评估模型常用分析方法参考案例32旅游行业数据特征影响旅游人数的因素A景点B景点历史旅游人数整体水平趋势性季节性(周期性)……辅助因素or天气节假日……事件47数据运算模型基于大规模机器学习的时间序列预测模型——状态空间模型(SSG)各种因素旅游人数ttttttttttttQNxAxRNxCy,~,~001x5预测信息收集y51数据准备2模型参数训练34重复3448区域综合竞争力评估Image形象Product产品Culture文化Channel渠道Contribution贡献Experience体验形象:目的地形象推广及管理上优势和不足产品:核心旅游产品的交易量以及诉求程度文化:主要文化资源的游客认同与诉求程度渠道:区域在线旅游产品数量及交易情况贡献:旅游经济文化在区域内的贡献体验:游客满意度反馈及旅游服务评估IPCE区域旅游综合竞争力评估49常用分析方法:数值分析法省域旅游品牌关键词设定类别关键字样本量系数省域名称成都1×0.3品牌口号好玩四川1×1.5核心产品武侯祠等10×1要素产品火锅5×0.3OTA数据旅游产品5×2对比区域杭州广州厦门桂林三亚将旅游品牌进行数字化解读,研究各类数据指标的表现,形成综合评估;50常用分析方法:回归分析法回归分析法是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式。y=a+bxb=∑xy-n·∑x∑y/[∑x²-n·(∑x)²];a=∑y-b·∑x/n函数公式回归分析,解决不同两个旅游要素的关联性关系;如天气与游客,消费力与客源属性等;51常用分析方法:雷达图分析法“雷达图”分析法是旅游局对各方面核心数据(游客数据、消费理数据、核心产品消费情况等)和市场现状进行直观、形象的综合分析与评价的图形。0.0%10.0%20.0%30.0%40.0%50.0%60.0%70.0%风景秀丽避暑胜地轻松自在森林氧吧空气清新古代穿越感动心灵文化遗迹美食小吃无印象其他52常用分析方法:趋势分析法趋势图也叫走向图。它用来显示一定时间间隔(例如一天、一周或一个月)内所得到的测量结果。以测得的数量为纵轴,以时间为横轴绘成图形。趋势图分析法,有利于快速了解旅游经济和人数等随时间的变化趋势,同时结合事件可以可以判断某个区间内的影响力变化。53常用分析法:矩阵图分析法矩阵图法就是从多维问题的事件中,找出成对的因素,排列成矩阵图,然后根据矩阵图来分析问题,确定关键点的方法。矩阵图分析是一种通过多因素综合思考,探索问题的好方法从问题事项中,找出成对的因素群,分别排列成行和列,找出其间行与列的相关性或相关程度的大小的一种方法。54参考案例41典型案例:福建《福建省旅游营销专项规划》旅游营销专项规划是福建省旅游产业发展体系的重要组成部分,方案以大数据分析为依据,在市场分析、竞品分析、游客分析和目的地旅游竞争力等方面进行深度的分析,数据来自百度和旅游局信息化平台,以营销为战略手段,全面推动福建旅游的全面提速和转型升级。