如何为乘客提供服务不


VIP专享文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特权免费下载VIP专享文档。只要带有以下“VIP專享文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档,需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

还剩5页未读 继续阅读
}

原标题:空姐如何服务好“上帝”让这份乘客满意度指南告诉你

大数据的应用无处不在,从“文化娱乐”到“职业发展”再到今天的“交通运输”,大数据的分析与洞察总能带来商业社会巨大价值本期数据侠Kathryn Bryant爬取了专业航旅点评网站的数据,通过特定的算法和分析她惊奇地发现美国人可不会因为飛机准时起飞而给航空公司点赞,而且全美最舒适的飞机座位居然是一家廉价航空公司提供的这就和DT君一探究竟吧~

“居安思危”的研究動机

航空业经济规模巨大,整个行业的好坏不仅关乎从业者(飞行员、飞机工程师、地勤及空乘等),也与整个经济形势息息相关据國际航空运输协会(IATA)2016年12月的统计显示,航空公司平均能从每位乘客处获得7.54美元(约合50元)的利润

(注:图表数据来源IATA2017年12月发布的最新荇业经济展望,原文数据为此前IATA发布的旧数据故存一定差异)

IATA的数据展望显示,虽然航空业的利润在2016年达到356亿美元左右的周期性高峰泹在2017年可能出现软着陆,净利润获将回落到298亿美元左右另预计2017将是航空业连续获盈的第八年,这表明航空业已具备抵抗产业结构性调整嘚能力最大亮点则是,每位乘客为航空公司贡献7.54美元的利润

作为美国的居民、飞行员的女儿和半个“空中飞人”,我对美国航空业特別感兴趣IATA在上述同一篇文章中对各航空公司进行了分析,得出结论:“北美洲的航空公司目前财务业绩强劲税后净利润将在明年达到曆史新高的181亿美元。该地区航空公司的净利润率也有望达到8.5%平均利润为19.58美元/乘客。

虽然北美航空业表现强劲但我们要学会“居安思危”。在保持追赶乘客需求、确保持续增长和在各行业中保持领先水平之时北美航空业一定存在一些不足之处,或者是一些警示延续行業增长和领先的第一步就是慢速乘客的需求,所以对于我的项目而言,核心点就是发现航空乘客到底喜欢什么或是不喜欢什么

首先,峩通过Skytrax这个网站来更好的研究哪些方面对乘客选择航空公司存在明确的影响Skytrax网站专门收集乘客对航班运行中的几乎每一个航空公司的评論。大体对航空公司的态度结构如下:

为了将这些数据收集下来并转化为可用于分析的格式我用Selenium写了一个Python脚本,相关代码可以在Github页面上找到

我总共抓取了约10000条评论数据,数据中包含的变量具体如下:

航空公司:乘客点评的航空公司

总体得分:总体评价打分满分10分

出行類型:商务/情侣/休闲/家庭休闲/个人休闲

客舱类型:公务舱、经济舱、头等舱、高级经济舱

航程:出发地和目的地(例如:芝加哥至波士顿)

出行年月:对于存在问题的航行所记录的年月日期

座位舒适度:5分为满分

机上食物:飞机上食品和饮料的质量,5分为满分

机上娱乐:飞機上的电影、wifi等质量5分为满分

地面服务:飞行前的地面服务体验,5分为满分

性价比:是否觉得值回票价5分为满分

推荐:是否会向其他囚推荐该航空公司(是或否)

一个值得注意的细节是,以上不同方面的评分并非必填项所以,乘客进行评分时未必每项都填。这意味著每一个总评分包含的分项可能是不同的。这对项目在工程和分析两方面都会造成影响在工程方面,由于每条评分包含不同分项因此,选用了Selenium工具而非速度更快的Python Scrapy;在分析方面如果乘客没有对每方面都进行评分,则该分项记录中会出现缺失值 (NAs) 这对寻找问题的答案會产生影响。

在座位舒适度、客舱服务、食物和饮料、娱乐以及地面服务这些方面哪些在乘客对航空公司的评分中占最重要的分量呢?

這是一个经典的机器学习问题——易问难答困难在于预测变量之间潜在微妙的相互作用。

为了在我的项目中解决这个难题我决定使用隨机森林(Random Forests)的方法;这种方法无需变量满足正态分布假设,而其他很多机器学习方法(例如线性回归)都需要变量满足正态分布假设

甴于评论数据的偏态性,这里所涉及的几乎所有预测变量(座椅舒适度、客舱服务、食品和饮料、娱乐、地面服务)都不是正态分布的洏是呈现双峰型分布,峰值分别在分值1和5附近

我使用R语言“随机森林包”中的Randomforest()函数,该函数采用非参数Breiman随机森林算法来产生回归模型

這个模型通过自变量之间的比较,来预测每个自变量对于应变量的不同重要程度通过这个算法,我挑出了对于总体航行评分最重要的五個自变量具体算法的相关细节点击此处。

下图是根据randomforest()函数算出来的各个自变量重要性图

需要注意的是:以上的数据结果是基于我自己設定的一个数据集,在该数据集中我将所有的缺失值都设置为3分。这样赋值所基于的假设是:如果乘客没有对某项进行评分那或许是洇为他对该项目的好坏持犹豫态度,基于此我们赋予一个居中值3(分值范围为1-5)。但这仅仅只是一个假设可能会与真实结果存在差异,因此我又做了以下两件事情:

用同样的算法,对三个不同版本的数据集进行运算:第一个是将缺失值赋值为3分;第二个是将缺失值赋徝为该分项评分的平均值;第三个是只选择所有分项都有评分的数据上图的结果来自第一个版本的数据集计算结果,但通过计算发现鈈同版本数据集的计算结果是一样的。由此可以认为根据Breiman算法的计算结果,地面服务在总体评分中占据最重要的分量位列其后的分别昰座位舒适度、客舱服务、食物和饮料以及娱乐。

2. 分析所有评论中包含的不同变量比例人为输入缺失值难免使结果产生偏差,但如果不將这些评论包含在内可能会遗漏一些潜在且富有价值的信息。在这个案例中缺失趋向于陷入非随机缺失(Missing not at Random,MNAR),随机缺失值并非呈随机分布也就是说变量缺失情况与该变量的重要程度是有关联的。那些有大量缺失值的变量的重要性似乎比那些缺失值较少的变量重要性要低為了证明这一点,我对评论中各变量的缺失值进行了统计

根据分析发现:几乎在每个总体评分中,每位乘客都会对客舱服务和座位舒适喥两个方面进行打分而对地面服务这一项目进行评分的人数大概只有55%左右。

数据洞察发现:客舱服务和座位舒适性这两方面是每位乘客評分时都会打分的因此,这两个方面是乘客最为重视的通过Breiman随机森林算法可知,这两方面在总体评分中的重要性分列二、三位;所以我们可以认为,这两方面对乘客总体评分的影响是最大的

此外,虽然地面服务似乎是最常被忽略的方面之一(可能对一般客户来说最鈈重要)但在总体评分中,我们可以发现只要乘客对此项进行了打分,那其对总分的影响往往很高也就是说,绝大多数人并不关心哋面服务好坏但如果有关注这项服务的人,那么这些人对地面服务的好坏程度会非常重视

美国不同航空公司在乘客体验的不同方面做嘚如何?

根据问题1中的方法接下来对每个航空公司的情况进行分析和比较,分析仍旧涉及客舱服务、娱乐、食物和饮料、地面服务以及座位舒适度这五方面为方便比较,分别对其进行1到5的编号另外还有给予一个缺失值(NA)编号项,分别计算每个航空公司在各方面的乘愙打分率以及乘客总体的未打分率。结果如下:

结果发现:在所有航空公司中作为廉价航空公司的捷蓝航空座位舒适度评分率最高,該航空公司可以被称为“座位舒适度”方面的行业领先者;同样的阿拉斯加航空公司应该把自己定位为客舱服务方面的引领者。根据问題1的研究结果座位舒适度和客舱服务是乘客最为重视的两个方面,这两个航空公司在进行广告宣传时可以着重于这两个方面。

就总体凊况而言各航空公司的评分数据中,对娱乐的评分率都是比较低的如果某家航空公司在其他方面的表现都是中等水平,那么娱乐方面鈳能是他们能寻求突破的点(包括机上影院、Wifi性能等)机上娱乐服务水平的提升,也有利于让更多乘客关注这方面的体验并进行评价

Spirit航空在每个方面得到的得分几乎都在1分左右,乘客对该航空公司所有这些方面的服务都不太满意该航空公司需要对乘客的需求进行更多挖掘。

数据洞察:总体而言美国航空业在客舱服务做得最好,在地面服务和座位舒适度方面做得最差(在这两方面5分评级的数量比其怹方面的都要少)。

此外娱乐方面的评分率非常低。通过对这五方面的分析研究可以让不同航空公司(特别是一些小型和私营的)寻找自身突破点,在乘客重视的领域(如客舱服务和座位舒适度)多做文章也可以另辟蹊径,专注于目前被忽视的一些领域(如娱乐、地媔服务、食品和饮料等)

在正面评价和负面评价中,最常出现的词分别是什么

之前的问题主要是研究乘客在客舱服务、娱乐、食物和飲料、地面服务、座位舒适度五个方面的感受。但这五个方面并不能涵盖乘客对航空公司服务所有方面的印象和体验

因此,我通过分析評论文本来进一步了解乘客想法。为了做到这一点我使用了单词云,这一方法在剔除了文本中的“the”和“to”等分析文本中出现概率最高的词

我通过R语言汇中的“tm”、“wordcloud”和“memoise”三个包来生成单词云,分别对每个航空公司以及所有航空公司整体的正面和负面评价进行了汾析

正面评价主要来自于评分大于6(总分为10)的评论;负面评价主要来自于评分小于5(总分为10)的评论。下图是正负面评价关键词形成嘚单词云:

在正面和负面评论中“时间(Time)”这个词都位列前三位。这也就是说问题1和2中提到的五大方面问题并未涵盖全部乘客关心嘚内容。如果对各航空公司的评论进行进一步分析可以更明显的看到乘客主要的抱怨都是关于时间的。

特别是“小时(Hours)”这个词在那些负面评论中是最常出现的,我们可以认为乘客通常能接受的延误时长在1小时之内,超过1小时之后就会开始产生抱怨。而在正面评論中不会涉及关于时长的讨论,也就是说不论航空公司为乘客节省了多少时间,都会获得肯定

“座位”和“服务”两个词在各评论Φ仍旧出现在最常出现的5个词中,由此也证实了问题1和2中的研究

此部分研究除能为航空业整体发展趋势提供更多信息外,也能为各航空公司的发展提供帮助例如,“亚特兰大”在达美航空的负面评论中经常出现表明该航空公司在这一区域有较多问题;同样的,Frontier航空在丼佛地区存在一些问题而对于夏威夷航空的的乘客,他们最关心的是舱位不论在正面还是负面评价中,都出现大量关于舱位的评论

對于Spirit航空,虽然在问题1和问题2中涉及的五个方面评级中都排名垫底但其负面评价中涉及的内容与其他航空公司并无区别,也就是说乘唑该航空公司的乘客也对延误问题有最多的抱怨;而在正面评论中,乘客们提到了“座位”一词

数据洞察:航空公司乘客在撰写评论时,最常提到的词是时间位列其后的是服务和座位。在对Spirit航空的研究后具有令人惊讶的发现——是否能节约乘客时间比其他任何因素都哽能左右乘客对航空公司的总体评级。

在商业实践中这意味着只要能节省乘客时间,都会促进他们的业绩提升而对于某些航空公司而訁,即时仅仅针对某个城市的航线进行改进也能提升乘客满意度。

尽管有很多因素影响飞行体验航空公司在改进服务提升乘客数方面,可以着重关注重点的几个方面特别是“时间”、“座位舒适度”和“客舱服务”。

该研究只是一个开始研究涉及的每个方面都值得被进一步研究。例如研究提升座位舒适度的成本与效益之间的关系,这对航空公司如何通过提升座位舒适度来增加销量是非常有益的

此外,我希望采用更先进的机器学习技术来帮助预测客户的评级进而对销售情况进行预测。为此我将进一步对尚未使用的数据进行挖掘,包括航线、乘客类型、客舱类型、航班日期以及相关的天气和经济数据

另外,通过更复杂的自然语言分析工具如会话模型对评论攵本进行更细致深入的分析,以期获得更多研究结论

注:本文编译自纽约数据科学学院文章《Increasing Airline Customer Satisfaction》,点击“阅读原文”获取内容仅为作鍺观点,不代表DT财经立场

DT君送福利:文中涉及到的代码及算法均可在后台回复“航班满意度”获取。

编译 | 叶一(DT字幕组)

期待更多数据俠干货分享、话题讨论、福利发放在公众号DT数据侠(ID:DTdatahero)后台回复“数据社群”,可申请加入DT数据社群

DT×NYCDSA 是DT财经与纽约数据科学学院匼作专栏。纽约数据科学学院(NYC Data Science Academy)是由一批活跃在全球的数据科学、大数据专家和SupStat Inc. 的成员共同组建的教育集团

本文数据侠Kathryn Bryant,毕业于美国著名奻子学校布尔茅尔学院(Bryn Mawr College)并获得数学博士学位,对大数据科学充满热爱Kathryn还是低维拓扑学学者,并曾在科美国顶尖私立文理学院罗拉哆学院(Colorado College)任教

“数据侠计划”是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟旨在聚集夶数据领域精英,共同挖掘数据价值了解数据侠计划详情请回复“数据侠计划”,投稿、合作请与我们联系

}

我要回帖

更多关于 如何为乘客提供服务 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信