机器学习在旅游与酒店个性化的研究

标签: 数据 | 发表时间:2020-09-03 19:02 | 作者:标点符
出处:https://www.biaodianfu.com

当我们访问Netflix、 YouTube 或Amazon时,我们认为个性化推荐是理所当然的。这些服务已经探索我们的行为很长一段时间了,今天已经足够了解我们,可以让我们参与进来,或者根据我们的喜好提出有价值的购买建议。对于旅游体验而言,情况略有不同。

根据 Sabre 的数据,尽管69%至75%的人喜欢以这种或那种形式提供个性化的旅游体验,但这在该行业还不常见。这一趋势已成为许多与旅行有关的企业的惯常议程项目,也是旅行会议上的一个关键话题。有两个主要趋势可以概述:

  • 行业参与者通常意识到个性化的机会,但局限于对底层技术的不了解
  • 那些已经实施个性化的网站甚至在部分实施之后也取得了令人印象深刻的成果

看起来,两者之间存在差距。早期的使用者有很大的机会来实现个性化技术的飞跃,因为技术已经存在。 那些允许该计划暂停一段时间的公司可能会错过火车,远远落后于竞争对手。

这一次,我们将探讨如何利用在线旅行社、酒店或航空公司应用程序的主要技术手段,成功地将旅行者的体验个性化。

个性化及其阶段

个性化使软件能够为特定客户量身定制服务。在这里,我们只讨论数字化和自动化个性化。有时候,这个术语与市场细分的概念可以互换使用,这是不完全正确的。细分需要了解您的客户群体,并将整个服务堆栈和用户体验与他们对齐。 基本上,它是在制造一种适合所有人的解决方案。在数字世界中,个性化更进一步。 在细分的基础工作完成之后,它允许根据每个客户的偏好单独地向他们推销特定的服务。让我们来看看个性化阶段:

让我们更详细地讨论每种方法的实现需求。

提供丰富和有价值的内容

让你的网站充满有用的内容本身就是好的。大多数与旅游相关的采购都是在进行深入研究之后进行的。根据 Expedia 的数据,旅行者会访问4.4个不同的网站,在购买旅游产品之前会花费38个会话时间。Sabre上述报告称,65% 的旅行者希望了解旅游供应商的详细信息,包括准时到达等级、机上设施、酒店客房服务和设施等。所以,让你的访问者在你的网站上停留更长的时间来探索所有的细节是一个聪明的方法。但是从个性化的角度来看还有另外一个原因。

个性化是关于获取详细的用户行为数据。关于用户兴趣的信息允许假设他或她将来可能喜欢什么。要首先收集这些数据,您应该有足够的内容供用户交互。这时,极简主义不是最好的主意。 您需要知道用户感兴趣的每一条信息,以及它是否影响最终的选择。考虑一下在 Booking.com 上提供了多少详细信息。 在酒店页面上,用户可以浏览酒店的照片,了解酒店的设施,包括宠物信息、入住和退房时间、评论、最近的地标和餐馆等等。

例如,你可能会发现对飞机设施感兴趣的用户更有可能是商务旅行者而不是休闲旅行者。这只是一个变量,不足以得出明确的结论。 但是与其他信号相结合,使得分割和进一步的个性化更加精确。

收集和统一用户提供的数据

数据类型

元数据。元数据是描述网络会话技术方面的最普遍的信息:

  • 用户位置
  • IP 地址
  • 浏览器类型和版本
  • 设备类型
  • 操作系统
  • 屏幕分辨率
  • 连接类型(Wi-Fi、 LTE 或 LAN)
  • 会期
  • 引荐来源(搜索、社交媒体、旅游元搜索网站、广告等)等

尽管元数据并不是详尽无遗的,但它提供了许多信息,有助于描绘客户的肖像并勾勒出客户的一些需求或兴趣。考虑到你的个性化努力,这些细节不是很有启发性,但它们是最可靠的。 问题是,在任何给定的时刻,您都不可能拥有关于每个用户的足够信息。 总会有一些你一无所知的新来者,或者只是那些清空了缓存的人,而你的算法认为他们是新来的。

假设你的目标是实时的酒店搜索信息。 如果你的访问者来自建议欧洲城市中心酒店的广告横幅,这些推荐信息不足以对市中心的酒店进行排名。显然,元数据是不够的。

用户行为数据。这是你根据每个访问你网站的用户所做的特定动作收集的数据。 它提供了详细的用户数据,您将主要用于个性化。我们不会列举所有可能的变量,只列举几个主要变量。

  • 目的地搜索
  • 选择旅行日期或灵活搜索
  • 滚动深度
  • 所有鼠标点击和悬停动作(包括那些针对设施、附加服务、位置数据、评级、评论等的动作)
  • 电子邮件订阅和活动(包括点击率)
  • 通知订阅(例如,您正在通知旅行者某些目的地的最低价格)

这些数据可以告诉你的客户最看重什么,他们的额外偏好是什么,等等。 我们将在下面讨论用例。 虽然它不是最稀有的数据,但它绝对是最有价值和唯一的信息,将你的个性化产品从其他市场区分开来。

用户行为数据的可靠性低于元数据。 如上所述,您可以收集它,但在许多情况下,使用它会更加困难。 最好的情况是,您与登录的用户打交道,并且您拥有每个访问者的所有历史数据。你也可以使用cookies,但现实是严峻的。人们可能不会登录,或者他们可能在没有登录的情况下通过手机搜索航班或酒店。 然后他们会登录他们的笔记本电脑进行购买。 没有有效的方法将这两个会话与您试图瞄准的单个用户关联起来。

CRM数据。这是一种最可靠的数据类型,客户明确地提供给您,当您购买或直接与您的员工交互。客户关系管理数据包括:

  • 姓名,登录凭证,联系信息
  • 购买详情和历史(包括访问次数和网站时间等)
  • 住宿类型或航班等级
  • 实际的服务偏好,例如与客房服务相关的活动和任何额外的服务

关于 CRM 数据的好处是,它很容易与至少部分行为数据结合。 如果客户没有登录,你可能会错过网站上与初步研究相关的行为数据,但是你会捕捉到与购买会话相关的行为。

地理位置数据。基本上,地理定位可以告诉你你的客户在任何时间的位置,通常精确到10米半径。 这种类型很少见。 在大多数情况下,它在旅途中会很有用,因为你可以通过客户手机上的应用程序或者可穿戴设备获得它。 如果你知道你的客户在哪里,你就可以发送与地点相关的信息。 如果你的顾客刚刚入住酒店,早餐服务已经结束,你可以给他们推荐最近的餐厅。 人们会很高兴知道在长途飞行后去哪里吃点东西。

社交媒体数据。 最终,你可能会使用客户的社交媒体活动,并以此为基础进行个性化。 根据 Amadeus 的数据,90% 的美国旅行者在网上分享他们的旅行经验。 因此,社交媒体是一片充满机遇的土地。

你可以跟踪以下类型的数据:

  • 评论的情绪分析
  • 共享的照片、视频或故事,这些可能经常被标记为特定地点的地理标签
  • 在特定的机场、酒店、餐馆或活动场所办理登机手续

这些数据对于了解旅行者是否喜欢你提供的服务非常有用。 但是把你的客户和特定的社交媒体用户联系起来的问题更加明显。 如果你的用户通过他们的社交媒体账户登录,这是可行的。 此外,您还应该了解此类数据收集的法律限制。

数据统一

统一数据需要管理和技术两方面的努力。

  • 管理角色。管理的作用是通过打破这些壁垒来减少数据碎片化。 管理层应该积极推广跨部门和公司分支机构的数据透明性,以帮助建立从所有来源和部门收集数据的知识库。
  • 技术角色。您收集的数据应该是统一的。 这并不意味着你需要从头开始构建所有的跟踪工具。然而,如果您选择使用所有可能的变量进行深度跟踪,那么最好考虑自定义解决方案。

使用数据挖掘来细分用户

市场细分是一个众所周知的技术。 几十年来,营销人员一直在利用年龄、地理位置、性别、社会发展等变量来建立用户档案和人物角色。今天,传统的功能列表已经不够了,因为现代的个性化可能包括数百个变量。有两种方法可以产生客户细分:

1. 使用显式数据。您可以通过您所拥有的显式数据变量来划分客户。 例如,你可以把单人和团体旅游的采购细分,或者按目的地细分(受欢迎的和不受欢迎的)。 在完成数据收集工作之后,这些变量应该是可用的。 你也可以直接向用户询问一些细节。

2、使用数据挖掘技术。数据科学在各个商业领域发生了革命性的变化,旅游个性化也不例外。 通过使用诸如聚类之类的非监督式学习分析技术,你可以深入了解你所处的细分市场。 无监督的方法可以通过简单地查看现有的数据集,找到您从未考虑过或无法区分的特定客户群。

这里有一些类型的细分原则,除了通用的人口统计学考虑:

  • 商务旅行、休闲旅行和旅游。 是的,商务加休闲。 这种类型很受欢迎,因为商务旅行者不会错过在会议和会议活动之间观光的机会。 一般来说,商务旅行对价格的关注程度较低,主要集中在便利性和时间框架上。
  • 转换可能性等级。 使用评分算法和按转换可能性划分访问者将有助于优化努力和资源,从广告活动到计算能力。 如果你能及早发现一个网站访问者不太可能转换,是否值得一试?
  • 价格与价值取向。这是你能想象到的最基本的类型之一,但仍然非常有用。 例如,通过在线旅行社预订的所有航空旅行者中,约有一半是以价格为导向的,例如,他们选择最便宜的特惠产品,不太关心飞机餐、长途中途停留以及低成本航空公司提供的幽闭座位。
  • 单身、双人和有孩子的家庭。这些群体相对来说比较容易被发现,然后向他们提供有价值的服务。 他们住在不同类型的酒店,选择不同类型的休闲活动。
  • 逗留时间。这些数据有助于根据逗留时间优先考虑和配置额外的价值建议。
  • 预订渠道。预订同一个房间或航班有很多方式,从在线旅行社到 GDS,以及直接预订。 这种类型的细分可以对使用这些频道的受众类型提供额外的洞察力。 例如,直接预订可能是品牌驱动型购买的信号,而在线旅行社的购买者可能会考虑以价格为中心等等。
  • 认知型和有感情的购买者。一些研究表明,以认知为导向的购买者采取功利主义的方法,试图在便利与价格和时间之间取得平衡。 喜欢购物的人倾向于个性化的建议和旅游购物行为。

这个列表并不详尽。 你可以组合的细分类型越多,你做出精确个性化点击的机会就越大。 但这里的问题是,如果你可以说明所有的部分,你有和定制的建议。另一个问题是市场细分并不是个性化。它仍然建议对相对较大的用户群体进行批量推荐。这就是为什么在初始数据分析阶段,细分是一个很好的技术,可以进一步简化针对个人旅行者的个性化。

测试各种预测用户偏好的方法

当涉及到预测用户偏好时,事情变得更加棘手。 你必须设计出能够预测偏好的机器学习引擎。 而且他们最好实时地做这件事。个性化的技术方面存在一般性和行业特有的问题。 一般问题与冷启动问题有关。 这仅仅意味着一个新用户没有留下足够的数据为他或她个性化。 行业特有的问题涉及到缺乏反馈,而这些反馈可以帮助你做出更好的预测。 不像 Netflix,人们倾向于给电影打分,旅游购物通常没有嵌入系统本身的工作反馈工具。 那么,让我们来看看可以应用于旅游业的基本的和先进的预测技术。

评分技术和分类。用户的每一个动作都会改变他或她的个人得分。不同的分数匹配不同的片段。几分钟后,系统获得足够的用户行为数据,以便按段对用户进行分类。这解决了冷启动问题,因为发动机可以根据初始数据进行一些预测。 随着用户在一个网站上花费的时间越来越多,算法就会对这个用户或那个用户属于哪个分段获得信心。该技术可以通过构建基于决策树的复杂方法来增强。决策树也可以仅仅基于元数据来区分访问者。评分和分类的问题在于它非常适合基本的个性化任务。 您只需将您的客户划分为若干组,并向这些组提出批量建议。 例如,如果你在OTA中个性化酒店搜索,你可以向商务旅行者推荐更贵的市中心酒店,向休闲旅行者推荐更便宜的房间。 虽然这还不是个性化,但这样的系统在一定程度上解决了数据缺乏和稀疏的问题。 然而,真正的个性化始于那些已经留下一些数据的用户。

基于内容的过滤。该方法基于用户已经提供的偏好数据和产品特性。 例如,商务旅行者最感兴趣的可能是房间里稳定的 Wi-Fi 和熨衣服务。 因此,这些类型的算法试图匹配产品的显式特征和先前的偏好。基于内容的过滤可能是旅游业的主要个性化类型。住宿和航班总是具有独特的属性,可以与旅行者的个人偏好相匹配。

这种方法的缺点是,您会遗漏所有未包含在显式特征中的数据。 不礼貌的人员、糟糕的房间清洁、糟糕的食物以及诸如此类的事情都不能被基于内容的过滤捕捉到。还有一组服务,你不能使用这种方法。 如果你试图个性化一些东西,比如没有足够明确的特点的主题旅游,会怎么样?另一个例子是餐馆。 它们可能具有明显的属性,比如价格、地点、烹饪类型等等,但是你不能仅仅用这些属性来解释餐馆的整体体验。当没有足够的产品数据来进行预测时,您可以应用基于协同过滤的系统。

协同过滤 协同过滤的核心理念是向其他类似用户推荐他们以前喜欢的项目。 这种方法概括了各种各样的机器学习方法,其中最常见的是矩阵分解。 用户矩阵分解为每个用户形成配置文件矩阵,并根据相似用户配置文件的信息矩阵在一个矩阵中填充缺失的值。虽然协同过滤是一种先进的技术,但它成为跨行业推荐系统的主流。 例如,它被用于 Netflix 的推荐引擎,因为电影除了类型之外通常没有明确的属性。

协同过滤也可应用于旅游业。它适用于所有没有足够显式属性的产品和服务。 这些可能是餐馆、名胜、名胜、主题旅游等。

混合技术。您可以使用这些方法的组合来解决所有类型的个性化问题。 例如,您可以使用评分技术提出基本建议,或者只是使用它们进行初步的细分工作。 此外,如果您有多种类型的具有不同属性可用性的产品,则可以同时使用协同过滤过滤和基于内容的过滤。

通过多个渠道实现个性化

个性化的复杂性不仅仅与数据科学有关。 它也是关于你可以根据已有的数据提出什么建议。 因此,我们将列出你能做的基本事情和更高级的事情。

  • 个性化检索引擎。这是你能想象到的第一件也是最直接的事情。当你的客户寻找酒店、航班或旅游选项时,系统会根据他们以前的行为提供量身定做的建议。
  • 个性化电子邮件。这是一个相对简单的方法,不需要额外的工程工作,因为数据科学的基础工作已经完成。
  • 重新定位活动。如果你按照转化可能性的等级来划分你的客户,你可以优化你的重新定位活动,通过对那些最有可能购买的新兴旅行者进行更高的出价。
  • 网站布局和复制。根据美国联合航空公司的说法,他们的个性化系统调整网站的布局部分,甚至在200毫秒的页面加载延迟后复制给不同的客户。
  • 旅途中的建议。 如果您有地理位置数据,您可以向用户发送关于附近餐馆和要看东西的通知。如果您还提供航空旅行服务,可以使用地理位置数据来支持登机体验。

设置反馈回路

最后,但并非最不重要的是,反馈是另一种你可以收集和分析的数据类型。虽然你可以建议一些符合旅行者偏好的东西,甚至说服他们去购物,但你不知道旅行者是否喜欢这种体验。这里的问题是,旅行者通常不会把他们的反馈信息留在他们购物的地方。让我们来看看除了从一个特定的旅行者那里反复购买这些明显的反馈之外,你还有哪些选择。

鼓励对奖励的评论。很可能你的客户会打算在社交媒体或专门的旅游评论网站上留下反馈,而不是你自己的评分系统。 这就是为什么,像折扣、里程数或者内部货币这样的激励措施对旅行者来说非常有用,可以鼓励他们在你的网站上留下评论。 这是最可靠的反馈来源,因为评论和评分将直接发送到特定的用户配置文件。

使用第三方数据。使用来自社交媒体或评论平台等第三方的数据是困难的,因为1)你必须将用户与客户联系起来,2)你必须考虑法律限制。 我们在关于旅游 API 的报道中提到过 TripAdvisor API,它提供个人评论,并允许在旅游网站中嵌入 TripAdvisor 小工具,但其条款和条件限制任何数据分析。 因此,在考虑第三方之前,一定要检查问题的法律方面。

总结建议

最后,让我们讨论一下在采用个性化方法时可能会遇到的一些挑战以及应对这些挑战的建议。

  • 从简单开始,使用忠诚度计划数据。不要从一开始就尝试个性化。 你不会从每个客户那里得到足够的数据,所以这里最好的方法是使用你已经为你最有价值的客户提供的信息,然后从这一点出发。
  • 不要依赖于你所拥有的唯一的数据,做一些验证的基础工作。Tripadvisor 分析主管 Michael Berry 讲述了一个关于数据中可能存在偏见的轶事故事。 在研究国际客房价格时,他发现莱索托和博茨瓦纳的平均价格高于瑞士和其他发达国家。 似乎只有莱索托和博茨瓦纳的高端酒店有在线展示,其他酒店则完全在线运营。 尝试在你的数据中发现异常,以避免基于偏差记录的预测。
  • 注意法律限制。所有个性化设置任务在某种程度上都需要用户分析。 这就是为什么你应该确保检查在你经营的国家的法律限制。 例如,从2018年5月25日起,欧盟将实施一项新的数据保护条例,旨在为欧盟公民提供对其个人数据的广泛控制。 它设定了一些新的标准。 在美国,用户分析受到一般数据保护条例的保护,该条例要求组织允许个人行使他们的权利,即拒绝自动数据处理和决策。
  • 当用户同意使用他们的数据时,让他们知道他们将要得到的价值。就用户期望的价值而言,隐私问题非常重要。 正如多项调查显示,超过一半的网络用户很可能会分享他们的个人数据,以换取更好的价值主张。 因此,需要适当的通信来获取所需的数据。

个性化是你无法绕过的东西。 它逐渐从增值能力过渡到必要性。 根据 segment.com 的数据,49% 的收到有价值的个性化服务的顾客可能会成为经常性顾客。 所以,如果你仍然没有个性化,现在就考虑这么做吧。

参考链接: https://www.altexsoft.com/blog/datascience/customer-experience-personalization-in-travel-and-hospitality-using-behavioral-analytics-and-machine-learning/

相关 [机器学习 旅游 酒店] 推荐:

机器学习在旅游与酒店个性化的研究

- - 标点符
当我们访问Netflix、 YouTube 或Amazon时,我们认为个性化推荐是理所当然的. 这些服务已经探索我们的行为很长一段时间了,今天已经足够了解我们,可以让我们参与进来,或者根据我们的喜好提出有价值的购买建议. 对于旅游体验而言,情况略有不同. 根据 Sabre 的数据,尽管69%至75%的人喜欢以这种或那种形式提供个性化的旅游体验,但这在该行业还不常见.

机器学习五步走

- - 我爱机器学习
经常会有人问“我该如何在机器学习方面更进一步,我不知道我接下来要学什么了. 一般我都会给出继续钻研教科书的答案. 每当这时候我都会收到一种大惑不解的表情. 但是进步确实就是持续的练习,保持较强的求知欲,并尽你可能的完成具有挑战性的工作. 因为他是为数不多的几种可以让你真真让你获取坚实知识的媒介. 是的,你可以选择选一门课,注册MOOC,参加一些讨论班.

机器学习之路

- - 我爱机器学习
自从答应简二毛博士将自己的机器学习历程和心得分享给大家至今,转眼间半年已经过去了,感谢简博士分享和开源精神的鼓舞,这也正是本系列关于机器学习介绍博客的动力来源. 之前有些网友,师弟们问我,学习机器学习怎么入手,从看什么书开始. 如果你只愿意看一本书,那么推荐Bishop的PRML,全名Pattern Recognition and Machine Learning. 这本书是机器学习的圣经之作,尤其对于贝叶斯方法,介绍非常完善.

机器学习算法Boosting

- - 标点符
机器学习通常会被分为2大类:监督学习和非监督学习. 在监督学习中,训练数据由输入和期望的输出组成,然后对非训练数据进行预测输出,也就是找出输入x与输出y之间的函数关系F:y = F(x). 根据输出的精确特性又可以分为分类和回归. 分类和回归的区别在于输出变量的类型. 定量输出称为回归,或者说是连续变量预测.

Mahout实现的机器学习算法

- - ITeye博客
使用命令:mahout -h.   在Mahout实现的机器学习算法见下表:. EM聚类(期望最大化聚类). 并行FP Growth算法. 并行化了Watchmaker框架. 非Map-Reduce算法. 扩展了java的Collections类. Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能.

国内的机器学习几个人

- - 丕子
转: http://blog.csdn.net/playoffs/article/details/7588597. 推荐几个机器学习和数据挖掘领域相关的中国大牛:. 李航:http://research.microsoft.com/en-us/people/hangli/,是MSRA Web Search and Mining Group高级研究员和主管,主要研究领域是信息检索,自然语言处理和统计学习.

Apache Mahout 0.8 发布,机器学习库

- - 开源中国社区最新新闻
Apache Mahout 0.8 发布了,Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用. 该项目已经发展到了它的最二个年头,目前只有一个公共发行版.

Ruby的机器学习项目

- - 阳志平的网志-技术类
作者是辉瑞公司的小牛,可惜烂尾了. 我在改啊改啊,可惜现在是商业项目,暂时不能放出改掉的部分. 对了,顺便做个小广告,去年组织翻译的一本小书:社会网络分析:方法与实践. 已经上市了,感兴趣的可以翻翻:. 社会网络分析:探索关系背后的科学与技术. treat:自然语言处理. 类似于igraph,也是桥接处理nlp.

机器学习该如何入门

- - CSDN博客综合推荐文章
  对于这个问题的解释,说实话我很有压力,因为在分享篇文章之前就有朋友告诉我,这个百度上一搜一大片,还需要你讲吗. 正如同一千个读者眼里有一千个林黛玉一样,我解释的当然是我个人自从读研到工作这么多年对机器学习的学习到应用过程的独特见解.   首先我们看下图了解一下机器学习在AI(Artificial Intelligence 人工智能)领域的地位.

[译] 理解机器学习技术

- - IT瘾-dev
第1讲 理解机器学习技术. 学完本模块的内容,读者将能够:. 讨论机器学习的技术和商业应用. 学完本讲的内容,读者将能够:. 解释各类机器学习方法和算法. “机器学习领域的突破,其价值10倍于微软. 你是否曾经为计算机能够下象棋或者机器人能够完成复杂任务而感到惊奇. 一旦你理解了机器如何学习和适应各种问题、提供合适的解决方案时,这些看上去很复杂的问题实际上相当简单.