民航出行产品的用户数据挖掘与个性化推荐
2023-07-06朱晓星刘昊荚雪绒
朱晓星 刘昊 荚雪绒
随着科技的不断发展,互联网时代的到来使得人们的出行方式发生了翻天覆地的变化,民航出行服务也不例外。随着出行服务市场的竞争越来越激烈,民航出行服务产品开始重视如何更好地了解用户需求,提供更贴近用户需求的个性化服务。
在此背景下,用户数据挖掘和个性化推荐成为了越来越受关注的技术。用户数据挖掘可以帮助民航服务企业更好地了解用户的行为习惯、状态和需求等,从而制定更准确的营销策略和服务方案。个性化推荐则可以根据用户的历史行为数据和用户画像,在保护用户隐私的前提下,推荐符合用户兴趣和需求的机票、酒店、租车、保险等相关产品和服务,提高用户的满意度和忠诚度。
一、背景
本章将回顾互联网产品中的用户数据挖掘与个性化推荐技术,引出后文关于民航出行服务的相关技术讨论。
(一)用户数据挖掘技术
互联网产品中的用户数据挖掘主要包括以下几个方面。用户行为分析——通过对用户在产品中的行为数据进行分析,可以了解用户的偏好、需求和行为模式,从而为产品的改进和优化提供参考;用户画像构建——通过对用户数据进行分析和处理,可以将用户数据转化为用户画像,进而更好地了解用户的需求和特点,为产品提供更为个性化的服务和推荐;用户分类和群体挖掘——通过对用户数据进行聚类和分类分析,可以将用户分为不同的群体和类别,从而更好地理解用户需求和行为模式,为产品的运营和推广提供支持;预测分析——通过对用户历史数据进行分析和建模,可以预测用户未来的行为和需求,从而为产品的推荐和营销提供指导。
用户数据挖掘在互联网产品中具有非常重要的应用价值,可以为产品提供更为个性化和精准的服务和推荐,提升用户体验和产品竞争力。
(二)个性化推荐技术
个性化推荐技术是一种根据用户的历史行为、兴趣、需求等个人特征,为用户推荐符合其偏好的内容或服务的方法。随着互联网信息爆炸式增长,用户需要花费大量时间才能找到他们感兴趣的内容或服务,这就促使了个性化推荐技术的发展。个性化推荐技术在电子商务、社交媒体、音乐电影等领域都得到了广泛应用。
常见的个性化推荐技术包括基于内容的推荐、基于协同过滤的推荐、基于深度学习的推荐等。基于内容的推荐是通过对用户过去的行为和兴趣进行分析,将用户的兴趣表示为一个向量,然后将这个向量与每个内容的向量进行比较,从而推荐最相关的内容,这个向量化(Embedding)的过程基于历史交互数据,将用户和感兴趣的内容映射到向量空间中尽可能相近;基于协同过滤的推荐是通过对用户的历史行为进行分析,将用户与其他用户的相似度计算出来,然后将与用户相似的其他用户喜欢的内容推荐给该用户;基于深度学习的推荐则是利用神经网络模型对用户行为和兴趣进行建模,并根据模型预测用户的兴趣并推荐相关内容,在处理海量内容的工业级推荐系统,常常分为召回系统和排序系统,以多个串并行的信息漏斗进行分层筛选和排序。
本文基于某民航出行服务App的数据,在第二章提出创新的用户数据分析与挖掘方法,包括精细化的民航出行用户生命周期挖掘以及用户行程相似度度量,并在第三章介绍具体应用场景中的优化效果和实践方案。
二、民航出行服务中的用户数据挖掘
在互联网产品中,常用的用户数据挖掘技术方案包括:用户生命周期分析——对用户进行分段分析,了解用户在不同生命周期阶段的行为特征和需求,从而制定相应的营销和服务策略;用户相似度度量——通过对用户行为数据的相似性进行度量,找到具有相似需求和兴趣的用户群体,为用户推荐更为精准的服务;用户特征提取与向量化表示——通过对用户数据进行关键特征提取和向量化处理,将用户的行为数据转换为数学向量,为后续的数据分析和算法落地提供基础,同时也可以提供相似度度量。
本章中我们介绍基于民航出行用户生命周期的精细化挖掘,和一种创新的用户行程相似度度量方法。
(一)民航出行用户的生命周期挖掘
场景化App的用户使用时间分布与日常App有显著区别,民航出行服务产品的这一分布与个人行程出发时间高度相关。我们分析了某民航出行App的用戶群体在出行时间(航班计划起飞时刻)前两个星期的访问行为,发现用户的使用App的行为与其他日常App存在明显的差异。用户使用该App的时间分布与个人行程的计划起飞时刻高度相关,且用户在不同的时间段会呈现出不同的使用特点。
经过对用户群体出行时间的访问行为分析,我们发现绝大部分用户在出行前三天(72小时)内频繁访问该App。这一分布与其他日常App的使用分布显著不同,主要取决于民航出行的行为习惯。购票行为多数发生在行程前7天内,虽然不同用户的行为存在一定的分散性,但是统计规律仍然比较明显。在购票后的行程准备阶段,用户开始使用App进行值机选座操作,这一行为通常发生在72小时内。而航班动态查询则主要在临近起飞之前几小时达到高峰期,尤其在航班延误情况下,这一查询高峰会更显著,且越过航班计划时刻。这些信息对于精细化分析民航出行用户的行为非常有帮助,也为全生命周期的个性化推荐提供了重要的参考。
(二)用户行程相似度度量方法
在个性化推荐场景中,用户间的相似度度量是重要依据。针对民航出行场景,我们围绕行程这一重要元素,提出了一个新的行程相似度度量方法,统一考虑不同行程轨迹之间方向性、时间差异等因素,在轨迹Hausdorff距离的基础上增加了方向性和时间系数,为传统的用户相似度计算提供了更精细化的分量。
传统Hausdorff距离刻画了无方向的两个轨迹之间的距离。