大数据技术在直播教育平台中的应用实践
2017-11-15卫向军
卫向军
2015年以来,“互联网+教育”一直是创业热点领域,创业方向主要围绕传统教育行业的三个痛点展开。一是传统教育模式无法有效记录学习轨迹,评估教学效果,而在线教育能把教学产品搬到线上,实现教学过程数据的留存和分析;二是传统教育中优质老师是稀缺资源,而“互联网+教育”构建的C2B2C平台能够让学生与老师的匹配更加有效;三是传统教育存在教学场地、招生推广等硬性成本,在线教育能有效节约这部分成本。
作为C2B2C模式的在线教育平台,三好网创立于2014年,是基于互联网直播互动技术提供线上教学服务的平台。伴随业务发展,三好网大数据平台日趋成熟,并以较低的成本完成了平台搭建、支撑业务等发展阶段。
大数据平台建设“三步走”
2014年,三好网数据平台建设的第一个阶段即与业务系统有效结合;从2015年开始,以推荐和搜索系统建设为核心进入数据平台发展第二个阶段;从2016年开始,随着业务扩展,团队着手搭建数据分析平台,实施精细化运营,并在此基础上引入语音分析、图像分析等技术,更好地挖掘平台上既有数据价值。
个性化搜索 对电商而言,个性化搜索更像一个垂直搜索领域,具体到教学领域,很多信息是结构化的,例如老师擅长的科目和年级,因为很多情况下我们的搜索都是基于筛选条件的,这就叫结构化搜索。又例如一些老师可能想看家长搜自己名字的频率,这类就是非结构化搜索。
我们可以实现结构化和非结构化结合的搜索。如搜索高中数学老师李旭光,高中数学是结构化条件,李旭光就是非结构化的搜索,整个搜索链条是先把结构化结果做一个整合,再对非结构化的做个召回,然后再去对其相关性排序,最终结合学生和老师的画像给出搜索结果。
推荐系统 我们做推荐系统时确定了两种类型的推荐方式,一是基于内容的推荐,二是基于协同过滤的推荐。前者主要应用于用户初次登录平台的时候,当其选择一个科目时会基于内容热度为其推荐产品。后者主要应用于用户已在平台积累了历史行为数据的情况下,例如我们发现该用户最近在浏览语文相关内容,就会在其浏览页面展示语文课程内容进行推荐,又例如我们发现很多学习数学的学生会去学习物理,系统就会认为数学到物理强关联的概率较高。在教育行业中,我们把这种跨品类叫跨科,其实在电商行业就是跨品类的协同过滤。
教师匹配 我们平台上还有一个重要产品,即教师匹配,就像很多O2O平台做的共性事情——撮合交易一样,我们开展的业务就是帮助学生找到一个最适合他的老师。要找到最匹配的老师,大数据技术应用十分关键。我们基于学生六个维度的数据能做出学生画像,同时基于老师六个维度的数据也能做出老师画像。当然,老师的数据相对而言更丰富一些,包括其交易数据、学生对其评价数据、其续费退费率的数据等,而学生数据相对而言会少一点。因此,我们通常的做法是针对学生的个性化需求,结合老师画像来做出一个精准化推荐。
建立数据化运营思维方式
在大数据平台建设运营中,我认为大数据技术在支撑公司业务方面,搜索和推荐是十分重要的应用。而对整个公司而言,数据化运营思维是公司能否进一步规模发展的奠基石。
运营过程中,最初我们确定的数据指标大都是延续教育行业的传统经验,如续费率、退费率等。后期,我们新增了一些细化的指标,但仍不够精细化。
以下是我认为在进行数据化运营过程中需要关注的几点。
第一,高效运营建立在精细化的数据统计分析上,运营效率的提升必须有相应系统支撑。根据个人经验,当一个技术人员要带一个完整项目时,必须具备一些产品思维。如果这个技术人员过去没有产品经理的从业经历,那就要有效地利用数据,可以先去做数据分析工作,通过数据分析得到更多有价值的信息。我个人认为可以有两个通道和方式来看产品开发,一是了解用户,最直接的方式就是多沟通;二是通过数据能够更准确、客观地反映用户的需求。
第二,从管理层视角,建立 KPI 体系。我们搭建数据平台时,工作量很大,需求也很多,而且最初都是零散的需求。所以我们到一定阶段后,要从公司整个宏观的视角去做一套自己的KPI体系。这种 KPI指标更多是从决策层视角出发,要对公司业务整体方向和目标有指导意义,当KPI指标确定后,我们能够清晰地了解整个公司的运营情况。
第三,关注业务流程,建立用户转化漏斗模型。KPI指标是关键点。此外,我们要建立整个业务的漏斗模型或者说转化率,我们可以把业务流的每一个关键节点通过我们这个转化率连为一条线,有了KPI,我们能知道每个点有没有取得相应的成绩;有了这条线,我们才能知道我们整个的问题出在这个线条过程中的哪个环节。
第四,从中层视角,进行运营数据统计分析。其实对中层管理者而言,他们对自己的小组、部门和业务运营的情况如何评估,最重要的评判依据就是转化率。市面上的产品可以分成两类:免费的和付费的。免费的产品更多的是会关注安装数量,以及留存和流失率;但对付费产品而言,更多则关注如何将免费的用户发展成一个付费的用户。举个付费转化率相关的例子,假设我们想测算8月份用户付费转化率,最初级的做法是8月份的付费用户除以8月份的注册用户。可以说,我们公司在刚开始的时候就是这么算的,我后来仔细想了一下,发现互联网产品应该有更复杂的考虑方式。互联网产品的留存率,要从用户 LTV 出发,以每天的安装量为基数,了解1 日、2 日、3 日、7 日后用戶的留存和活跃,要对指标进行精细化拆解,才能发现问题发生的环节,找出对应的解决方案。考虑问题的时候不应该只考虑当月所有的付费及当月的注册,而是应该考虑用户的转化周期。因为你当月注册的用户并不一定当月能转化,你当月转化的用户也不一定是当月注册的。
关于转化率,还要注意以下三点。一是转化周期,通过数据统计分析结果和业务实际结果的比较,来判断转化的时效是否及时;二是注册/体验转化率,一个指标可拆解为四步:电话接通率、预约体验课、体验课出勤率、体验课成功率;三是数据指标的质量,可考虑按照渠道统计或按照地区统计。endprint