大数据背景下推荐系统的设计与应用分析
2021-03-26冯倪
冯倪
(陕西师范大学计算机科学学院,陕西 西安 710000)
0 引言
现如今是一个信息爆炸的时代,我国的网络信息技术得到了比较快速的发展,在社会的各行各业中数据量也在不断地增长。针对这样的环境,如何处理好大量的数据,并提高数据的使用效率是每一家互联网公司需要做的工作。在大数据应用技术中,个性化的推荐系统是一项得到广泛应用的技术,其主要的作用就是对用户的数据做更加智能的处理,通过设计好的数据模型以及算法将用户感兴趣的信息推送给用户,以进一步提升用户的实际上网体验。现阶段,一些个性化推荐系统被广泛应用于人们生活的各个领域,比如说音乐、电商、购票等社交平台上,可以满足不同用户的多样化需求。因此,和推荐系统有关的研究依旧在如火如荼的进行中。
1 个性化推荐系统的大数据特点
大数据一般被认为是规模非常大,也没有办法使用常规的软件进行储存和处理的数据,是一种在处理之后才具备较高价值的数据。随着信息时代的发展,对大数据进行处理,并合理地使用个性化的推荐系统是非常重要的一个工作。个性化推荐系统使用的大数据一般具备以下的特点:
1.1 多样性
大数据具备的一个特性就是多样性,多样性体现在大数据的种类以及相关的来源上。按照数据的结构,可以将数据主要分为三种不同的类型。在这三种类型中,非结构化和半结构化的数据正在慢慢地成为数据的主要成分。非结构化的数据是指结构不完整或者说结构不规则的数据,是不能使用数据库二维表来表现出来的,包括图片、音频、文本以及其他的信息等。这种非结构化数据的占比是非常高的,且正在不断的增长中。结构化数据指的是可以使用二维表结构进行表达的数据,其有着一定的数据格式,可以使用关系型的数据库进行储存。介于这两者之间的是一种称之为半结构化的数据,这种数据既具备一定的规则性也具备一定的结构性,但是并不符合关系型数据库的模型结构[1]。
1.2 时效性
大数据具有非常强的时效性。随着时间的流逝,如果大数据得不到合理的处理,其价值就会下降。处理大量的数据是需要时间的,因此,就需要结合实际情况利用新型的数据处理方法对数据进行有效率的处理。在信息时代,云计算应运而生,合理地使用云计算功能能进一步地提升信息处理的能力,在一定程度上减少运算过程中需要的时间。现如今,计算的速度达到了每秒可处理PB级(1PB=220GB)的数据[2]。
1.3 低密度价值性
在信息时代,大数据有着非常高的利用价值,但是,需要注意的是,大数据的规模是比较大的,需要经过科学的处理才能得到有效的信息,这样才能使得推荐系统更加符合不同受众的喜好。针对这样的情况,基于信息技术和大数据的推荐系统就没有必要考虑精准度,这是因为,大数据本身就不会遗漏掉任何一个数据,从另一个角度来说,推荐系统也正朝着“是什么”转变着。
2 个性化推荐系统
现阶段,在大数据的背景下,推荐系统也顺应时代潮流诞生了。在对相关的网络用户数据进行收集之后,利用建模计算的模式对大数据进行处理,可以得出网络用户的行为、爱好、习惯等相关的信息,并在之后,为网络用户提供个性化的推荐,这样能帮助用户接收到自己想要的信息,从而提升用户的网络使用感[3]。
2.1 个性化推荐系统相关技术
个性化推荐系统在实际应用中,可以实现对数据的可靠处理,主要包括数据处理与收集等。也就是说,该系统提供的服务主要是通过数据采集、推荐算法及人机交互等不同模块实现的。
2.2 数据源
网络公司的数据来源存在很大差异,一部分网络公司的数据来源从内部产生,自身就可以为数据来源提供支持。但是就实际情况来看,很多网络公司并没有这种实力,数据一般来自于不同的数据库,在选择时需符合自身需求。数据库中存储着多样化的数据,比较常见的有交易数据、业务数据等。在传感器中,也会产生比较多的半结构化数据等。在互联网上充斥着形式各异的非结构化数据,比较常见的数据库有SQL Server、Oracle以及 Access等。众所周知,数据的来源途径是非常多样的, 用户在网络平台的实际操作过程中,有着用户自身的属性和特点。但是,需要格外注意的是,这些数据都要有规范的格式,对数据进行科学合理的选择,并对数据进行筛选[4]。
2.3 数据采集
在数据的采集过程中,还需要将数据进行分类,数据是有着不同类型的,也有着不同的价值。针对这样的实际情况,就需要做好数据的采集工作。因此,数据买方在对数据进行采集时,需要充分了解自身所需要的数据类型、价格、规模和其他的信息,结合实际情况做好数据端口的对接工作,这样才能让数据的收集更加准确。
2.4 数据清洗
在完成了数据传输的相关工作之后,就需要对购买来的数据做进一步的清洗,这样可以有效提升数据的质量,并纠正在数据中存在的各种错误,避免出现数据错误以及丢失的情况。比较常规的数据清洗手段是纠正错误、数据压缩以及修正逻辑等,在做完了一系列的数据清洗工作之后,就能进行接下来的数据建模工作了[5]。
2.5 数据建模
数据建模是非常重要的一个环节,也是考验设计者统筹规划能力的一项工作。相关的设计者需要结合实际情况建立起一个完善的数据库,将不同类型的数据根据相关的规则进行合理的分析和整理,并通过合理的方式表示出数据之间的关系,这样的数据才是科学、合理的,便于后期的加工处理。在相关的数据建模完成了之后,平台设计者可以结合用户的兴趣来创建算法。通过构建模型,用户的短期兴趣以及长期兴趣都被比较规则地展现了出来,用户的网络体验感得到了提升。个性化的推荐算法是计算推测出用户可能会喜欢某样东西的一种计算机算法[6]。
2.6 用户交互
在构建了处理数据的模型以及分析了数据之后,就能结合用户的兴趣进行个性化的推荐。计算机会结合用户的兴趣模型进行进一步的计算,这样可以为网络用户推荐其感兴趣的内容。接下来,网络用户的这一次选择又会被再一次作为数据储存在数据库中,成为了下一次被继续利用的新数据。以上的这些内容,就是一个比较完整的推荐过程。
3 个性化推荐系统的应用
个性化推荐系统的发展是非常迅速的,可应用到各个行业领域,比如社交网络、电子商务、视频网站等这些能够和普通用户产生关联的网络平台,相关的网络企业就能针对这样的情况做更进一步的研究。
在一些比较熟悉的电商平台上,用户在进行购物时,后台可以结合用户的喜好来推荐相关的商品,这样可以在一定程度上提升用户的购买率,企业就能获得更多的盈利。最近这些年,个性化推荐已经得到了比较快速的发展,比如“日推”“私人FM”就是在这一时代背景下所产生的热词。在未来,用户在使用手机或者是网络平台时,就能体会到更加个性化的服务。
2017年,我国第一家大数据交易中心,也就是贵阳大数据交易开始运营,这也标志着我国大数据交易是非常成功的。大数据交易的商品一般分为了以下几个种类:第一类,是经过了网站工作人员仔细处理之后的数据;第二类是结合用户喜好所设计的模型算法;第三类是和网络信息技术有着直接相关性的应用工具,比如说云计算等等。拥有海量数据的腾讯大数据为开发者提供着一批可依赖的大数据产品,随着个性化推荐系统的进一步进化,这些产品将为行业带来了更多的活力。
4 结论
综上所述,最近这些年来,随着大数据价值的不断提升,一些和数据泄露相关的案例层出不穷,人们也更加关注数据安全的问题。在大数据背景下,大数据技术可以更加便利地对这些数据进行利用,能极大地保护好用户的隐私。所以,网络企业在未来的发展过程中需要做好个性化推荐,对相关的数据进行合理的利用,这样才能提升用户的网络使用感,为企业创造更多的经济利益。