基于大数据聚类的用户画像提取与智能推送系统
2022-01-25薛晓璇
薛晓璇
(西安职业技术学院经济管理学院,陕西西安 710077)
随着互联网技术的快速发展,互联网信息数量在迅速增长,以前,网络用户从互联网上搜索与内容相关的信息,而现在网络用户根据自己的实际需求搜索自己需要的信息,但是从互联网的海量信息中获取最新的、满足网络用户需求的信息较为困难,是目前需要解决的问题之一[1-2]。用户画像是指网络用户在浏览网站时会留下多种网络数据,被互联网自动识别并收集,例如网络用户的喜好、生活习惯、工作职业、消费水平等信息,网络平台会针对网络用户个人的信息选择有效的信息数据作为标签,然后根据做成的标签信息构建属于网络用户个人的抽象模型[3]。各大公司可以根据网络用户的需求、生活习惯等对用户进行有针对性的推荐,如何有效地利用用户画像向用户进行推送,是目前研究的方向。
该文根据以上有关用户画像推荐系统出现的问题,设计了基于大数据聚类的用户画像提取与智能推送系统,该系统采用了大数据聚类的技术,合理构建用户画像,构建自动推送模型,从而根据网络用户个人的喜好、需求,进行有针对性的智能推送,提高推送信息的效率。
1 系统硬件设计
1.1 电源电路设计
基于大数据聚类的用户画像提取与智能推送系统的电源电路,必须能快速、有效地调整单片机的转速,进而使智能推送系统更具有可靠性与实时性,在具体设计时需要采用单极性可逆脉冲调制来控制推送系统的电源电路,该电路的优点是电路运行可靠性高,不用添加其他电路,开关频率高[4-5]。该电源电路的芯片选用TD 公司生产的ST264,该芯片是一种驱动芯片,具有较强的智能控制能力,驱动芯片最大输出电流为40 A,工作电压最高达到60 V,芯片内部设有特殊装置,能够高效地保护电路,例如欠压、欠流、线损等,对电源电路控制较简单、灵敏。为了使电源电路更加稳定,需要降低电流的损耗,提高电源的输出电压,所以采用0.1 Ω的电阻,用驱动芯片放大电阻两端的输入电压,共模输出电压为1.8~3.3 V,驱动输出电流为10 mA,工作电压为20~40 V,电路需要具有良好的开关特性,电路中的功率管在工作时功耗较小,工作电压最高为60 V,输出的直流电流最高为150 A,为了使电源电路更快地实现串口通信,需要在电源电路中加入电平转换芯片[6-7]。
该文设计的电源电路如图1 所示。
1.2 单片机设计
基于大数据聚类的用户画像提取与智能推送系统的单片机芯片选用三星公司推出的SFI16F3365,该芯片专门针对智能推送控制,具有良好的控制能力与A/D 电平转换能力,该文设计的单片机与市场同类单片机相比,具有较多的优势:具有6 对互补输出的功率控制模块、采样速度最高达到305 次每秒、12 位A/D 转换器、输出电流最高达40 mA,其次还具有较好的功耗管理方式、高效的振荡器构造[8-10]。单片机结构如图2 所示。
图2 单片机结构
单片机整个构造由蓄电池供电,由推送系统的电源电路转换后,传感器的采样信号被送到单片机的输出端口,单片机根据驱动特性以及大数据聚类算法对传感器采集的数据进行分析处理,进而确定单片机工作电流的方向与大小,单片机通过采集器传输的电源控制命令生成采样信号,信号通过单片机的外围电路控制单片机的正常工作,在单片机的外围电路上设置电压传感器,传感器将单片机的输出电流传输到智能推送系统的采集器,采集器对电源电路实行开关闭环管理,如果智能推送系统在工作时出现异常,单片机的警示灯将进行报警提示[11-12]。
1.3 采集器设计
基于大数据聚类的用户画像提取与智能推送系统的采集器主要由信号转换器、采集器外围电路两部分组成,信号转换器主要完成采样信号的输入、放大,将转换完成的采样信号处理后输入到采集器的驱动芯片中,该种信号转换器包括两路采集通道,1路低频通道与3 路高频通道相连,2 路高频通道与4 路低频通道相连,3 路高频通道可以传输40~60 kHz 频段的采样信号,4 路低频通道主要传输100~400 kHz频段的采样信号,各个通道具有相位一致性的特点。信号转换器的低频通道传输完成差分过的差分信号,2 路高频通道不需要为信号转换器传输差分信号,A/D 转换器与采集器的外围电路底板相连[13-15]。采集器结构如图3 所示。
图3 采集器结构
采集器的外围电路选用的核心芯片为SIMENSA公司生产的最新系列芯片SIC1286,该芯片可以处理采集器采集的信号数据,对其进行控制、传输并保存,外围电路的电路板主要提供外围电路所需要的电源,把信号转换器以及采样数据进行并列保存、连接,为转换器的串口通信提供输入接口。采集器的外围电路也可以完成采样信号的转换,外围电路芯片可支持的最高采样频率为256 kHz,支持的最低采样频率为64 kHz,中心频率为2~30 kHz,采集器整体接收输入信号的方式设计为差分方式,方便对采样数据的采集与处理。
1.4 微处理器设计
微处理器主要完成数据的处理、存储和控制,微处理器的芯片选用ST 公司生产的最新芯片SD6528,微处理器设有网口、USB 以及通信串口接口,通过与无线电设备的连接,实现对采集器采集数据的预处理,此外,微处理器处理数据的速度由芯片管脚的数量决定,该文设计的微处理器电路如图4 所 示[16]。
图4 微处理器电路图
2 系统软件设计
该文设计的基于大数据聚类的用户画像提取与智能推送系统采用了大数据聚类技术,聚类在信息数据挖掘中应用较为广泛,大数据聚类可以有效细分网络用户,发现网络中的可靠信息,搜索网络信息中的重要数据。在传统聚类方法中,聚类提出的假设可以一次性嵌入网络数据信息中,现在的聚类算法通常属于迭代型算法,下一步骤的计算需要使用上一步骤计算出来的数据结果。随着互联网数据信息迅速增长,计算机的容量与计算能力无法满足网络用户对海量数据的计算需求,需要网络平台采用分布式算法对用户需要的网络数据进行并行处理。该文采用大数据聚类技术主要因为大数据可以包含网络海量信息的结构化数据,对用户的信息需求,可以有针对性地进行分析预处理,根据用户的消费行为、浏览喜好、生活习惯等进行有效的智能推送,对用户需要的网络非结构化数据以及无结构化数据能够较快处理,且存储网络信息数据的容量非常巨大。
按照用户喜欢的类型给用户推送内容,是基于大数据聚类的用户画像提取与智能推送系统运行的主要目的,智能推送的流程如图5 所示。
图5 智能推送流程
首先对用户喜好的数据进行采集与处理。采集用户的消费行为、浏览网站或者生活习惯等行为数据,将这些行为数据作为系统软件分析的数据,用户通过自己安装的浏览器软件浏览网站的相关内容,企业根据网络平台上传输的用户行为数据,按照推送的方式反映给用户,用户根据系统软件提供的相关信息,进行选择性地浏览以及购买。用户被网络平台采集的数据信息多种多样,包括用户的性别、职业、生活习惯、地理位置、年龄等,网络将这些信息数据统一封包整理,汇总到系统软件的服务器,通过数据集成、清洗、变换、简化4 种预处理数据的方式对这些用户数据进行处理。
然后整理用户数据做成标签。标签类似一种特殊符号,整理用户画像,用户的行为数据被采集完成后,汇总到对应的标签中,用户标签包含用户位置标签、习惯标签、兴趣爱好标签等。
最后系统软件对用户实现个性化推送。对用户个人数据采集并处理完后,做成标签,根据用户标签准确预测用户的个人需求,在数据库中为用户推送感兴趣的内容,实现个性化用户推送。
3 实验研究
为了验证该文提出的基于大数据聚类的用户画像提取与智能推送系统的有效性,与传统系统进行实验对比。得到的提取时间实验结果如表1 所示。
表1 提取时间实验结果
推送准确率如图6 所示。
图6 推送准确率实验结果
该文设计的基于大数据聚类的用户画像提取与智能推送系统,采用了大数据聚类技术,有效地将用户行为数据统一地整理并进行处理,提高了整理用户行为数据的速度,时效性较强。智能推送系统的硬件包括电源电路、采集器、微处理器与单片机,各种硬件分工合作,使智能推送系统较容易地实现,提高了基于大数据聚类的用户画像提取与智能推送系统的安全性与可靠性,对用户画像进行有针对性的采集、分析与处理,并做成对应的标签信息,标签信息可以包括用户的位置、性别、年龄等数据,使推送给用户的个性化信息内容更具有针对性与准确性,能更准确地预测用户的行为爱好与生活习惯,为用户提供更满意的个性化服务,采用软硬件的环境,突出了个性化服务对用户的重要性,使基于大数据聚类的用户画像提取与智能推送系统更具特色[17]。
4 结束语
该文基于大数据聚类设计了用户画像提取与智能推送系统,通过互联网建立用户画像与标签体系,通过采集用户行为数据,利用大数据聚类将行为数据进行分类并做成对应的标签,提高了用户行为数据的整合性。根据用户的习惯爱好,预测用户可能喜好的网络信息内容,提高了智能推送系统的工作效率,使系统更具有准确性与可靠性。软硬件的设计环境,使推送系统更具安全性,根据用户已经安装的系统软件,建立可以实现网络信息提取与智能发送的模型,使系统的个性化推送内容更周到、全面、细致,用户对智能发送的满意度最高,进而可以更好地为有需求的用户进行画像。