大数据背景下的计算机信息处理技术探究
2020-12-15刘慧力
刘慧力
(哈尔滨华德学院,黑龙江 哈尔滨150025)
1 计算机信息处理技术流程
1.1 信息收集。面对海量化的数据,如何从中挑选出有价值的关键信息,是计算机信息处理的第一步。信息收集质量在一定程度上决定了信息处理结果的可用性和可信度,因此在计算机信息处理中,该环节的重要性不容忽视。关键词检索是信息收集中常用的技术,设计关键词能够有效缩小信息的采集范围,并且利用大数据技术快速过滤,将符合要求的信息保留下来,而其他非相关信息则被过滤掉,提高了信息数据的利用价值。信息收集流程如图1 所示。
图1 信息收集系统
1.2 信息储存。对于收集到的数据,应当根据数据来源、数据类型等,将其分类存储。如何保障存储信息的安全性,防止信息泄露,是信息存储环节必须要考虑的问题。在大数据背景下,云存储逐渐成为一种主流的信息存储模式,除了提供超大的存储空间外,在保障信息隐私,方便信息调用等方面也有显著的优势。基于云计算的信息存储程序如图2 所示。
图2 云计算存储技术程序
1.3 信息传递。资源共享让信息数据的价值得到了进一步的发挥。而信息共享必然伴随着信息的交流和传递。在大数据背景下,除了要保证信息传递效率,还要营造安全的网络环境,保证信息的安全。数字签名认证技术是目前保证信息传递安全的一种常用计算机信息处理技术。其原理是在信息的发送端对需要传递的信息进行加密,在信息的接收端对接收到的信息进行解密。加密和解密共用相同的数字签名,这样就可以防止第三方窃取或破坏信息,达到了保障信息安全传递的目的,其流程如图3 所示。
图3 信息传递流程图
1.4 信息安全处理。大数据时代的到来,一方面为计算机信息处理提供了便利和机遇,同时也带来了诸多的挑战。如上文所述,如何保证信息安全就成为必须要考虑的关键问题。目前来看,已经形成了较为完善的信息安全处理技术体系,而二维码技术就是其中的一种。通过采集用户指纹图像,对数据进行加密、编码等,生成唯一的二维码,同样也能达到保障信息安全的效果,技术流程如图4 所示。
图4 信息安全技术流程
2 计算机多道信息处理技术
2.1 计算机多道处理技术原理。虽然根据多道程序设计的不同,多道处理的技术方式存在一定的差异。但是从硬件组成上来看,脉冲多道分析的结构组成基本类似,其中核心模块包括4 部分,分别是用于终端控制的PC机、用户数据收集的数据采集板、用于数据识别与筛选的甄别器,以及用于脉冲幅度测量的展宽器。利用前端传感器捕捉信号后,将模拟信号转变为计算机可识别的数据信号,这一过程称为ADC变换。在PC机内置程序的控制下,将ADC变换幅度作为地址码,并通过该地址码读取该道址的参数。读取结果输入到运算器内,由运算器完成加1 运算。PC机获得这一运算结果后,将其重新计入到存储器内。通过重复上述流程,实现多道处理。
2.2 计算机多道处理技术的构成。现阶段比较流行的计算机多道,是以通用数据采集卡为硬件基础,以Visual C++6.0、Windows为软件开发平台的。计算机多道有如下的功能,数据获取方面:在定时或定事例数的控制下,采集事件信号幅度的数据,或事例时间间隔的数据;实时显示所采集的信号幅度谱或时间谱。数据处理方面:显示已采集的谱形和已采集的时间。点击鼠标,可显示该点的道址和该道的事例数。所采集的数据作为数据文件,供保存、调用和离线分析。完成上述功能,计算机多道的硬件构成如图5 所示。
图5 多道的硬件构成
2.3 计算机多道处理技术的改进
上述计算机多道基本上满足了当下对各类信息处理的要求,但是也存在一些不足。例如探测器接受到的信号脉冲,宽度要比常规脉冲略窄。而这些脉冲通过数据采集板之后,还会产生一定的损耗,这也就意味着最终PC 机上识别的信号脉冲宽度,大幅度的低于实际值,从而导致处理结果失真。因此,为了避免此类问题,许多在现有的计算机多道软硬件基础上,进行适当的改进。一种可行性的技术措施是,用一台快速恢复式的幅度保持器代替展宽器,新的多道硬件组成如图6 所示。
图6 改进的多道硬件框图
幅度保持器的运行机理为:前端设备捕捉到信号后,首先经过电容C,此时信号被充电并放大一定的倍数。放大后的信号被分成两部分,并通过不同的路径进行传输。一路信号直接进入甄别器;另一路信号触发放电控制,并经过放电控制脉冲驱动模拟器开关K重新与第一路信号回合。在该路信号中,可以人为设计信号传输延迟,通常在3-5s 不等。幅度保持器的脉冲波形如图7 所示。
图7 幅度保持器波形
第一个信号脉冲幅度被采集后,电容C开始放电,在基线未完全恢复时,又来相邻的第2 个信号,此信号叠加在未复原的基线上,即第二个信号的幅度叠加了一个对应于当时基线的一个小台阶。此台阶将影响第二信号幅度的采集精度,事例率越高,也就是相邻第二个信号来的越早,基线的台阶对精度的影响越大,也就是精度越差。因此,我们可以在允许的FWHM条件下,以最高的事例率(或事例率上限)来衡量数据采集的性能。表1 给出本幅度保持器的FWHM与事例率上限的关系,所用的探测器系统(NaI 晶体)同有的FWHM为8%。
表1 幅度保持器的FWHM与事例率上限的关系
3 大数据背景下计算机信息处理技术创新
3.1 大规模廉价计算平台的应用。大数据时代的一个典型特征,就是数据的爆发式增长。海量的数据一方面是占用了太多的存储空间,导致物理存储成本上涨;另一方面则是普通的计算机处理速度难以完全消耗海量数据,造成了数据的浪费。在这种情况下,基于大数据的计算机信息处理技术,也需要进行适应性的创新,才能在新时期保持更高的信息处理效率,以及更深层次的挖掘信息的利用价值。运用虚拟化技术,能够降低大规模、集成化计算平台的应用成本,将物理服务器转化为虚拟服务器,在虚拟环境下同步运行,不仅可以实现所有的信息处理功能,而且进一步提升了虚拟计算平台的兼容性和稳定性。
3.2 采用Map Reduce 技术的支持。在大数据的支持下,运用分布式信息处理技术,可以将海量信息分散到不同的虚拟服务器上,以便于提高处理效率。而Map Reduce 技术的出现,让并行式信息处理也体现出了应用优势。处理流程为:管理员对Map 和Reduce 这两个端口分别进行定义,然后从端口输入信息,计算机接收到信息后,根据预设的程序将数据进行分类,形成若干带有标签的数据片段。每个片段上分别对应一个键值对。计算机通过匹配数据片段的标签,以及每个Map 的特性,进行逐一配对,确保每个Map 都能分配数据片段并进行运算。最后将所有的运算结果汇总起来,形成一个键值对集合。后期根据信息利用需要,随时调用键值对中的数据。
3.3 云计算的大规模数据处理框架模型。云计算虽然具有极高的数据处理能力,但是面对纷繁复杂的数据,也存在数据处理成本高、系统运行负荷大等问题。通过构建大规模数据处理框架模型,提供一个模式化的数据处理流程,该模型内不同模块分别承担大规模数据处理的不同环节,例如数据预处理、数据分类、数据计算等,模型的运行效率和性价比更高。此外,该框架模型还具有较强的可扩展能力,后期可以根据大数据技术的发展,以及信息处理要求的变化,不断的增加一些新的功能,从而始终保持较高的实用性。
4 结论
大数据时代的到来,在推动计算机信息处理效率提升、挖掘信息数据利用价值等方面,提供了必要的支持,并且逐渐渗透到各个行业中,对社会经济发展、日常生活产生了深远的影响。下一步要依托大数据、云计算等技术,持续优化计算机信息处理技术,逐步提升技术的应用价值,满足现代化发展需求。