APP下载

基于数据挖掘技术的放疗数据分析与评估技术应用探析

2023-11-06陈凌宇邓金城卢燕妮

电脑知识与技术 2023年25期
关键词:度量数据挖掘数据库

陈凌宇,邓金城,卢燕妮

(1.玉林市第一人民医院肿瘤科,广西玉林 537000;2.深影医疗科技(深圳)有限公司,广东深圳 518109;3.广西医科大学附设玉林卫生学校学生工作部门,广西玉林 537000)

0 引言

放疗数据是恶性肿瘤治疗过程中产生的相关数据,其产生的途径主要分为3方面,一是由医院信息管理系统、电子健康记录以及个人健康记录中产生;二是由放射治疗计划管理中产生;三是由医学影像设备产生[1]。这些放射数据中包含患者所有的个人信息、诊断结果、治疗记录以及用药和住院治疗等多个方面的详细信息[2];这些信息结构复杂,类别较多,包含医学影响、诊断记录、病历档案等,整体可分为结构化信息、半结构化信息以及非结构化信息[3],具有显著的多源异构特性,因此在一定程度上呈现相互孤立、且分散程度较高等分布状态。除此之外,放疗数据存储于不同的治疗科室内,导致医生在进行临床应用时,无法全面掌握数据情况,到时数据的可利用程度较低[4]。近几年恶性肿瘤的临床治疗病例显著增加,各大医院对于该类患者进行治疗过程中,均需依据放疗数据完成,因此,导致各大医院对于放疗数据的管理需求也逐渐增加,如何有效、全面、合理的实现放疗数据的整合和管理[5],对于患者情况的掌握以及其放疗数据的分析具有重要意义。

数据挖掘技术属于人工智能领域中的一项重要的大数据处理技术,该技术具有良好的大数据处理能力,可获取海量数据中的隐藏信息。并且该技术具有不同类型数据的挖掘和处理能力[6],能够较好地完成具有多源异构特性的分析和处理;除此之外,其还能够完成数据库的挖掘。因此,本文针对放疗数据的管理需求,提出基于数据挖掘的放疗数据分析与评估技术,并对该技术的应用情况展开相关分析和测试。

1 基于数据挖掘技术的放疗数据管理

1.1 放疗数据挖掘模型原理

由于放疗数据为多源异构数据,数据的类别较多、结构较为复杂,因此,本文为实现放疗数据的全面、有效管理,主要依据基于数据挖掘模型进行放疗数据的挖掘,该模型结构如图1描述。

图1 放疗数据挖掘模型结构

数据挖掘模型在进行放疗数据挖掘时,可以对各个部门中的患者档案、电力病例以及相关治疗记录文档和表格进行深度挖掘,并且对挖掘和抽取的放疗数据进行加载和转换处理后,实现放疗数据的高效整合[7],以此构建统一的元数据库。以元数据库为基础,利用数据引擎获取其中的放疗数据和信息,并且通过可视化界面,将所需的放疗数据呈现给用户。通过该模型即可有效解决临床中放疗数据的分散现象,实现放疗数据的整体化管理,提升放疗数据的管理水平。

1.2 基于数据挖掘技术的放疗数据挖掘

由图1 可知,放疗数据库的构建是以元数据库为基础,因此,本文为保证放疗数据库构建后数据的调用能力以及数据完整性,文中采用MVC 框架作为放疗数据的数据库结构,该框架主要分为模型层、视图层以及控制层,通过3层之间的相互支撑,完成数据库基础结构的构建。其中,模型层是数据库框架的基础,其主要作用是为数据库构建提供相应功能支撑,保证放疗数据业务处理流程满足相关标准和规则;视图层主要是用于实现数据库的可视化和交互,使用户能够查看数据库中的数据结果;控制层属于数据库框架中的中间层,主要用于另外两层之间的数据传送和操作的协调和控制。

采用数据挖掘技术进行放疗数据挖掘时,以元数据库为基础,利用数据挖掘引擎获取其中的放疗数据,形成不同主题的放疗数据集,实现放疗数据库构建。本文为保证放疗数据的挖掘效果以及数据库的质量,在进行放疗数据挖掘和存储过程中,主要采用聚类算法完成。

式中:me表示所有质心数量;αi表示质心,属于同一个放疗数据样本,其计算公式为:

式中:X表示放疗数据总样本。

为避免挖掘的放疗数据存在储过程中发生畸变,文中引入畸变函数对挖掘的放疗数据进行约束,其计算公式为:

式中:J(c,α)表示距离平方和,对应样本点和其质心之间,保证其取值为最小结果,同时完成(c,α)的收敛,以此获取放疗数据局部最优结果。在此基础上,依据概率强度和关联重要程度,提升放疗数据库的应用效果,确保放疗数据的存储和管理效果。

1.3 数据挖掘结果评估

依据上述小节完成放疗数据的挖掘后,为衡量挖掘结果对于临床的应用效果,挖掘的放疗数据是否为有价值数据,文中直接对数据挖掘结果进行评估。该评估主要从两个方面进行,分别为用户的主观层面以及挖掘模型的客观层面;前者主要通过3种标准进行衡量,分别为易于理解程度、数据有效程度、潜在价值情况;后者则通过主观度量进行评估,该度量需具有放疗数据特征给定能力,同时满足已经定义的信息需求。

本文在进行挖掘模型客观层面评估时,度量信息能够通过3个层次的度量,进行数据挖掘模型的评估,分别为基本度量、派生度量以及指示器。挖掘模型的评估度量构造模型如图2描述。

图2 数据挖掘模型的评估度量结构

对数据挖掘模型在进行放疗数据挖掘后,会获取若干条模式,其中也会存在一定的无价值模式,因此,对挖掘模型的挖掘结果进行评估,是保证数据挖掘结果的有效手段;依据评估结果可去除没有价值的模式,并且提升数据挖掘的效率。

2 应用结果分析

为分析数据挖掘技术在放疗数据分析与评估上的应用效果,以某医院的放疗数据作为实例分析对象展开相关测试,测试主要包含两个方向:一是放疗数据库构建效果,二是放疗数据分析效果。

放疗数据库构建效果对于放疗数据的应用效果存在直接影响,文中采用离散度常数作为衡量指标,用于分析数据库中,同类放疗数据的差异性,该指标的取值范围在0~1 之间,越接近1 表示数据库的构建效果越差。该指标的计算公式为:

式中:mean表示加权平均数;ij表示放疗数据元素的一个项。

依据该公式获取本文技术进行放疗数据库构建后,在不同的数据类别下,随着数据量的逐渐增加,σ2的测试结果,如表1描述。

表1 离散度常数测试结果

由表1结果可知:在数字化结构数据、影像数据以及结构化数据三种数据类别下,随着数据量的逐渐增加,采用本文技术进行数据挖掘后,构建数据库,数据库发的离散度常数σ2结果均在0.025 以下,表示同类放疗数据之间的差异性较小,能够有效完成放疗数据挖掘,数据库的构建效果较好。

为验证本文技术应用后,对于放疗数据的分析效果,随机抽取一条数据库中存储的放疗信息,并对该信息记性分析,获取分析结果如图3所示。

图3 放疗数据的分析效果

由图3结果可知:本文技术应用后,能够实现数据库中放疗数据的解析,并获取解析结果,该结果中包含患者的CT 检查数据以及部分的治疗信息。因此,本文技术具有放疗数据分析能力,能够精准掌握数据库中放疗数据详情。

3 结论

数据挖掘技术对于大数据的处理具有显著优势,放疗数据包含多个类别的数据信息,对于数据的利用、患者情况分析等均具有一定影响。因此,为保障放疗数据的二次利用,同时分析数据挖掘结果的可靠程度,本文探析数据挖掘技术在放疗数据分析与评估上的应用情况。以数据挖掘模型为基础,并依据该模型挖掘放疗数据,构建数据库,实现放疗数据的统一封装和管理,并且评估挖掘效果,确保放疗数据的管理效果。

猜你喜欢

度量数据挖掘数据库
鲍文慧《度量空间之一》
模糊度量空间的强嵌入
迷向表示分为6个不可约直和的旗流形上不变爱因斯坦度量
基于并行计算的大数据挖掘在电网中的应用
地质异常的奇异性度量与隐伏源致矿异常识别
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究