APP下载

Y—STR全自动比对一体化系统的设计与实现

2015-05-12张衡

科技创新导报 2015年34期

张衡

摘 要:该文按照法医DNA实验室管理以及质量控制的相关标准和规范,利用计算机局域网络建成一套规范的Y-STR信息录入查询比对系统。系统重点实现了对基因测序仪获取的Y-STR数据进行自动批量导入数据库,并自动比对数据进行分析处理,形成比对结果报告供刑侦破案专用。

关键词:Y-STR 比对 网络信息系统

中图分类号:TP393 文献标识码:A 文章编号:1674-098X(2015)12(a)-0000-00

人类的Y染色体是男性所特有的父系遗传染色体,它只能由亲代中的父亲传递给子代中的儿子,因此在Y染色体上留下了基因的族谱,也就是说一个大家庭中祖、父、孙、伯或叔、堂兄或堂弟的Y-STR数据是一致的。利用同一父系家族的男性成员拥有相同的Y-STR这一特性,将犯罪现场提取到的Y-STR数据,与一定范围内的家系进行比对,便可以追踪识别犯罪行为人所在家系,从而大大缩小侦查范围。

笔者按照法医DNA实验室管理以及质量控制的相关标准和规范,利用公安系统计算机局域网络建成一个规范的Y-STR信息录入查询比对系统。系统重点实现了对基因测序仪获取的Y-STR数据进行自动批量导入数据库,并自动比对数据进行分析处理,形成比对结果报告供刑侦破案专用。另外系统可对犯罪嫌疑人和物证信息进行多条件、全模糊、动态查询和检索。该系统是一套基于局域网络运行的多用户工作平台,可以通过广域网络实现与其他地域的DNA数据共享和数据交换。

系统的建成,不仅大大丰富和完善了公安部门Y-STR数据的积累和管理,而且极大地提高了Y-STR信息检测比对的工作效率,减少人工处理的差错,为刑侦部门解决案情提供了科学依据和有力保障。

1 系统设计

考虑到使用和后期维护的便利性,系统采用三层网络访问模式,即多浏览器+单Web服务器+多数据库服务器+动态计算。浏览器端分为三级用户登录(包括:普通录入员、管理员、超级管理员);单web服务器主要处理录入、查询、比对、分析、显示结果等过程;多数据库服务器主要存储系统所用到的人员、物证、Y-STR等数据(详见文章第三部分);动态计算部分是指系统采用的主要比对算法,用于快速、准确地分析显示比对结果。系统总体架构如图1所示。

2 数据库设计

我国DNA数据库的建设已经有近15年的历史了,但是对Y-STR基因座数据库的研究却不常见。随着Y-STR基因分析技术在案件侦破中发挥的作用越来越明显,文章重点研究了“人员信息数据库”“物证信息数据库”“Y-STR基因数据库”等7个数据库的设计与建设。各数据库之间的关系如图2所示。

(1)人员信息库:该数据库主要用来存储被测人员的基本信息,其中ID字段为唯一标识字段,LAB_NO字段与基因数据库关联,身份证号字段与全国公安身份证查询系统关联。

(2)基因数据库:该数据库是该系统中最重要的数据库,主要用来存储人员和物证信息相应的Y-STR信息,其中ID字段为唯一标识字段,LAB_NO字段与人员信息数据库和物证信息数据库关联。

(3)物证信息库:该数据库主要用来存储物证信息的基本信息,其中ID字段为唯一标识字段,LAB_NO字段与基因数据库关联。

3 主要功能

3.1 人员信息维护与管理

该功能主要针对与Y-STR相应的人员信息录入与管理,主要包括:单个人员信息录入;批量人员信息录入(支持Excel的*.xls文件格式批量导入人员信息);编辑、修改、删除已录人员信息。

另外,批量导入可以智能判断加人工干预已录实验室编号和未录实验室编号,并可以在入库前在线编辑导入数据格式和内容。

系统提供通过“实验室编号、人员姓名、录入者、性别”任一项快速查询人员信息及相应Y-STR信息,也可以通过“实验室编号、姓名、性别、样本类型、人员类型、出生日期、身份证号码、别名/绰号、文化程度、身份、涉案名称、涉案性质、户籍地、现住址、关押地类型、送检单位、送检时间、送检人、送检人电话、检验人、录入者、录入时间”任意单项或者组合模糊检索人员信息。

3.2 物证信息维护与管理

该功能主要针对与Y-STR相应的物证信息录入与管理,主要包括:物证信息录入;编辑、修改、删除已录物证信息。

系统提供通过“实验室编号、受理登记号、物证名称、案件名称、检验人”任一项快速查询物证信息及相应Y-STR信息。也可以通过“实验室编号、受理登记号、物证名称、案件名称、案发地点、案发时间、简要案情、案件备注、物证备注、送检单位、送检时间、送检人、送检人电话、检验人、录入时间”任意单项或者组合模糊检索物证信息。另外还可以快速编辑物证信息相应的Y-STR信息。

3.3 Y-STR信息维护与管理

此部分功能是系统核心功能和最主要的部分,主要包括:单个Y-STR信息录入;批量Y-STR信息录入(支持DNA测序仪获取的*.dat文件格式批量导入)。

批量导入可以自动检测dat数据中的Y-STR数据条目,可以智能判断在“Y-STR数据库”“人员信息库”“物证信息库”中是否存在dat数据中检测出的各实验室编号。

Y-STR信息入库同时可以比对出所录信息与Y-STR库中已有信息是否有大于或等于13项相同值的记录,并自动记录相同值的数量。另外,系统支持任意Y-STR信息的比对、编辑、修改、删除。通过“实验室编号”“检验人”任一项快速查询Y-STR信息及相应人员或物证信息,也可以通过“实验室编号、检验人、录入时间”任意单项或者组合模糊检索Y-STR信息。

4 结语

有效地建立Y-STR数据库并应用于公安刑侦工作,并对数据库建设中数值比对方法和提高比对速度的问题进行全面的研究十分必要。广泛收集样本和数据,验证和比较当前常用的Y-STR基因座并寻找适合的比对方法,探索突变的数学模型,运用适当的网络信息系统建设方法,解析与常染色体STR联合使用的结果,结合实际办案不断总结问题和需求,可以为我国Y-STR数据库的建设及高效应用打下良好的基础。

参考文献

[1] 侯丛.DNA数据存储与比对技术研究[D].西安:西安电子科技大学,2004.

[2] 于兆新.Y-STR分型在侦破案件中的应用[J].河南科技大学学报:医学版,2013,31(1):45-46.

[3] 杨玉章.Y-STR DNA数据库建设及应用[J].河南警察学院学报,2013,22(5):47-53.

[4] 刘冰.现阶段我国DNA数据库发展的几个关键问题[J].刑事技术,2015,40(4):318-323.

[5] 葛建业,严江伟,谢群,等.中国Y-STR数据库建设相关问题探讨[J].法医学杂志,2013,29(3):212-215,221.