人工智能在生物技术领域的应用
2023-06-24赵心慧
摘要:人工智能在生物技术领域的应用越来越常见,且信息安全也逐渐受到关注。在此种背景下,本文从生物识别技术推动人工智能发展的观点入手,研究了人工智能技术在生物信息学中的应用,又分析了信息安全领域中生物识别技术和人工智能融合。
关键词:人工智能;生物技术;信息安全
随着人工智能的发展,各行业系统、机器等的运行越来越智能化,工作也越来越高效和精确。生物技术是利用微生物和动物作为原料,对其进行研究、分析、加工,为人类提供各种有用的技术。随着人工智能和生物技术的结合,它能够自动接收、分析和发送信息,从而极大地提高了信息管理和信息传递的能力。
一、生物识别技术推动人工智能发展
(一)生物识别为人工智能提供大数据支撑
人脸识别是一种以面部特征为基础的一种生物技术,首先要将多张面孔图像经过相机的拍摄,然后预加工、校正、过滤等预处理后,将所得到的图像特征与所保存的特征模板进行检索和比对,以确认图像。相对于其他的生物特征如指纹、虹膜等,它具有采集容易、成本低等优点[1]。如果说照相机赋予人工智能视觉,那面部辨识技术赋予人工智能“最强大脑”的能力,让人工智能拥有了一双智慧之眼。科技改变生活,人工智能和面部辨识技术使人们走上了“刷脸”的道路。例如:在走向一个自助银行时,摄像机会自动“刷脸”打开大门。如果在ATM机上忘了密码,就能用ATM机上的相机“刷脸”提款和转账。这样既能方便存款人,又能保证资金安全。世界上具有人脸识别功能的自动取款器在杭州问世,广州在养老金的身份验证中采用了面部识别技术。不仅如此,在轨道交通系统中,也将率先采用面部特征的人脸识别技术进行身份鉴别。
(二)生物识别企业发力人工智能市场
无论是机械视觉还是生物识别,都是人工智能的范畴,而机器视觉与生物识别的实质就是影像的辨识与对比。而人脸识别,是利用计算机和生物识别技术,实现对人脸进行身份验证的合理方案。
让人工智能拥有最强大的头脑,则是人工智能技术的第一个突破方向。对于生物识别厂商而言,这是一个难得的机遇,很多公司都在主动地进入人工智能领域,或者通过与人工智能公司的联合,占据更大的市场份额。
(三)生物识别技术促进人工智能生态形成
生物识别技术由于受到各种因素的影响,目前尚未形成规模,导致其工业化进程很慢。在智能手机和人工智能等新兴行业中,生物技术的快速发展给了它巨大的发展机会。据了解,目前平安生物识别技术已经为100多个应用领域提供了支持,比如深圳社保部门最近发布的“刷脸”退休金网上验证系统。深圳航空公司已经和平安科技公司建立了一种新的战略伙伴关系,并且已经开始了面部图像的应用[2]。深度学习对传统的生物辨识技术的运用产生了革命性的影响。随着深度学习算法的不断完善,其精度不断提高,其技术的发展也打破原来的局限,逐步向更广泛的方向发展。而基于深度学习的计算机技术的发展也为生物辨识系统的发展和应用奠定了坚实的基础。
二、人工智能技术在生物信息学中的应用
(一)文本分析技术在生物信息学中的应用
1.蛋白质折叠识别
蛋白质的折叠是指能够正确地从大量的蛋白质中提取出特定的三维立体结构,这是目前的一个重要研究领域。在蛋白质一级序列中,常用字母来表达标准型的氨基酸,而其顺序则是通过文字文档将其存储到相应的资料库中。目前全球最大的蛋白质顺序数据库是美国国家生化技术信息中心NR,即非基因工程数据库。NR的数据仓库和普通的MySQL数据库完全不同,它采用了fasta的形式,且信息量非常大,可以將大量的数据分析方法用于蛋白质序列分析工作。
2.应用原理
当前,蛋白质从折叠识别开始,可以将蛋白质的全部顺序涵盖,直至建立起三维空间,而传统的研究方式则多采用“穿线法”(Threading),以目标序列为“针”在蛋白质的立体空间中穿行,并对其进行精确的分析。而在蛋白质的折叠状态中,它的理论应用是基于在不完全相同的前提下,它的空间构造也具有类似的作用,这就说明了蛋白质具有较强的同源性。在生物学的发展过程中,为了确保自身的基因结构能够维持自身的完整,那么基因的结构就必须维持自身的稳定性,而基因的序列却会受到各种变异的影响。这种特征可以用一个具有较多的保守性的蛋白质的构造来表示。在蛋白的折叠中,文字的解析是非常关键的。当前科学研究领域提倡一种以文字为基础、以机器学习为辅助手段的研究新思路。在使用此技术时,利用文字解析来实现信息查询的功能,当一个蛋白质的层次结构被明确查询时,针对一个折叠蛋白的目标,就是将包含概率的固定的模板,按照顺序和结构关系进行分类。本文的研究是从整体的观点出发进行的一种策略,可以说是利用与搜索引擎有关的方法,来达到对蛋白质的有效的翻转。同时,将蛋白的特性矢量(作为设计的参量)引入到机器学习中,可以对蛋白质的序列进行描述,并对其结构相似度进行解析。
3.文本存储
尽管通过3D图像可以实现蛋白质结构的展示,但真正的蛋白质结构的储存工作是以文字形式进行的,并且以PDB形式将其保存在有关的计算机或资料库中。目前PDB的数据库中,包含了160,000多个大分子的数据,其中大部分都是与蛋白质的结构有关的文档。正是由于利用文字来储存蛋白质的档案,使得文字的解析对于特定的蛋白质结构进行研究,包含但不局限于从数据库中提取资讯、充分地分析数据、筛选蛋白的选择等等。
4.蛋白质分类
从外观和使用的作用上,可以把整个机体的蛋白质分为纤维蛋白、球蛋白、膜蛋白三大类别。在蛋白质中,膜蛋白是一种比较特别的物质,其二次构造的预测精度不高。主要的成因在于,由于膜蛋白质处于生物膜的内部,因此跨膜区与非跨膜区的膜蛋白质,不论其现实的差别,或其特定的作用均有很大差别。因此,膜蛋白与球蛋白的生物化学性质是截然不同的。准确获取跨膜区及非跨膜区的膜蛋白质的信息,有助于准确地评价膜蛋白质的生物活性。显然,针对细胞膜蛋白质的二级构造进行预测,是未来的一个主要发展趋势。
(二)Docker技术在生物信息学中的应用
1.技术优势
Docker不但拥有开放的资讯,而且能够在应用中确保其安全性和可靠性,因此对于生物资讯科学的实际使用很有意义。首先,是跨平台支持。随着生物信息学的不断发展,各种信息资料以几何倍数的速度增加,270多种开放源代码的技术都被用于了生物学领域。但是,很多实用的工具,都是由C++、Python等多种编程语言来实现,每一门语言都有自己独特的应用场景和配置。Docker可以在任何情况下,为用户在各种场合下的应用程序和性能提供最好的支持。其次,是集成服务器。它要做大量的数据分析,比如序列比对、基因组注释等等,并不需要太多的数据存储和维护。由于不清楚特定的资源效应,使得很多独立的研究机构很难利用现有的序列信息,从而增加了对基因的研究的困难。Docker可以将所有的计算资源都集中起来,并且灵活地进行扩展,在最少的开销下,将所有的硬件都发挥到极致。最后是高效开发。在进行数据分析时,不管是输入还是输出,都需要庞大的数据处理能力,这就造成了很多测试数据都是GB级的,而省里和国家的研究,往往也是GB级的,这就造成了很多问题的重复和修改,这就造成了很多应用程序的重复。不过Docker可以在一个地方的计算机上生成几十个存储数据和 Docker的镜像,这样就可以有效地进行在线仿真练习。另外,开放源码社群还为你的镜像提供了许多的调试工具,可以让你的镜像变得更好,同时也可以降低对你的需求。此外,就是有效地使用各种资源,在生物信息领域,高通量的测序仪所能提供的信息远远超出了摩尔定律的极限,而二次世代的基因序列技术,虽然比前一代的基因序列要多出几百到一千倍。Docker可以让启动速度达到秒级,并具备更好的运算速度,这样就可以专注于数据的解析,节省了大部分的生产过程,减少系统的负荷并提升整个应用的效率。
2.分析工具
Docker可以将大量的实用仪器和相关的数据资料打包到一个没有任何重复的镜像中,为分析者创造了一个方便的环境。NanoOK是以BLASR、BWA等技术组成的,它的作用是进行多个序列的对比和序列的匹配,而其具体作用是利用大基因组进行全面的对比,从而进行更加全面的多基因比对。而SBMLDock,将被试的对象作为数据模型,将各个模型的结构进行比较,从而实现对各个模块的识别和解释,以及从数据中抽取出相应的数据,从而实现对生物的系统的分析。FloweatchR则是利用EBImage技术,将细胞的影像以微观形态进行提取,并进行分析,以此来判断细胞在被探测到的过程中的真正位置,以及细胞受到外界刺激时的运动,最终得到细胞的运动轨迹。利用大量的数据,在标准的输入和输出过程中,实现了系统的参数管理,同时还可以让不同的分析工具使用相同的界面,大大减少了以前的软件部署的困难,提高了系统的分析速度,也解决了以前的资源分享问题。更有代表性的是SBMLDock可以用SBML的形式来编写对数的资料。
3.分析流程
Docker能够将各种技术的软件组合起来,并将它们组合成一个完整的镜像,使技术工作者能够在使用过程中维持同样的执行准则。另外,根据特定的分析过程来制造Docker的影像,也可以作为生物资讯的一个应用结果。比如,将Illumina HiSeq数据平台提供序列化的数据,就可以为Docker的镜像进行数据传送、实现Docker的实际操作,以及将诸如FastQC等各種工具的镜像进行包装。此外,还可以进行基因工程的研究,进行基因的评价和比较,筛选出最有参考意义的基因,供今后的试验选用。利用Tophat2的工具,可以完成RNA的全部解析,并将其作为一种数据,储存在适当的储存装置中,SAKE会对基因的变化进行全方位的检测,提高分析的速度,而BLAST可以将测试的目标设定为不特定的RNA。利用Docker的方法,可以减少许多耗费计算机的工作量,减少复杂的数据处理,使其在重复使用上获得了广泛的支持。利用Galaxy的数据处理系统,利用SADI的前端,以及从视觉上的角度,对Docker进行了分析,从而实现了对UniProt数据库的高效率的存取和精确的数据检索,对数据的有效统计,以及对问题的及时跟踪,确保了对程序的快速反应,提高了检测的品质,更方便地使用。
三、信息安全领域中生物识别技术和人工智能融合
(一)以人脸识别为基础的生物识别技术算法分析
从人脸识别的整个过程来看,图像预处理是最重要的一步,因为在人脸的识别过程中,影像的品质会直接关系到人脸的检测和对比度[3]。而当人脸是由摄像机拍下的时候,得到的影像会受到一系列的因素的干扰,从而导致影像与原始物体之间的差别很大,难以进行有效的辨识。在大部分的图像前处理中,通常采用的是灰度化和直方图均衡以及图像滤波去噪声等。在进行图像处理时,最常见的是RGB格式,由于光照等原因,RGB彩色模式必须采用RGB模式。直方图平衡是通过增强图像的区域对比性,通过直方图的帮助,使得图像的亮度均匀分配,增强了局部的对比性,而不会对整个图像的反差产生任何的影响。在进行了预处理之后,要对脸部特征进行有效的抽取,其中包含了哈尔特征、LBP特征和Gabor特征。只有在对人脸进行预处理和面部特性的描述之后,才能对目标进行有效的人脸识别。利用电脑技术对影像资料进行加工,并采用辨识技术进行有效辨识,并与资料库中的资料进行比较,以实现辨识。
(二)在金融信息安全领域的应用
在世界范围内,我们国家的外汇市场在国际上占有举足轻重的地位,地位仅次于美国。在美国,以信用卡为主导的国内金融业务中,移动电话付款占有很大比重[4]。为了保证财务信息的安全,美国大部分的金融业都采用了人脸识别和指纹识别等生物识别技术[4]。
(三)在个人身份信息安全认证中的应用
由于美国的许多机场都采用了生物辨识技术,因此在很多机场都采用了这种个人身份信息安全认证技术。在国内,人们普遍采用了生物技术进行个人身份信息的安全性验证,并在最近几年中收到了显著的效果[5]。
(四)在门禁系统中的应用
对于高级别的组织而言,他们的保密措施对于保证机密和关键信息的安全起着非常关键的作用,所以近年来各大组织纷纷采用了生物识别技术,以防止信息泄露和其他潜在的危险。在身份验证中,采用了人脸、指纹、虹膜、语音等多种身份验证,从而确保了身份的安全。
(五)智能终端设备与生物识别技术的联合应用
近几年,随着科技的发展,智能手机越来越受到大众的欢迎,而在目前的科技发展中,通过与生物技术相結合的方式,可以通过指纹和面部的技术来完成。在2018年,生物辨识技术在手机上的使用量已达到了50%以上,其中大部分都用于解锁手机,解密隐私文件,手机的密码认证。
(六)在智能化场景中的应用
在信息安全方面,将其与人工智能技术结合起来,可以避免信息丢失和泄露,从而更好地保护信息的安全,二者结合已被广泛地用于许多智能化的场合。比如,现在许多车辆在开关启动、车锁应用和监控上都采用了生物辨识技术和人工智能技术[6]。
四、结束语
当前生物技术和人工智能技术在信息安全行业中的应用越来越广泛,在今后的发展中,它的市场将会越来越大,发展方向也会逐渐多样化。因此人工智能在生物技术领域的实际应用,是未来各行业发展与研究的重点。
作者单位:赵心慧 华中师范大学
参 考 文 献
[1]唐代兴. 基因工程和人工智能:人类向后人类演进的不可逆风险与危机[J]. 江海学刊,2020(03):111-117.
[2]李怀胜. 滥用个人生物识别信息的刑事制裁思路——以人工智能“深度伪造”为例[J]. 政法论坛,2020,38(04):144-154.
[3]张昌盛. 人工智能、缸中之脑与虚拟人生——对元宇宙问题的跨学科研究[J]. 重庆理工大学学报(社会科学),2021,35(12):52-63.
[4]周祯,闫超,张辰宇. 人工智能生物学——生物学3.0[J]. 中国科学:生命科学,2022,52(03):291-300.
[5]韩水法. 人工智能时代的人文主义[J]. 中国社会科学,2019(06):25-44,204-205.
[7]孟琪. 人工智能时代个人信息的法律保护[D].北京交通大学,2021.
赵心慧(2002.06-),女,汉族,山东德州,华中师范大学2020级生命科学学院在校大三学生。