APP下载

遗传疾病领域中面部识别诊断技术的研究与发展

2021-04-03王泽宇陈露祁鸣

当代医学 2021年22期
关键词:正确率遗传综合征

王泽宇,陈露,祁鸣

(浙江大学医学院,浙江 杭州 310000)

人面部识别(human face recognition)技术是生物识别技术的一种,主要通过计算机与光学、声学、生物传感器和生物统计学原理等高科技密切结合,利用人体固有的脸形、虹膜、视网膜、色斑、痣疣以及指纹、静脉纹等生物特征,和头部动态、眨眼睛频率、声音、笔迹、步态等行为特征,采用不同特征表示方法分析人面部图像,提取有效信息进行研究。科学研究发现,疾病不仅会造成人体内在结构、生理功能的异常,还可能会导致人面部特征、运动形态改变或畸形,尤其先天性遗传疾病会造成面部特殊特征。基于此,近年来,人脸面部识别技术已逐渐进入医学诊断领域,通过分析患者面部的视觉特征信息研究疾病引起的特殊面容,采集患者面部特征标志点数据,构建患者面部模式与疾病数据库,最终通过计算机机器诊断来确定患者的疾病类型[1-2]。本文简要概述了人面部识别技术的发展历史与基本原理,以及其在医学遗传领域上的发展历史、应用与现状,为医学领域的遗传学研究提供遗传诊断的依据[3]。

2 遗传疾病面部识别诊断技术研究与应用

18世纪,1篇基于人面部特征信息进行身份鉴别的文章发表于《Nature》[2]上,开启了近代人面部识别技术应用的序幕。

目前,遗传病诊断包括常规诊断和特殊诊断。常规诊断指与一般疾病相同的诊断方法;特殊诊断是指采用遗传学方法,包括染色体检查、家系分析等,是遗传病确诊的关键。前者耗时短但误诊率高,后者准确性高却需耗费大量的人力、物力、财力,非普通家庭所能承担。而面部识别技术可用技术模型协助人力,以数据库补充遗传学分析,将线下会诊转化为线上询诊,在降低误诊率的同时提高诊断效率。据统计,遗传综合症中已明确约有3 500 种遗传综合征具有明显的面部病理特征。面部识别诊断技术是由成熟的面部识别技术与医学领域诊断技术相结合,通过计算机机器辅助医生进行疾病的准确诊断。面部识别诊断技术的基本步骤包括受试者图像预处理、人面部检测、面部特征信息提取和疾病数据库对比并分类。具体步骤如下:①获得受试者(患者)面部图像。图像可通过摄像头、相机等获得,图像需保证清晰度、像素、人脸完整程度、背景光线颜色和被拍摄者的方向与形态,建立图像的预处理标准,有助于批量处理图像。②检测预处理图像。按照面部形态以及比例特征进行面部点位标记,点位标记精细程度越高,产生数据量也就越大,识别准确率也就越高。③图像特征点信息提取。采用Gabor 小波变换(Gabor wavelet transform)、局部二值模式(local binary pattern)等方法对几何特征、质地和相关度等特征点进行处理与数据提取[1]。④完成数据提取后,将受试者样本面部特征数据与机器后端中疾病数据库进行比对,筛选出与样本特征相似的疾病模型且归类,从而对该受试者得出具体诊断结果,其中可用到的诊断分类、归类方法包括留一交叉验证法及训练法等[4]。

面部识别技术及成果已初步应用于医学领域,在具有明显面部病理特征的疾病中,人面部识别技术可对其进行精确识别与分类,且具有诊断的潜在应用价值,如先天遗传性疾病、内分泌疾病、慢性疲劳综合征和CFS 缺乏等疾病[5]。2003年,人面部识别技术第1次被成功地应用于遗传综合征的面部识别,证明计算机机器通过识别算法识别遗传综合征的可行性较高。该实验选取55 例患有5 类不同遗传综合征的测试者,包括脆性X综合征(窄长脸、面中部发育差、前额突出、下颌前突、耳部特殊改变,如大耳、耳外翻、招风耳、单耳轮等)、德朗热综合征(小头、弓形眉、连体眉、短鼻、鼻孔前倾、长人中、上唇薄、嘴角上翘和颚/颌小)、黏多糖贮积症3型(头大、舟型头、前额突出、眉毛浓密、眼睛突出、眼睑肿胀、鼻梁低平、鼻孔上翻和嘴唇大而厚)、Prader-Willi综合征(窄脸、前额窄凸、长颅、单眼皮、杏仁眼、斜视、窄鼻梁、薄上唇、嘴角下垂、小嘴、小下颌)和Williams-Beuren综合征(小头、眉间潮红、眼裂小、斜视和低鼻梁)。试验采用人工设置32 个面部标记点并使用Gabor小波变换进行数据处理,结果采用留一法将单个样本进行对比与分类,试验结果最终显示诊断准确率达到76%,而试验中的临床遗传学专家对同样的图片进行判断,其准确率仅为62%,低于计算机的识别正确率。计算机能更好的、更精准的识别受试者患有的潜在疾病。

2.1 唐氏综合征 唐氏综合征是最常见的因染色体异常导致的遗传综合征。唐氏综合征患者具有的特殊面容特征包括眼距宽、眼裂小、眼外侧上斜、有内眦赘皮,鼻根低平,外耳小,舌胖、常伸出口外,流涎多,身材矮小,头围低于正常人、头前后径短、枕部平呈扁头,颈短,皮肤宽松等特殊的面容特征,可被计算机捕捉且识别检测率较高[6-7]。2014年,研究者采用多个不同的分类器(包括支持向量机、k-近邻、随机森林和线性鉴别分析)识别唐氏综合征患者和正常人群,正确率最高为96.7%。实验中识别技术采用独立分量分析(independent component analysis),同时,改进了标志点的检测,用该技术分析出的代表性面部特征非常符合临床的观察。另外,实验还测试该技术分辨唐氏综合征和其他遗传综合征,到97%的正确率。有研究者认为,该技术可有效地用于唐氏综合征的检测,并可推广至其他遗传综合征的识别[8]。

2.2 德朗热综合征 2014 年,一种新型技术面部畸形新分析(facial dysmorphology novel analysis,FDNA)技术被用于识别CdLS患者的面部图像。研究者选取34例CdLS患者的照片作为阳性样本,97例非CdLS的其他综合征患者作为阴性样本,对FDNA系统进行训练,训练完毕的系统识别31例NIPB,或 SMC1A 基因突变的 CdLS 患者和非 CdLS 受试者(分别为16、6、9例),其识别正确率为87%,而医学专家对相同样本的识别正确率为77%。可见FDNA技术对CdLS患者和非CdLS受试者的辨识能力较强,临床前景较好[4]。

2.3 努南综合征 Noonan综合征(努南综合征),1963年由Noonan 和Ehmke 首次认定的一种疾病,患者伴有特殊面容和多发畸形,包括先天性心脏病。Noonan 综合征的发病率为1:2 500~1:1 000,目前明确发病相关基因为PTPN11、SOS1、RAF1、RIT1、KRAS、BRAF、SHOC2等,与丝裂原活化蛋白酶(RAS-MAPK)信号通路异常有关[9-10]。Noonan 综合征的主要特征包括特殊面容(即眼距增宽、睑裂下斜、蹼颈)、先天性心脏病、身材矮小和胸部畸形。约25%的患者有精神发育迟滞,50%患者有出血倾向。骨骼系统、神经系统、泌尿生殖系统、淋巴系统、眼睛和皮肤可不同程度地受累[11-14]。2004 年,Hammond 等[15]使用 11 个遗传综合征的医学诊断相关特征点,包括内外眼角、上嘴唇中点、左右嘴角、鼻根、鼻尖、人中、下巴等,同时采用密度表面模型(dense surface model,DSM)和3D人脸模型分析的方法进行Noonan综合征面部特征的建模和分析。实验中采用5 种分类器包括近邻均值、C5.0 决策树、神经网络、逻辑回归和支持向量机识别Noonan患者和健康人群。实验结果表现敏感性和特异性的最高水平达到94%和88%。2017 年3 月,Paul Kruszka 等[16]选取非洲、亚洲和拉丁美洲等地共20 多个国家的罕见病患者样本,运用人面部特征识别技术进行试验比对,其中患者平均年龄8 岁。总样本量为322 例,标注样本量为125 例Noonan患者,其中女性占比46%。实验结果显示,敏感性为94%,特异性为90%。

2.4 其他遗传疾病 除上述遗传疾病种类以外,仍有多种遗传疾病具有明显的面部患病特征可通过人工智能面部识别进行诊断,包括克氏综合征(Klinefelter syndrome,KS)、X染色体易裂症等遗传疾病[17]。针对表现出特殊面部特征的疾病,面部识别技术均能较准确的识别并进行诊断[18-19],如内分泌代谢性疾病库欣综合征[20-22]、肢端肥大症[23-24]等。2011年,实验室研究人员选取57 例肢端肥大症患者面部图片样本进行试验,加入60张正常人面部图像,使用面部图像辅助诊断(facial image diagnostic aid,FIDA)人脸分类软件对患者及正常人群进行识别。建立Gabor 小波变换与留一交叉验证方法对实验图像进行分析处理,实验结果显示,患者识别正确率为71.9%,对照组图像识别正确率为91.5%,略高于医学专家的63.2%和80.8%[25]。

2.5 遗传疾病常规诊断现状与技术对比 遗传疾病常规诊断依赖于传统医生的个人经验与诊断技术,个体差异较大,而人面部识别技术可依据数据库识别成功率较高,且已在遗传综合征、肢端肥大症等疾病领域取得了良好效果。同时,人面部识别技术也可用于其他具有特殊特征的疾病类型,如慢性疲劳综合征和内分泌疾病等有面部特征改变的疾病。人面部识别诊断技术作为遗传疾病诊断辅助手段或遗传疾病筛查手段具有高效、简单、便宜、非侵入性和易推广等优点。

但人面部识别诊断尚需实现以下几方面工作:①识别诊断成功率受到样本数据量的限制。数据量积累越多,所获得的检测结果往往越精确。②受地域限制。不同地域不同人种的面部特征及数据往往不同,需在计算机内建立多套样本模型以保证识别检测的成功率。③需建立年龄、BMI和家庭基础信息匹配的人面部识别数据库,尽量完善统计数据信息与种类,从而保证计算机识别的准确性。

3 展望

经过人面部识别技术的不断发展与完善,越来越多的遗传综合征将被计算机记录,应用开发机器算法,有望覆盖遗传综合征检测筛查。在国内遗传咨询临床医生严重缺乏、国内医疗资源分布不均的环境下,传统疾病检测诊断的高昂费用将推进人面部识别技术这种人力资源消耗少、费用低廉的新型医疗检测方式的普及与应用[26]。虽然面部识别技术应用前景可观,但在医学遗传领域,对其技术稳定性的评估和临床应用的普适性还需要实践探索,尤其是相似面部病理特征的区分与归类,仍有待医学与计算机领域研究者共同推进。

猜你喜欢

正确率遗传综合征
非遗传承
SAPHO综合征99mTc-MDP及18F-FDG代谢不匹配1例
Chandler综合征1例
门诊分诊服务态度与正确率对护患关系的影响
考前综合征
还有什么会遗传?
还有什么会遗传
还有什么会遗传?
猪繁殖与呼吸综合征的预防和控制
生意