计算机辅助面部分析法在Noonan综合征中的应用
2019-07-10辛颖王树水
辛颖 王树水
1汕头大学医学院(广东汕头515000);2广东省人民医院,广东省医学科学院,广东省心血管病研究所心儿科(广州510080)
遗传综合征大多属于疑难罕见病,表型复杂,临床诊断困难,由于人们对这类疾病认识不足,大量病例长期得不到确诊,据统计,目前全球25%的罕见病患者需反复就医5~30年才能被正确诊断,延误了病情的控制治疗,给患者及其家庭造成了沉重的经济和精神负担[1]。人类基因和分子遗传学的研究进展已经证实,遗传综合征大都伴随颜面部的异常[2],同一种遗传综合征有着相似的面容特征,而且面部特征与种族背景也息息相关[3],因此,研究面部特征与遗传综合征的关系为疑难罕见病的诊断开辟了一个新的方向。
Face2Gene 是一家以色列公司开发的一款通过脸部照片预测遗传综合征的应用软件,所采用的面部畸形分析技术(facial dysmorphology novel analysis,FDNA)将面部识别软件与生物知识相结合,能够从二维面部照片中检测出畸形特征和可识别的人类畸形模式[4],并能够建立遗传综合征的共同特征模式,对具有相同遗传综合征的脸部特征进行识别。因此,本研究运用Face2Gene 软件对16 例确诊为Noonan 综合征的患者照片进行分析,评估该软件在临床中的应用价值,为临床早期筛查诊断提供依据,对于提高出生人口素质、减轻社会和家庭的负担具有重大的经济和社会价值。
1 资料和方法
1.1 一般资料 选择广东省人民医院心儿科2016年11月至2018年10月收治的经基因检测确诊为Noonan 综合征患儿共16 例(男7 例,性9 例),年龄(3.7 ± 2.5)岁;对照组非Noonan 综合征患儿共83 例(男39 例,女44 例),年龄(4.1 ± 3.3)岁,见表1。所有病例取清晰的正面照一张,本研究经广东省人民医院医学研究伦理委员会批准,收集患儿信息及照片前均由其本人或监护人签署知情同意书。
表1 入组病例临床资料Tab.1 Clinical data of enrolled cases
1.2 遗传学检测分析
1.2.1 基因组DNA 制备 EDTA 抗凝管采集外周静脉血2~3 mL,参照《盐析法血液DNA 提取试剂盒》操作要求制备基因组DNA,用Sim-100 超微量分光光度计测定DNA 的OD值。
1.2.2 二代基因测序 取1 μg 基因组DNA 用Q800R 超声破碎仪进行打断,电泳质检峰值在350 bp 左右。然后进行末端修复,3′端加A,两端加上特定序列的接头,不同样本连接不同序列的条形码,经PCR 对带有接头的文库放大。Qubit 测定文库的浓度,每例样本取300 ng 进行混合,8 例样本为一个混合单位。往混合后样本中加入人类外显子文库进行杂交捕获,捕获后产物纯化后,经过post-PCR 扩增。琼脂糖凝胶电泳测定文库的大小,Qubit 3.0 及荧光定量PCR 测定文库的浓度。质检后文库稀释至上机测序浓度,使用Illumina Nextseq 500测序平台进行测序分析,测序平均覆盖深度为200X 左右,>10X 覆盖区间占100%,>20X覆盖区间占100%。
1.2.3 测序数据分析 测序结果经生物信息学方法进行数据分析,二代测序原始数据的注释范围为:每个外显子的变异以及外显子上下游各10 bp内含子中的变异,变异类型包括:错义、无义、同义、移码、整码、剪切等。对变异数据进行质控,测序覆盖深度低于20X 的变异标记为低质量变异。检索内部数据库、dbSNP、ESP6500、ExAC 等人群数据库,标注单核苷酸多态性和低频良性变异。应用预测软件对变异的保守性/致病性/危害性进行预测。检索HGMD,Pubmed,Clinvar 等数据库,检索变异相关文献,分析文献内容,参考ACMG(美国医学遗传学和基因组学学会)变异分类指南,对变异进行分类。根据基因突变的致病性程度分为5 档,即“1 类为致病的”、“2 类为可能致病的”、“3 类为意义不明确的”、“4 类为可能良性的”、“5 类为良性的”[5]。
1.3 Noonan 综合征面部特征分析
1.3.1 Face2Gene 软件 Face2Gene 软件结合了几种人脸识别方法,主要是基于局部外观的识别和基于格式塔的识别。在基于局部外观的识别中,系统会根据视觉线索,直接评估匹配脸部各个部位的概率。对于基于格式塔的识别,系统会考虑整个面部模式,而不会关注特定的区域[6]。具体步骤:首先对输入图像进行预处理,实现人脸标志点的检测和校准;预处理后,将输入图像裁剪到面部区域;然后将每个区域输入深度卷积神经网络(DCNN)来获得一个函数向量,分析其与模型中的每个综合征的对应关系;最后对所有区域DCNNs的输出向量进行聚合和排序,得到最终的遗传综合征排序列表。如果临床医生提供添加更多信息,如临床特征或人体具体量化数据,可以提高排名精确度。
1.3.2 研究方法 在Face2Gene 软件的临床应用中,应至少上传每个病例的正面照片1 张。由于该软件只能判定遗传综合征型,因此上传正常人照片后也会匹配包括30 个遗传综合征的排序列表,按照相似度进行排名。此外,对于上传的每一个病例(图1A),Face2Gene 软件会提供一个病例库中的标准化图片(图1B),同时还会生成一个热图(图2),热图中红色区域代表该类综合征最显著的标记特征,蓝色区域为最不显著特征。根据既往的研究[7],规定Noonan 综合征出现在所有匹配遗传综合征的前10 名时,将其认为阳性结果,11 名至30 名时认为阴性结果;若未出现在软件所匹配的30 个遗传综合征列表中时,则标记为31 名,为阴性结果。绘制两组之间每个等级的分布直方图,比较Noonan 综合征和非Noonan 综合征识别匹配的灵敏度、特异度和准确度。
2 结果
2.1 基因检测结果 16 例Noonan 综合征患儿分别检测到了BRAF、RAF1、PTPN11、LZTR1、RIT1 五个致病突变基因,且均为“1 类致病”和“2 类可能致病”,其中PTPN11 数量是最的,约占44%,见表2。
图1 Face2Gene 软件照片分析Fig.1 photo analysis in Face2Gene
图2 Face2Gene 软件生成热图分析Fig.2 Heat map in Face2Gene
表2 16 例Noonan 综合征基因检测结果Tab.2 Genetic results about Noonan syndrome 例
2.2 Face2Gene 分析结果 在Face2Gene 软件中共输入104 例病例照片,其中Noonan 综合征组16 例,非Noonan 综合征88 例,其中有5 例照片因面部图片太小软件无法识别而排除。在Noonan综合征组中,16 例患儿匹配项中Noonan 综合征全部排名在前10,即16 例全部为阳性,其中有12 例排名为第1 位;非Noonan 综合征组,有15 例排名在前10,即阳性率为18%。两组之间各个排名数量见图3,经计算,Face2Gene 软件对Noonan 综合征的分析检测灵敏度为100%,特异度为82%,准确度为85%。
图3 两组各个排名数量分布情况Fig.3 Ranking distribution of the two groups
3 讨论
Noonan 综合征是一种常染色体显性遗传病,活产新生儿中发病率为1/2 500~1/1 000[8],1968年NOONAN[9]首次报道了19 例该类患者,并以此命名为Noonan 综合征。2001年,TARTAGLIA 等[10]首次确定Noonan 综合征2 型患者的非受体蛋白酪氨酸磷酸化酶基因(PTPN11)错义突变,并在该基因缺陷的小鼠模型上证实,其编码蛋白产物SHP-2在心脏瓣膜的胚胎发育过程中起关键作用[11],其参与调控一系列生长因子和细胞因子的信号转导,从而导致患儿生长迟缓和骨骼异常等多种临床表现。通过查询OMIM,即在线《人类孟德尔遗传》(https://www.omim.org/)发现,根据不同的基因突变位点,可将Noonan 综合征分为10 个亚型。在本研究中发现了其中5 个致病基因,分别为BRAF、RAF1、PTPN11、LZTR1、RIT1,以PTPN11 数量最多,这与此前的报道是一致的[12]。
遗传综合征患儿普遍存在面容的异常,而且同一种综合征面容极为相似,例如21-三体综合征、williams 综合征等,Noonan 综合征是临床上一种罕见的遗传综合征,该类患儿也具有独特且相似的面部特征:上睑下垂、内眦赘皮、眼距增宽、鼻梁高、鼻孔大而上翻、嘴大且嘴角下斜、蹼颈,还常常伴有身材矮小,鸡胸或漏斗胸,凝血异常和肥厚性心肌病、肺动脉狭窄等。2017年,KRUSZKA 等[13]对来自20 多个国家不同种族的161 例Noonan 综合征患者进行研究发现,除了上睑下垂和蹼颈有差异外,Noonan 综合征在不同人群中的临床表现是相似的,其中超过70%的患者都有3 个共同的临床特征:眼距增宽、耳位低和身材矮小。
Face2Gene 软件是一款基于深度卷积神经网络(DCNN)[14-15]、通过脸部照片预测遗传综合征的应用软件[16]。本研究发现,Face2Gene 软件对16 例Noonan 综合征患儿面部图片进行分析匹配,其阳性率高达100%,即灵敏度100%,这可能与人们不断上传来自世界各地不同种族的同一类疾病的照片有关,使得Face2Gene 软件的灵敏度不断提高[17-18];而在非Noonan 综合征组中,Face2Gene 软件分析匹配结果认为约82%(68/83)为阴性,即特异度为82%,但是仍有18%(15/83)的非Noonan综合征患者被误认为Noonan综合征,这可能与软件本身的局限性有关,Face2Gene 软件默认所有上传的照片中的人均为综合征患者,即正常人也会匹配30个遗传综合征,因此在非Noonan 综合征组中会出现假阳性。在本研究中,Face2Gene 软件对Noonan 综合征的检测灵敏度为100%,特异度为82%,准确度为85%,由此笔者认为运用Face2Gene 软件对Noonan综合征进行分析是有效可行的,截止2018年11月14日,Face2Gene 软件上传照片数已达314 270 张(https://www.face2gene.com/),笔者相信随着上传病例数的不断增多,该软件对Noonan综合征检测的灵敏度、特异度会更高。查阅资料发现(https://www.omim.org/),根据不同的基因突变位点,Noonan 综合征有不同的10 个亚型,但是对于本研究中的16 例Noonan综合征患儿,该软件分析结果中没有对其进行分型,分析是由于该软件目前尚处于病例库建立初步阶段,同一类疾病数量有限,但是随着病例数逐渐增多以及数据的进一步完善,该软件会对每一类疾病的分析及分型做到更加精细。
综上所述,Face2Gene 软件对于Noonan 综合征的分析识别灵敏度较高,可以帮助临床医生特别是基层医生快速筛查、识别Noonan 综合征,可提高临床医生对该类疾病的认识,减少误诊漏诊率,优化治疗策略,有效开展遗传咨询工作,对于提高出生人口素质、减轻社会和家庭的负担具有重大的经济和社会价值。但是在本研究中,由于病例样本量不足,对于Noonan 综合征面部特征分析不够全面,需更大样本的研究进行验证,下一步将推广至大范围地区;其次,Face2Gene 是国外FDNA 公司开发的一款软件,目前为免费检测收集数据阶段,而且由于人类种族的差异性,自主研发一款适合亚洲人的人脸识别软件是十分有意义的,今后本团队将致力于研发适合亚洲人基于特殊面容特征的人工智能辅助诊断软件,对优生优育及减少出生缺陷具有重大意义。