APP下载

疾病本体数据在人体生理位置上的可视化研究

2019-05-16彭栩生王亚东

智能计算机与应用 2019年2期
关键词:本体器官边缘

彭栩生,王亚东

(哈尔滨工业大学计算机科学与技术学院,哈尔滨150001)

0 引 言

疾病本体[1-2]是人类疾病的标准化本体,对其开发将旨在为生物医学界提供一致的和可重复使用的人类疾病术语、表型特征和相关医学词汇。

疾病本体的拓扑结构是有向无环图,其根结点id为“DOID:4”,目前其下又可以分为8类,分别是:disease by infectious agent、disease of anatomical entity、 disease ofcellularproliferation、 disease of mental health、disease of metabolism、genetic disease、physical disorder、syndrome 。

考虑到疾病本体数据繁多,且多以obo[3-4]或者owl[4-6]之类的文本形式存在,难以阅读和查找,因此需要对其进行合适的可视化操作。

本文给出了一种对部分疾病本体数据进行可视化的方案,可以将疾病本体数据映射到人体的生理位置,直观清晰地表示某个生理系统或者器官中的疾病,从而加速对疾病本体的筛选和查找过程。

1 总体方案设计

该可视化方案主要是在可视化区域中,首先绘制人体各主要系统或者器官的图片,另列出该层级下所有包含的疾病本体实例。当用户点击某个具体的器官或者系统时,可视化区域中所绘制的人体图片也将发生变化,仅绘制与选择器官或者系统有关的数据,与此同时,疾病本体列表也进行精简,只保留该系统或者器官下的实例。系统共分为3个层级,从上至下依次为:全身、系统、器官。对器官之下的、比如组织层级,由于图片数据等未臻细致,不再做进一步的区分,但本系统提供了后续的扩展性,若在将来当相应的数据映射和图片得到了补充,也可以给出更加细化的表示。

由前述总体方案设计可以得出,该可视化方案的设计流程可阐释为如下3个关键步骤:

(1)将疾病本体实例与某一系统或者器官进行映射。

(2)人体各系统和器官的图片的绘制。

(3)确定某一个点击事件所对应的系统或者器官。

这里,在疾病本体中,“disease of anatomical entity”为解剖学实体相关的疾病,其id为DOID:7,可以与人体的生理位置实现有效映射。因此,本次可视化方案中,选择疾病本体下的所有父亲节点或者祖先节点为DOID:7的子集作为疾病数据集合。该集合共有大约3 000条数据实例。这些疾病本体的实例,通过人工校对,被标注到对应的器官或者系统上。

2 关键技术设计和实现

2.1 人体各系统和器官的图片绘制

由本系统所使用图片文件来源于互联网,而且该图片已被授权可以用作包括商业在内的任意用途,同时使用者也可以自由更改。原始图片格式为SVG[7-9],设计研究内容如图1所示。

图1 原始图片文件内容Fig.1 The original SVG file

在本质上,SVG 是 XML[10]文件格式,可以通过其中文本的操作较为简捷地改变文件的内容。由图1可以看到,原始文件中各个器官重叠在一起,无法清晰地展示系统和器官,也无法对此进行选择操作。因此研究中就需要对其按照器官或者系统为单位,将图片中的内容在处理后得以分离。分离后所得到的称为原子图片文件。研究中将给出由原始图片加工得到各原子图片的设计步骤详见如下。

(1)从原始SVG文件中提取文件头和一些公用的样式作为模板。

(2)遍历 SVG 文件中<svg></svg>标签下的一级子节点(不包括步骤(1)中的样式节点),调整这些节点中的透明值,全部设成不透明,并将其插入到模板中,得到新生成的SVG文件。

(3)将所有新生成的SVG文件导出为PNG文件。

以上方法所获得的所有原子图片都具有相同的宽度,而在获得所有的原子图片后,便可将每个系统或者器官表示成若干原子图片的叠加。这样,便生成了该系统或者器官所对应需要展示的图片。由此推证得出的整体变换过程如图2所示。

图2 从原始图片获得心血管系统图片过程示意Fig.2 The process of getting the image of cardiovascular system from original file

在获得某系统或者器官的图片后,就可以将疾病本体数据与图片数据之间建立映射关系。基于此,系统就可以在绘制系统或者器官的图片时,也一并罗列出与之相关的疾病本体数据。

2.2 系统或器官点击事件确定

由于人体器官或者系统的图片在绘制时,是一张完整的图片,无法获取其点击的是某一个具体的器官,只能得到鼠标点击的坐标,从而无法对此予以精准响应,以及再对系统或者器官展开进一步的细化,最终对疾病数据实现筛选和过滤。因此,确定鼠标点击位置落在哪个部位的身体器官上是该可视化问题需要解决的核心问题。

本系统通过获取每个器官的边缘路径,判断坐标是否位于这个路径所围成的封闭曲线内部来判断鼠标是否点击了该器官。若鼠标点击的位置是多个器官的重叠处,则通过事先建立的优先级顺序,决定最终需要响应的器官。

研究时只需确定图片的边缘路径,因此图片内部的具体色彩信息可以被忽略,在这里仅需考虑像素的“有”和“无”两种状态,故而,一个二维图片可以抽象为一个0-1矩阵。矩阵中值为0处表示该处图片为透明,值为1处表示该处存在像素点。综上研究过程可称为图片的二值化。

接下来,拟将引入一些数学定义。对此可研究分述如下。

定义1设有0-1矩阵Am×n,当2≤i≤m-1,2 ≤j≤n-1 时,若同时满足Ai±1,j±1=1,Ai,j±1=1,Ai+1,j=1,则称(i,j) 为Am×n中的内部点。

定义 2设有0-1 矩阵Am×n,若Ai,j=1 且(i,j) 不是Am×n中的内部点,则称(i,j) 为Am×n中的边界点。

定义 3设有 0-1 矩阵Am×n,若(i,j) 既不是Am×n中的内部点,又不是Am×n中的边界点,则称(i,j) 为Am×n中的外部点。

通过对本系统中所使用的图片进行分析,可以发现,所有原子图片中的物体的各个部分是连通的,即所有的内部点是连通的。而且,最多只在物体内部存在若干孔洞,或者分散在整张图片的若干孤立的噪声点。关于噪声点的去除,可做剖析叙述如下。

考虑以某点为中心的3∗3子矩阵内与其相邻的8个点,若有大于6个点的值与该点不相同,则认为该点是一个噪声点,将其修改为与周围大多数点相同的值即可。而图片内部的孔洞,只需将点击该部分也视作对整个物体的点击,则可以不用对其进行特殊处理。

针对上述情况,还需定义矩阵的边缘路径,内容描述见如下。

定义4设有0-1矩阵Am×n,若其所有内部点和边缘点构成的区域是连通的,则称S=<(i1,j1),(i2,j2), (i3,j3),..,(ik,jk),..,(is,js)>为Am×n的边缘路径,其中(ik,jk) 是Am×n的边缘点,且所有的Am×n所有的内部点都在边缘路径S所构成的封闭图形内。

简单地说,边缘路径就是图片中物体的轮廓所构成的封闭图形,这是物体边缘点的某种连线方式,该连线方式要求不能穿过物体的内部。为了获取图片内物体的边缘路径,本次系统研发得到的算法流程步骤可详述如下。

(1)从左至右,从上到下遍历矩阵的元素,直到找到第一个点P1(i1,j1), 使得Ai1,j1=1。 并记P0(i0,j0)=(i1-1,j1),同时将P0,P1加入数组。

(2)取出数组的最后 2个元素分别为P-2,P-1,计算其向量

(3)依次遍历点p-1的4个方向的点,找到第一个边缘点,将其加入数组。遍历的顺序为:以为正下方,按照左、上、右、下的顺序完成遍历。

(4)重复过程(2)~(4),直至数组的最后一个元素与P1相同。

(5)设此时数组中为<P0,P1,P2,..,Ps,P1>, 则<P1,P2,..,Ps>便是矩阵Am×n的边缘路径。

在此基础上,针对一幅原子图片计算其边缘路径的过程展现则如图3所示。

图3 对心脏计算边缘路径过程示意Fig.3 The process of calculating the path of heart image

在计算出边缘路径之后,便可判断鼠标点击时的坐标是否落在边缘路径所构成的封闭图形内部来确认是否点击了该物体。物体点击时的设计效果如图4所示。

图4 鼠标点击心脏效果图Fig.4 The result of clicking heart organ

3 结果展示

通过将疾病本体数据与图片相映射,以及图片中相关器官的点击事件的响应,可以构建出一个通过人体生理位置进行相关疾病的检索与筛选的过程。初始状态时,可视化区域展示较高层级的系统或器官,以及与该层级系统或器官相对应的疾病。图5即表示了处于高层级状态时的可视化区域内容。而后,通过点击心脏或者血管,可视化区域进入到如图6所示的低层级系统或者器官,并对疾病数据进行了过滤。

图5 高层级系统或者器官展示Fig.5 The display of high level human system and organs

图6 低层级系统或者器官展示Fig.6 The display of low level human system and organs

4 结束语

本文针对疾病本体下的“disease of anatomical entity”分支,提出一种有效的可视化方法,将疾病本体数据映射到人体的生理位置上,并通过在相关系统或者器官上的操作,对疾病本体进行筛选过滤,从而对其做出清晰的表示。

猜你喜欢

本体器官边缘
继齐韵往昔,以今声开来——思考自五音戏主奏乐器的演变、本体及延伸
类器官
眼睛是“本体”
ORGANIZED GIVING
皮肤是个大大的器官
肺脏:隐藏多年的造血器官
一张图看懂边缘计算
专题
Care about the virtue moral education
在边缘寻找自我