摘要
电子病历数据类型多样以及时序不规则,现有的基于深度学习的方法在特征学习的过程中大多无法同时兼顾对不同类型临床数据间静态关联和就诊记录间动态时序依赖的有效捕获.针对该问题,本文提出了一种基于多域图神经网络的疾病预测模型.该方法首先利用一个结合编码级注意力和时间感知LSTM的时序特征学习模块获得患者每次就诊的初始特征表示.然后,根据就诊序列中不同就诊间的相关性和时间间隔信息分别构建了一个就诊亲和图和一个就诊时序图,并通过图卷积神经网络从图中挖掘就诊记录间的静态语义关联和动态时序依赖.最后,利用一个基于自注意力机制的多域特征融合模块将时序特征和语义关联特征结合起来得到最终的患者融合特征表示,用于患者未来的疾病预测.在两个真实临床数据集上的实验结果表明,本文方法超过其他现有的方法获得了更高的预测准确性.
疾病风险预测因其在疾病防控和治疗等方面突出的临床意义一直是医疗卫生领域关注的重要研究课题.传统的基于病例队列研究的疾病预测方法耗时冗长,人力、物力投入巨大,难以满足服务临床应用的需求.随着大数据、人工智能技术的发展以及医院信息化程度的提高,各个医疗机构积累了丰富的临床电子病历(electronic medical records, EMR)数据,为研究人员提供了大量类型多样、易于获取的患者诊疗全流程临床信息.因此,如何利用深度学习技术对电子病历数据进行分析,挖掘患者疾病发展的潜在模式以支持疾病风险预测等相关临床应用的辅助决策,一直是该领域的研究热点之一.
为了从电子病历的历史诊疗记录中捕获相关临床事件之间的时序关联以获得患者健康状态的动态特征,卷积神经网络(CNN)、循环神经网络(RNN)及其变体(LSTM和 GRU)等深度模型已经得到了广泛的应
图是一种描述复杂关系的常用数据结构,近年来,许多学者尝试将电子病历数据中不同临床实体间的关系表示为图结构,并利用图神经网络(graph neural network, GNN)来提取和挖掘其中蕴含的语义特征和交互模
为了解决上述问题,本文提出一种基于多域图神经网络(multi-domain graph neural network, MD-GNN)的疾病预测模型,在得到患者每次就诊的初始特征表示的基础上,根据就诊序列中不同就诊间的相关性和时间间隔信息分别构建了一个就诊亲和图和一个就诊时序图.然后,采用图卷积神经网络来学习患者就诊时间序列中各次就诊记录间的静态语义关联以及动态时序依赖.最后,通过一个多域特征融合模块将时序特征和两种语义关联特征表示结合起来得到最终的患者融合特征表示,用于患者未来的疾病预测.
1 相关工作
1.1 基于EMR的疾病预测研究
电子病历是医疗机构对患者临床诊疗和指导干预的、数字化的医疗服务工作记录,详细全面地反映了患者的病程发展以及相关诊疗过程,成了医疗大数据分析应用的关注热点.大量研究人员利用深度学习等技术挖掘EMR中的重要临床信息来实现患者未来疾病发展趋势的预
1.2 基于GNN的疾病预测研究
图是描述现实世界中对象之间复杂关系的常用结构.为了有效地对图结构数据中的复杂模式进行建模,Scarselli等
2 基于多域图神经网络的疾病预测
2.1 问题描述
仅通过样本筛选的数据无法直接用于训练疾病预测模型,还需要将诊断编码序列转换成向量表示.为了便于对后续基于多域图神经网络的疾病预测模型的描述,将实验数据集中诊断编码的集合表示成表示诊断编码的数量,任意元素代表一个诊断编码.数据集中的样本集合被表示成表示样本总数.对于任意样本的电子病历数据可以由一个医疗就诊序列表示,其中是该样本的住院次数,则表示样本的第i个就诊记录,是由一个或多个诊断编码组成的无序集合.此外,任意样本每次就诊的时间被记录为,相邻就诊之间的时间间隔序列是,其中.因此,本文涉及的疾病预测问题可以定义为通过样本历史诊断信息与时间间隔信息预测未来的诊断结果.
2.2 模型架构
基于多域图神经网络的疾病预测模型MD-GNN的总体架构如

图1 MD-GNN模型架构图
Fig.1 Architecture of MD-GNN
2.2.1 基于时序关系的特征学习
首先将诊断编码集合C中的任意一个编码ci表示成一个维度为m的向量.那么,对于任意就诊记录Vt,可以聚合其中的诊断编码信息来获得该次就诊的特征表示.考虑到不同诊断之间存在相关性,同时各诊断对于患者健康状态具有不同的影响,采用了自注意力机制,将任意编码的向量表示通过权重矩阵分别映射为查询向量、键向量和值向量.然后,通过注意力函数计算得到对应的注意力分数,以此来表示诊断序列中各诊断编码对当前就诊的影响程度.具体计算过程如式(1)~
(1) |
(2) |
(3) |
(4) |
式中: , ,a是缩放因子.
于是,第次就诊记录Vt的特征向量可表示为该次就诊中所含诊断编码向量的加权和.
(5) |
考虑到大部分ICU患者的就诊序列较短,且在我们的模型中仅使用了诊断编码一种类型的数据,而未使用受时间影响较大的实验室检验等数值型数据.因此,我们采用了一个简单的时间感知长短期记忆网络(Time-aware LSTM),在LSTM网络的基础上引入了一个信息衰减函数来模拟临床事件对患者健康状态的影响随时间衰减的过程.具体来说,在第t个时间步,LSTM以隐藏状态、记忆单元状态和当前的输入为输入,输出当前的隐藏状态和记忆单元状态.Time-aware LSTM通过信息衰减函数将时间间隔转换为权重,用以控制历史记忆单元状态中的短期记忆的比重,加权后的短期记忆再与长期记忆结合组成新的历史记忆单元状态.后续的隐藏状态的更新与基础LSTM的步骤相同.主要计算过程如式(6)~
(6) |
(7) |
(8) |
(9) |
(10) |
(11) |
这里,ot表示第t个时间步的输出门状态.这样,我们可以得到患者历史就诊记录的时序特征表示.
2.2.2 基于语义关系的特征学习
为充分挖掘就诊记录之间的语义信息,我们基于患者的临床时序数据分别构建了一个就诊亲和图和一个就诊时序图,然后设计了一个基于图神经网络的语义关系特征提取模块.
1) 关系图的构建
我们根据就诊序列间的相关性和时间间隔构建就诊亲和图和就诊时序图,构图规则如下所示:
i)两个关系图中的每个节点都表示一次就诊,图节点的初始表示是Time-aware LSTM模块对应时间步的输出.
ii)两个关系图均为全连接且带有边权重的无向图.
iii)就诊亲和图中边的权重的定义如下:采用Pearson相关系数衡量两个就诊序列的相关性,计算过程如
(12) |
式中:表示向量和向量之间的协方差;表示二者的标准差的乘积.Pearson相关系数介于-1和1之间,值越大表示相关性越高,表示负相关,表示不相关,表示正相关.因此,当时,两个就诊序列呈现正相关的关系,且值越大这两个就诊序列之间的相互作用关系越强、影响越大.
iv)就诊时序图中边的权重定义如下:假设两次就诊之间相隔的时间越久,那么这两次就诊信息的相互影响就越小.因此,这里采用与2.2.1中相同的衰减函数计算连接两个就诊节点的边权重.
根据上述规则可以构建得到就诊亲和图和就诊时序图,其中是关系图节点的表示, 为元素全为1的矩阵,表示图节点的连接关系,和则分别对应就诊亲和图和就诊时序图中的边权重.
2) 关系特征提取
采用图卷积神经网络(GCN)来更新每个节点的表示,它能够有效地聚合图节点及其邻域的局部信息.第层的图卷积以前一层的图节点表示作为输入,然后通过卷积操作为每个节点生成一个新的表示.在模型MD-GNN中我们对传统的图卷积神经网络进行了改进.传统的图卷积神经网络应用于无向无权图,在进行卷积操作时对所有的邻接节点一视同仁,而不考虑各个邻接节点对当前节点的重要程度的不同.然而,本文中设计的两个语义关系图都是无向带权图,因此在进行卷积时需要考虑边的权重,即邻接节点在重要程度上的差异,从而有所侧重地聚合邻域信息.此外,为聚合到非直接邻接节点的信息,我们采用了一个两层的GCN聚合更新关系图中各节点的信息,基于就诊亲和图和就诊时序图的图卷积过程分别如
(13) |
(14) |
式中:表示激活函数;
2.2.3 多域特征融合与预测模块
通过基于时序关系的特征学习和基于语义关系的特征学习,可以得到时序特征表示以及两种类型的语义关系表示和.对于每一位患者,来自不同邻域的特征对未来的疾病预测的影响程度不同.在此背景下,采用self-attention的融合机制使得模型可以自适应地为各部分特征分配权重,并通过加权求和进行特征融合.通过上述过程学习得到最终的患者表示.
(15) |
最后,采用一个带有激活函数Sigmoid()的线性层计算得到每种疾病的概率,计算如
(16) |
由于是多标签分类任务,我们采用二进制交叉熵损失函数BCELoss()计算真实标签和预测概率之间的损失.假设表示所有的参数,那么损失计算公式如(17)所示:
(17) |
3 实验结果与分析
3.1 数据描述与预处理
本文研究中使用了MIMIC-
根据对两个数据集中患者的就诊次数的统计,我们将本文的研究目标设定为利用患者前3次历史就诊记录中的诊断编码来预测第4次就诊的患病风险.因此,对于MIMIC-Ⅳ数据集,我们滤除了就诊次数少于4次的患者.对于就诊次数大于4次的患者我们使用一个长度为4的滑动窗口以4为步长进行采样,以此来扩充样本集.而对于MIMIC-Ⅲ数据集,由于其中大多数患者的就诊次数均不足3次,所以,我们选择保留了就诊次数不小于2次的患者,并对就诊序列长度不足4次的采用零向量填充的方式予以补齐.最终数据集的统计信息如
参数 | MIMIC-Ⅲ | MIMIC-Ⅳ |
---|---|---|
患者数 | 6 609 | 11 733 |
样本数 | 6 797 | 17 124 |
ICD编码总数 | 931 | 1 036 |
平均就诊次数 | 2.74 | 6.82 |
单次就诊平均ICD编码数 | 12.76 | 10.58 |
3.2 实验设置和评估指标
我们将经过筛选的数据按照8∶1∶1的比例划分训练集、验证集和测试集.为了保证比较的公平性,所有的实验均采用5折交叉验证来评估模型的性能,并设置了95%置信区间.为了评价模型的性能,我们根据患者每次就诊平均的诊断数量选择了 Recall@10,Recall@20和AUC作为评价指标.为优化模型参数,采用BECLoss()作为损失函数,优化器为AdamW,以上设置也适用于所有的基准模型和消融模型.本文中涉及的所有实验均基于PyTorch 1.10.2深度学习框架实现并采用批量训练,batch size设置为128, epochs设置为150.我们提出的模型MD-GNN的基本参数设置如下,诊断编码嵌入维度为64,Time-aware LSTM的隐藏向量维度为128,两个图卷积维度均为128.为防止过拟合,我们采用了dropout机制,在MIMIC-Ⅲ和MIMIC-Ⅳ数据集上的实验中,dropout_rate分别设为0.2和0.3.
3.3 Baseline方法
为验证我们提出的基于多域图神经网络的疾病预测模型MD-GNN的预测效果,我们选择了六种相关方法进行了性能对比,具体描述如下.
Dipol
TLST
LSA
GCN-TLSTM:一个基于图卷积神经网络和TLSTM的端到端的预测模型.首先利用GCN学习诊断编码之间的依赖关系得到每次就诊的特征表示,然后再通过TLSTM学习电子病历数据的时序特征.
IIC
MulT-EH
3.4 结果分析
3.4.1 整体性能分析
如
模型 | MIMIC-Ⅲ | MIMIC-Ⅳ | ||||
---|---|---|---|---|---|---|
Recall@10 | Recall@20 | AUC | Recall@10 | Recall@20 | AUC | |
Dipole |
0.296 3 0.003 5) |
0.422 2 0.002 3) |
0.614 4 0.008 6) |
0.3460 0.0067) |
0.4833 (0.0048) |
0.676 2 0.006 7) |
TLSTM |
0.301 6 0.006 1) |
0.434 7 0.007 4) |
0.616 1 0.013 9) |
0.364 9 0.002 4) |
0.511 4 0.004 5) |
0.690 9 0.002 1) |
LSAN |
0.337 6 0.005 0) |
0.470 2 0.003 7) |
0.637 8 0.008 9) |
0.404 9 0.009 8) |
0.535 6 0.011 4) |
0.706 7 0.009 5) |
GCN-TLSTM |
0.308 6 0.007 8) |
0.441 8 0.005 1) |
0.617 5 0.009 3) |
0.391 4 0.003 7) |
0.534 8 0.002 4) |
0.713 5 0.006 8) |
IICL |
0.338 7 (0.006 7) |
0.473 9 (0.008 0) |
0.641 6 (0.010 3) |
0.410 2 (0.005 9) |
0.552 0 (0.007 3) |
0.718 6 (0.007 7) |
MulT-EHR |
0.314 4 (0.005 7) |
0.454 7 (0.008 6) |
0.628 1 (0.007 9) |
0.398 9 (0.004 5) |
0.539 1 (0.006 5) |
0.720 0 (0.008 4) |
MD-GNN |
0.347 0 0.010 5) |
0.482 1 0.011 5) |
0.657 3 0.014 9) |
0.423 2 0.006 4) |
0.567 1 0.007 5) |
0.734 4 0.006 4) |
从表中结果还可以发现,基于图神经网络的几种方法的性能整体要优于其他对比方法.其中,GCN-TLSTM通过在TLSTM的基础上增加一个图卷积神经网络来增强就诊级的特征表示能力,其性能相比TLSTM得到了一定的提升.IICL利用图对比学习有效地捕获了疾病间的静态和动态关系,提高了特征表示的准确性,因此,其获得了仅次于MD-GNN的性能表现.MD-GNN之所以能取得较好的预测性能,我们认为主要得益于以下几方面:首先采用编码级的注意力机制学习每次就诊的嵌入表示,可以使模型更加关注与预测相关的诊断编码而减少一些无关记录对预测的影响.其次,时间感知的LSTM可以根据时间间隔决定保留历史信息的数量,从而学习到具有不规则时序性的隐藏特征表示.更重要的是,我们引入了多域图神经网络从就诊序列间的相关性和就诊序列间的时间间隔两个角度构建就诊亲和图和就诊时序图,并利用图卷积神经网络学习就诊序列间的语义关系.就诊亲和图的语义特征学习根据就诊序列之间的相关性衡量就诊之间的影响,就诊时序图的语义特征学习不用考虑顺序而直接根据时间间隔计算就诊之间的影响程度,这使得信息的传递更加简单直接,一定程度上也减少了信息损失和噪声,因此,显著地提升了最终患者表示的有效性.
3.4.2 消融实验
为了检验MD-GNN不同组成部分的有效性,我们对MD-GNN在两个数据集上进行了消融实验.我们逐一删除MD-GNN的某一部分,同样通过Recall@10、Recall@20和AUC来验证它们的性能.在我们的消融实验中使用的模型如下:
MD-GNN(A):删除MD-GNN中的编码级注意力机制(code-level embedding),直接使用multi-hot向量作为Time-aware LSTM模块的输入.
MD-GNN(B):删除MD-GNN中的就诊亲和图特征提取部分.
MD-GNN(C):删除基于注意力机制的多域特征融合模块(adaptive-fusion),将融合方式改为向量的拼接.
MD-GNN(D):删除MD-GNN中的就诊时序图特征提取部分.
MD-GNN(E):完全移除语义特征学习模块,仅保留时序特征学习模块.
如
模型 | MIMIC-Ⅲ | MIMIC-Ⅳ | ||||
---|---|---|---|---|---|---|
Recall@10 | Recall@20 | AUC | Recall@10 | Recall@20 | AUC | |
MD-GNN(A) |
0.315 9 (0.005 3) |
0.450 7 0.003 4) |
0.641 6 (0.001 8) |
0.404 8 0.003 5) |
0.553 2 0.002 9) |
0.737 1 0.001 4) |
MD-GNN(B) |
0.301 1 0.020 4) |
0.431 3 0.020) |
0.606 9 0.041 6) |
0.390 7 0.005 3) |
0.535 6 0.006 6) |
0.718 6 0.004 1) |
MD-GNN(C) |
0.280 4 0.018 0) |
0.415 5 0.018 0) |
0.562 1 0.044 5) |
0.417 0 0.006 0) |
0.561 6 0.006 0) |
0.745 5 0.005 8) |
MD-GNN(D) |
0.279 5 0.015 1) |
0.415 2 0.014 4) |
0.556 6 0.038 0) |
0.400 0 0.003 8) |
0.544 1 0.001 6) |
0.721 6 0.006 5) |
MD-GNN(E) |
0.301 8 0.022 7) |
0.432 9 0.020 3) |
0.601 9 0.036 5) |
0.384 9 0.004 9) |
0.532 6 0.004 7) |
0.723 2 0.003 4) |
MD-GNN |
0.347 0 0.010 5) |
0.482 1 0.011 5) |
0.657 3 0.014 9) |
0.423 2 0.006 4) |
0.567 1 0.007 5) |
0.734 4 0.006 4) |
3.4.3 案例分析
为进一步分析时序特征与语义特征对模型MD-GNN预测的影响,我们以患者B和患者C的就诊记录为例,通过自适应特征融合部分的权重观察不同特征对疾病风险预测的贡献.如

图2 患者就诊记录及MD-GNN捕获的特征权重示例
Fig.2 Example of patient visit records and feature weights captured by MD-GNN
4 结 论
本文提出了一个基于多域图神经网络的疾病预测模型 MD-GNN,在学习就诊序列的时序特征的同时,提取就诊序列间的多重语义特征.在时序关系的特征学习模块中,采用了编码级注意力机制学习就诊嵌入并通过时间感知LSTM 捕获不规则时序特征.在语义特征学习模块中,基于序列间的相关性和时间间隔分别构建两种语义关系图(就诊亲和图和就诊时序图),加权的图卷积神经网络被用于语义特征的提取.最后引入自注意力机制使模型自适应地融合各类特征表示.该模型的疾病预测性能在数据集 MIMIC-Ⅲ 和 MIMIC-Ⅳ 上得到了验证,并开展了消融研究,证明了 MD-GNN 各核心模块的有效性.
参考文献
MA F L,CHITTA R,ZHOU J,et al.Dipole:diagnosis prediction in healthcare via attention-based bidirectional recurrent neural networks[C]//Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.Halifax NS, Canada.ACM,2017:13-17. [百度学术]
KIM Y J, LEE Y G, KIM J W, et al. Highrisk prediction from electronic medical records via deep attention networks[C]//Proceedings of the 31st Conference on Neural Information Processing Systems. Long Beach, CA, USA. ACM, 2017:1-10. [百度学术]
AN Y,HUANG N J,CHEN X L,et al. High-risk prediction of cardiovascular diseases via attention-based deep neural networks[J]. IEEE/ACM Transactions on Computational Biology and Bioinformatics,2021,18(3):1093-1105. [百度学术]
BAYTAS I M,XIAO C,ZHANG X,et al.Patient subtyping via time-aware LSTM networks[C]//Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Halifax,NS,Canada.ACM, 2017: 65-74. [百度学术]
LUO J Y,YE M C,XIAO C,et al.HiTANet:hierarchical time-aware attention networks for risk prediction on electronic health records[C]//Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. Virtual Event,CA,USA.ACM,2020:647-656. [百度学术]
LI R,GAO J.Multi-modal contrastive learning for healthcare data analytics[C]//2022 IEEE 10th International Conference on Healthcare Informatics (ICHI). Rochester,MN,USA.IEEE,2022:120-127. [百度学术]
NIU S,YIN Q,SONG Y Y,et al.Label dependent attention model for disease risk prediction using multimodal electronic health records[C]//2021 IEEE International Conference on Data Mining (ICDM). Auckland,New Zealand. IEEE, 2021: 449-458. [百度学术]
MENG Y W,SPEIER W,ONG M K,et al. Bidirectional representation learning from transformers using multimodal electronic health record data to predict depression[J]. IEEE Journal of Biomedical and Health Informatics,2021,25(8):3121-3129. [百度学术]
CHOI E,BAHADORI M T,SONG L,et al.GRAM[C]//Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Halifax,NS,Canada.ACM,2017:787-795. [百度学术]
MA F L,YOU Q Z,XIAO H P,et al.KAME[C]//Proceedings of the 27th ACM International Conference on Information and Knowledge Management. Torino,Italy.ACM,2018:743-752. [百度学术]
LI Y,QIAN B Y,ZHANG X L,et al.Knowledge guided diagnosis prediction via graph spatial-temporal network[C]//Proceedings of the 2020 SIAM International Conference on Data Mining.Philadelphia,PA:Society for Industrial and Applied Mathematics,2020:19-27. [百度学术]
CHOI E, XIAO C, SUN J, et al. MiME: multilevel medical embedding of electronic health records for predictive healthcare[C] //Proceedings of the 32st Conference on Neural Information Processing Systems. Montreal, QC, Canada. ACM, 2018:4547-4557. [百度学术]
MENG Q W,QIAN H W,LIU Y,et al.MHCCL: Masked hierarchical cluster-wise contrastive learning for multivariate time series[C]//Proceedings of the AAAI Conference on Artificial Intelligence. Washington, DC, USA. ACM, 2023:9153-9161. [百度学术]
ANSARI A F,HENG A,LIM A,et al.Neural continuous-discrete state space models for irregularly-sampled time series[C]//Proceedings of the 40th International Conference on Machine Learning. Honolulu,Hawaii,USA.ACM,2023:926-951. [百度学术]
RAGHU A,CHANDAK P,ALAM R,et al.Sequential multi-dimensional self-supervised learning for clinical time series[C]//Proceedings of the 40th International Conference on Machine Learning. Honolulu,Hawaii,USA.ACM,2023:28531-28548. [百度学术]
NGUYEN P,TRAN T,WICKRAMASINGHE N,et al.Deepr: a convolutional net for medical records[J].IEEE Journal of Biomedical and Health Informatics,2017,21(1):22-30. [百度学术]
LEE W,PARK S,JOO W,et al.Diagnosis prediction via medical context attention networks using deep generative modeling[C]//2018 IEEE International Conference on Data Mining (ICDM). Singapore.IEEE,2018:1104-1109. [百度学术]
YE M C,LUO J Y,XIAO C,et al.LSAN:modeling long-term dependencies and short-term correlations with hierarchical attention for risk prediction[C]//Proceedings of the 29th ACM International Conference on Information & Knowledge Management. Virtual Event,Ireland.ACM,2020:1753-1762. [百度学术]
TAN Q X,YE M,YANG B Y,et al.DATA-GRU:dual-attention time-aware gated recurrent unit for irregular multivariate time series[C]//Proceedings of the AAAI Conference on Artificial Intelligence. New York, USA. ACM, 2020:930-937. [百度学术]
AN Y,TANG K, WANG J X. Time-aware multi-type data fusion representation learning framework for risk prediction of cardio vascular diseases[J]. IEEE/ACM Transactions on Computational Biology and Bioinformatics,2022, 19(6): 3725-3734. [百度学术]
AN Y, CAI G L, CHEN X L,et al. PARSE:a personalized clinical time-series representation learning framework via abnormal offsets analysis[J]. Computer Methods and Programs in Biomedicine,2023, 242: 107838. [百度学术]
AN Y, ZHANG H J, SHENG Y, et al. MAIN:multimodal attention-based fusion networks for diagnosis prediction[C]//2021 IEEE International Conference on Bioinformatics and Biomedicine (BIBM). Houston,TX,USA.IEEE,2021:809-816. [百度学术]
ZHANG C H,CHU X,MA L T,et al.M3Care:learning with missing modalities in multimodal healthcare data[C]//Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining. Washington DC, USA. ACM,2022:2418-2428. [百度学术]
LIU S C,WANG X L,XIANG Y,et al.Multi-channel fusion LSTM for medical event prediction using EHRs[J].Journal of Biomedical Informatics,2022,127:104011. [百度学术]
SCARSELLI F,GORI M,TSOI A C,et al.The graph neural network model[J].IEEE Transactions on Neural Networks,2009,20(1):61-80. [百度学术]
KANG Y,ZHENG J Y,YANG M J,et al. Inter-structure and intra-semantics graph contrastive learning for disease prediction[J]. Knowledge-Based Systems, 2024, 300: 112059. [百度学术]
WANG Y C,XU Y C,YANG J F,et al.Fully-connected spatial-temporal graph for multivariate time-series data[J].Proceedings of the AAAI Conference on Artificial Intelligence,2024,38(14):15715-15724. [百度学术]
CHAN T H,YIN G S,BAE K,et al.Multi-task heterogeneous graph learning on electronic health records[J].Neural Networks,2024,180:106644. [百度学术]
YE M C,CUI S H,WANG Y Q,et al.MedPath:augmenting health risk prediction via medical knowledge paths[C]//Proceedings of the Web Conference 2021. Ljubljana,Slovenia.ACM,2021: 1397-1409. [百度学术]
CHOI E, XU Z,LI Y J,et al.Learning the graphical structure of electronic health records with graph convolutional transformer[J].Proceedings of the AAAI Conference on Artificial Intelligence,2020,34(1):606-613. [百度学术]
AN Y,SHI Y H,GUO L,et al.Knowledge-enhanced difference-aware clinical time series representation learning for diagnosis prediction[C]//2023 IEEE International Conference on Bioinformatics and Biomedicine (BIBM). Istanbul,Turkiye.IEEE,2023:1014-1021. [百度学术]
WU T,WANG Y L,WANG Y,et al. Leveraging graph- based hierarchical medical entity embedding for healthcare applications[J]. Scientific Reports, 2021, 11(1): 5858. [百度学术]
AN Y, LI R Z, CHEN X L. MERGE: a multi-graph attentive representation learning framework integrating group information from similar patients[J]. Computers in Biology and Medicine,2022,151:106245. [百度学术]
JOHNSON A E W, POLLARD T J, SHEN L,et al. MIMIC-Ⅲ,a freely accessible critical care database[J]. Scientific Data, 2016,3: 160035. [百度学术]
JOHNSON A E W, BULGARELLI L, SHEN L,et al. MIMIC-Ⅳ,a freely accessible electronic health record dataset[J]. Scientific Data, 2023, 10(1): 1. [百度学术]