本申请提供了一种基于知识图谱的糖尿病风险预测方法、装置、设备及介质,其中,该方法包括:使用待预测对象的第一病历数据对糖尿病知识图谱进行更新得到目标知识图谱;根据目标知识图谱中待预测年份节点的周围节点的第一节点向量,确定待预测年份节点的第二节点向量;根据第二节点向量和目标节点与待预测年份节点之间的第一关联关系向量得到第一拼接向量;目标节点为患病节点和/或未患病节点;第一关联关系向量是根据待预测年份节点与周围节点之间的第二关联关系向量确定的;将第一拼接向量和目标节点向量输入到糖尿病风险预测模型中输出第一余弦相似度;根据第一余弦相似度确定糖尿病的患病概率。通过该方法提高了糖尿病风险预测的准确性。病风险预测的准确性。病风险预测的准确性。
全部详细技术资料下载
【技术实现步骤摘要】
基于知识图谱的糖尿病风险预测方法、装置、设备及介质
本申请涉及计算机
,尤其是涉及一种基于知识图谱的糖尿病风险预测方法、装置、设备及介质。
技术介绍

糖尿病是一种以高血糖为特征的代谢性疾病,现有技术中,对糖尿病进行风险预测时,通常仅依赖于患者的病历数据(例如体检数据)建立糖尿病预测模型,并使用该预测模型对患者进行糖尿病风险预测。该方式并未充分利用先验医学知识,导致预测的准确性不高。
技术实现思路
有鉴于此,本申请的目的在于提供一种基于知识图谱的糖尿病风险预测方法、装置、设备及介质,以提高糖尿病风险预测的准确性。
第一方面,本申请实施例提供了一种基于知识图谱的糖尿病风险预测方法,包括:
使用待预测对象的第一病历数据对预先建立的糖尿病知识图谱进行更新,得到更新后的目标知识图谱;所述第一病历数据包括所述待预测对象在待预测年份且与糖尿病相关的各项医学指标数据;

根据所述目标知识图谱中与待预测年份节点相关联的周围节点的第一节点向量,确定出
【技术保护点】
【技术特征摘要】
1.一种基于知识图谱的糖尿病风险预测方法,其特征在于,包括:使用待预测对象的第一病历数据对预先建立的糖尿病知识图谱进行更新,得到更新后的目标知识图谱;所述第一病历数据包括所述待预测对象在待预测年份且与糖尿病相关的各项医学指标数据;根据所述目标知识图谱中与待预测年份节点相关联的周围节点的第一节点向量,确定出所述待预测年份节点的第二节点向量;将所述第二节点向量和所述目标知识图谱中的目标节点与所述待预测年份节点之间的第一关联关系向量进行拼接,得到第一拼接向量;所述目标节点包括用于表示患有糖尿病的患病节点,和/或,用于表示未患有糖尿病的未患病节点;所述第一关联关系向量是根据所述目标知识图谱中所述待预测年份节点与所述周围节点之间的第二关联关系向量确定出来的;将所述第一拼接向量和所述目标节点的目标节点向量输入到训练好的糖尿病风险预测模型中,输出所述第一拼接向量与所述目标节点向量之间的第一余弦相似度;根据所述第一余弦相似度,确定所述待预测对象在所述待预测年份患有糖尿病的概率大小。2.根据权利要求1所述方法,其特征在于,当所述目标节点为所述患病节点时,将所述第一余弦相似度作为所述待预测对象在所述待预测年份患有糖尿病的概率大小;当所述目标节点为所述未患病节点时,将所述第一余弦相似度作为所述待预测对象在所述待预测年份未患有糖尿病的概率大小,以根据所述未患有糖尿病的概率大小计算患有糖尿病的概率大小;当所述目标节点包括所述患病节点和所述未患病节点时,判断第二余弦相似度和第三余弦相似度之间的大小关系;所述第二余弦相似度为所述第一拼接向量与所述患病节点的患病节点向量之间的第一余弦相似度;所述第三余弦相似度为所述第一拼接向量与所述未患病节点的未患病节点向量之间的第一余弦相似度;根据所述第二余弦相似度和所述第三余弦相似度之间的大小关系,确定所述待预测对象在所述待预测年份患有糖尿病的概率大小。3.根据权利要求1所述方法,其特征在于,所述糖尿病知识图谱是通过以下方式建立的:获取与糖尿病相关的医学特征数据,每个所述医学特征数据的层级和所述医学特征数据之间的关联关系;以及获取样本患者的第二病历数据;所述第二病历数据包括所述样本患者在各个历史年份的与糖尿病相关的各项医学指标数据以及各个所述历史年份对应的糖尿病患病情况;根据所述医学特征数据、每个所述医学特征数据的层级和所述医学特征数据之间的关联关系,构建所述糖尿病知识图谱的概念层;以及根据所述第二病历数据构建所述糖尿病知识图谱的实例层;所述实例层中包含有所述样本患者的各个历史年份节点与各个医学指标节点和所述目标节点之间的关联关系;根据所述概念层和所述实例层,构建所述糖尿病知识图谱。4.根据权利要求1所述方法,其特征在于,所述糖尿病风险预测模型是通过以下方式训练的:
针对所述糖尿病知识图谱中的每个目标三元组,将该目标三元组中的第一头节点转换为头节点向量、将第一尾节点转换为尾节点向量以及将所述第一头节点和所述第一尾节点之间的第一关联关系转换为第三关联关系向量;针对每个所述目标三元组,将该目标三元组对应的所述头节点向量和所述第三关联关系向量拼接为第二拼接向量;将所述糖尿病知识图谱中的所有所述目标三元组划分为多个三元组集合;将同一所述三元组集合中所有所述目标三元组对应的所述第二拼接向量和所述尾节点向量输入到待训练糖尿病风险预测模型中,输出任意两个所述第二拼接向量和所述尾节点向量之间的第四余弦相似度;针对每组所述尾节点向量和所述第二拼接向量,使用该组对应的所述第四余弦相似度和用于表示该尾节点向量与该第二拼接向量是否为同一所述目标三元组的标签计算损失函数,得到损失数值;使用所述损失数值更新所述待训练糖尿病风险预测模型中的可学习参数,直至达到预设训练轮次后停止训练,并将当前的待训练糖尿病风...
【专利技术属性】

技术研发人员:王乐,许峥,张林,许娟,史文钊,
申请(专利权)人:神州医疗科技股份有限公司,
类型:发明
国别省市:
全部详细技术资料下载 我是这个专利的主人



















