跳到主要内容

利用机器学习在急性神经护理中早期预测病人出院倾向

摘要

背景

在美国,急性神经并发症是导致死亡和残疾的主要原因之一。在这种情况下治疗患者的医疗专业人员的任务是决定在哪里(例如,家庭或设施),如何以及何时让这些患者出院。重要的是能够在患者住院期间尽早预测潜在的患者出院结果,并了解哪些因素影响出院计划的制定。本研究进行了两个平行实验:一个多分类结果(患者出院目标为“家”、“护理机构”、“康复中心”、“死亡”)和一个二元分类结果(“家”与“非家”)。本研究的目的是开发每个实验的早期预测模型,探索哪些患者特征和临床变量显著影响患者的出院计划,基于住院后24小时内可获得的数据。

方法

我们的方法围绕建立和训练五种不同的机器学习模型,然后对这些模型进行测试和调整,为每个实验找到最适合的预测因子。这些模型的数据集来自eICU-CRD数据库,包含5,245名患有神经疾病的成年患者。

结果

本研究结果显示,XGBoost是预测“家庭”、“护理设施”、“康复”和“死亡”四种常见出院结果的最有效模型,平均c统计值为71%。XGBoost模型也是二元结果实验中表现最好的模型,c统计值为76%。本文还通过识别和分析对预测影响最大的特征,探讨了在每个实验中表现最好的模型的准确性、可靠性和可解释性。

结论

基于早期入院数据的预测模型的可接受的准确性和可解释性表明,该模型可以用于提示性背景下,帮助指导医疗保健提供者努力规划有效和公平的出院建议。

突出了

  • 该研究的重点是根据患者入院后24小时内可获得的数据,为患有严重神经疾病的急性护理环境中的患者提供出院地点的早期预测。

  • 两个独立的实验考虑了独立的出院结局分类:二元结局(在家vs非在家)和多级结局(在家、护理机构、康复、死亡)。

  • 开发了5个机器学习模型用于每个实验,并提供详细的准确性报告(混淆矩阵、ROC曲线等)。

  • 该研究还通过识别和分析对预测影响最大的特征来调查最佳表现模型的准确性、可靠性和可解释性。

同行评审报告

背景

急性护理通常是一种住院环境,在这种环境中,患者接受严重伤害和疾病的积极护理。在美国,急诊病人平均住院4.8天[1].出院后,如果患者没有去理想的地方继续康复,无论是由于医院的不正确建议还是由于患者自己的意愿,患者都可能遭受负面的健康后果。这些后果可能包括跌倒和再次受伤,可能导致再次住院[1].通常,医疗专业人员必须选择将患者送到自己的家、康复设施、疗养院设施或其他各种可能的目的地。虽然众所周知,健康的决定因素会以独特的方式影响患者的处方医疗保健,但还不清楚哪些决定因素最重要的驱动或影响急性护理医疗中心的患者在什么情况下的出院计划。通过确定医院获得性条件、住院时间延长或急性后护理需求等可改变的推高成本的风险因素,可帮助提供者优先考虑患者护理,并帮助出院规划[2].

病人并不是唯一从出院计划中受益的人。随着人口的增加,住院病人过度拥挤是医院的一个重大问题,而且2020年大流行的影响加剧了这一问题。患者流量和住院时间直接影响医疗保健的获取和质量,以及医院的财务业绩[3.].在某些情况下,根据数据实现自动出院预测已显示出有希望的结果,可支持改善医院的患者流量,而不增加额外的工作人员或患者容量等开销[3.].尽管这种类型的流量预测有明显的需求和好处,但缺乏关于其使用和有效性的研究和确凿证据[4].

最近,机器学习(ML)方法的普及显示了在各种环境和患者条件下实现卓越预测能力的良好结果。现代机器学习方法可以发现自变量之间非线性高阶相互作用的隐藏模式,并产生比传统统计更稳定的预测[5].目前,很少有工具能够自动准确地帮助预测患者出院情况[6].在为数不多的研究中,有些研究的目的是帮助临床团队的早期决策,而不是取代这些决策[6].在此背景下,本文探讨了患者入院24小时内可获得的各种患者特征和临床变量是否会影响18岁及以上因脑血管事故(CVA)入住急性神经内科病房的成人的出院位置和对最新出院建议的遵守。本研究旨在开发可靠的ML模型,可以有效预测成人急性神经疾病的出院计划,以更好地帮助医疗保健提供者、患者及其家人,提供更好的护理和信息,以确定和计划出院建议。

本文考虑了来自5,245名因严重神经系统疾病入院的重症监护病房的非身份患者的数据,并试图确定选定的患者特征和临床变量是否具有足够的信息,以潜在地描述患者是否将被释放到他们的家、护理机构、康复机构,或在出院前到期。数据分析利用了几个患者和临床变量,包括基本的人口统计学特征,如年龄、性别和种族;临床特征,如身高、体重、体温;以及医疗风险判定,如格拉斯哥昏迷评分(GCS)和急性生理和慢性健康评估(APACHE) IV [7)病人的特点。

该研究的主要目标是更好地帮助医疗保健提供者以及患者及其家属提供早期出院建议,该研究对两种不同的设置进行了实验。第一个实验分析了上述数据集,并将所有四种出院类别(家庭、护理设施、康复设施或死亡)视为结果,并在此基础上构建和评估模型。基于在住院的早期阶段,医疗保健提供者和患者家属可能也有兴趣了解患者出院到“家”与任何其他设施(包括“死亡”情况下的殡仪馆安排)的概率,本研究还进行了第二次实验,为“家”与“非家”的二元结果构建和评估模型。本研究是之前一项研究的延伸[8,它只考虑了多阶层的结果。

本研究的结果表明,性能最好的机器学习模型能够基于患者的早期入院数据预测出院结果,在两个实验中都具有较高的准确性。通过使用一种专门的工具来识别和分析对预测影响最大的特征,我们还探索了性能最好的模型及其在每个实验中的预测的准确性、可靠性和可解释性。因此,这些模型、它们产生的预测以及它们提供的可解释性可以被临床医生用于建议性环境(在临床医生对患者出院位置做出决定之前)或确认性环境(在临床医生做出决定之后),以帮助医疗保健提供者和家庭为这些患有复杂神经疾病的成人制定有效、及时和公平的出院建议。

本文的其余部分组织如下:相关研究“科调查和比较相关研究,”数据集和预处理本节讨论数据集和预处理步骤。方法一节阐述了详细的方法。结果与讨论部分讨论结果,以及结论这一节结束了文章。

相关研究

之前的一些研究也探索了ML在预测患者出院位置方面的应用。表格1调查和比较所有以前的研究,以及当前的研究,关于预测放电配置。如表所示1本研究的重点是预测急性神经护理环境中确诊为CVA的患者的出院位置,仅使用入院时(在最初24小时内)可获得的患者特征,并分析预测的意义和可解释性,这是本研究与其他相关研究的区别。本研究的确定需求和动机是基于与出院计划相关的不断变化的医疗保健需求和风险因素,提前预测预期出院地点可以使医疗保健提供者、患者及其家属受益。

表1基于ml的出院处置预测工作描述表

数据集和预处理

本研究使用的数据集来自麻省理工学院的eicu协同研究数据库(eICU-CRD)。该数据库源自飞利浦医疗保健eICU远程医疗系统,用于ML算法、决策支持工具和临床研究等应用[17].e-ICU-CRD由来自美国大陆许多重症监护室的患者数据组成,这些患者在2014-2015年作为飞利浦eICU项目的一部分接受治疗。该数据库包含31个不同的患者数据表,以所有类型的危重症患者为中心。本数据集从其他相关数据库中选择,如MIMIC-III [18],因为它包含多中心数据而不是单中心数据,包含更多的最新数据,总体上有更高的可用数据量,这通常是ML所需要的。uniquepid,用作表之间的外键。浏览这些表格的数据文件,以发现和选择最合适的患者和临床特征,以预测急性神经护理出院处置的主题,基于住院24小时内可用的数据。例如,出院重量、ICU和住院时间、呼吸机使用天数等都是很有希望的功能,但我们选择放弃,因为它们在入院时或入院后不久就无法使用。

本研究的最终数据集是通过选择和合并5个这样的表(标题为apacheApsVarapachePatientResultapachePredVar病人,admissiondx17])基于唯一的患者ID。这五个表是在梳理数据库并确定它们包含研究所需的相关早期入学变量后选择的。为了选择只接受急性神经护理治疗的患者,我们删除了所有记录,除了那些被诊断为中风/CVA的患者。在原始数据集中,有几个出院类别,如“家庭”、“其他”、“其他外部”、“其他医院”、“熟练护理”、“康复中心”、“死亡”和“疗养院”。由于目标是使用预测作为医疗保健提供者的早期警报,本研究专注于预测四种典型的出院处置。为此,出院类别为“其他”、“其他外部”和“其他医院”的患者被从分析中剔除。“熟练护理”和“疗养院”被合并在“护理机构”出院类别下。结果,最后四个出院类别是“家庭”、“护理机构”、“康复中心”和“死亡”。

作为数据清理的一部分,丢失放电结果的行被删除。缺少相对少量数据的列的数据通过取数据的中值和模态来计算。例如,“种族”列中缺失的值被替换为模式,而“身高”和“体重”列中缺失的值被替换为中位数。创建了一个新的数据列,从单元入院时间中提取入院时间。通过Python Scikit Learn的LabelEncoder提取和编码目标结果放电位置[19],所有分类特征列均使用OneHotEncoder编码[20.].最终的数据集包含了来自5245名急性神经系统患者的34个精选特征描述及其出院地点的信息。

为了执行本研究额外进行的二元分类(“在家”vs.“不在家”)实验,上述数据集被进一步预处理,通过将所有“护理设施”、“康复”和“死亡”类别的患者合并到一个单一的“不在家”类别,获得两种出院结果,如“在家”vs.“不在家”。

表格2根据四个目标放电结果(在多分类结果实验中)和两个目标放电位置(在二元分类结果实验中),详细分析了这些特征及其分布,其统计意义表示为p值。表格2结果显示,虽然二元转归数据大部分是平衡的,“家庭”和“非家庭”的观察量大致相等,但另一方面,多类别转归数据分解显示不平衡,“家庭”是大多数观察的出院地点。的p值在表2对于离散类别特征生成卡方检验,和p-连续特征的值通过单因素方差分析检验生成。在表格中有几个缩写2它们的定义如下:

  • 格拉斯哥昏迷评分

  • 心肌梗死

  • ICU——重症监护病房

  • 外科ICU

  • MICU -医疗ICU

  • CTICU -心胸ICU

  • CSICU -心脏外科ICU

  • CCU -重症监护室

  • 洛杉矶-停留时间

表2按二进制类和多类出院结果分列的数据

方法

Jupyter笔记本(21]及谷歌云平台[22]是主要的开发环境。Python 3 (23]被Scikit Learn用作开发语言[24]作为ML方面的主库。在这两个实验中,使用了一系列的分类算法,并对其进行比较,以建立模型并确定最佳性能。五种算法[25]选择随机森林(RF)、XGBoost (XGBC)、支持向量机(SVM)、k -最近邻(KNN)和逻辑回归(LR)。这些模型的选择主要基于从背景文献中观察到的发生频率和性能。例如,[16使用KNN, [81316]采用RF和LR, [8101216]使用XGB,以及[1012利用支持向量机。

在本文中,使用各种标准评价指标来评估分类器的性能,即精度、召回率、特异性、F1评分和受试者工作特征(ROC)曲线下的面积。将策划数据集分为训练集(75%)和测试集(25%),分别用于模型训练和预测评估。在数据拆分过程中,实施了分层抽样,以确保从每个排放类别中抽样了合理数量的实例,以确保测试集能够代表总体。通过超参数调优对五种算法进行优化,找到性能最佳的参数分布。两个实验的优化方法是相同的,使用组合RandomizedSearchCV25GridSearchCV25以及其他迭代方法,以确定最佳参数分布取决于被优化的算法。RandomizedSearchCV获取参数分布的字典,并尝试从这些指定的参数分布中抽样的许多交叉验证的参数设置,而GridSearchCV穷尽所有可能的参数组合。虽然网格搜索可以返回更高质量的解决方案,但运行时可以在大量需要测试的参数下呈指数增长,即在基于树的算法的情况下。

对于具有大量参数的基于树的算法,如RF和XGBoost,使用1000个抽样参数组合和五倍交叉验证进行随机搜索,总共使用5000个拟合对指定参数范围进行抽样。对于支持向量机,由于支持向量机具有更少的可能参数数量,总共500个拟合,因此使用五倍交叉验证网格搜索。对于KNN,采样K从1到50的范围以找到最优K值。对于LR,采用迭代方法在正则化参数的值范围内尝试每个求解器。所有优化都是为了提高F1评分度量的准确性。

为了探索最佳表现模型的可解释性,使用了一个可解释的AI框架SHAP (Shapley Additive explained)。SHAP是一种使用博弈论解释ML模型输出的方法沙普利值26].在这种情况下,功能值被假设为游戏中的“玩家”,而游戏的“支付”是预测。27].沙普利值是一种来自联盟博弈论的方法,它告诉我们如何在使用的功能中公平分配“收益”,即重要性。27].我们使用了SHAPsummary_plot方法上的最佳性能模型。Summary_plot结合了特征重要性和特征效果,图上的每个点都是一个特征和一个实例的Shapley值,特征按重要性排序。y轴上的位置由特征决定,x轴上的位置由Shapley值决定[27].图上的特征按其重要性排序,颜色表示特征值从低到高,表明特征值与其对预测的影响之间的关系[27].

结果与讨论

在本节中,首先介绍和讨论从多类模型获得的结果,然后讨论从二元类模型获得的结果。

多层次实验结果

多类结果模型的最佳性能超参数优化的结果由“方法各节如下:

  • LR - solver = L-BFGS, C = 0.01,罚= l2

  • SVM - C = 0.001, gamma = 0.001, kernel =线性

  • KNN - K = 8,米制=闵可夫斯基距离

  • XG - max_depth = 8, n_estimators = 747

  • RF - max_depth = 10, min_samples_split = 10, n_estimators - 700

表格3.下面给出了测试数据集上的多类模型的结果,其中四个结果类分别为行,指标和模型分别为列和子列。最重要的观察结果是,表现最好的模型(XGBC和RF)在区分正确结果类别的所有四个指标上表现相对较好。KNN被证明是最无效的模型,因为它在所有评估指标中得分相对较低。

表3用测试数据对多类模型的评价

混淆矩阵是深入了解这类多分类问题的一个很好的工具,如图所示。1(安妮)。基于测试数据集,KNN模型(图。1.a)预测“死亡”类的回忆率为54%(即54%的“死亡”观察结果被模型正确归类为“死亡”),其余三个类的回忆率均在32%-38%的范围内相似。数字1(a)还描述了KNN模型中的主要错误来自于“家庭”、“护理机构”和“康复中心”这类。实际的“家庭”课程被错误地预测为“护理设施”和“康复”的概率分别为22%和32%。类似地,31%的几率将“nursing facility”错误地预测为“rehab”,27%的几率将“rehab”错误地预测为“nursing facility”,这严重影响了整体的准确性。这些结果表明,KNN在表征和区分这三种放电类型方面不够有效。

图1
图1

基于多类测试数据集的5种模型的混淆矩阵

数字1.b和c为SVM和LR的混淆矩阵,与KNN矩阵有些相似。对于支持向量机,“家”类是最准确的预测,召回率为63%,而对于LR模型,“死亡”类是最高的,召回率为57%。与LR模型类似,支持向量机模型在25%的情况下会错误地将“死亡”预测为“护理设施”。数字1.d和e给出了基于树的模型XGBC和RF的矩阵。这些模型具有非常相似的预测分布,“家庭”和“死亡”级别的预测准确率相对较高。然而,在41-52%的情况下,他们都倾向于将“护理机构”和“康复中心”的实际标签错误地预测为“家”。这可能是一个指标,这些模型是过度拟合的训练数据与大多数“家庭”班。

此外,正如这些混淆矩阵所证明的那样,几乎所有模型都难以准确预测“家庭”、“护理机构”和“康复中心”之间的关系。这可能可以通过提供更深刻的患者特征来补救,例如关于他们在护理单元内的物理治疗过程的信息或患者急性后护理活动测量(AM-PAC) [28这些分数通常用于这种医疗环境,以赋予模型必要的能力来区分这三种相对相似的出院结果。此外,与患者的保险信息、患者的家庭/家庭状况和预期援助有关的特征也将有助于模型区分这三种结果。然而,在使用的数据集中没有这些可用的特性。

ROC曲线是通过对每个类的输出进行二值化而创建的,结果是每个类、每个模型的曲线,对于表现最好的模型(XGBC和RF),如图所示。2(a, b)。ROC曲线表明,“家”类具有更大的准确性(AUC值或c统计量),表明两个模型都更容易正确地将“家”类与其他类区分开来。同时,考虑到结果分类的数量,两种模型似乎都有一个值得尊敬的AUC值。通过这种图形格式,还给出了微观平均和宏观平均,其中微观平均是基于阶级平衡的曲线的加权平均,宏观平均是四条曲线的真平均值。有一种正在发生的趋势,即“家庭”曲线的表现远远高于平均值,死亡曲线的表现介于平均值之间或略高于平均值,而“康复”和“护理机构”的表现低于平均值。这强化了模型缺乏持续区分“护理设施”和“康复”类的信息和能力。

图2
图2

基于多类测试数据集的XGBC和RF模型的ROC曲线

数据3.而且4下面分别显示了性能最好的RF和XGBC模型的特征重要性。数字3.使用permutation_importance24的方法来计算每个特征在射频模型决策中的重要性。该方法使用一种算法随机洗牌特征值并检查其对模型精度评分的影响,而XGBoost方法plot_importance24使用' weight '重要类型绘制模型在一个特征上分裂决策树的次数,如图所示。4.这两张图共同的重要特征是年龄和葡萄糖。RF模型发现医院、ICU死亡率预测和GCS评分(即眼睛、语言、运动)是预测出院地点的重要特征,而XGBC模型更倾向于平均血压、心率和其他入院特征,如年龄、身高和体重。

图3
图3

RF模型的多类特征重要性图

图4
图4

XGBoost模型的多类特征重要性图

数字5显示了使用最佳XGBC模型的多班实验的SHAP总结图。这为我们提供了额外的见解,并提供了基于功能对每个目标类的影响的功能重要性的分解(通过栏的不同颜色表示)。该图的结果与图中XGBC模型的特征重要性图有些吻合。4,因为年龄、葡萄糖和心率都在这两个图中最重要的五个特征中。患者的年龄对“回家”和“死亡”结果类别的影响最大,患者的血糖读数对“死亡”类别的影响也很大。另一个有趣的观察是,患者第一天的GCS运动评分和是否插管与“死亡”类别有极高的影响相关性。此外,GCS语言分数表明,他们对“家庭”类别有很高的影响。同样,平均血压(平均血压)似乎推动了“康复”,入院体重似乎影响了“护理机构”类别。

图5
图5

shasummary Plot显示特征值对XGBoost多类模型输出的影响

二进制类实验结果

二元结果模型的最佳性能超参数优化的结果由“方法各节如下:

  • LR - solver = L-BFGS, C = 0.1,罚= l2

  • SVM - C = 0.1, gamma = 0.001, kernel =线性

  • KNN - K = 9,公制=闵可夫斯基距离

  • XG - max_depth = 5, n_estimators = 285

  • RF - max_depth = 100, min_samples_split = 10, n_estimators = 100

在测试数据集上的二进制实验结果如下表所示4.与预期的一样,所有模型在预测“家庭”和“非家庭”班级时,与多班级预测时的准确性相比,都表现出了相当大的提高。当使用XGBC预测“home”类时,二进制类模型在70% F1值时的表现与多类模型相似。然而,与多班级不同的是,当“非家庭”班级的F1分数为70%时,二元模型的性能显著提高。与多班实验一样,考虑到“家庭”和“非家庭”准确性,性能最好的模型再次是XGBC和RF。然而,与多类模型相反,KNN模型的表现更稳定,其AUC为72%,表明与四个类相比,两个结果类之间的混淆更少。

表4用二进制测试数据评估二进制类模型

由于在二元实验中只有两个类,ROC曲线(图。6)能够像正常情况下一样被构造。在ROC分析中,前四个模型的表现都非常相似,它们之间的差距都在一个百分点以内。KNN模型是一个例外,其AUC为71.5%,而表现最好的XGBC为75.6%。

图6
图6

二元实验的ROC曲线

RF和XGBC的特征重要性图(图。7而且8)的结果与多班实验的结果显著相似。对于射频,最重要的特征被打乱了一点,插管第1天和GCS运动评分被心率和平均血压取代。对于XGBC,温度被预测的ICU LOS取代,顺序打乱,入院体重在最前面,葡萄糖和年龄稍靠后。

图7
图7

RF模型的二元特征重要性图

图8
图8

XGBoost模型的二元特征重要性图

数字9显示XGBC模型特征的SHAP摘要图。该图显示了按重要性排序的顶级特征,并显示了特征值如何影响模型的输出,红色表示较高的特征值,蓝色表示较低的特征值,重叠值在y轴上抖动。x轴是SHAP值,表示对模型输出的影响,在本例中,正值趋向于“非家庭”类,负值趋向于“家庭”类。

图9
图9

XGBoost二元类模型的SHAP总结图

根据该模型,从这张图中得出的一些结论是,当患者在眼睛和语言反应的GCS中得分较高时,他们就更有可能被“回家”。这一结论在情节中得到了反映,即GCS最高(红色)的眼睛和语言特征值集中在分类的“家”方面。另一个与众不同的结论是,患者的年龄越高,“非在家”出院的可能性就越大。同样,葡萄糖、平均血压和心率较低表明患者“在家”出院。然而,应该注意的是,这些效应只是描述了模型的行为,并不一定代表了现实世界中的因果关系[27].

将研究结果转化为临床护理环境

本节旨在阐明本文的结果,并讨论如何在临床环境中使用这些模型和结果的实际意义。数字10显示医疗保健诊所上下文中的整体流程。在大多数情况下,临床医生的当务之急之一是了解患者是否有可能出院回家,或通常需要与保险公司、医院和患者/患者家属等实体进行预先规划和安排的其他地点。在此背景下,本研究开发了一个简单的二元分类(“家庭”与“非家庭”)模型,利用住院24小时内获得的变量和患者特征预测CVA患者最可能的出院目的地。该研究进一步开发了另一个模型,在需要对潜在的出院目的地进行更多洞察的情况下,该模型能够在区分四种出院结果(“家”、“死亡”、“康复”、“护理机构”)的同时产生早期预测。我们的研究结果表明,一旦使用大量标记出院处置和患者数据进行训练,这两个模型都能够在患者住院24小时后以可接受的准确性生成预测。因此,这些模型和预测可以被临床医生用于建议性环境(在临床医生对患者出院地点做出决定之前)或确认性环境(在临床医生做出决定之后),以帮助医疗保健提供者规划有效、及时和公平的出院建议。有两个并行模型根据相同的输入特征同时产生预测还有一个好处。例如,如果模型之间存在任何分歧(即二元模型与多分类结果模型不一致,或者模型预测彼此一致,但与临床医生的判断不一致),那么临床医生可以考虑对患者的病例进行更紧密的重新评估。

图10
图10

整个过程在一个诊所的背景下

本研究还表明,与使用产生预测的黑盒模型相比,使用驱动这些预测的患者特征的可视化和可解释的表示来增强预测是可能的,这可能会使结果对临床医生更可信和更容易解释。特征重要性图。3.47,8)和SHAP总结图(图。5而且9)可以集成为预测应用工具的一部分,并可能提供有关预测的重要和可解释的见解。此外,临床医生可以进一步研究特定患者的数据和相应的预测更紧密地利用SHAP的力图[2728如图所示。11而且12.这些图允许从数据中可视化单个患者记录实例中最具影响力的特征,允许在个案基础上增加透明度和可解释性。力图显示每个特定实例的SHAP值产生的预测值(粗体数字),然后根据模型基于数据的预测,将其转换为0或1。红色的力值是将预测值推近1(非home)的值,而蓝色的力值是将预测值推近0 (home)的值。模型正确预测“家”的实例(图5)。11)表明年龄、预测的住院死亡率和患者的平均血压的较低值(归一化数据后用负数表示)是该模型使用的前3个特征之一,导致对该特定患者的“家”预测。在无花果。12,我们发现,较高的年龄、呼吸频率和平均血压值是驱动模型正确预测“不在家”出院结果的主要特征。

图11
图11

SHAP力图显示特征的值和方向,导致一个单一实例被正确预测为“Home”

图12
图12

SHAP力图显示特征的值和方向,导致一个单一实例被正确预测为“非住宅”

在这种情况下,临床医生可以观察哪些变量和患者特征驱动模型的预测,如果他们选择这样做的话,可以进一步研究。有了这一点,临床医生在模型数据驱动的预测支持下,实现了对最终决定的更高水平的信心,并实现了为患者提供最高质量水平的护理的最终目标。通过提供这种最佳水平的护理和预测,可以避免常见的负面后果,如出院地点不当导致的住院再入院/再受伤和患者住院时间过长导致的医院获得性感染。

本研究的局限性

在这项研究中有几个局限性需要注意。如前所述,模型的预测是基于最初24小时的可用数据,旨在提供迅速的预测。由于研究的前提是关注入院的CVAs患者,并且研究只关注入院第一天内可以获得的患者变量,以便尽早通知医生,因此从eICU-CRD中获得的可用记录总量不是很大。我们的模型预测中许多已注意到的错误模式似乎可以通过访问更多的数据来弥补,这些数据属于那些代表性不足的类别。

此外,模型只考虑了数据集给定日期的医院和医疗保健提供者的过去做法,这并不一定表明当前或最佳的出院决策做法。除此之外,其他因素,如保险公司的投入、当地设施的床位可用性以及患者家属的偏好,都对患者的最终目的地起着重要作用。这些模型没有明确考虑这些因素,所用的数据库也没有提供这些因素。因此,随着这些因素的改变,最终的患者出院结果也可能发生变化。

结论

在这项研究中,进行了两个并行实验,比较了五种不同的ML算法方法的性能,基于住院24小时内可用的患者数据预测出院处置。我们的第一个实验建立和评估了模型,以预测四个出院地点,如“家庭”,“护理机构”,“康复中心”和“死亡”,并在预测“家庭”出院级别时取得了可接受的准确性,但在区分“护理机构”和“康复中心”出院级别与其他结果时显示出困难。结果表明,该模型可以通过在数据集中添加诸如“患者流动性”或“物理治疗需求的过去历史”等附加特征而得到改进,这些特征可能提供额外的洞察,以确定具有“护理设施”和“康复”出院需求的患者的特征。第二个实验的重点是预测“家庭”和“非家庭”出院地点。据观察,在住院的早期阶段,了解病人是否可以被“回家”而不是任何其他目的地,可能对病人和医疗机构都很有意义。第二个实验的结果表明,表现最好的模型能够区分“家庭”和“非家庭”放电地点,具有相当的准确性。本研究采用多种超参数整定方法对模型进行优化,在两次实验中,RF和XGBC模型均获得了最佳的结果。最佳模型的准确性结果显示,基于患者在最初24小时内获得的基本人口统计、临床和医疗风险评估信息,在预测急性神经系统患者出院目的地方面具有良好的效果。本研究得出结论,此类模型可能被用于更好地告知医疗专业人员和患者家属,使他们能够提供更高质量的患者护理,并制定更适当的出院计划。

未来的工作

未来,本研究将专注于对这些结果进行外部验证,并实现深度学习算法创建预测模型,希望发现本研究中使用的传统ML算法尚未探索到的更大的准确性和复杂的隐藏模式。为了能够有效地实现深度学习,将需要一个更大的数据集,因为深度学习的性能和好处通常会相对于可作为输入的数据量而增加。

此外,将对这些模型在排除“死亡”结果的情况下的表现进行进一步研究。虽然过期是这类严重神经系统诊断的常见结果,通常也需要自己的提前规划,但排除它可能对临床医生更清楚地解释“非家庭”类别的结果具有一定的意义。

数据和材料的可用性

当前研究中分析的数据集可在eICU-CRD存储库中获得,https://eicu-crd.mit.edu/

参考文献

  1. 科特尼C,卢特金斯K,雷恩斯K。“急性病人出院后的处置和成功”。UNLV毕业论文、学位论文、专业论文和毕业论文。2017。2924.https://doi.org/10.34917/10983010

  2. 罗森,斯蒂尔,A。“住院时患者日常生活活动能力与关键指标的关系”。UNLV论文,论文。专业论文和顶点,2020年。3775.https://doi.org/10.34917/18162617

  3. 德·格鲁德A,布雷兹K,彭达卡尔SR。“急诊医院出院预测过程综述”。医疗保健政策。2016;12(2):105 - 15。https://doi.org/10.12927/hcpol.2016.24854

  4. 列文,巴尼斯,托尔珀,等。“基于机器学习的出院预测可以支持多学科查房,并缩短住院时间”。BMJ创新。2021;7:414-21。

  5. 应用预测模型。,卷26施普林格;2013.

  6. 王晓燕,王晓燕,王晓燕,等。“机器学习模型的开发和验证,以帮助住院外科护理出院过程”。2019;2(12):e1917221。

  7. Knaus William A等人。“apache -急性生理学和慢性健康评估:一个基于生理学的分类系统”。危重护理医学。1981;9(8):591-7。

  8. Mickle C, Deb D.“在急性神经护理中预测患者出院倾向”。2021 IEEE计算智能系列研讨会(SSCI)。2021.p。1 8。https://doi.org/10.1109/ssci50451.2021.9659904

  9. Goto T,等等。“预测急诊科哮喘和慢性阻塞性肺病恶化倾向的机器学习方法”。中华急诊杂志2018;36(9):1650-4。https://doi.org/10.1016/j.ajem.2018.06.062

  10. Karhade, Aditya V等人,“预测腰椎间盘退行性疾病选择性住院手术后出院倾向的机器学习算法的开发”。Neurosurg焦点。2018;45:5。https://doi.org/10.3171/2018.8.18340

  11. Alexander S,等。一种基于电子医疗记录的出院处理工具被终结:机器学习中临床数据准确性的衰减相关性。今天Arthroplast。2020;6(4):850 - 5。https://doi.org/10.1016/j.artd.2020.08.007

    文章PubMed公共医学中心中科院谷歌学者

  12. Paul T,等人。预测脊柱滑脱术后出院位置的机器学习算法的开发。中国科学(d辑:自然科学版);https://doi.org/10.1007/s00586-019-05936-z

    文章PubMed中科院谷歌学者

  13. Cho, Jin,等。“使用可解释的机器学习方法预测中风后出院处置。”2019年IEEE大数据国际会议(大数据),2019,doi:https://doi.org/10.1109/bigdata47090.2019.9006592

  14. Muhlestein Whitney E等人。使用引导机器学习集成模型预测脑膜瘤切除术后的出院情况。神经外科杂志B辑:颅底。2017;79(02):123-30。https://doi.org/10.1055/s-0037-1604393

    文章公共医学中心谷歌学者

  15. Muhlestein Whitney E等人。种族对脑肿瘤开颅术后出院、处置及住院时间的影响。世界Neurosurg。2017;104:24-38。https://doi.org/10.1016/j.wneu.2017.04.061

    文章PubMed公共医学中心中科院谷歌学者

  16. Shakeri Hossein Abad, Zahra等“利用机器学习预测危重患者的出院目的地”。IEEE生物医学健康通报。2020。1 - 1。https://doi.org/10.1109/jbhi.2020.2995836

  17. eICU合作研究数据库,一个免费的多中心重症护理研究数据库。Pollard TJ, Johnson AEW, Raffa JD, Celi LA, Mark RG和Badawi O.科学数据(2018)。DOI:https://doi.org/10.1038/sdata.2018.178

  18. 李晓燕,李晓燕,李晓燕(2019)。MIMIC-III临床数据库演示(1.4版本)。生理网。https://doi.org/10.13026/C2HM2Q

  19. sklearn.preprocessing.LabelEncoder - scikit-learn 0.22.1文档。(2019)。Scikit-Learn.org。https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.LabelEncoder.html

  20. onehotencoder - scikit-learn 0.22文档。(2019)。Scikit-Learn.org。https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html

  21. Kluyver T,等。Jupyter笔记本-可复制计算工作流的发布格式。正确的做法是:洛伊兹德斯F,施密特B,编辑。学术出版的定位与权力:参与者、代理人与议程。IOS出版社;2016.p . 87 - 90。https://doi.org/10.3233/978-1-61499-649-1-87

  22. 谷歌。(2019)。云计算服务|谷歌云。谷歌云。https://cloud.google.com/

  23. Van Rossum G, Drake FL. Python 3参考手册。scott Valley, CA: CreateSpace;2009.

    谷歌学者

  24. 学习:Python中的机器学习- Scikit-Learn 0.16.1文档。Scikit scikit-learn.org/。

  25. Pedregosa F,等。Scikit-learn, Python中的机器学习。中国科学(d辑:自然科学版)2011;

  26. 伦德伯格SM,李秀仁。“解释模型预测的统一方法”,第31届神经信息处理系统国际会议论文集(NIPS’17)。Red Hook: Curran Associates Inc.;2017.p . 4768 - 77。

  27. Molnar,克里斯托弗。“可翻译的机器学习。5.9 Shapley Values, 2021年4月12日,christophm.github.io/interpretable-ml-book/ Shapley .html。

  28. jeette DU, Stilphen M, Ranganathan VK, Passek SD, Frost FS, jeette AM。AM-PAC“6-点击”住院患者日常活动和基本活动简表的有效性。phy其他领域。2014;94(3):379 - 91。https://doi.org/10.2522/ptj.20130199

    文章PubMed谷歌学者

下载参考

确认

该研究得到了北卡罗来纳大学研究机会倡议(ROI)奖“温斯顿-塞勒姆州立大学应用数据科学中心”,2020财年- 2023财年和NSF奖#1600864的支持,以改善温斯顿-塞勒姆州立大学的大数据和云计算研究和教育。

资金

该研究得到了北卡罗来纳大学研究机会倡议(ROI)奖“温斯顿-塞勒姆州立大学应用数据科学中心”,2020财年- 2023财年和NSF奖#1600864的支持,以改善温斯顿-塞勒姆州立大学的大数据和云计算研究和教育。

作者信息

作者和联系

作者

贡献

CM进行了背景研究,设计和开发预测模型,运行实验,并收集结果。DD制定问题并指导研究,确定特征,讨论结果并写下结论。所有作者阅读并批准了最终稿件。

相应的作者

对应到Debzani Deb

道德声明

伦理批准和同意参与

不适用。

同意出版

不适用。

相互竞争的利益

作者声明他们没有竞争利益。

额外的信息

出版商的注意

施biwei体育官网app下载普林格自然对出版的地图和机构附属的管辖权要求保持中立。

权利和权限

开放获取本文遵循创作共用署名4.0国际许可协议(Creative Commons Attribution 4.0 International License),该协议允许在任何媒体或格式中使用、分享、改编、分发和复制,只要您给予原作者和来源适当的署名,提供创作共用许可协议的链接,并说明是否有更改。本文中的图片或其他第三方材料包含在文章的创作共用许可中,除非在材料的信用额度中另有说明。如果材料不包含在文章的创作共用许可中,并且您的预期用途不被法律法规允许或超出了允许的用途,您将需要直接从版权所有者那里获得许可。欲查看此许可证的副本,请访问http://creativecommons.org/licenses/by/4.0/.创作共用公共领域奉献放弃书(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文提供的数据,除非在数据的信用额度中另有说明。

再版和权限

关于这篇文章

通过CrossMark验证货币和真实性

引用这篇文章

Mickle, C, Deb, D.使用机器学习在急性神经护理中对患者出院倾向的早期预测。BMC运行状况服务保留区221281(2022)。https://doi.org/10.1186/s12913-022-08615-w

下载引用

  • 收到了

  • 接受

  • 发表

  • DOIhttps://doi.org/10.1186/s12913-022-08615-w

关键字

  • 机器学习
  • 出院计划
  • 可解释性
  • 神经系统