[Improved Palliative Care Practices Through Machine-Learning Prediction of 90-Day Risk of Mortality Following Hospitalization. Oo TH, Marroquin OC, McKibben J, Schell JO, Arnold RM, Kip KE. NEJM Catalyst Innovations in Care Delivery Vol. 4 No. 1|January 2023]
https://catalyst.nejm.org/doi/full/10.1056/CAT.22.0214
Introducción
Los pacientes con enfermedades graves y sus familias confían en que los médicos les proporcionen información pronóstica sincera, transparente y precisa, basada en datos, para tomar sus decisiones informadas y basadas en valores. Las conversaciones sobre el final de la vida ofrecen a los pacientes la oportunidad de definir sus objetivos y expectativas en cuanto a los cuidados médicos que desean recibir cerca de la muerte y, en comparación con los cuidados médicos agresivos, estas conversaciones se han asociado a tasas más bajas de ventilación y reanimación, a una inscripción más temprana en programas de cuidados paliativos y a una mejor calidad de vida. En este ámbito, se ha producido una proliferación del uso de algoritmos de aprendizaje automático (Machine Learning, ML por sus siglas en inglés) en los sistemas de atención sanitaria para desarrollar y validar modelos predictivos de mortalidad a corto y largo plazo y proporcionar una atención óptima a estos pacientes.
Enfoque global de la modelización predictiva y la aplicación operativa
En este estudio, en The University of Pittsburgh Medical Center (UPMC), los autores describen, mediante un esquema en cinco pasos -organizar, analizar, construir, evaluar y desplegar-, el uso de algoritmos de ML integrados con las historias clínicas electrónicas (HCE) para generar clasificaciones de riesgo de mortalidad a 90 días (M90) en pacientes hospitalizados. El sistema activa automáticamente alertas clínicas para grupos de pacientes de riesgo intermedio y alto, de modo que el equipo asistencial pueda mantener conversaciones sobre los objetivos de los cuidados (OC), identificando pacientes y actuaciones concordantes con sus OC y monitorizar el impacto.
Previamente a la implementación, mediante revisiones de la mortalidad hospitalaria, se identificaron oportunidades en las que una atención más adecuada podría haber influido positivamente en la experiencia final de la vida de un paciente. La iniciativa pretendía mejorar la frecuencia de las conversaciones sobre sus OC en pacientes con enfermedades graves, a través de: la identificación, con un modelo predictivo, de pacientes con alto riesgo de mortalidad; la revisión de notas de OC en la HCE y la notificación a los médicos para impulsar las consultas específicas de cuidados paliativos en las personas con mayor riesgo.
Material y métodos
La población de estudio de ML incluyó a 611.543 pacientes hospitalizados entre 2015 y 2019, con edades de 18 años o superiores, capturados automáticamente del sistema UPMC, distribuidos homogéneamente (edad, sexo, raza y grupo étnico) en una proporción de 80:20 en dos subgrupos similares de aprendizaje y ajuste, tanto para el entrenamiento del algoritmo como para su validación. Para la fase de aplicación, se seleccionaron otros 25.116 pacientes hospitalizados en el HU Presbiteriano de Pittsburgh (HUPP) durante 2021 y primer semestre de 2022.
El objetivo primario de resultado para el análisis de ML fue el riesgo de M90 observado al ingreso. Como predictores potenciales se evaluaron 390 variables/paciente – de índole sociodemográfica, utilización previa de asistencia sanitaria, valores antropométricos y de laboratorio, y comorbilidades-, (82 numéricas y 308 categóricas). Para el ML se utilizó el algoritmo de código abierto light gradient-boosting machine.
El protocolo fue aprobado por el Comité de Ética y Calidad del centro. Todo el desarrollo y la validación del modelo incluyó el compromiso continuado de los médicos de UPMC, HUPP y otros grupos de interés.
Resultados
La edad media de la muestra del UPMC fue de 57 años, predominantemente blancos y con una baja proporción de hispanos. Debido al sobremuestreo intencionado de fallecimientos, las tasas M90 fueron de 10,5% y 10,7% (en los grupos de entrenamiento) y de 7,5% y 5,9% (en los grupos de validación clínica). Para el despliegue operativo se definieron las categorías de riesgo: alto (A) >0,80, intermedio (I) entre 0,40-0,80 y bajo (B) <0,40. Las categorías se insertaron en las HCE para que los algoritmos pudieran ejecutarse automáticamente, de forma silente en una primera fase (validación de selección) y activa en la segunda (implementación de conversaciones de OC).
En la implementación del algoritmo en el HUPP, el modelo mostró buena predictibilidad, con una categorización para riesgos B/I/A de 83,9%/15,1%/1.0% respectivamente. Los de riesgo A fueron prioritariamente pacientes trasladados a UCI. Las mortalidades por categoría fueron 2.3%, 12.3% y 34.2%, respectivamente.
Tras la implementación de los algoritmos de ML en julio de 2021, se produjo un aumento inmediato y sostenido en el número de pacientes que recibieron conversaciones OC, especialmente para los pacientes de UCI de riesgo A e I, en los que se duplicó.
Los pacientes de riesgo A e I que tuvieron conversaciones de OC, fueron con mayor frecuencia pacientes ingresados en la UCI [más de riesgo alto], con mayor puntuación Elixhauser [mayores comorbilidades], con estancia media más larga y más consultas de cuidados paliativos. El 65% de los pacientes con conversación OC realizó también consulta de cuidados paliativos en comparación con sólo el 12% de los pacientes que no la tuvieron.
Los autores también ofrecen sugerencias analíticas y operativas, basadas en su enfoque, para la aplicación en otros centros, recomendando la utilización de múltiples variables de la HCE, probar diferentes modelos de agregación de variables y su repercusión en los resultados de mortalidad a 90 días, implicar a todos los grupos de interés e incluir los resultados como alertas automáticas en la HCE.
[Reseña: GS]