Modelos de Riesgo en Sanidad usando Inteligencia Artificial

La Sanidad está experimentando una profunda transformación derivada del uso tecnologías relacionadas con las técnicas de analítica avanzada usando modelos de Inteligencia Artificial basados en Aprendizaje Automático (Machine Learning). A medida que los sistemas de salud se enfrentan al aumento de los costos, a la limitación de recursos y a una creciente demanda de atención eficiente y personalizada, los Modelos de Riesgo han surgido como una poderosa herramienta para abordar estos desafíos.

Un Modelo de Riesgo es una función matemática empleada habitualmente para estimar la confianza de que ocurra un evento o resultado binario (“Sí”/”No”) específico en el futuro. En el contexto de la Gestión Sanitaria, estos modelos también pueden utilizarse de forma prospectiva. Por ejemplo, se pueden aplicar para estimar, basándose en datos conocidos sobre un episodio clínico, cuál era la probabilidad de un determinado resultado y compararlo con lo que ha ocurrido en la realidad. Esta comparación permite detectar posibles casos de ineficiencia sanitaria, problemas de codificación médica o u otros casos anómalos.

Asimismo, los modelos de riesgo aprovechan métodos computacionales avanzados para analizar datos complejos de pacientes e identificar patrones que puedan orientar los procesos de toma de decisiones, mejorando finalmente los resultados de los pacientes y optimizando la asignación de recursos.

Los enfoques estadísticos tradicionales como la regresión logística se han empleado durante mucho tiempo en modelos de riesgo. La regresión logística es un modelo estadístico lineal que modela la relación entre una variable dependiente binaria (por ejemplo, la mortalidad) y una o más variables independientes (por ejemplo, la edad, el género o el GRD). La regresión logística funciona adecuadamente con datos linealmente separables, pero cabe destacar que su rendimiento se ve drásticamente disminuido con relaciones complejas entre un alto número de variables.

Una de las principales ventajas de los enfoques de aprendizaje automático es su capacidad para manejar datos de alta dimensión y conjuntos de datos complejos, los cuales son comunes en Sanidad. Estos métodos pueden procesar eficientemente miles de variables predictoras potenciales, como las presentes en el Conjunto Mínimo Básico de Datos (CMBD) y otras fuentes de datos, y seleccionar automáticamente las características más relevantes para el problema en cuestión.

Además, los algoritmos de aprendizaje automático están diseñados para manejar datos incompletos, valores atípicos y “ruido”, lo que los hace más robustos y confiables al analizar conjuntos de datos del mundo real. También, mediante el uso de metodologías de redes neuronales profundas, tienen la capacidad de manejar y combinar diferentes tipos de datos heterogéneos, como texto, imágenes, señales y datos estructurados, lo que los convierte en una opción atractiva para el análisis integrado de datos clínicos.

Por ejemplo, nuestra plataforma ENARA MLS utiliza modelos basados en el algoritmo de boosting “XGBoost”, reconocido como la vanguardia en los métodos de aprendizaje conjunto (“ensemble learning”). Este enfoque combina múltiples árboles de decisión especializados para crear un modelo predictivo combinado más robusto. En el contexto de los modelos de riesgo en Sanidad, donde los datos suelen ser complejos, no lineales y de alta dimensión, los modelos de boosting como XGBoost superan el rendimiento de la regresión logística y permiten un mejor ajuste de los casos esperados.

Sin embargo, el desarrollo e implementación de modelos de riesgo no está exento de desafíos. La necesidad de interpretabilidad y transparencia es crucial. Además, las preocupaciones éticas, como el sesgo algorítmico, la privacidad y el potencial uso indebido o mala interpretación de los resultados del modelo, deben abordarse para garantizar la adopción responsable y confiable de estas tecnologías.

Sigesa