Las 7 principales particularidades del Machine Learning en el sector sanitario

En anteriores artículos ya hemos hablado de la importancia que está adquiriendo el Machine Learning en numerosos sectores, tanto en el mundo académico como corporativo. Hoy en día, gracias a esta tecnología, se han conseguido grandes avances como los coches autónomos, el reconocimiento facial automático o la detección de compras web fraudulentas.

Sin embargo, en el sector sanitario hay una serie de particularidades que hacen que el desarrollo de estas tecnologías sea mucho más lento y en cierto modo más complejo. En este artículo repasaremos 7 peculiaridades del Machine Learning en el sector sanitario.

1. Mayor criticidad en la toma de decisiones

Uno de los grandes desafíos para la aplicabilidad de este tipo de algoritmos en el sector sanitario es el riesgo a la hora de la toma de decisiones. Los modelos de Machine Learning pueden ser empleados tanto para aspectos de gestión sanitaria como clínicos. Muchos de los retos que se llevan a cabo en el segundo ámbito, la finalidad clínica, abarcan problemas como el diagnóstico precoz, predicción de riesgo en un paciente, recomendación de tratamientos, terapias personalizadas, etc. por lo que un error o mal uso del modelo podría afectar a la salud del paciente. En ocasiones, las razones que llevan al clínico a tomar una decisión están fuera del alcance del modelo al no estar presentes en los datos empleados para entrenar el mismo, por ello es necesario el conocimiento y supervisión de profesionales sanitarios para la decisión final.

2. Privacidad de los datos

Otro de las grandes particularidades del ámbito sanitario, es la necesidad de asegurar la privacidad de los datos ya que se trata de datos extremadamente sensibles. Estos datos personales como pueden ser pruebas médicas, tratamientos, diagnósticos, etc., están especialmente protegidos por la Ley Orgánica de Protección de Datos Personales y garantía de los derechos digitales. El tratamiento de datos de este tipo requiere siempre previo consentimiento y una correcta anonimización, además es importante conocer siempre donde están guardados y quién puede tener acceso a ellos.

3. Disponibilidad y calidad de los datos

El sector sanitario es uno de los sectores en los que más potencial y valor puede alcanzar el uso de tecnologías como Machine Learning, dado que estos modelos basan su potencial en el volumen y riqueza de los datos con los que se entrenan y la cantidad de datos médicos que se generan día a día es inmensa.

Sin embargo, la disponibilidad de estos datos es una de las principales limitaciones que impiden llegar a alcanzar todo este potencial. Las reservas para hacer disponibles datasets, incluso debidamente anonimizados, en el ámbito médico dada su especial sensibilidad, es muchas veces una gran barrera para el desarrollo de estas tecnologías.

Además, estos datos muchas veces se encuentran distribuidos en repositorios de información distinta e inconexa, en ocasiones repartidos entre entidades públicas y privadas. La información médica no siempre se almacena de la misma forma y suele haber muchos registros sin información y bases de datos que en ocasiones no han recibido los debidos procesos de limpieza y aseguramiento de calidad del dato. Un modelo de Machine Learning es solo tan bueno como lo sean los datos que se empleen para generarlo, por lo que esto supone un problema muy significativo.

4. La interpretabilidad

Por otra parte, la interpretabilidad del modelo adquiere especial importancia cuando es aplicado con finalidades clínicas. Las ‘cajas negras’ de los algoritmos, de las que hemos hablado en anteriores artículos, hacen que los modelos de Machine Learning sean difíciles de interpretar. En este sector un error puede poner en riesgo la vida de un paciente como comentábamos en el punto 1, por este motivo es importante extraer explicaciones que nos lleven a entender la decisión del modelo, además de permitir al clínico darse cuenta de inconsistencias que le permitan no tener en cuenta ciertas recomendaciones de un algoritmo en determinadas situaciones. Por ello, en Sigesa creemos que es una de las líneas de investigación más importantes a seguir para la implementación del Machine Learning en sanidad y podéis leer aquí como tratamos de solventar esta tarea, y también nuestros comentarios sobre la diferencia entre interpretabilidad y causalidad.

5. Implementación de los modelos

Otro de los desafíos más difíciles es la implementación real del modelo. Aunque cada vez son más frecuentes las investigaciones sobre modelos de Machine Learning en sanidad, desde diagnóstico a partir de radiografías hasta estimación temprana de padecer ciertos tumores, a la hora de la verdad estos modelos requieren una validación exhaustiva por parte de expertos sanitarios que nos permita confiar en sus predicciones.

Además, la gran variabilidad de las fuentes de datos, las diferencias en los registros clínicos, y la varianza en casuísticas y funcionamiento entre distintas entidades, añaden dificultad extra a la hora de implementar un mismo modelo dentro de hospitales distintos.

6. Necesidad de eliminar potenciales sesgos

La aplicación de Machine Learning en áreas de gran relevancia social debe aspirar a ser justa, y asegurarse de que el empleo de estos algoritmos no afecte al tratamiento del paciente por sesgos en la equidad (como el sexo, lugar de origen, etc.). Afortunadamente, este aspecto ético del Machine Learning está sufriendo un importante auge en los últimos años, y ya existen actualmente diversas técnicas para controlar que éstos no sufran de sesgos de este tipo, como comentaremos en más detalle en un futuro artículo.

A pesar de esto, la especial sensibilidad de los datos y decisiones en el sector sanitario hace necesario, o al menos recomendable, la existencia de comités éticos que obliguen a definir el empleo responsable de la inteligencia artificial.

7. Mayor impacto social

No todo son dificultades extra o complicaciones cuando hablamos del empleo del Machine Learning en la sanidad con respecto a otros sectores, por lo que nos gustaría terminar con un factor positivo y que es el principal motivo por el que desde Sigesa hemos decidido implementar esta tecnología en nuestros productos, y este no es otro que su mayor impacto social positivo.

La aplicación de Machine Learning en este sector puede llegar a tener un gran impacto en la calidad de la sanidad a nivel mundial, sirviendo de apoyo a los clínicos y también a los gestores sanitarios en su día a día. Esto puede redundar en una mejor eficacia en el empleo de los recursos disponibles, así como en mejoras directas en el diagnóstico o tratamiento y, en general, la calidad asistencial de los pacientes.

Por otro lado, no podemos olvidar que estas tecnologías también sirven para ofrecer apoyo en zonas con menos recursos. La aplicación de estos modelos ayuda a mejorar el diagnóstico en zonas donde hay falta de personal sanitario, así como optimizar la gestión de sus limitados recursos disponibles. Además, el empleo de asistentes virtuales o la monitorización de la asistencia sanitaria son técnicas que pueden utilizarse en remoto con el fin de aumentar la calidad asistencial de los pacientes incluso en zonas con menor potencial sanitario. De esta forma, los algoritmos de Machine Learning pueden servir no solo para mejorar el servicio sanitario per se, sino también como homogeneizador de la calidad asistencial en su conjunto.

El desarrollo e implantación generalizada de tecnologías ligadas a la Inteligencia Artificial en el sector de la salud responde a esta ley. El potencial transformador es tan grande que se han generado unas expectativas exageradas en el corto plazo, olvidando algunos de los retos y dificultades técnicas. Sin embargo, en el largo plazo, cuando se solventen las barreras que existen actualmente, su implantación supondrá un cambio disruptivo en línea con las cifras estimadas por los distintos estudios publicados. No estamos ahora mismo, por tanto, ante una burbuja sino en una fase muy inicial de un gran cambio.