Deep Learning para el reconocimiento de imágenes en sanidad

Machine Learning, ML, o Aprendizaje Automático, es una rama de la Inteligencia Artificial cuyo objetivo es construir sistemas que aprendan automáticamente de los datos. La popularidad de las técnicas de ML ha crecido exponencialmente en los últimos años, y se han aplicado para resolver una gran variedad de problemas, como la predicción del mercado de valores, la detección de transacciones fraudulentas o la predicción de la producción energética mediante energías renovables.

En Sigesa llevamos años desarrollando productos basados en algoritmos de aprendizaje automático para el apoyo en el sector sanitario, como por ejemplo nuestra herramienta Enara MLS, o los modelos Machine Learning Predictors, MLP, de los que ya hablamos en un artículo hace unos meses.

En este artículo queremos centrar nuestra atención en los modelos de Aprendizaje Profundo, o Deep Learning, DL. Aunque a menudo se considera un campo independiente, DL no es menos ni más que otra familia de modelos de Machine Learning. Sin embargo, se trata de una familia de modelos con algunas propiedades sumamente relevantes, como su alto poder predictivo y su capacidad para realizar aprendizaje extremo a extremo, en el que la necesidad de conocimiento experto en el campo correspondiente al problema a resolver se ve enormemente reducida.

Deep Learning para el conocimiento de imágenes en sanidad

Una familia específica de técnicas de Deep Learning, denominada Redes Neuronales Convolucionales, CNNs, presenta un conjunto de propiedades muy ventajosas para su uso en tareas de clasificación de imágenes, un tipo de problemas habituales en el sector sanitario, y se ha convertido en los últimos años en el estado del arte para este tipo de problemas.

Los problemas de reconocimiento o clasificación de imágenes son un conjunto de tareas dentro de la rama de aprendizaje supervisado de los problemas de ML cuyo objetivo es clasificar correctamente una serie de imágenes en un conjunto predefinido de posibles grupos o clases. Por ejemplo, podemos querer clasificar si una imagen contiene un automóvil, etiqueta 1 o no, etiqueta 0. Las tareas de clasificación de imágenes aparecen a menudo en el sector de la salud, siendo una de las áreas donde estas tecnologías están teniendo una mayor penetración en el mercado. Algunos ejemplos de estos problemas son el diagnóstico de la Retinopatía Diabética, el análisis histológico, o la detección precoz de tumores.

Una de las principales dificultades para construir estos modelos, que a menudo se encuentra en problemas en el sector sanitario, es la cantidad reducida de datos de imágenes disponibles, como imágenes de rayos-x o tomografías computarizadas. Dado que todos los modelos de Aprendizaje Automático, y el Deep Learning no es una excepción, basan su potencial en el volumen y diversidad de datos empleados para entrenarlos, este factor supone un inconveniente de significativa importancia.

Para hacer frente a este inconveniente, en Sigesa aplicamos dos métodos. En primer lugar, hacemos uso de técnicas de Transfer Learning, que permiten aprovechar el conocimiento extraído por modelos CNN de investigaciones previas en tareas similares. De este modo, en lugar de partir de cero, nuestros modelos de Deep Learning parten de una base de conocimiento creada a partir de problemas sanitarios de clasificación de imágenes con similitudes al que nosotros queremos resolver.

Para mitigar aún más los efectos de una posible escasez de datos, también aplicamos una serie de técnicas conocidas como data augmentation. Como tener un gran conjunto de datos es crucial para el rendimiento del modelo de aprendizaje profundo, estas herramientas tienen como objetivo crear ejemplos sintéticos basados en el conjunto de datos original. Esto puede implicar desde métodos directos como la rotación o traslación de imágenes, hasta técnicas específicas de mucha mayor complejidad. En Sigesa, hemos puesto especial énfasis en este aspecto en las Generative Adversarial Networks, GANs, actualmente considerado mayoritariamente el estado del arte en este sentido.

Empleando este tipo de tecnologías Sigesa ha creado por ejemplo una herramienta capaz de realizar predicciones de indicadores clínicos clave en pacientes de COVID-19. Actualmente formamos parte del programa COVID-X, una iniciativa de innovación europea que recibe financiación del Horizonte 2020 de la Unión Europea, y que tiene como objetivo el apoyo a herramientas tecnológicas basadas en datos que busquen ayudar en la lucha contra la pandemia causada por el virus COVID-19.

Para más información sobre nuestros modelos de aprendizaje automático, póngase en contacto con nosotros.