Espacio editorial virtual

Toward Foundational Deep Learning Models for Medical Imaging in the New Era of Transformer Networks

Radiology: Artificial Intelligence
Willemink MJ, Roth HR and Sandfort V Toward Foundational Deep Learning Models for Medical Imaging in the New Era of Transformer Networks Radiology: Artificial Intelligence 2022; 4(6):e210284
SERAM - Radiology Radiographics
Autor/es: Willemink MJ, Roth HR and Sandfort V

Los modelos de aprendizaje profundo (Deep Learning) son actualmente la piedra angular de la inteligencia artificial en análisis de las imágenes médicas. El núcleo tecnológico de las redes neuronales convolucionales (CNN) solo ha tenido innovaciones modestas en los últimos años. Hay pues una necesidad de mejora y en este sentido, recientemente, han surgido redes de transformadores (Transformers Networks) que reemplazan a las CNN con un mecanismo de atención complejo, que han igualado o superado el rendimiento de las CNN en muchas tareas.

Los transformadores necesitan grandes cantidades de datos de entrenamiento, incluso más que las CNN, pero obtener datos etiquetados bien seleccionados es costoso y difícil. Una posible solución a este problema sería transferir el aprendizaje con entrenamiento previo en una tarea auto supervisada usando grandes cantidades de datos médicos no etiquetados. Esta red preentrenada luego podría ajustarse en tareas específicas de imágenes médicas con requisitos de datos relativamente modestos.

Los autores creen que la disponibilidad de un modelo 3D a gran escala sería muy beneficioso para la investigación en imágenes médicas. En este artículo, discuten los desafíos y obstáculos de capacitar a un gran transformador de imágenes médicas, incluidas las necesidades de datos, los sesgos, tareas de entrenamiento, arquitectura de red, preocupaciones de privacidad y requisitos computacionales. Consideran que los obstáculos son sustanciales, pero no insuperables para equipos colaborativos ingeniosos que pueden incluir socios académicos y de la industria de la tecnología de la información.

El artículo cuenta con dos figuras. En la figura primera se muestra un ejemplo de uso de lenguaje natural con texto o con un modo visual. También se muestra un ejemplo de segmentación de estructuras con alta dificultad técnica para ello como el estómago o el páncreas. En la figura 2 se muestra como se convierte una imagen en una secuencia de imágenes de menor tamaño para permitir su análisis.

PUNTOS FUERTES:

  • Calidad de las dos figuras del artículo que muestra dos ejemplos muy ilustrativos del mensaje que quiere transmitir esta publicación.
  • Revisión bibliográfica completa.
  • Equipo potente de autores.

PUNTOS DEBILES:

  • No hay discusión sobre la aplicación de esta tecnología en el flujo de trabajo completo de la imagen médica por ejemplo a nivel de la valoración de la adecuación de la demanda de pruebas de diagnóstico por la imagen.
  • No hay un comentario sobre las limitaciones del estudio.

 

 

Dr. Salvador Pedraza

Sección de Formación en Radiodiagnóstico - FORA

Suscríbete

Comités

Sugerencias

Mantenimiento web

El próximo fin de semana, 2 y 3 de marzo, la web no estará operativa por labores de mantenimiento.
Podrás seguir accediendo a la plataforma de formación en http://aula.formacion.seram.es