Espacio editorial virtual
- Inicio
- Espacio editorial virtual
- Toward Foundational Deep Learning Models for Medical Imaging in the New Era of Transformer Networks
Toward Foundational Deep Learning Models for Medical Imaging in the New Era of Transformer Networks

Los modelos de aprendizaje profundo (Deep Learning) son actualmente la piedra angular de la inteligencia artificial en análisis de las imágenes médicas. El núcleo tecnológico de las redes neuronales convolucionales (CNN) solo ha tenido innovaciones modestas en los últimos años. Hay pues una necesidad de mejora y en este sentido, recientemente, han surgido redes de transformadores (Transformers Networks) que reemplazan a las CNN con un mecanismo de atención complejo, que han igualado o superado el rendimiento de las CNN en muchas tareas.
Los transformadores necesitan grandes cantidades de datos de entrenamiento, incluso más que las CNN, pero obtener datos etiquetados bien seleccionados es costoso y difÃcil. Una posible solución a este problema serÃa transferir el aprendizaje con entrenamiento previo en una tarea auto supervisada usando grandes cantidades de datos médicos no etiquetados. Esta red preentrenada luego podrÃa ajustarse en tareas especÃficas de imágenes médicas con requisitos de datos relativamente modestos.
Los autores creen que la disponibilidad de un modelo 3D a gran escala serÃa muy beneficioso para la investigación en imágenes médicas. En este artÃculo, discuten los desafÃos y obstáculos de capacitar a un gran transformador de imágenes médicas, incluidas las necesidades de datos, los sesgos, tareas de entrenamiento, arquitectura de red, preocupaciones de privacidad y requisitos computacionales. Consideran que los obstáculos son sustanciales, pero no insuperables para equipos colaborativos ingeniosos que pueden incluir socios académicos y de la industria de la tecnologÃa de la información.
El artÃculo cuenta con dos figuras. En la figura primera se muestra un ejemplo de uso de lenguaje natural con texto o con un modo visual. También se muestra un ejemplo de segmentación de estructuras con alta dificultad técnica para ello como el estómago o el páncreas. En la figura 2 se muestra como se convierte una imagen en una secuencia de imágenes de menor tamaño para permitir su análisis.
PUNTOS FUERTES:
- Calidad de las dos figuras del artÃculo que muestra dos ejemplos muy ilustrativos del mensaje que quiere transmitir esta publicación.
- Revisión bibliográfica completa.
- Equipo potente de autores.
PUNTOS DEBILES:
- No hay discusión sobre la aplicación de esta tecnologÃa en el flujo de trabajo completo de la imagen médica por ejemplo a nivel de la valoración de la adecuación de la demanda de pruebas de diagnóstico por la imagen.
- No hay un comentario sobre las limitaciones del estudio.
Dr. Salvador Pedraza
Sección de Formación en Radiodiagnóstico - FORA