¿Hasta qué punto es precisa la inteligencia artificial para diagnosticar el queratocono?

Mensajes clave

• Los estudios incluidos sugieren que la inteligencia artificial (IA) puede identificar el queratocono. Esto podría permitir la detección precoz y la prevención de la pérdida de visión.
• Las estimaciones fueron similares para los distintos tipos de algoritmos de IA.
• Se tiene poca confianza en la evidencia; es necesario investigar más sobre este tema.

¿Qué es el queratocono y por qué es tan importante un diagnóstico (precoz)?

El queratocono es una enfermedad de la córnea (la ventana transparente de la parte frontal del ojo) que afecta a personas de entre 10 y 40 años. En los afectados, la córnea se debilita y adelgaza con el paso de los años, abombándose gradualmente hasta adoptar la típica forma cónica, lo que provoca una reducción de la visión. Las gafas pueden resolver este problema en los estadios iniciales del queratocono, pero dejan de ofrecer una solución satisfactoria a medida que la enfermedad se agrava. El diagnóstico precoz es imprescindible para garantizar el seguimiento y el tratamiento y evitar así la pérdida de visión.

El diagnóstico del queratocono se basa en una exploración del ojo (medición del ojo y evaluación de la córnea con un haz de luz vertical y un microscopio) y el diagnóstico por la imagen (técnicas asistidas por ordenador que crean imágenes o mapas tridimensionales de la córnea). La interpretación de las imágenes puede ser difícil, especialmente en los centros de atención primaria y en los estadios iniciales de la enfermedad. No reconocer el queratocono puede conducir a un empeoramiento de la enfermedad y de la visión. Por ejemplo, las personas con riesgo de desarrollar queratocono que se someten a cirugía refractiva (cirugía para corregir su visión) podrían acabar con una visión peor.

¿Qué es la inteligencia artificial y cómo puede ayudar a detectar el queratocono?

La detección del queratocono a partir de imágenes es difícil, especialmente para los médicos sin formación. La IA proporciona a las máquinas la capacidad de adaptarse, razonar y encontrar soluciones. Se pueden desarrollar y entrenar algoritmos para analizar imágenes de la córnea y reconocer el queratocono. Estas pruebas podrían ayudar a oftalmólogos, optometristas y otros profesionales de la visión a realizar un diagnóstico y remitir a tiempo a las personas con queratocono a especialistas en córnea para preservar su visión. Existen muchos tipos diferentes de algoritmos, pero todos distinguen entre ojos sanos y queratoconos basándose en imágenes de la córnea.

¿Qué se quiso averiguar?

El objetivo de la revisión era averiguar si la IA puede diagnosticar correctamente el queratocono en personas que desean someterse a cirugía refractiva y en personas cuya visión ya no se puede corregir completamente con gafas.

¿Qué se hizo?

Se buscaron estudios que investigaran la precisión de la IA para diagnosticar el queratocono, preferentemente en personas que solicitan cirugía refractiva o personas cuya visión ya no se puede corregir completamente con gafas. Se compararon y resumieron los resultados de los estudios para calcular dos medidas de exactitud: la sensibilidad (la capacidad de la IA para identificar correctamente el queratocono) y la especificidad (la capacidad de la IA para descartar correctamente el queratocono). Cuanto más se acerquen la sensibilidad y la especificidad al 100%, mejor es el algoritmo.

¿Qué se encontró?

Se encontraron 63 estudios que utilizaron tres unidades diferentes (ojos, participantes e imágenes) para analizar la precisión de la IA en la detección del queratocono: 44 estudios analizaron 23 771 ojos, cuatro estudios analizaron 3843 participantes y 15 estudios analizaron 38 832 imágenes.

La precisión de la IA para detectar el queratocono manifiesto (queratocono que se puede detectar mediante una exploración clínica) fue alta. Si se hicieran pruebas a 1000 personas, 30 personas con queratocono serían remitidas correctamente a un especialista en córnea, y no se pasaría por alto a ninguna. De las 970 personas restantes (sin queratocono), solo 17 serían derivadas erróneamente. Estas personas se someterían a pruebas no invasivas adicionales para verificar si presentan queratocono.

La exactitud de la IA para detectar el queratocono precoz fue menor. Si se sometiera a la prueba a 1000 personas, nueve personas con queratocono serían remitidas correctamente a un especialista en córnea y una pasaría desapercibida. Si esta persona se sometiera a cirugía refractiva, se agravaría la enfermedad y empeoraría su visión. De las 990 personas restantes (sin queratocono), a 941 se les aseguraría que no presentaban la enfermedad y recibirían cirugía refractiva o gafas; 49 personas serían derivadas erróneamente.

La evidencia sugiere que la IA podría ser buena para detectar el queratocono manifiesto, pero podría no ser ideal para el cribado del queratocono precoz.

¿Cuáles son las limitaciones de la evidencia?

Se tiene poca confianza en la evidencia sobre la exactitud de la IA para detectar el queratocono manifiesto, y se tiene poca o ninguna confianza en la evidencia relacionada con el queratocono precoz. Hubo problemas con la forma en que se realizaron los estudios, lo que podría dar lugar a que la IA parezca más precisa de lo que realmente es.

¿Cuál es el grado de actualización de esta evidencia?

La evidencia está actualizada hasta el 29 de noviembre de 2022.

Conclusiones de los autores: 

La IA parece ser una herramienta de triaje prometedora en la práctica oftalmológica para el diagnóstico del queratocono. La exactitud de la prueba fue muy alta para el queratocono manifiesto y ligeramente inferior para el queratocono subclínico, lo que indica una mayor probabilidad de pasar por alto un diagnóstico en personas sin signos clínicos. Esto podría provocar la progresión del queratocono o una indicación errónea de cirugía refractiva, lo que empeoraría la enfermedad.

No fue posible establecer conclusiones claras y fiables debido al alto riesgo de sesgo, la heterogeneidad inexplicable de los resultados y las grandes dudas sobre la aplicabilidad, todo lo cual redujo la confianza en la evidencia.

Una mayor estandarización en futuras investigaciones aumentaría la calidad de los estudios y mejoraría la comparabilidad entre ellos.

Leer el resumen completo…
Antecedentes: 

El queratocono sigue siendo difícil de diagnosticar, sobre todo en estadios iniciales. Se trata de un trastorno progresivo de la córnea que comienza a una edad temprana. El diagnóstico se basa en la exploración clínica y en las imágenes de la córnea; aunque en estadios iniciales, cuando no hay signos clínicos, el diagnóstico depende de la interpretación de las imágenes de la córnea (p. ej., topografía y tomografía) por especialistas en córnea formados. El uso de la inteligencia artificial (IA) para analizar las imágenes de la córnea y detectar casos de queratocono podría ayudar a prevenir la pérdida de agudeza visual e incluso el trasplante de córnea. Sin embargo, un diagnóstico erróneo en personas que desean someterse a cirugía refractiva podría provocar un debilitamiento de la córnea y una ectasia similar al queratocono. Es necesario disponer de una idea general fiable de la exactitud de la IA para detectar el queratocono y de la aplicabilidad de este método automatizado al contexto clínico.

Objetivos: 

Evaluar la exactitud diagnóstica de los algoritmos de inteligencia artificial (IA) para detectar el queratocono en personas que presentan defectos de refracción, especialmente aquellas cuya visión ya no puede corregirse completamente con gafas, las que solicitan cirugía refractiva corneal y las que se sospecha que presentan queratocono. La IA podría ayudar a oftalmólogos, optometristas y otros profesionales de la salud ocular a tomar decisiones sobre la derivación a especialistas en córnea.

Objetivos secundarios

Evaluar las siguientes posibles causas de heterogeneidad en el rendimiento diagnóstico en los estudios:

• Diferentes algoritmos de IA (p. ej., redes neuronales, árboles de decisión, máquinas de vectores de soporte)
• Metodología de la prueba índice (técnicas de preprocesamiento, método básico de IA y técnicas de posprocesamiento)
• Fuentes de información para entrenar algoritmos (imágenes de topografía y tomografía mediante el sistema de discos de Plácido, el sistema Scheimpflug, el sistema de escaneo de hendidura o tomografía de coherencia óptica (TCO); número de casos/imágenes de análisis y entrenamiento; etiqueta/criterio de valoración utilizado para el entrenamiento)
• Contexto del estudio
• Diseño del estudio
• Origen étnico, o zona geográfica como sustituto
• Diferentes criterios de positividad de la prueba índice proporcionados por el dispositivo de topografía o tomografía
• Prueba de referencia, topografía o tomografía, uno o dos especialistas en córnea
• Definición de queratocono
• Media de edad de los participantes
• Reclutamiento de los participantes
• Gravedad del queratocono (clínicamente manifiesto o subclínico)

Métodos de búsqueda: 

Se realizaron búsquedas en CENTRAL (que contiene el Registro de ensayos del Grupo Cochrane de Salud ocular y de la visión [Cochrane Eyes and Vision]), Ovid MEDLINE, Ovid Embase, OpenGrey, el registro ISRCTN, ClinicalTrials.gov y la Plataforma de registros internacionales de ensayos clínicos de la Organización Mundial de la Salud (ICTRP de la OMS). No se impusieron restricciones de idioma ni de fecha en las búsquedas electrónicas de ensayos. La última búsqueda en las bases de datos electrónicas se realizó el 29 de noviembre de 2022.

Criterios de selección: 

Se incluyeron estudios transversales y de diagnóstico de casos y controles que investigaron la IA para el diagnóstico del queratocono mediante topografía, tomografía o ambas. Se incluyeron los estudios que diagnosticaron el queratocono manifiesto, el queratocono subclínico o ambos. La prueba de referencia fue la interpretación de las imágenes de topografía o tomografía por al menos dos especialistas en córnea.

Obtención y análisis de los datos: 

Dos autores de la revisión extrajeron de forma independiente los datos de los estudios y evaluaron su calidad mediante la herramienta Quality Assessment of Diagnostic Accuracy Studies (QUADAS-2). Cuando un artículo contenía varios algoritmos de IA, se seleccionó el algoritmo con el índice de Youden más alto. La certeza de la evidencia se evaluó con el método GRADE.

Resultados principales: 

Se incluyeron 63 estudios, publicados entre 1994 y 2022, que desarrollaron e investigaron la exactitud de la IA para el diagnóstico del queratocono. En los estudios hubo tres unidades de análisis diferentes: ojos, participantes e imágenes. En 44 estudios se analizaron 23 771 ojos, en cuatro estudios se analizaron 3843 participantes y en 15 estudios se analizaron 38 832 imágenes.

En 54 artículos se evaluó la detección del queratocono manifiesto, definido como una córnea que mostraba cualquier signo clínico de queratocono. La exactitud de la IA parece casi perfecta, con una sensibilidad resumida del 98,6% (intervalo de confianza [IC] del 95%: 97,6% a 99,1%) y una especificidad resumida del 98,3% (IC del 95%: 97,4% a 98,9%). Sin embargo, la exactitud varió entre los estudios y la certeza de la evidencia fue baja.

En 28 artículos se evaluó la detección del queratocono subclínico, aunque la definición de subclínico varió. Se agrupó por queratocono subclínico, forma fruste y ojos muy asimétricos. Las pruebas mostraron una buena exactitud, con una sensibilidad resumida del 90,0% (IC del 95%: 84,5% a 93,8%) y una especificidad resumida del 95,5% (IC del 95%: 91,9% a 97,5%). Sin embargo, la certeza de la evidencia fue muy baja para la sensibilidad y baja para la especificidad.

En ambos grupos, la mayoría de los estudios se consideraron con alto riesgo de sesgo, con grandes dudas con respecto a la aplicabilidad, en el dominio de selección de los pacientes, ya que la mayoría fueron estudios de casos y controles. Además, la certeza de la evidencia se consideró baja a muy baja debido al sesgo de selección, la inconsistencia y la imprecisión.

No fue posible explicar la heterogeneidad entre los estudios. Los análisis de sensibilidad según el diseño de estudio, el algoritmo de IA, la técnica de imagen (topografía versus tomografía) y la fuente de datos (parámetros versus imágenes) no mostraron diferencias en los resultados.

Notas de traducción: 

La traducción de las revisiones Cochrane ha sido realizada bajo la responsabilidad del Centro Cochrane Iberoamericano, gracias a la suscripción efectuada por el Ministerio de Sanidad del Gobierno de España. Si detecta algún problema con la traducción, por favor, contacte con comunica@cochrane.es.

Tools
Information