Dr. Alejandro Guzmán De León.

Profesor titular de tiempo completo

Universidad Autónoma Metropolitana – Iztapalapa.

Departamento de Ingeniería Eléctrica.

Area de Procesamiento Digital de Señales e Imágenes Biomédicas PDSIB.

e-mail: agdl@xanum.uam.mx

Teléfono: 58 04 49 04 ó 05

Tema del proyecto:

Procesamiento digital de imagenes colposcopicas




Este documento está basado en mi trabajo de tesis doctoral para tratar el tema del procesamiento digital hecho sobre las imágenes colposcopicas color.

Daré una pequeña introducción de lo que originó el estudio de estas imágenes y la búsqueda de un apoyo al diagnóstico basado en el procesamiento digital de imágenes. En seguida explicaré cuáles fueron los métodos propuestos y sus alcances. Al final, hablaré de cómo se podría continuar el desarrollo de dicha investigación.

Introducción

El ginecólogo realiza el estudio colposcopico del cuello uterino para detectar diferentes patologías que podemos clasificar en cuatro tipos: Normal, infección, ectopias y transformaciones que pueden evolucionar hasta cáncer [3].

De acuerdo a las estadísticas realizadas por el WHO [10], la primer causa de mortandad por cáncer en la mujer, corresponde al cáncer uterino, ya sea localizado en el cuerpo o en el cuello del útero.

El interés de la utilización del procesamiento digital de imágenes es simplemente el de apoyar al diagnóstico de una manera mas objetiva y cuantitativa.

Para mejor comprensión del tema, me permito hacer una pequeña introducción a lo que es la localización anatómica así como una somera descripción de la realización del estudio colposcopico.

El col uterino se encuentra en la parte inferior del útero conocido mejor como cuello uterino (figura 1),

Figura 1. Localización anatómica del col uterino.

este es visible desde el exterior, vía vaginal con la ayuda de un tipo de lupa llamada colposcopio (figura 2) y la utilización de separadores vaginales llamados espéculo o espejos (figura 3).

Figura 2 Figura 3

Colposcopio Olympus OCS 2 Pinzas y espejos de colposcopia

  Sobre el cuello uterino, el ginecólogo analiza 3 tipos de tejidos. El principio del endocol o endocervix (para la literatura anglosajona), la unión escuamo-cilíndrica u orificio y el exocol o exocervix que corresponde a la superficie más visible y más importante para nuestro procesamiento de imagen (figura 4).

 

Figura 4

El estudio colposcopico es realizado en 3 etapas:

La primera es llamada sin preparación correspondiente a la observación del col, en particular el exocol, haciendo una limpieza de la mucosa existente y en donde se buscan diferentes imágenes elementales o regiones de interés tales como orificios glandulares, contornos lesionales, zonas blancas, sean homogéneas cuadriculadas o piqueteadas, por nombrar algunos (figura 5).

Figura 5

La segunda etapa del estudio colposcopico se realiza al aplicar una solución al ácido acético cuya reacción permite determinar otras imágenes elementales (figura 6).

Figura 6

La tercera etapa corresponde a la aplicación de otra sustancia a base de Iodo llamada Lugol y de la misma forma se buscan otras imágenes elementales que son visibles después de la reacción [3] (figura 7).

Figura 7

Estas imágenes elementales son reagrupadas en tablas para dar una conclusión colposcopica de la cual se deriva un diagnóstico. Esta tabla colposcopica resume las características visibles en función de su localización y de su etapa de estudio (Tabla 1).

Tabla 1

Al analizar estas tablas nos percatamos que todas las imágenes elementales son descritas mediante las características de su color. De ahí la idea de querer segmentar este tipo de imágenes considerando sus características de color como base para aislar sus imágenes elementales.

Sabemos que en las imágenes color, un pixel está construido a partir de la combinación de a lo menos tres componentes. Sabemos que existen diferentes formas de representación espacial para un mismo color, es decir, existen diferentes sistemas o espacios de representación color. Aquí presento tres espacios de representación color que son de los más fundamentales para la colorimetría.

El espacio de representación color RGB (figura 8): Posee a los colores Rojo, Verde y Azul como componentes fundamentales. Su construcción se basa en dos teorías: la de Maxwell que habla de la composición de cualquier color a partir de tres componentes primarios, y la teoría tricromática que se basa en la existencia de tres neuro-receptores del color, los conos rojos, verde y azul. La composición del color a partir de estos componentes es mediante la suma de ellos, por eso mismo también se le llama sistema aditivo.

Figura 8

Espacio de representación color RGB

El espacio de representación color TLS (figura 9): Sus componentes fundamentales son el Tinte, la Luminosidad y la Saturación. El tinte lo podemos relacionar con la longitud de onda como parámetro, la luminosidad habla de la energía del color y la saturación habla de la pureza del color, o sea, qué tan mezclado con el color blanco se encuentra dicho color. Este sistema fue expuesto por Munsell [4,8],como un modelo de la percepción humana del color y es conocido tambien como sistema bi-cónico debido a su construcción espacial.

Figura 9

Espacio de representación color TLS

El espacio de representación CIE XYZ (figura 10): Cuyos componentes X, Y, Z, fueron definidos por la comisión internacional de la iluminación en 1931 para estandarizar la métrica de los colores mediante un diagrama cromático.

Figura 10

Espacio de representación color CIEXYZ

Se realizó un estudio de la literatura colorimétrica que permitió manipular 20 diferentes espacios de representación color [6]. Esta manipulación se basó en el hecho de que la tarjeta gráfica color de una computadora normalmente maneja el sistema RGB, por lo tanto se hizo una clasificación de los diferentes espacios estudiados dependiendo de la transformación requerida para su obtención a partir del sistema RGB y de acuerdo a la teoría en la cual se fundamenta, estos son:

Espacios de representación color que sufrieron una transformación lineal a partir del espacio RGB:

  1. RGB, XYZ, CMY, YIQ, T1T2T3, I1I2I3, I1I2'I3', I1rg, rgb normalizado (9).

De hecho los espacio I1rg y rgb normalizados sufren una transformación no lineal pero su implementación es tan simple que quisimos incluirlos en este grupo.

Espacios de representación color que sufrieron una transformación no lineal a partir del espacio RGB y que se basan en la construcción del diagrama cromático:

(10) Lab, Luv, UVWshetini, UVWotha (13).

Espacios de representación color que sufrieron una transformación no lineal a partir del espacio RGB y que se basan en la construcción propuesta por Munsell:

(14) HSV, HSLfoley, TLSmaxwell, TLCcarron, SOWpratt, CTLcarron, STL (20).

Posteriormente asignamos un número a cada espacio según una reagrupación hecha siguiendo sus características de transformación (lineal, no lineal), representación espacial (coordenadas rectangulares y cilíndricas) basados o no en el diagrama o plano cromático, y posibilidad de reversibilidad.

Hasta aquí he presentado la información que nos ayuda a conocer la imagen colposcopica. Ahora es necesario presentar cómo se va a procesar dicha información y sobre todo qué es lo que buscamos.

Lo que se busca es poder detectar las imágenes elementales de una manera automática o semi-automática. De tal forma que no sea necesario que el ginecólogo colposcopista trace a mano esas regiones. El detectar esas imágenes elementales, que desde ahora llamaré regiones de interés (ROI), permite eliminar subjetividades del tipo: localización, tamaño, distancia, color y forma.

Una cosa de gran utilidad sería el saber si es posible encontrar un parámetro, que permita reconocer una patología dada.

Para detectar las regiones de interés, tenemos que hacer uso de una técnica de procesamiento digital de imágenes, la segmentación.

Existen muchos métodos de segmentación [7] y hablando de segmentación en color podemos hacer una distinción en dos grandes grupos: aquellos que trabajan directamente sobre el espacio imagen y aquellos que trabajan sobre el espacio de representación color.

El primer grupo lo podemos subdividir en dos grandes sub-grupos que engloban la mayor parte de técnicas utilizadas hasta antes del desarrollo de las herramientas propias a la inteligencia artificial (IA); la segmentación por crecimiento de regiones y la detección de contornos.

La segmentación por crecimiento de regiones, utiliza un criterio de homogeneidad como parámetro para delimitar la región (figura 11).

La segmentación por detección de contornos, busca fuertes variaciones de algún parámetro dentro de la imagen utilizando operadores diferenciales (figura 12).

Figura 11 Figura 12

Crecimiento de regiones Detección de contornos

Para el segundo grupo, los métodos que se aplican sobre el espacio de representación color, existen sobre todo aquellas técnicas que se basan en la teoría de análisis de datos para hacer la clasificación (figura 13). Entre estas técnicas encontramos el análisis en componentes principales.

Figura 13

Clasificación

Entre las características del análisis en componentes principales, que determinaron la elección de este método para segmentar las imágenes, se encuentran las siguientes:

Una mejor presentación del espacio de representación color (ERC), simplificando la clasificación.

Una posible reducción de dimensiones físicas del ERC (3D, 2D ó 1D).

Esta técnica tiene la cualidad de sintetizar información útil sobre la imagen y crear nuevos parámetros para el análisis de la imagen.

Respecto a otras técnicas, este método es más simple de implementar. Las ecuaciones de la figura 14 muestran esta simplicidad.

Figura 14

La matriz de covarianza expresa la relación existente entre cada componente color de cada pixel con sus otros componentes color y la relación con los otros componentes de los otros pixeles que constituyen la imagen. Esta relación, está expresada por medio de la varianza y la covarianza. Después resolvemos la ecuación con la matriz de covarianza para determinar sus valores y vectores característicos, los cuales utilizaremos para hacer un cambio de coordenadas o desde otro punto de vista, reubicar a cada pixel respecto al nuevo sistema que permite una mejor visualización de los pixeles.

La primer contribución de este trabajo es la implementación de esta segmentación semi-automática Como es de intuir, debido a su transformación lineal, esta técnica tiene la cualidad de manipular la información sin distorsionarla. El algoritmo de segmentación es el siguiente:

Tenemos una imagen que posee pixeles, estos pixeles representan un elemento en el espacio de representación color y todos los pixeles constituyen una nube tridimensional. Al aplicar el Análisis en Componentes Principales (ACP) visualizaremos la nube reubicada precisamente donde ésta tiene sus dimensiones más grandes, lo que implica que la distancia entre elementos es máxima sobre ese nuevo sistema de ejes coordenados. Gracias al ACP podemos, en caso de que sea factible, diferenciar la posición de elementos contiguos y dividir el espacio de representación color (ERC) de la imagen colposcopica, de una manera bastante simple utilizando una de las 5 técnicas propuestas [6] y que explicaré más adelante. Posteriormente, se asigna un mismo índice color a los elemento de cada clase, por ejemplo el color promedio, y regresamos al espacio imagen con una segmentación por regiones (figura 15).

Figura 15

Algoritmo de segmentación utilizando el ACP y clasificación.

 

Las técnicas de división espacial (clasificación) propuestas son las siguientes:

Talla (figura 16): Tomamos sobre cada nuevo eje coordenado los valores externos y dividimos este rango max–min entre el número de particiones deseadas, de tal forma que ese será el valor de los incrementos para cada paralelepípedo sobre cada dimensión, así construiremos paralelepípedos de igual tamaño aunque estos no posean la misma cantidad de elementos (pixeles). Hay que aclarar que el número de particiones deseadas es el parámetro a fijar por el usuario y hace de la segmentación por ACP, una segmentación semi-automática.

Figura 16

Clasificación por talla

Orden (figura 17): En este caso tomamos en cuenta la totalidad de elementos existentes en toda nuestra nube y formamos grupos de tal forma que tengamos la misma cantidad de elementos en cada paralelepípedo (clase) aunque estos no posean las mismas dimensiones.

Figura 17

Clasificación por orden

Centro Móvil (figura 18): Consiste en tomar tantos elementos al azar como clases se desean construir, inicialmente cada elemento escogido va a construir su clase en función de una distancia euclidiana. El siguiente paso es encontrar el elemento más céntrico de cada clase quien va a reconstruir su clase de nuevo considerando a sus vecinos más próximos. Este paso va a repetirse siguiendo uno de dos criterios de parada, una convergencia o un número finito de iteraciones. La convergencia se encuentra cuando los elementos más céntricos de cada clase no cambian de una a otra iteración, el inconveniente es que en este caso no se sabe cuantas iteraciones serán necesarias para cumplir con el criterio. Por lo tanto decidimos fijar un número de iteraciones basados en estadísticas. Este último parámetro ha sido fijado a 16 iteraciones.


Figura 18

Tamaño-Centro Móvil u Orden-Centro Móvil: Estas dos últimas técnicas toman el elemento central de cada clase, creado por cualquiera de las dos primeras técnicas, y con ese elemento central arrancan las iteraciones de la técnica centro móvil.

 

Al ir implementando estos algoritmos nos percatamos que la segmentación propuesta con la ayuda del ACP, podía dar diferentes resultados dependiendo del espacio de representación color utilizado. Por lo tanto tenemos que determinar cual de los veinte espacios de representación color se adecua mejor a la técnica de segmentación propuesta.

Tambien tenemos que determinar cual de los cinco métodos de clasificación propuestos es el mejor.

Por último, tenemos que evaluar a los vectores característicos obtenidos del ACP como nuevos parámetros de análisis.

Respecto a la elección del mejor método de clasificación, se siguió un estudio heurístico, aplicando los 5 métodos tanto a imágenes sintéticas como reales, se sacaron estadísticas sobre el éxito de encontrar las regiones de interés y se determinó que el mejor método de clasificación corresponde a la combinación Talla-centro móvil.

Someramente voy a mostrar cuáles fueron las etapas que seguimos para determinar el mejor espacio de representación color y cuáles fueron nuestros criterios y resultados. Después expondré la posibilidad de utilizar "nuevos parámetros" para el análisis clínico, que podrían ayudar en el diagnóstico.

Aplicamos nuestro algoritmo de segmentación semi-automático en los 20 ERC, con las 5 variantes de clasificación espacial sobre un grupo de 12 imágenes de la patología Transformación Atípica de Grado I (TAG I). Comparamos nuestros resultados con la delimitación manual de las regiones de interés hecha por el ginecólogo-colposcopista.

Estudio sobre la elección del mejor espacio de representación color.

Cualitativamente agrupamos los ERC que dieron resultados semejantes formando 6 grupos diferentes y escogimos el mejor ERC de cada grupo tomando en cuenta la detección de la región de interés, la detección de otras características importantes de la imagen y el tiempo de cálculo. Así retuvimos 7 ERC, uno más que la cantidad de grupos construidos debido a que en el tercer grupo quisimos conservar el segundo mejor ERC debido a que el primero consumía mucho tiempo de cálculo.

Después, entre estos espacios retenidos hicimos una clasificación otorgando del primero al séptimo lugar a cada ERC sobre cada uno de los elementos del primer grupo de imágenes. Esta clasificación fue hecha de manera cualitativa, visualmente. Intentamos realizar una cuantificación mediante la utilización de los momentos estadísticos de orden 3 y 4 aplicada a cada componente color y haciendo uso de nuevo del análisis en componentes principales para poder formar grupos de ERC semejantes, pero demostramos [6] que esto era imposible debido a las no linealidades de las transformaciones quienes causan compresiones, estiramientos y doblamientos de los espacios. Esto último fue determinado mediante la utilización de una imagen sintética, una paleta de colores bidimensional. Cabe hacer notar que para los ERC que sufrieron la transformación de tipo lineal, sí se reagruparon como era de esperarse.

Con nuestra clasificación cualitativa, promediamos la clasificación y obtuvimos como mejor ERC el espacio Lab, seguida del espacio rgb normalizado quien pertenecía originalmente al mismo grupo de "espacios semejantes" que Lab pero el espacio rgb normalizado reduce enormemente el tiempo de cálculo. Por último quisimos retener un tercer ERC el tercer lugar corresponde al espacio XYZ quien posee la cualidad de obtenerse a partir de una transformación lineal, a diferencia de los dos primeros.

 

 

Las principales características del espacio de representación color retenidos son:

Espacio Lab:

Obtenido a partir de los componentes RGB mediante una transformación no lineal, su representación espacial es en coordenadas rectangulares basado en el diagrama cromático, posee la cualidad de reversibilidad, pero su cálculo en cualquier sentido es tardado más que complicado. Este ERC presenta también la peculiaridad de reducir la excentricidad de las elipses de MacAdams en sus tres dimensiones [1]. Aunque su representación es cartesiana, este espacio tiene un aspecto cilíndrico donde cada sector angular presenta uniformidad de variación respecto a la visión humana.

Espacio rgb normalizado:

Corresponde a una transformación no lineal a partir de los componentes RGB, su representación se hace en coordenadas rectangulares y su cálculo es sencillo. Este espacio inicialmente llamado diagrama cromático corresponde al triángulo equilátero unitario conocido también como triángulo de Maxwell. (Actualmente el diagrama cromático corresponde a un triángulo rectángulo donde r y g son perpendiculares).

Espacio XYZ:

  Se obtiene de los componentes RGB mediante una transformación lineal y se presenta en coordenadas rectangulares fácilmente implementable, rápida y reversible.

  Las ecuaciones de transformación son las siguientes:

XYZ [9]:

  Esta ecuación se calculó considerando el color blanco de referencia que en nuestro caso se normalizó y utilizó sobre un monitor color con formato NTSC.

 

rgb normalizado [9]:

  Lab [11]:

  Es conocido también como el ERC de las raíces cúbicas o como CIELAB.

  Este ERC necesita de una transformación intermediaria de RGB hacia XYZ considerando el color blanco de referencia y si fue o no normalizado (Yn). Después se aplica el siguiente algoritmo:

Si (Y/Yn > 0.00886) entonces

L = 116(Y/Yn)1/3 - 16

si no L = 903.3(Y/Yn)

fin

y la diferencia de dos colores dados en las coordenadas Lab es calculado por la ecuación siguiente:

 

  Discusión

  La utilización del ERC Lab da el mejor resultado para nuestro algoritmo de segmentación aplicado sobre las imágenes colposcópicas color. Su implementación no es complicada pero para sacar provecho de este ERC hay que trabajar en una computadora rápida debido al elevado tiempo de cálculo, al querer hacer una aproximación del posible resultado reduciendo considerablemente el tiempo de cálculo aconsejamos utilizar el espacio rgb normalizado. La característica de linealidad del espacio XYZ nos aporta dos ventajas respecto a los otros espacios:

  De un lado, al haber obtenido una muy pequeña varianza sobre los vectores característicos obtenidos de la matriz de covarianza (que representa a la imagen en nuestro algoritmo de segmentación [5]) de todas las imágenes estudiadas, esto nos permite proponer un ERC propio a las imágenes colposcópicas.

  De esta forma podemos aplicar nuestros algoritmos de clasificación ahorrándonos el cálculo de la matriz de covarianza, y la estimación de los valores y vectores característicos, reduciendo así el tiempo de cálculo.

  Por otro lado la utilización de esos mismos vectores característicos correspondientes a nuestro algoritmo de segmentación junto con este ERC podrían ayudar en la identificación de una patología determinada, dado que constituyen un tipo de firma con una varianza mínima (figura 19).

Figura 19

Firma del espacio XYZ

  Propuesta de proyectos

  Del trabajo presentado aún quedan varias cosas por refinar y otras que podríamos añadir:

  Las estadísticas efectuadas sobre la elección del mejor espacio color deben ser presentadas con intervalos de confianza, verificar qué tan próximos estuvieron las ROI obtenidas por segmentación de aquellas ROI demarcadas por el ginecólogo. Aumentar el número de imágenes procesadas y ver qué efectos tendría el mismo análisis sobre diferente tipo de patología.

  Analizar los nuevos parámetros (valores y vectores característicos) para determinar si estos presentan una respuesta única que pueda reconocer una patología. Es decir, existe la posibilidad de tener diferentes matrices de covarianza, correspondientes a diferentes imágenes, y obtener valores y vectores característicos muy semejantes?. De esa misma duda surge otra, cómo mostrar la sensibilidad de estos nuevos parámetros en sus tres diferentes etapas de estudio para la misma paciente, o en subpatologías.

  Los resultados presentados en mi trabajo de tesis doctoral, muestran que los vectores característicos no son lo suficientemente sensibles para diferenciar entre subpatologias, a excepción de la aplicación del algoritmo de segmentación utilizando el espacio de representación color Lab, cuyo segundo vector característico sí mostró diferencias entre las etapas y subpatologías (figura 20). Por qué es sensible este segundo vector característico?.

Figura 20 Firma del ERC Lab

  Firma de la Transformación Atípica de Grado 1, utilizando el espacio de representación color Lab.

  Si estos nuevos parámetros fueran realmente sensibles y reconocieran una patología dada, podríamos implementar un sistema de diagnóstico.    Procesaríamos una imagen colposcopica cualquiera, obtendríamos una firma a partir de sus vectores característicos y al compararlo contra una base de datos de firmas, podríamos identificar la patología.

  Sería interesante poder obtener relaciones cuantificables entre los espacios de representación color que siguen transformaciones no lineales.

  Al observar de nuevo las tablas colposcopicas, notamos que la textura es de suma importancia en la descripción de la patología, por lo tanto sería recomendable combinar características de textura con las del color para mejorar la segmentación y la identificación de patrones propios de cada patología.

  Otras técnicas de segmentación reportadas en la literatura, muestran que la utilización de la lógica difusa aporta muy buenos resultados [2], sería interesante ver cómo se comportan estos algoritmos con las imágenes colposcopicas.

  La superposición de imágenes, mediante técnicas de empalmamiento, auxiliaría en el análisis subsecuente a la detección de las regiones de interés o imágenes elementales.

  La superposición temporal, sería aquella superposición de imágenes de la misma etapa de estudio, de la misma paciente, tomadas en diferentes ocasiones. Este análisis mostraría la evolución de la enfermedad y con eso, saber si el tratamiento ha sido adecuado o no.

  La superposición espacial, la definiríamos como la superposición de las tres diferentes imágenes correspondientes a las etapas del estudio colposcopico. El análisis mostraría como se comporta cada imagen elemental en función del estudio. Muy probablemente teniendo esta información podríamos mejorar el reconocimiento de la patología.

  Pero antes de hacer cualquiera de estos procesamientos y análisis, sugiero mejorar la técnica de adquisición de las imágenes colposcopicas y/o dar un preprocesamiento más profundo a la imagen, de tal forma que se eliminen al máximo los artefactos como el reflejo del flash.

  Otro punto de suma importancia a mejorar es la creación de clases de forma automática, mejor dicho, determinar de forma automática el número de clases necesarias para la clasificación.

 

Referencias.

[1] D. Calle, A. Montanvert et S. Ubeda, "Pyramides d’images couleur", Laboratoire d’informatique du Parallélisme, Ecole Normale Supérieure de Lyon, Research Report N° 95-35, Novembre 1995.

[2] T. Carron, "Segmentation d'images couleur dans la base Teinte-Luminance-Saturation: approche numérique et symbolique", Thèse de Doctorat de l'Université de Savoie, Spécialité: Electronique-Electrotechnique-Automatique, Décembre 1995.

[3] F. Coupez, "Initiation à la Colposcopie", Ed. MASSON, Paris, 1990.

[4] R.C. Gonzalez and R.E Woods., "Digital Image Processing", Addison-Wesley publishing company, 1993.

[5] A. Guzmán De León, J.F. Lerallut and J.Ch Boulanger, "Segmentation of colposcopic color images", 10th Nordic-Baltic Conference on Biomedical Engineering, Tampere, Finlande, pp 253-254, June 9-13, 1996.

[6] A. Guzmán De León, "Etude d’espaces couleur pour la segmentation et l’aide à l’analyse", Thèse Doctorale, Université de Technologie de Compiègne, France, Juillet 1997.

[7] Nikhil R. Pal and Sankar K. Pal, "A Review on Image Segmentation Techniques", Pattern Recognition. Vol. 26, N°9, pp1277-1294, 1993.

[8] W. K. Pratt, "Digital Image Processing", John Wiley & Sons, New York, 1978.

[9] D.F. Rogers, "Procedural Elements for Computer Graphics", McGraw-Hill International Editions, 3rd printing, 1988.

[10] World Health Organization, "Cytological Screeninig in Control of Cervical Cancer", Technical Guidelines 198000, Geneva, 1995.

[11] G. Wyszecki et W.S. Stiles, "COLOR SCIENCE: Concepts and Methods, Quantitative Data and Formulae", John Wiley and Sons, New York, 1982.