Aplicación de detectores multicanal Gabor para encontrar correspondencias entre imágenes de...

CENTRO DE INVESTIGACIÓN CIENTÍFICA Y DE EDUCACIÓNSUPERIOR DE ENSENADA

DIVISIÓN DE FÍSICA APLICADA

DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN

APLICACIÓN DE DETECTORES MULTICANAL GABOR PARAENCONTRAR CORRESPONDENCIAS ENTRE IMÁGENES DE

TEXTURAS DE SEDIMENTOS LAMINADOS

que para cubrir parcialmente los requisitos necesarios para obtener el gradode MAESTRO EN CIENCIAS en CIENCIAS DE LA COMPUTACIÓN

presenta:

JOSÉ ADRIÁN MUNGUÍA RIVERA

Ensenada, Baja California, México. Diciembre 2003

TESIS DEFENDIDA POR

José Adrián Munguía Rivera

Y APROBADA POR EL SIGUIENTE COMITÉ

Dr. Hugo H. Hidalgo Silva

Director del Comité

________________________

M.C. Jorge Torres Rodríguez

Miembro del Comité

__________________________

M.C. Vicente Ferreira Bartrina

Miembro del Comité

_________________________

Dr. Jesús Favela Vara

Jefe del Departamento de

Ciencias de la Computación

___________________________

Dr. Luis Alberto Delgado Argote

Director de Estudios de Posgrado

11 de diciembre del 2003

RESUMEN de la Tesis de José Adrián Munguía Rivera presentada como requisito parcialpara la obtención del grado deMAESTRO EN CIENCIAS enCIENCIAS DE LA COM-PUTACIÓN . Ensenada, Baja California, México. Diciembre 2003.

APLICACIÓN DE DETECTORES MULTICANAL GABOR PARA ENCONTRARCORRESPONDENCIAS ENTRE IMÁGENES DE TEXTURAS DE SEDIMENTOS

LAMINADOS

Resumen aprobado por: ________________________

Director de Tesis

En este trabajo presentamos un método y su implementación para encontrar la correspon-dencia entre imagenes de texturas en general así como en el caso particular de imágenesde sedimentos laminados. El método propuesto se basa en un detector multicanal Gabor, latransformada de Karhunen-Loève, y la representación de lascaracterísticas de las texturascomo cúmulos de puntos en un espacio multivariado. La representación de las característicasde las texturas como cúmulos de puntos da pie a poder medir cuan discímiles son por mediodel cálculo de la distancia de Penrose. El sistema fue implementado totalmente en Java y seencuentra disponible en: http://www.AnalisisDeTexturas.net.

Palabras claves: Gabor, textura, sedimentos laminados.

ABSTRACT of the Thesis submitted by José Adrián Munguía Rivera as a partial fulfill-ment of the requirements to obtain theMASTER OF SCIENCE degree inCOMPUTERSCIENCE. Ensenada, Baja California, México. December 2003.

MULTICHANNEL GABOR DETECTORS FOR LAMINATED SEDIMENTTEXTURE IMAGE MATCHING

Abstract approved by: ________________________

Thesis Advisor

In this work we present a method and its implementation to solve the general problem oftexture matching as well as for the particular case of imagesof laminated sediments. Themethod we present is based on multichannel Gabor detectors,the Karhunen-Loève trans-form, and the presentation of our texture features as clusters of points in a multi-dimensionalspace. The representation of texture features as clusters of points allows the possibility tomeasure the amount of similarity between them by means of thePenrose distance measure.The software was implemented in Java and is available at: http://www.TextureAnalysis.net.

Keywords: Gabor, texture, laminated sediments.

DEDICATORIA

AGRADECIMIENTOS

Contenido

1. Introducción 11.1. Definición de textura . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 21.2. Aplicaciones del análisis de texturas . . . . . . . . . . . . . .. . . . . . . . 3

1.2.1. Imágenes médicas . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2.1.1. Detección de cáncer mamario . . . . . . . . . . . . . . . . 41.2.1.2. Detección de padecimientos pulmonares . . . . . . . . .. 6

1.2.1.3. Detección de melanomas . . . . . . . . . . . . . . . . . . 61.2.2. Percepción remota . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.2.3. Procesamiento de documentos . . . . . . . . . . . . . . . . . . . .. 71.2.4. Sedimentos laminados . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.2.4.1. Construcción de series de tiempo . . . . . . . . . . . . . . 12

1.3. Finalidad del trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . 17

2. Características de texturas 192.1. Tipos de características . . . . . . . . . . . . . . . . . . . . . . . . .. . . . 20

2.1.1. Métodos estadísticos . . . . . . . . . . . . . . . . . . . . . . . . . .212.1.1.1. Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . 212.1.1.2. Matrices de co-ocurrencia . . . . . . . . . . . . . . . . . . 22

2.1.2. Métodos geométricos . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.1.2.1. Telaraña de Voronoi . . . . . . . . . . . . . . . . . . . . . 252.1.2.2. Métodos estructurales . . . . . . . . . . . . . . . . . . . . 26

2.1.3. Métodos basados en modelos . . . . . . . . . . . . . . . . . . . . . .282.1.3.1. Modelo autorregresivo . . . . . . . . . . . . . . . . . . . . 29

2.1.3.2. Campos aleatorios Markovianos . . . . . . . . . . . . . . 29

2.1.4. Métodos basados en procesamiento de señales . . . . . . .. . . . . 32

2.1.4.1. Métodos espectrales . . . . . . . . . . . . . . . . . . . . . 32

2.1.4.2. Transformada de coseno discreto . . . . . . . . . . . . . . 322.1.5. Filtros Gabor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.1.5.1. Base biológica . . . . . . . . . . . . . . . . . . . . . . . . 34

2.1.5.2. Descripción matemática . . . . . . . . . . . . . . . . . . . 35

2.1.5.3. Definición de filtros Gabor . . . . . . . . . . . . . . . . . 362.1.5.4. Principio de incertidumbre de Heisenberg . . . . . . .. . 37

2.1.5.5. Función Gabor compleja . . . . . . . . . . . . . . . . . . 39

2.1.5.5.1. Función Gabor compleja unidimensional . . . . . 39

2.1.5.5.2. Función Gabor compleja n-dimensional . . . . . 41

2.1.5.5.3. Función Gabor compleja bidimensional . . . . . 42

2.1.5.5.4. Función Gabor real . . . . . . . . . . . . . . . . 43

3. Detectores multicanal 453.1. Función Gabor real en múltiples escalas y múltiples direcciones . . . . . . . 46

3.1.1. Esquemas anteriores . . . . . . . . . . . . . . . . . . . . . . . . . . 48

3.1.1.1. Esquema de Randen y Husoy . . . . . . . . . . . . . . . . 48

3.1.1.1.1. Etapa de Filtrado . . . . . . . . . . . . . . . . . 49

3.1.1.1.2. Etapa de función de energía local . . . . . . . . . 49

3.1.1.1.3. Operadores no lineales . . . . . . . . . . . . . . 50

3.1.1.1.4. Filtro suavizante . . . . . . . . . . . . . . . . . . 523.1.1.1.5. No linealidad normalizante . . . . . . . . . . . . 53

3.1.1.2. Esquema de Weldon y Higgins . . . . . . . . . . . . . . . 53

3.1.2. Configuración de filtros . . . . . . . . . . . . . . . . . . . . . . . . 54

3.1.3. Análisis de componentes principales . . . . . . . . . . . . .. . . . . 57

3.1.4. Medición de distancias multivariadas . . . . . . . . . . . .. . . . . 583.1.4.1. Distancias entre observaciones individuales . . .. . . . . 59

3.1.4.1.1. Distancia Euclidiana . . . . . . . . . . . . . . . 593.1.4.2. Distancias entre poblaciones y muestras . . . . . . . .. . 60

3.1.4.2.1. Distancia de Penrose . . . . . . . . . . . . . . . 603.1.4.2.2. Distancia de Mahalanobis . . . . . . . . . . . . 60

3.2. Esquema propuesto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .62

3.2.1. Filtrado Gabor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 643.2.2. No linealidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653.2.3. Función suavizante . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

3.2.4. Transformada de Karhunen Loève . . . . . . . . . . . . . . . . . .. 663.2.4.1. Vector de observaciones . . . . . . . . . . . . . . . . . . . 663.2.4.2. Matriz de observaciones . . . . . . . . . . . . . . . . . . . 67

3.2.5. Cálculo de correspondencias entre características. . . . . . . . . . . 68

3.3. Identificación de estructuras sedimentarias contiguas . . . . . . . . . . . . . 70

4. Experimentación 75

4.1. Configuración del sistema para pruebas . . . . . . . . . . . . . .. . . . . . 76

4.2. Aplicación del método a imágenes compuestas de dos texturas . . . . . . . . 77

4.2.1. Experimento 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

4.2.2. Experimento 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

4.2.3. Experimento 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

4.2.4. Experimento 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

4.3. Experimentos con imágenes Brodatz . . . . . . . . . . . . . . . . .. . . . . 85

4.3.1. Experimento 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

4.3.2. Experimento 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

4.3.3. Experimento 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

4.4. Experimentos con imágenes de sedimentos laminados . . .. . . . . . . . . . 95

4.4.1. Experimento 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

4.4.2. Experimento 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

4.4.3. Experimento 10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

5. Conclusiones y contribuciones 105

Bibliografía 106

Índice de figuras

1. Ejemplos de imágenes de superficies con textura. (a) Imagen de una huelladactilar, (b) textura D4 Brodatz, (c) textura D3 Brodatz, (d) imagen del ojohumano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2. (a) Mamograma que muestra una masa sólida irregular con calcificaciones,(b) un quiste dividido por un septum y (c) tejido mamario altamente texturizado. 5

3. (a) Imagen del glaciar Malaspina en Alaska, (b) estante dehielo de AlfredErnest en la isla de Ellesmere en Canada y (d) un remolino grande en elocéano en el estrecho de Shelikof en Alaska. . . . . . . . . . . . . . .. . . . 7

4. Cuenca de Santa Barbara en la actualidad. . . . . . . . . . . . . . .. . . . . 115. Vecindad alrededor de algún punto que se desea anclar. La comparación se

realiza visualmente, o en su defecto, calculando la correlación lineal entrelos valores que se extraen de una columna de cada una de las imágenes. Unacolumna de las cuales se puede extraer valores para compararlos con los deotra imagen se muestra como una franja clara vertical en la imagen. . . . . . 15

6. Secuencia de valores correspondientes a una franja vertical de dos imágenesdistintas de sedimentos laminados. . . . . . . . . . . . . . . . . . . . .. . . 16

7. Imágenes de sedimentos laminados. Texturas formada por sedimentos lami-nados. Nótese que aunque se trata de imágenes de sedimentos distintos, ex-hiben texturas muy semejantes. . . . . . . . . . . . . . . . . . . . . . . . .. 18

8. Una primitiva de textura cuyo símbolo esa (a). Otra primitiva de textura, susímbolo esS (b). Patrón que resulta de realizar la derivaciónS ! aS (c).Patrón que resulta de realizar la derivaciónS ! aS ! aaS . . . . . . . . . . 27

9. Textura generada por el patrónaaab baa . . . . . . . . . . . . . . . . . . . 28

10. Vecindades de un MRF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3011. función Gabor unidimensional en el dominio espacial conparámetrosw =

0;9 y � = 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

12. Función Gabor unidimensional en el dominio de frecuencias con parámetrosw = 15 y � = 0;06. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

13. Función Gabor real bidimensional en el dominio espacial. . . . . . . . . . . . 44

14. Representación en el dominio de frecuencias de 16 filtrosGabor en escalalog-polar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

15. Mapas de intensidad de funciones Gabor en el dominio espacial sintonizadasa cuatro orientaciones (0Æ, 45Æ, 90Æ, 135Æ) y a cuatro frecuencias (0.015, 0.03,0.06, 0.12). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

16. Esquema multicanal propuesto por Randen y Husøy. . . . . . .. . . . . . . 49

17. Función sigmoidetanh(�x) con distintos valores de saturación. (a)� = 1

(b) � = 0;25 (c) � = 0;1 (d) � = 0;05 . . . . . . . . . . . . . . . . . . . . . 51

18. Aplicación de filtros Gaussianos para la eliminación de altas frecuencias, (a)imagen original, (b) parámetro� = 2, (c) con parámetro� = 4, (d)� = 8. . . 53

19. Esquema para clasificar/segmentar imágenes de texturaspropuesto por Wel-don y Higgins . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

20. Esta figura muestra una imagen que consta de dos texturas compuesta por dos¨texeles¨ distintos,t

a la izquierda yt2

a la derecha y algunos parámetros quedeben ser determinados para configurar al filtro Gabor que lasdiscrimine. . . 55

21. Esquema propuesto para la extracción de características de cada una de lastexturas a procesar por el sistema. . . . . . . . . . . . . . . . . . . . . .. . 63

22. Obtención del vector de observacionesX

a partir de lasd imágenes desalida del detector multicanal . . . . . . . . . . . . . . . . . . . . . . . .. . 67

23. Esquema general del sistema para encontrar correspondencias entre texturas . 70

24. Tipos de contiguidad que existe entre imágenes de texturas de sedimentoslaminados.(a) muestra dos imagenes de sedimentos laminados distinos. (b)muestra dos imágenes de sedimentos laminados que corresponden a la mismatextura pero no empatan sus extremos. En (c) las imagenes corresponden (ocasi corresponden) a la misma textura y empatan sus extremos. . . . . . . . 72

25. aplicación de un canal del banco de filtros Gabor. No existe discontinuidadentre texturas, por lo que las dos estructuras sedimentarias son contiguas. . . 74

26. aplicación de un canal del banco de filtros Gabor a dos estructuras sedimenta-rias identicas desfazadas. Existe una discontinuidad (salto) en la imagen queresulta de aplicar el filtro Gabor y el suavizado. . . . . . . . . . .. . . . . . 74

27. Imagen de prueba construida por dos texturas. . . . . . . . . .. . . . . . . . 78

28. Imagen resultado de aplicar un canal del método propuesto para discernirentre dos texturas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

29. Gráfica de los valores de los pixeles de la imagen original(a). Valores de lospixeles de la imagen filtrada por un filtro Gabor sintonizado (b). Valores delos pixeles de la imagen después de aplicar a (b) el operador(�)

2(c). Resultadode aplicarle a (c) un filtro suavizante Gaussiano (d). . . . . . .. . . . . . . . 79

30. Imagen de prueba construida por dos imágenes de texturasBrodatz: D6 en elfondo y D17 en el centro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

31. Imagen resultado de aplicar un canal del método propuesto para ldiscernirentre dos texturas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

32. Gráfica de los valores de los pixeles de la imagen original(a). Valores de lospixeles de la imagen filtrada por un filtro Gabor sintonizado (b). Valores delos pixeles de la imagen despues de aplicar a (b) el operador(�)

33. Imagen de prueba construida por dos imágenes de texturasBrodatz: D5 a laizquierda y D92 a la derecha . . . . . . . . . . . . . . . . . . . . . . . . . . 82

35. Gráfica de los valores de los pixeles de la imagen original(a). Valores delos pixeles de la imagen filtrada por un filtro Gabor sintonizado (b). Valoresde los pixeles de la imagen después de aplicarle a (b) el operador (�)2(c).Resultado de aplicarle a (c) un filtro suavizante Gaussiano (d). . . . . . . . . 83

36. Imagen de prueba compuesta por dos texturas de sedimentos laminados. . . . 84

38. Gráfica de los valores de los pixeles de la imagen original(a). Valores de lospixeles de la imagen filtrada por un filtro Gabor sintonizado (b). Valores delos pixeles de la imagen después de aplicar a (b) el operador(�)

39. Imágenes de texturas Brodatz utilizadas en las evaluaciones del sistema. . . . 86

40. Imágenes perturbadas de prueba Brodatz. A la imagen D94 se le añadió rui-do Gaussiano con� = 10 (D94r1), � = 20 (D94r2) y � = 30 (D94r3),respectivamente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

41. Correspondencias para la textura D1 calculadas por medio de las distancias:(a) Mahalanobis sin TKL y (b) Mahalanobis con TKL. . . . . . . . . .. . . 88

42. Correspondencias para la textura D1 calculadas por medio de las distancias:(a) Euclidiana sin TKL y (b) Euclidiana con TKL. . . . . . . . . . . .. . . . 89

43. Correspondencias para la textura D1 calculadas por medio de las distancias:(a) Penrose sin TKL y (b) Penrose con TKL. . . . . . . . . . . . . . . . . .. 90

44. Correspondencia calculada (a) para la imagen D2 y la imagen (b) D35. . . . . 92

45. (a) Correspondencia entre la imagen D5 y varias texturasBrodatz. (b) Corre-spondencia entre D94 y texturas D94 de Brodatz con varios niveles de ruidoGaussiano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

46. Imágenes de prueba de sedimentos laminados . . . . . . . . . . .. . . . . . 96

47. Imágenes perturbadas de prueba de sedimentos laminados. A la imagen S14se le añadió ruido Gaussiano con� = 10 (S14r1),� = 20 (S14r2b) y� = 30

(S14r3), respectivamente. . . . . . . . . . . . . . . . . . . . . . . . . . . .. 97

48. (a)Correspondencia calculada entre la textura S5pert yotras texturas de sed-imentos laminados. (b) Correspondencia calculada entre laimagen de sedi-mentos laminados S14 y S14 con varios niveles de ruido. . . . . .. . . . . . 98

49. (a)Correspondencia calculada entre la textura S1 y otras texturas de sedimen-tos laminados. (b) Correspondencia calculada entre la imagen S16 y otrossedimentos laminados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

50. Imágenes distintas de sedimentos laminados pertenecietes a un mismo sitio.La imagen (a) servirá para anclar dos puntos de la imagen (b).. . . . . . . . 102

51. Imágenes seccionadas en 7 renglones y 5 columnas, respectivamente. Estasimágenes sirven como base para realizar búsquedas de correspondencias en-tre las secuencias sedimentarias. . . . . . . . . . . . . . . . . . . . . .. . . 103

52. Correspondencias calculadas entre las texturas contenidas en el tercer renglónde la imagen de la figura 51 (a) y aquellas contenidas en la imagen de la figura51 (b). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

53. Correspondencias calculadas entre las texturas contenidas en el quinto renglónde la imagen de la figura 51 (a) y aquellas contenidas en la imagen de la figura51 (b). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

Lista de tablas

I. Descriptores de características a partir de una matriz de co-ocurrencia . . . . 24

II . Características de texturas a partir de telarañas de Voronoi . . . . . . . . . . 27

III . Criterios para elegir los parámetros de un filtro Gabor paradiscriminar dostexturas en una misma imagen. . . . . . . . . . . . . . . . . . . . . . . . . . 56

IV . Formato de una matriz de observaciones . . . . . . . . . . . . . . . . .. . . 67

V. Configuración básica del detector multicanal propuesto para discriminar tex-turas Brodatz y de sedimentos laminados . . . . . . . . . . . . . . . . .. . 77

Capítulo 1

Introducción

La visión por computadora surge como una rama de las cienciascomputacionales y la inge-

niería electrónica en los años 1960s. Desde entonces, existen dos motivaciones principales

para los investigadores en esta área: el desarrollo de algoritmos para resolver problemas de

visión por computadora y entender cómo modelar el sistema devisión humana (Bowyer y

Phillips, 1998).

El propósito de un sistema de visión por computadora es el extraer información acerca del

ambiente a partir de una imagen o de una secuencia de imágenes. La información obtenida

del sistema de visión debe ser útil para la ejecución de alguna tarea o de algún conjunto de

tareas en particular. La mejor medida del éxito o fracaso de un sistema de visión es la utilidad

de la información que provee (Chaney, 1993).

La mayor parte de las superficies de objetos naturales exhiben una cualidad muy importante

que puede ser causada por su rugosidad u orientación de filamentos que la componen. Mien-

tras que estas cualidades pueden ser percibidas por el tacto, también existen los casos en que

estas cualidades las generan diferencias de reflexión debido a sus colores. A esta cualidad

le llamamos textura. Uno de los problemas con el cual tienen que tratar muchos sistemas de

visión es la textura del mundo que nos rodea.

1.1. Definición de textura

La gran complejidad del estudio de este tema comienza por su definición. Existen muchas

definiciones para este término, cada quien la define dependiendo del contexto en que se tra-

baje. En el idioma español (Real Academia Española, 2001), textura es la disposición de las

partes de un cuerpo. Coggins (Coggins, 1982) ha recopilado una gran cantidad de definiciones

de literatura de visión por computadora. Algunos ejemplos son:

“Podemos considerar a la textura como aquello que constituye una región macroscópi-

ca. Su estructura es simplemente atribuida a los patrones repetitivos en los cuales ele-

mentos o primitivas se encuentran ordenadas de acuerdo a unaregla de acomodo.”

“Una región dentro de una imagen posee textura constante si un conjunto de estadísticas

locales u otras propiedades locales de la imagen son constantes, varían lentamente, o

son aproximadamente periódicas.”

Por otra parte, Dunn y colaboradores (Dunnet al., 1994) consideran que la mayor parte de

las texturas pueden ser descritas por un conjunto de objetosprimitivos similares, pero no

necesariamente idénticos, ordenados de forma repetitiva.A cada uno de estos elementos lo

llamantexel.

Algunos ejemplos de texturas se observan en la figura 1.

(a) (b)

(c) (d)

Figura 1: Ejemplos de imágenes de superficies con textura. (a) Imagen de una huella dactilar,(b) textura D4 Brodatz, (c) textura D3 Brodatz, (d) imagen del ojo humano.

1.2. Aplicaciones del análisis de texturas

La clasificación y segmentación de texturas a partir de imágenes digitales ha recibido gran

atención en las últimas décadas (Randen y Husøy, 1999). Estaatención, primordialmente es

debida a la gran cantidad de aplicaciones que se le daría a un sistema que satisfactoriamente

clasificara o segmentara texturas. La discriminación de texturas es la parte básica para muchas

aplicaciones en problemas de visión por computadora (Azencott et al., 1997), por lo que

la parte esencial del análisis de texturas (clasificación, segmentación, etc.) se encuentra en

diseñar un método que logre detectar diferencias entre una textura y otra.

Métodos para el análisis de texturas han sido utilizados en varios dominios de aplicación.

Existen algunas áreas, como en la percepción remota, en que este análisis ya se ha utiliza-

do, mientras en otras áreas, como en la inspección de superficies, nuevas aplicaciones estan

siendo encontradas.

Algunos de los campos de aplicación primordiales del análisis de texturas son en imágenes

médicas, percepción remota, procesamiento de documentos,búsqueda de imágenes basada en

contenido, reconstrucción de formas tridimensionales a partir de imágenes bidimensionales,

análisis de texturas de dimensión arbitraria, síntesis de texturas, esta generalmente utilizada

para la compresión de imágenes (Tamuraet al., 1978), y para el sistema de visión de robots.

1.2.1. Imágenes médicas

Las imágenes en medicina son obtenidas mediante métodos no invasivos como los rayos-

X, fotografías, ultrasonido y tomografías, así como por medio de métodos invasivos como

fotografías microscópicas de biopsias.

En medicina, el análisis de texturas juega un papel importante en el diagnóstico de algunas

enfermedades. Ciertas enfermedades pulmonares, condiciones cardiacas, abscesos, cánceres,

y otras condiciones pueden ser detectadas y clasificadas pormedio del estudio de texturas

presentes en imágenes médicas (Sutton y Hall, 1972).

1.2.1.1. Detección de cáncer mamario

El cáncer mamario es la segunda causa de muerte en las mujeresdespués del cáncer pul-

monar en Estados Unidos de América. Se estima que en el año 2003 la cantidad de mujeres

que desarrollarán este cáncer será de 211,300 y 39,800 morirán por consecuencia, según la

American Cancer Society (Cancer Facts and Figures, 2003). El diagnóstico temprano de este

cáncer es la forma más efectiva para reducir el índice de mortalidad dado.

Es conocido que la formación de cúmulos de microcalcificaciones es una de las primeras

señales de cambios potencialmente cancerosos en el tejido mamario. Existen problemas al

tratar a las imágenes de mamogramas con técnicas tradicionales de segmentación y de de-

tección de bordes (Gulsrud y Husøy, 2000). Esto se debe a que las microcalcificaciones fre-

cuentemente no poseen contornos bien definidos y a su vez pueden encontrarse incrustadas

entre tejido altamente texturizado. Imágenes médicas de las glándulas mamarias se muestran

en la figura 2.Basados en el hecho de que el tejido de las glándulas mamarias es altamente tex-

turizado podemos plantear que estas imágenes deben ser tratadas por métodos para el análisis

de texturas (Gulsrud y Løland, 1996).

(a) (b) (c)

Figura 2: (a) Mamograma que muestra una masa sólida irregular con calcificaciones, (b) unquiste dividido por un septum y (c) tejido mamario altamentetexturizado.

1.2.1.2. Detección de padecimientos pulmonares

La fibrosis pulmonar intersticial causa la cicatrización o engrosamiento de los tejidos pul-

monares profundos sin una causa conocida; de tal forma que sepresentan cambios en la

textura de las imágenes de radiografías (Tuceryan y Jain, 1998).

1.2.1.3. Detección de melanomas

La mayor causa de muertes por cáncer en la piel se debe al melanoma maligno cutáneo,

cuya incidencia se ha incrementado rápidamente en las últimas décadas. Los melanomas

son un tipo de tumores malignos en la piel. Estos son generalmente descritos como lesiones

sobre la piel que poseen cambios de colores. Además, sus bordes tienden a ser irregulares y

asimétricos con indentaciones.

1.2.2. Percepción remota

La percepción remota consiste en la interpretación de mediciones de la energía electromag-

nética que es reflejada o emitida por un punto distante al objetivo. En particular, el estudio

del planeta Tierra por medio de la percepción remota es la interpretación y entendimiento de

mediciones de la energía electromagnética que es reflejada oemitida por la superficie de la

tierra o su atmósfera, y el establecer relaciones entre ellas (Mather, 1999).

(a) (b) (c)

Figura 3: (a) Imagen del glaciar Malaspina en Alaska, (b) estante de hielo de Alfred Ernesten la isla de Ellesmere en Canada y (d) un remolino grande en elocéano en el estrecho deShelikof en Alaska.

El análisis de texturas ha sido extensamente utilizado parala clasificación de imágenes de

percepción remota. La clasificación del uso de suelo, donde regiones heterogéneas, com-

puestas por distintos tipos de terrenos (trigo, cuerpos de agua, regiones urbanas, etc.) deben

ser identificadas, es una aplicación importante (Tuceryan yJain, 1998). Algunos ejemplos de

imágenes utilizadas en la percepción remota se muestran en la figura 3.

1.2.3. Procesamiento de documentos

Al observar a distancia documentos impresos, el ojo percibelas regiones que contienen texto

como poseedora de texturas distintas a las que poseen gráficos. El poder segmentar y distin-

guir las partes de los documentos que contienen texto y las que no lo contienen es de gran

importancia para el reconocimiento óptico de caracteres endocumentos digitalizados, como

periódicos. Jainet al. (1992) trata este problema haciendo uso de técnicas para el análisis de

texturas, de igual manera trata el problema de localizaciónde códigos de barras a partir de

imágenes.

El procesamiento de documentos puede aplicarse para resolver problemas como el reconocer

áreas que contienen códigos postales y domicilios en objetos enviados por medio del sistema

de correo (Tuceryan y Jain, 1998) así como para el análisis e interpretación de mapas.

1.2.4. Sedimentos laminados

Una característica de las rocas sedimentarias es la estratificación. La estratificación es oca-

sionada por varios procesos periódicos y episódicos así como sobreimpresiones a causa de

procesos biológicos y diagenéticos (Schaaf, 1995). La diagénesis es el conjunto de proce-

sos químicos y físicos dentro de sedimentos depositados durante su conversión a roca. Estas

cualidades sedimentarias pueden representar secuencias tanto en escala global como local. Se

considera usualmente una secuencia de láminas como un ciclo, sin embargo, el término ciclo

sedimentario se utiliza sólo como un término práctico para describir sucesiones repetitivas de

ciertos tipos litológicos.

Cualquier secuencia sedimentaria es consecuencia de procesos autogenéticos o de procesos

alogenéticos. Los procesos autogenéticos son aquellos quesuceden dentro de los sedimentos

mismos (o de la cuenca que los contiene), por ejemplo: depósitos de turbidita. Los procesos

alogenéticos suceden fuera de los sedimentos (dentro de la columna de agua o fuera del

agua). Un tipo de proceso alogenético es el cambio de la composición de los sedimentos

como consecuencia de cambios en el clima (Schaaf, 1995).

Los procesos alogenéticos son los más importantes para investigar cambios y patrones ocea-

nográficos y climatológicos del pasado así como la relación que existe entre el clima y la

composición de los sedimentos. Esta relación entre el climay la composición de los sedi-

mentos da la posibilidad a investigadores de establecer conclusiones acerca de la variabilidad

del clima en el pasado a partir de estudios de series de tiempode la composición sedimentaria

de regiones climatológicamente importantes y sensibles.

Los sedimentos laminados obtenidos del fondo de lagos y mares actúan como un expediente

detallado de las condiciones climatológicas y biológicas abarcando hasta miles de años. El

uso de sedimentos laminados nos brinda una herramienta importante para realizar el análisis

de las poblaciones dado que las fluctuaciones de estas varíanen escalas de tiempo extensas

(varias décadas o más) (Baumgartneret al., 1992).

Analizando la composición de sedimentos laminados obtenidos de la cuenca de Santa Bar-

bara, al sur de California, Baumgartneret al. (1992) generó una serie de tiempo de las tasas

de depositación de escamas de la sardina del Pacífico y de la anchoveta norteña. Esto con

fines de estimar las fluctuaciones periódicas de losstocksde sardinas y anchovetas de los

últimos casi 2000 años (desde 300 D.C. hasta 1970). Estudiosde este tipo se han llevado a

cabo en el pasado por Soutar e Isaacs (1969) en los cuales se realizó un análisis de muestras

de sedimentos laminados que abarcan más de 2000 años de historia. Los estudios de Soutar

fueron realizados sobre sedimentos adquiridos por un nucleador de pistón de la cuenca de

Santa Barbara. Posteriormente se consideraron series más cortas que abarcan los 160 años

desde 1810 D.C. hasta 1970 (Soutar e Isaacs, 1974). Estos datos formaron la primera serie

continua de tiempo de peces fósiles y mostró la variabilidadde tamaños de poblaciones sobre

periodos significativamente mayores a un siglo (Baumgartner et al., 1992).

Una conclusión del estudio que realizaron Baumgartneret al. (1992), en el cual se comple-

mentaron los datos de Soutar al utilizar datos de un núcleo depistón adicional, es que tanto

la población de la sardina del Pacífico como la de la anchovetanorteña ha sufrido grandes

fluctuaciones naturales claramente no ocasionadas por la pesca. Se han construido secuencias

de tasas de depositación de escamas a partir de sedimentos del margen de Benguela (costa

Oeste de África) y de Perú, pero la falta de secuencias de sedimentos laminados anualmente

depositados, también llamadas varvas, bien preservadas haobstaculizado la construcción de

series de tiempo que igualen en calidad a aquellas construidas a partir de las muestras de la

cuenca de Santa Barbara. Otra virtud de los sedimentos laminados provenientes de la cuenca

de Santa Barbara es que estos comenzaron a depositarse hace aproximadamente 8000 años y

han aportado secuencias más detalladas para la reconstrucción de la historia paleoecológica

y climatológica que los de otros sitios.

El este del Océano Pacífico es una de las regiones más sensibles a cambios climatológicos del

mundo. Sus aguas se caracterizan por poseer una surgencia costera persistente. La surgencia

costera es un proceso mediante el cual aguas frías, a menudo abundantes en nutrientes, se

elevan hacia la superficie desde la profundidad del océano. Esta surgencia costera ocasiona

una alta bioproductividad en las aguas cercanas a la superficie que a su vez ayuda a mantener

a una rica comunidad de vida marina y terrestre. El hundimiento y el decaimiento de materia

orgánica dentro de la columna de agua causa un agotamiento deoxígeno en aguas interme-

dias (100m a 1000m de profundidad). En el lugar donde las aguas intermedias intersectan la

interfaz sedimento/agua, los sedimentos son depositados bajo condiciones anóxicas, lo cual

permite la conservación de la estructura sedimentaria en forma de varvas anuales. Existen dos

umbrales que conectan a la cuenca de Santa Barbara al Océano Pacífico, uno a 450m de pro-

fundidad y el otro a 250m de profundidad. A profundidades mayores que las de los umbrales,

las aguas de la cuenca se agotan de oxígeno . Una capa densa de bacterias en el fondo de la

cuenca asiste en la estabilización de los sedimentos sobre la superficie. El bajo contenido de

oxígeno y la presencia de sulfuro de hidrógeno son causantesde la ausencia de organismos

bénticos que se entierran, permitiendo así, la conservación de láminas estacionales. La forma

de la cuenca de Santa Barbara se muestra en la figura 4.

Zona anearóbica

Zona de alta productividad

Aguas transicionales

Aguas intermedias Umbral a 450 m

Umbral a 250 m

Figura 4: Cuenca de Santa Barbara en la actualidad.

El régimen de surgencia costera reacciona de manera muy sensible a cambios de clima region-

al o global con cambios en la fuerza y ubicación. La alta tasa de sedimentación de hasta 2mm

por año y la composición particular de los sedimentos hacen dichos cambios climatológicos

discernibles directamente en los sedimentos. En particular, el este del Océano Pacífico es un

sitio ideal para el estudio de la variabilidad climatológica de los últimos 160,000 años.

En las últimas décadas se han realizado cientos de estudios sobre las cuencas y cuestas del

Pacífico Este para comprender el sistema climatológico regional y global. Las limitaciones

tecnológicas son el problema con el que se han topado la mayoría de los investigadores en

este campo (Schaaf, 1995).

1.2.4.1. Construcción de series de tiempo

El principio fundamental para la reconstrucción de series de tiempo a partir de sedimen-

tos laminados es que a la columna de sedimentos le corresponde una cronología. Los pares

de laminas claro-oscuro corresponden a varvas anualmente depositadas (Baumgartneret al.,

1992). Para la reconstrucción del ambiente a partir de sedimentos es necesario obtener carac-

terísticas que fueron producidas en la época de depositación. Muchas características que se

observan en sedimentos laminados son el resultado de procesos de compactación, diagénesis

y metamorfosis. Por lo tanto es necesario poder discernir entre características primarias pro-

ducidas durante la depositación y características secundarias producidas posteriormente a la

época de depositación (Reineck y Singh, 1981).

La manera en que se capturan las imágenes de sedimentos laminados es de suma importancia.

La mayoría de las capas gruesas de lodo (>1cm), las cuales a primera vista aparentan ser

burdas y sin laminaciones internas son, frecuentemente, finamente laminadas en su interior.

Las laminaciones internas de este tipo de muestras de lodo seestudian adecuadamente en

secciones delgadas o con la ayuda de rayos-X (Reineck y Singh, 1981).

Como resultado de las actividades de organismos bénticos los sedimentos sufren perturba-

ciones, esto es, las capas son deformadas o interrumpidas y desplazadas (Reineck y Singh,

1981). Aun cuando la preservación de varvas como las de sedimentos obtenidos de la cuen-

ca de Santa Barbara es casi perfecta para los últimos 2000 años, episodios de bioturbación

han interrumpido la secuencia de láminas en grados que van desde insignificante hasta lograr

borrar completamente la estructura laminada de los sedimentos. Al extender la cronología

anual a través de estos intervalos (al interpolar las tasas de sedimentación) nos afecta una in-

certidumbre inherente proporcional al grosor del intervalo, el cual se acumula como vayamos

encontrando nuevos problemas de bioturbación (Baumgartner et al., 1992).

Para superar problemas de incertidumbre en secuencias de varvas perturbadas es posible com-

plementar la secuencia por medio del uso de otros datos. La incertidumbre cronológica en

secuencias de varvas de la cuenca de Santa Barbara puede ser reducida al realizar una corre-

lación cruzada entre secuencias de grosores de varvas y grosores de los anillos de árboles,

ya que existe una relación entre estos valores y la cantidad de lluvia en el sur de California.

De igual manera la incertidumbre en secuencias de varvas en sedimentos puede disminuirse

complementando los datos con el uso de muestras adicionalesde sedimentos, estos extraídos

de un sitio a alguna distancia del que posee la secuencia de varvas perturbadas.

Para mejorar la calidad de alguna imagenI

de secuencia de varvas con la ayuda de otra

imagenIb

se ejecutan los siguientes pasos:

1. Se identifican y empatan las secuencias de varvas de ambas imágenes de muestras de

sedimentos laminados;

2. Se les asignan fechas a las varvas, contando desde aquellas correspondientes a la su-

perficie (fechas recientes) hacia el fondo (fechas antiguas);

3. Se encuentran puntos (fechas) para anclar al par de imágenes. Esto es, si la imagen de

sedimentos laminados que queremos complementar (I

) contiene alguna perturbación

entre la fechaa0

y la fechaa1

, podemos empatar estas dos fechas a los puntosb

, respectivamente, de otra imagen (I

) de sedimentos laminados. Al lograr anclar

las fechas, y como sabemos que el área entrea

corresponde a los sedimentos

laminados entreb0

, podremos reemplazar el área entrea

(área perturbada) de

la imagenIa

por el área entreb0

de la imagenIb

De esta manera podemos eliminar bioturbaciones u otro tipo de perturbaciones presentes en

una secuencia obtenida de sedimentos laminados por medio dela ayuda de otras muestras.

El procedimiento que se ha llevado a cabo para lograr anclar fechas entre pares de imágenes

de sedimentos laminados ha sido en gran parte en forma visual. La comparación visual se

realiza tomando una vecindad alrededor de algún punto de la imagenIb

, digamos el corres-

pondiente al puntob1

. Luego, recorremos la imagenIa

hasta encontrar una región que le

corresponda. En esta región se sitúa el puntoa

por lo que este punto corresponde a una

primera ancla. Después, se toma una vecindad alrededor del puntob0

y se recorre de nuevo la

imagenIa

, pero esta vez la búsqueda comienza a partir del ancla anteriormente fijada hacia

la superficie. Al encontrar la región deIa

correspondiente a la vecindad deIb

que contiene al

puntob0

, fijamos la segunda ancla en esa región.

Una estrategia, no totalmente visual, que se ha aplicado para encontrar la correspondencia

entre dos regiones (vecindades alrededor del punto que se pretende anclar) de sedimentos

laminados consiste en calcular la correlación lineal entrelos dos patronesP1

generados

por franjas verticales de las imágenes (figura 5). Estas franjas verticales poseen un ancho de

k � 1 pixeles. La posibilidad de muestrear a las imágenes por medio de franjas verticales

de anchos variables permite suprimir ruido, así como registrar la naturaleza no estrictamente

horizontal de las laminas de sedimentos.

En casos donde se utilizan muestras de franjas verticales deun pixel de ancho, la inclinación

de las láminas no se registra en el patrónP , mientras que si se utilizan franjas verticales

de más de un pixel de ancho, la inclinación de las láminas se reflejan en su correspondiente

patrón como un suavizado en las transiciones claro-oscuro yoscuro-claro (Schaaf, 1995). El

i-ésimo elemento del patrónP se obtiene tomando el promedio de losk pixeles que compo-

nen eli-ésimo renglón de la franja vertical de la imagen.

Figura 5: Vecindad alrededor de algún punto que se desea anclar. La comparación se realizavisualmente, o en su defecto, calculando la correlación lineal entre los valores que se extraende una columna de cada una de las imágenes. Una columna de las cuales se puede extraervalores para compararlos con los de otra imagen se muestra como una franja clara vertical enla imagen.

La correlación lineal que existe entre dos patrones columnas de las vecindades que se de-

sean anclar nos puede dar un índice de la similitud que existeentre las dos vecindades. Para

encontrar la correlación entre los patronesP

correspondientes a las imágenesm y n,

respectivamente, se utiliza la expresión:

(i)�

donder denota al coeficiente de correlación de los patronesP

(i) representa al

i-ésimo valor del patrónPm

de una imagen de muestras de sedimentos laminados. Las canti-

dades �

representan a las medias de los vectoresP

, respectivamente.

Un ejemplo de la secuencia de valores que se obtienen de muestrear a un par de imágenes

con fines de calcular su correlación se muestra en la figura 6.

0 100 200 300 400 50080

Profundidad en columna

0 50 100 150 200 250 300 350 400 45060

Profundidad en columna

(a) (b)

Figura 6: Secuencia de valores correspondientes a una franja vertical de dos imágenes distin-tas de sedimentos laminados.

Las imágenes de muestras que se observan en la figura 7 ilustran que el análisis de los sed-

imentos puede llevarse a cabo por medio de un sistema que los tratase como imágenes de

texturas. En este caso podemos observar que cada varva es un componente de textura y que

alguna cantidad determinada de varvas define a un tipo de textura.

1.3. Finalidad del trabajo

El objetivo principal de nuestro trabajo es, mediante un estudio de las técnicas de análisis

de texturas más importantes que se han utilizado en el pasado, diseñar un esquema eficaz

para el análisis de texturas; así como aportar una solución aun problema general de discrimi-

nación de texturas y en particular resolver el problema de encontrar la correspondencia entre

imágenes de texturas de sedimentos laminados.

El problema de encontrar la correspondencia entre texturasde sedimentos laminados es par-

ticularmente complicado dado que a simple vista estas imágenes son muy semejantes. Una

de las pocas propiedades de estas imágenes que las hace distintas son los cambios ligeros en

sus frecuencias y/u orientación. La gran similitud entre las texturas formadas por imágenes

de sedimentos laminados puede notarse al observar la figura 7.

Para realizar este objetivo se construirá un sistema basadoen Java que implementará un banco

de filtros Gabor, un subsistema de posprocesado y de búsquedade correspondencias en base

a un análisis de componentes principales y medidas de distancias multivariadas.

(a) (b) (c)

Figura 7: Imágenes de sedimentos laminados. Texturas formada por sedimentos laminados.Nótese que aunque se trata de imágenes de sedimentos distintos, exhiben texturas muy seme-jantes.

Capítulo 2

Características de texturas

La identificación de cualidades perceptibles de texturas esla primera etapa hacia la constru-

cción de un modelo matemático para el análisis de texturas. Las variaciones de niveles de

intensidad dentro de una imagen que caracterizan texturas son debidas a variaciones físicas

en la escena, tales como guijarros en la playa u olas en el agua. Modelar variaciones físicas

es muy difícil, por lo que la textura de una escena es comunmente caracterizada por varia-

ciones bidimensionales de las intensidades presentes en una imagen. Esto puede hasta cierto

punto explicar el que no exista una definición precisa general para el término de textura en la

literatura en el campo de la visión por computadora (Tuceryan y Jain, 1998).

Una manera de extraer información a partir de imágenes es reducir la cantidad de datos real-

izando abstracciones. El diseñador del sistema de visión realiza supuestos acerca de la infor-

mación presente en los datos. También, tendrá que desarrollar algoritmos de procesamiento

basados en estas suposiciones y debe especificar la representación de los datos de tal forma

que la información pertinente sea explícita (Chaney, 1993).

Un tipo de abstracción utilizada en el campo de visión por computadora es la definición

de unacaracterística. La definición de una característica requiere la suposiciónde que su

presencia particular en la imagen es significante (Chaney, 1993).

Las imágenes de texturas poseen cuantiosas cualidades perceptibles a lo que concierne la

distribución espacial de niveles de gris. Laws (1980) identificó varias propiedades que jue-

gan un papel importante en la descripción de texturas, algunas son: uniformidad, densidad,

granulosidad, aspereza, regularidad, dirección, frecuencia, etc. Algunas de estas cualidades

perceptibles no son independientes de otras. Por ejemplo, la frecuencia no es independiente

de la densidad, y la propiedad de dirección solo aplica a texturas direccionales (Tuceryan y

Jain,1998).

El hecho de que la percepción de texturas posea tantos factores distintos es una razón impor-

tante del por qué no exista un método único para su representación.

2.1. Tipos de características

Autores como González y Woods (1996); Tuceryan y Jain (1998); y Randen y Husøy (1999),

han identificado a un conjunto de tipos de características que pueden ser utilizadas para la

descripción de texturas. Cada uno de estos tipos de características puede separarse de acuerdo

a la naturaleza del método que fue utilizado para extraerlas. Dentro de las características más

comunes se encuentran aquellas adquiridas por medio de:

Métodos estadísticos;

Métodos geométricos;

Métodos basados en modelos;

Métodos basados en el procesamiento de señales.

2.1.1. Métodos estadísticos

Una de las cualidades que pueden definir a las texturas es su distribución espacial de valores

de gris (Tuceryan y Jain, 1998 ). Los descriptores estadísticos proporcionan características de

texturas que indican cualidades como suavidad, rugosidad,granulosidad y otras (González y

Woods, 1996).

Uno de los métodos más simples para describir texturas consiste en utilizar momentos del

histograma de niveles de gris de una imagen o, en su defecto, de una región (González y

Woods, 1996).

2.1.1.1. Momentos

Seaz una variable aleatoria que indica la intensidad de una imagen discreta, y seap(zi

), para

i = 1; 2; 3; :::; L, el correspondiente histograma, dondeL es la cantidad de niveles distintos

de gris. Eln-ésimo momento dez respecto a la media se define por:

siendom el valor medio dez (la intensidad media):

Podemos observar de la ecuación 2 que�

= 1 y �1

El segundo momento o varianza es denotado por�

(Z) y es de particular importancia en la

descripción de texturas. Este segundo momento es una medidadel contraste de niveles de

gris que se puede utilizar para establecer descriptores de suavidad relativa. Por ejemplo, la

medida:

R = 1�

1 + �

es 0 para áreas de intensidad constante y tiende a 1 para valores grandes de�2(Z). El tercer

momento es una medida de la desviación del histograma.

Las medidas de textura que sólo hacen uso de histogramas presentan la limitación de no

contener información referente a la posición relativa de cada pixel con respecto a otros. Una

manera de introducir este tipo de información en el proceso de análisis de textura consiste

en no solamente considerar la distribución de intensidades, sino también tomar en cuenta las

posiciones de pixeles con valores de intensidad idénticos ocasi idénticos (González y Woods,

1996).

2.1.1.2. Matrices de co-ocurrencia

Haralick (Haralicket al., 1973), propuso el uso de matrices de co-ocurrencia de niveles de

gris. Estas matrices de co-ocurrencia han sido utilizadas ampliamente en el ámbito del análisis

de texturas. La matriz de co-ocurrencia de niveles de grisP

para un vector de desplazamiento

d = (dx; dy) se define de la siguiente manera:

= jf((r; s); (t; v)) : I(r; s) = i; I(t; v) = jgj (5)

donde la entrada(i; j) dePd

indica la cantidad de ocurrencias del par de pixeles con valor

de grisi y j que se encuentren separados por una distanciad, j�j denota la cardinalidad del

conjunto,(r; s); (t; v) 2 N �N y (t; v) = (r + dx; s+ dy).

El tamaño de de la matriz de co-ocurrenciaPd

es determinado por la cantidad de niveles

de gris en la imagen de entrada. Por esta razón, la aplicaciónde esta estrategia a menudo

requiere que se vuelvan a cuantificar las intensidades en unas pocas bandas de niveles de

gris, esto para mantener el tamaño deP

razonable (González y Woods, 1996).

Por ejemplo, si una imagen con tres niveles de gris:z

= 0, z2

= 1, y z3

= 2; es representada

de la siguiente manera:

0 0 0 1 2

1 1 0 1 1

2 2 1 0 0

1 1 0 2 0

0 0 1 0 1

podemos definir al operador desplazamientod comod = (1; 1), o un operador de posición,

como lo llama González y Woods (1996), como ”un pixel hacia laderecha y un pixel hacia

abajo”. Esto nos lleva a obtener la siguiente matriz de co-ocurrencia:

Haralicket al.(1973) han propuesto un conjunto de características que pueden ser calculadas

a partir de la matriz de co-ocurrencia. Estas características se presentan en la tablaI.

TablaI: Descriptores de características a partir de una matriz de co-ocurrencia

Descriptor de Textura Fórmula

EnergíaP

(i; j)

EntropíaP

(i; j) logP

(i; j)

ContrasteP

(i� j)

(i; j)

HomogeneidadP

1+ji�jj

CorrelaciónP

(i��

)(j��

Donde�x

y �y

representan a las medias y�x

y �y

representan a las desviaciones estándar de

(x) y Pd

(y), respectivamente, dondePd

(x; j) y Pd

(i; y).

La idea básica es caracterizar el contenido de la matriz de co-ocurrenciaPd

por medio de estos

descriptores (González y Woods, 1996). El uso de características basadas en matrices de co-

ocurrencia posee la desventaja de que no existe un método establecido para seleccionar un

vector de desplazamientod = (dx; dy), y el calcular matrices de co-ocurrencia para distintos

valores ded no es viable (Tuceryan y Jain, 1998).

Un método para utilizar estos descriptores es ¨enseñar¨ a unsistema valores de descriptores

representativos para un conjunto de texturas diferentes. Por consiguiente, la textura de una

región desconocida se determina por la exactitud con la que sus descriptores concuerdan con

los almacenados en la memoria del sistema (González y Woods,1996).

2.1.2. Métodos geométricos

2.1.2.1. Telaraña de Voronoi

El uso de telarañas de Voronoi, para el análisis de texturas,fue propuesto por Tuceryan y Jain

(1990), después de que Ahuja (1982) las propusiera como un modelo para definir vecindades.

La finalidad de este método es extraer símbolos representativos de imágenes a partir de las

características de su telaraña de Voronoi. La capacidad de las telarañas de Voronoi para definir

vecindades espaciales locales y que la distribución espacial de sus símbolos representativos

se ve reflejada en la forma de los polígonos de Voronoi es la mayor motivación para su uso.

Para hacer uso de esta técnica en el análisis de texturas primero se deben extraer símbolos

representativos de la imagen. Estos símbolos, en su forma más simple, pueden constar de

puntos con un alto gradiente, así como estructuras más complejas como segmentos de rectas

o bordes cerrados. Después de extraer los símbolos representativos, se procede a construir la

telaraña de Voronoi.

Por simplicidad consideraremos a un símbolo descriptivo como un punto. Consideremos la

existencia deS conjuntos de tres o más símbolos descriptivos en un espacio euclideano.

Supongamos que no todos los puntos son colineales y que ningún conjunto de cuatro puntos

son cocirculares. Consideremos a un par arbitrario de puntosP y Q, el bisector del segmento

de recta que los une contiene a los puntos equidistantes entreP y Q, y parte el plano en dos

partes iguales. El hemi-planoHP

) contiene a los puntos más cercanos aP (Q) que aQ

(P ). Para cualquier puntoP , se debe obtener un conjunto de tales hemi-planos para varias

elecciones deQ.

La intersecciónQ2S

define una región poligonal formada por puntos cercanos aP

más que a cualquier otro punto. Tal región define un polígono de Voronoi asociado con el

puntoP . El conjunto completo de polígonos es conocido como el diagrama de Voronoi deS.

El diagrama de Voronoi junto con los polígonos incompletos en el casco convexo definen a

una telaraña de Voronoi del plano entero. Se dice que dos puntos son vecinos si los polígonos

de Voronoi que los contienen poseen aristas en común (Tuceryan y Jain,1998).

La vecindad de un símbolo descriptivoP se define por el polígono de Voronoi que con-

tiene aP . Las propiedades geométricas de las vecindades de Voronoi definen muchas de las

características de los símbolos descriptivos de la imagen.Para la descripción de texturas se

utilizan las propiedades geométricas de los polígonos de Voronoi. Los momentos de área de

los polígonos de Voronoi describen adecuadamente sus características geométricas. Los mo-

mentos de área de(p+ q)-ésimo orden de una región cerradaR con respecto a un símbolo

representativo con coordenadas(x

) se definen como:

(x� x

(y � y

dxdy (6)

dondep+ q = 0; 1; 2; :::.

Una descripción de las características utilizadas por Hu (Hu, 1962) se da en la tablaII . Las

coordenadas del centroide de un polígono de Voronoi es denotado por(�x; �y).

2.1.2.2. Métodos estructurales

Los modelos estructurales para el análisis de texturas suponen que una textura se compone

de primitivas de textura. La colocación de estas primitivasde acuerdo a ciertas reglas de

TablaII : Características de texturas a partir de telarañas de Voronoi

Característica de Textura Fórmula

+ �y

(�y=�x)

20�m

acomodo generan una textura (Tuceryan y Jain, 1998). El análisis estructural de texturas

consiste de dos etapas:

1. Extracción de los elementos de textura;

2. Inferencia de la regla de acomodo.

La regla de acomodo se puede considerar como una de la formaS ! aS, que nos indica que

el conjunto de símbolosaS pueden ser derivados a partir del símboloS, esto es, en vez de

S podemos escribiraS cada vez que este aparezca (González y Woods, 1996). Este tipo de

derivaciones se ilustran en la fiura 8.

(a) (b)

(c) (d)

Figura 8: Una primitiva de textura cuyo símbolo esa (a). Otra primitiva de textura, su símboloesS (b). Patrón que resulta de realizar la derivaciónS ! aS (c). Patrón que resulta de realizarla derivaciónS ! aS ! aaS

Si se añaden algunas nuevas reglas a este esquema:S ! bA, A! A, A! , A! bS,

S ! a, donde el símbolob indica un ¨circulo abajo¨ y el símbolo indica un ¨circulo a la

izquierda¨. Este tipo de reglas nos permiten formar patrones en dos dimensiones. La idea

básica es que con un conjunto de reglas de acomodo y con un conjunto de elementos pri-

mitivos de textura podemos limitar la cantidad de posibles composiciones. Un ejemplo bidi-

mensional se puede formar por el patrónaaab baa y las reglas anteriormente definidas; el

resultado se muestra en la figura 9.

Figura 9: Textura generada por el patrónaaab baa

2.1.3. Métodos basados en modelos

Los métodos basados en modelos para el análisis de texturas se basan en la construcción

de un modelo de imagen que puede ser utilizado no solo para describir una textura sino

también para sintetizarla (Tuceryan y Jain, 1998). Las característica o descriptores de este

tipo suponen algún modelo para una subimagen, y los valores de los parámetros o atributos

derivados de ellos son utilizados como características o descriptores (Randen y Husøy, 1999).

Los parámetros del modelo capturan las cualidades esenciales de la textura (Tuceryan y Jain,

1998).

2.1.3.1. Modelo autorregresivo

Mao y Jain (1992) han propuesto un método denominado Modelo Multirresolución Autorre-

gresivo. El modelo autorregresivo para una imagenx(m;n) puede ser expresado como:

x(m;n) =

(k;l)2�

�(k; l)x(m� k; n� l) + �

"(m;n) (7)

donde� denota a una vecindad del modelo,�(k; l) representa a los parámetros del modelo,

"(m;n) representa al término de error del modelo. Los vectores de características se

componen de todos los parámetros del modelo (Randen, 1997).

2.1.3.2. Campos aleatorios Markovianos

La teoría referente a los campos aleatorios de Markov (MRF) es una rama de la teoría de prob-

abilidades utilizada para analizar las dependencias espaciales o contextuales de un fenómeno

físico (Chantler, 1994). Los MRFs han adquirido popularidad en el ámbito del modelado

de imágenes. Estos modelos suponen que la intensidad de cadapixel dentro de la imagen

depende solamente de la intensidad de los pixeles que lo rodean.

Los campos aleatorios Markovianos han sido utilizados parala síntesis de texturas (Cross y

Jain, 1982), clasificación de texturas (Chellappa y Chatterjee, 1985; Khotanzad y Kashyap,

1987), segmentación de imágenes (Cohen y Cooper, 1987; Therrien, 1983), restauración de

imágenes (Geman y Geman, 1984), y compresión de imágenes.

Los campos aleatorios de Markov pueden ser vistos como generalizaciones bidimensionales

de cadenas de Markov, las cuales se definen en términos de probabilidades condicionales. Las

probabilidades condicionales son las mismas en toda la cadena (o campo) y son dependientes

solo de la vecindad de alguna variable (la suposición de Markov). La forma y el tamaño de

las vecindades son determinados por el orden del modelo. Vecindades de primer, segundo,

tercero y cuarto orden dex se muestran en la figura 10, donde la vecindad de primer orden

consiste de variables etiquetadas con el valor ”1”, la vecindad de segundo orden consiste en

variables etiquetadas con el valor ”2”, etc. (Chantler, 1994).

4 3 44 2 1 2 43 1 x 1 34 2 1 2 4

Figura 10: Vecindades de un MRF

En general, podemos representar a una imagen por una retícula de dimensiónM �M denota-

da porL = f(i; j)j1 � i �M; 1 � j � Ng. I(i; j) es una variable aleatoria que representa el

valor de gris del pixel en la posición(i; j) dentro deL. Podemos simplificar el indizado sobre

la retícula, por simplificación matemática, por medio deI

tal quet = (i� 1)N + j. SeaA el

contradominio común para todas las variables aleatoriasIt

; :::; x

2 A; 8tg el conjunto que denota a las etiquetas deL.

Según Tuceryan y Jain (1998), un campo aleatorio de Markov esun campo aleatorio cuya

función de masa de probabilidad posee las propiedades de positividad, Markovianidad y ho-

mogeneidad. Esta última propiedad no es necesaria de acuerdo con Li (2001) . Si denotamos

a una vecindad de ordenr alrededor de un puntoIt

comoIrt

, un campo aleatorio es un campo

aleatorio de Markov si y solo si cumple con:

) > 0 (8)

; :::; I

) = P (I

Esta última propiedad (Markovianidad) implica que la probabilidad de que algún pixel tome

cierto valor depende estrictamente de sus vecinos y no de toda la imagen.

La propiedad de un campo aleatorio de Markov es que mientras la variable aleatoriaI puede

tomar cualquier valor, la probabilidad de que tome cierto valor está condicionada por los

valores que poseen los pixeles en su alrededor (vecindad). Esto es, existe una función local

de densidad de probabilidades que describe las vecindades de la imagen (Paget y Longstaff,

1996).

Dentro del modelado de campos aleatorios de Markov las características de texturas corres-

ponden a los parámetros del modelo. La extracción de características de una imagen de tex-

tura es equivalente a la estimación de parámetros del modelo(Li, 2001).

2.1.4. Métodos basados en procesamiento de señales

2.1.4.1. Métodos espectrales

El espectro de Fourier ha demostrado ser de gran utilidad para la detección de la direccion-

alidad de patrones bidimensionales poriódicos o casi periódicos de una imagen. Algunas

características útiles del espectro de Fourier para describir texturas son (González y Woods,

1996):

Picos prominentes del espectro de Fourier que muestran la dirección de los patrones de

textura;

Picos en el plano de frecuencia dan el periodo espacial fundamental de los patrones;

La eliminación de los componentes periódicos mediante el filtrado deja elementos de

la imagen no periódicos; que se pueden tratar por técnicas estadísticas.

2.1.4.2. Transformada de coseno discreto

La transfomada de coseno discreto es una herramienta popular para la codificación de imá-

genes debido a su buen desempeño y su facilidad de implementación (Ramstadet al., 1995).

Esta transformada sirve como base para la codificación de imágenes de formato JPEG (Ran-

den, 1997).

La transformada de coseno discreto se define como:

C(u) = �(u)

f(x) os

(2x + 1)u�

parau = 0; 1; 2; :::; N � 1.

La transformada de coseno discreto inversa se define como:

f(x) =

�(u)C(u) os

(2x+ 1)u�

parax = 0; 1; 2; :::; N � 1.

Para estas dos últimas ecuaciones,� se define como:

�(u) =

parau = 0

parau = 1; 2; 3; :::; N � 1

Para el caso bidimensional la transformada de coseno discreto se define como:

C(u; v) = �(u)�(v)

f(x; y) os

(2x+ 1)u�

(2 + 1)v�

parau; v = 0; 1; 2; :::; N � 1.

La transformada inversa se define como:

f(x; y) =

�(u)�(v)C(u; v) os

(2x+ 1)u�

(2y + 1)v�

parax; y = 0; 1; 2; :::; N � 1.

2.1.5. Filtros Gabor

2.1.5.1. Base biológica

La gran capacidad de los humanos para realizar segmentacióny clasificación de texturas así

como estudios realizados en el campo de la percepción visualhumana han dado pie a un

paradigma para la extracción de características de texturas basado en filtros Gabor (Kumar y

Pang, 2000).

Los esquemas basados en filtros Gabor constan de una serie de filtros, cada uno sintonizado

a una escala y a una orientación distinta. Esto, justificado en gran parte por la existencia de

evidencias fisiológicas de que la respuesta de células selectivas a la orientación en la corteza

visual puede ser modelada utilizando filtros Gabor (Daugman, 1984; Daugman, 1985). Los

campos receptivos tipo Gabor son fundamentales en el procesamiento biológico de imágenes

de texturas, pero cualquier extensión hecha hacia el campo de la visión por computadora debe

mantenerse en el marco de la computación (Kumar y Pang, 2000).

El uso de detectores multicanal para el análisis de texturases un tema inspirado por la teoría

de filtrado multicanal del procesamiento de información visual llevado a cabo en gatos y

monos (Hubel y Wiesel, 1962; Hubel y Wiesel, 1974). Campbelly Robson (1968) proponen

que el sistema visual humano descompone la imagen formada enla retina en cierta cantidad

de imágenes filtradas donde cada una contiene variaciones deintensidad sobre una gama

estrecha de frecuencias. Posteriormente, se descubrió queel cerebro contiene una gran cadena

de neuronas que filtran información visual por orientación ytamaño en cada punto de la

corteza visual (De Valoiset al., 1989).

La fisiología y psicofísica de la visión temprana se enfoca enla forma en que los mecanismos

visuales convierten y codifican los patrones de luz que llegan al ojo.

2.1.5.2. Descripción matemática

Usualmente a las imágenes se les considera como un conjunto de pixeles (dominio espacial)

o como la suma de sinusoidales (dominio de frecuencias). Gabor, en cambio, observó que

la representación en el dominio espacial y la representación en el espacio de frecuencias

son justamente extremos opuestos de una cantidad infinita nonumerable de representaciones

posibles en un dominio conjunto espacio/frecuencia (Dunnet al., 1994).

Si una imagen se representa en el dominio espacial, no tendríamos información alguna acerca

de los números de onda contenidos en un punto de la imagen. Conocemos la posición con

una exactitud de�x, pero el número de onda local en este punto es desconocida, puede variar

entre� 1

. Si se utiliza la representación en el espacio de frecuencias (representación

de número de onda) caemos en el caso contrario (Jähne y Hau�ecker, 2000). Cada pixel en

este dominio representa un número de onda con la más alta resolución de número de onda

posible para el tamaño de la imagen dada, el cual es1

para una imagen conN pixeles en

cada coordenada. Toda información pocisionalposicional es perdida bajo esta representación

ya que un punto en el espacio de número de onda representa una estructura periódica que se

encuentra distribuida sobre toda la imagen.

La representación exclusiva en cualquiera de los dominios anteriormente mencionados es

inadecuada para analizar objetos dentro de imágenes.

La transformada de Fourier es un análisis del contenido global de frecuencias de una señal.

Existen cuantiosas aplicaciones donde se requiere que el análisis se encuentre localizado

tanto en el dominio espacial como en el dominio de frecuencias. Para satisfacer este requisito

podemos introducir una dependencia espacial al análisis deFourier. Una forma clásica de

introducir esta dependencia es por medio de la transformadaventaneada de Fourier.

Para el caso unidimensional, la transformada ventaneada deFourier de una señalf(x) se

define como:

(u; �) =

f(x)w(x� �)e

�j2�ux

dx (15)

La funciónw(x) es la función de ventana. Cuando esta función de ventana es una función

Gaussiana, la transformada de Fourier ventaneadaF

(u; �) es llamada Transformada Gabor

(Jähne y Hau�ecker, 2000).

2.1.5.3. Definición de filtros Gabor

Para nuestro estudio definimos a un filtro Gabor para el análisis de texturas como Dunn (Dunn

et al., 1994), de la siguiente manera:

m(x; y) = i(x; y) � h(x; y) (16)

donde� denota al operador convolución bidimensional,i a la imagen de la textura por

analizar,h a una función que Dunnet al. (1994) llama ”función elemental Gabor”, ym es la

respuesta del filtro. Las funciones elementales Gabor poseen propiedades importantes que las

hacen atractivas para ser utilizadas en el análisis de texturas. Algunas de estas propiedades

Las funciones elementales Gabor son las únicas funciones que alcanzan la cota inferior

especificada por el principio de incertidumbre (Bracewel, 1999; Dunnet al., 1994). De

hecho, los filtros Gabor poseen las ventanas espacio/frecuencia más estrechas de todas

las transformadas ventaneadas de Fourier (Prasadet al., 1997). Esto permite que las

funciones elementales Gabor puedan ser configuradas para ser altamente selectivas en

el espacio de frecuencias y al mismo tiempo poseer localización espacial.

La forma de las funciones elementales Gabor poseen semejanza a campos receptivos

de células simples de los conductos visuales (Kulikowskyet al., 1980), por lo que

biológicamente poseen similitud en funcionamiento al sistema visual de los humanos.

Son filtros pasa-banda. Esta característica permite que lasfunciones elementales Ga-

bor puedan ser configuradas para extraer una banda de frecuencias específica de una

imagen.

2.1.5.4. Principio de incertidumbre de Heisenberg

Es ampliamente conocido que el producto del ancho de banda y la duración de una señal

no puede ser menor que un cierto valor constante mínimo. Estehecho es esencialmente un

fenómeno matemático que surge a partir de la interdependencia que existe entre el tiempo

y la frecuencia, la cual hace imposible la especificación arbitraria de señales en el plano

tiempo-frecuencia (Bracewell, 1999).

Básicamente lo que este principio nos da a saber es que el componente de frecuencia de una

función y su localidad (posición en la cual ese componente defrecuencia se encuentra) no

pueden ser medidas a un grado arbitrario de simultaneidad.

Sabemos que una funciónf y su transformada de Fourier:

f = F (f) (17)

no pueden ambas estar altamente localizadas. Esto es, sif se desvanece (o posee valores

muy pequeños) fuera de un intervalo pequeño, entonces^

f debe ser amplia y viceversa. Para

explicar este fenómeno recurrimos al teorema de ancho de banda/principio de incertidumbre

(Howell, 2001):

Supongamos que las funcionesf y ^

f son acotadas, y la transformada de Fourier^

f = F (f)

existe. Definimos aE como la energía en el proceso descrito porf y a�x como una medida

del ancho de la gráfica def , la cual puede ser utilizada para determinar una cota efectiva de

la duración def . Estas cantidades son descritas como:

�x =

jf(x)j

�w =

jF (w)j

donde:

jf(x)j

jF (w)j

dw (20)

también, supongamos que nif ni F sean la función cero, y que:

1. �x o�w tiendan a infinito; o que

2. wF (w) sea transformable y que tantof 0 y wF (w) sean acotadas; o que

3. xf(x) sea transformable, y que tantoF 0 y xf(x) sean acotadas;

entonces:

�x�x �

con la igualdad cumpliendose si y solo si:

f(x) = Ae

para algún par de constantesA y , tal que > 0.

2.1.5.5. Función Gabor compleja

Una función Gabor es una función exponencial compleja modulada por una Gaussiana en

el dominio espacial, y en el dominio de frecuencias es una Gaussiana desplazada. Estas fun-

ciones fueron definidas por Dennis Gabor en 1946 (Gabor, 1946) para el caso unidimensional.

Posteriormente, Daugman (1984) las extendió para el caso bidimensional y mostró sus cual-

idades concernientes al principio de incertidumbre (Chan yChen, 2000).

2.1.5.5.1. Función Gabor compleja unidimensional Para el caso unidimensional, una

función Gabor se denota como sigue:

h(x) =

2��

j2�[U(x�x

)℄ (23)

dondeU representa la frecuencia del plano sinusoidal. La transformada de Fourier deh(x)

se denota como:

H(u) = e

[�(U�u)℄

(U�u) (24)

Gráficamente la función Gabor en el dominio espacial y en el dominio de frecuencias se

pueden observar en las figuras 11 y 12, respectivamente.

0 10 20 30 40 50 60 70 80 90 100−0.8

−0.6

−0.4

−0.2

Figura 11: función Gabor unidimensional en el dominio espacial con parámetrosw = 0;9 y� = 5.

0 10 20 30 40 50 60 70 80 90 1000

Figura 12: Función Gabor unidimensional en el dominio de frecuencias con parámetrosw =

15 y � = 0;06.

2.1.5.5.2. Función Gabor compleja n-dimensional En general, para el caso n-dimensional,

una función Gabor se expresa de la siguiente manera:

h(p) = f(p)m(p) (25)

dondef(p) es una función Gaussiana dada por:

f(p) =

(2�)

det(�)

(p�p

℄ (26)

y m(p) es es la función compleja de modulación:

m(p) = e

(p�p

℄ (27)

dondep 2 R

n y p0

n definen a las coordenadas espaciales de algún punto donde es

evaluada la función Gabor y del centro de la función Gabor, respectivamente.Rn representa

a la frecuencia de traslación de la función Gabor.� es una matriz de covarianza positiva

definida de dimensiónn� n denotada por la siguiente expresión:

) = Æ

donde�2j

denota a la varianza de la función Gaussiana en direcciónj y Æ

a la delta de

Kronecker definida por:

1 parai = 1

0 parai 6= j

2.1.5.5.3. Función Gabor compleja bidimensional Para el caso bidimensional (el cual

será utilizado para nuestro estudio), las coordenadas espaciales horizontales y verticales son

representadas por el vectorp = [x; y℄

T y el vectorp0

T denota la traslación de su

origen. La forma de la función Gaussianaf(p) es determinada por la matriz de covarianza�

definida por:

donde�2x

y �2y

son las varianzas de la función Gaussiana sobre el ejex e y respectivamente,

las cuales son utilizadas para controlar la orientación y sensibilidad de la función Gabor. Por

consiguiente:

det (�) = �

El vectorw = [u; v℄ denota las frecuencias axiales sobre dos coordenadas mientras que el

vectorw0

℄ representa la traslación de frecuencias de la función Gabor.

En dos dimensiones un filtro Gabor es un filtro pasa-banda sintonizado a una orientación

� =tan

del ejeu y centrado en la frecuenciaw0

La representación en el espacio de frecuencias de un filtro Gabor se obtiene calculando su

transformada de Fourier para pasar a tener a partir de 25, 26 y27:

H(u; v) = e

�2�

[u�u

[v�v

(w�w

) (32)

2.1.5.5.4. Función Gabor real Una función Gabor compleja de la forma 25, 26 y 27

puede separarse en sus componentes real e imaginaria.

Esta descomposición resulta en la siguiente expresión:

h(p) = f(p)

(p� p

+ i sen

(p� p

pasamos a obtener las expresiones para las partes real e imaginaria de la función Gabor

descrita por< [h(p)℄ e= [h(p)℄, respectivamente.

< [h(p)℄ =

2� det (�)

(p�p

(p� p

= [h(p)℄ =

2� det (�)

(p�p

(p� p

La parte real de funciones Gabor (figura 13) han sido utilizadas por Casasent y Smokelin

(1994; Casasent, 1995) y Weber y Casasent (1995) para la detección de objetos, Kumar y

Pang (2000) la utilizan para la detección de defectos de textiles a partir de imágenes. Una

combinación de la parte real y la parte imaginaria fue utilizada por Weldon y Higgins (1996)

para la segmentación de imágenes de texturas.

En general, dado que muchas aplicaciones en la visión por computadora requieren respuestas

en tiempo real, es necesario implementar mecanismos eficientes para el cálculo de imágenes

filtradas por funciones Gabor. La forma de una función Gabor bidimensional real en el do-

minio espacial se ilustra en la figura 13.

Figura 13: Función Gabor real bidimensional en el dominio espacial.

Capítulo 3

Detectores multicanal

La suposición general al utilizar métodos basados en filtroses que la distribución de energía

en el dominio de frecuencias identifica a una textura. Por consiguiente, si el espectro de

frecuencias de una imagen poseedora de textura se descompone en una suficiente cantidad de

bandas, se generarán firmas de energía espectral. Estas firmas espectrales serán distintas para

texturas diferentes. Basados en este principio, varios autores han propuesto diversos métodos

para la segmentación/clasificación de imágenes de texturas(Randen y Husøy, 1999).

En experimentos hechos con gatos y monos, los cuales poseen un sistema de visión similar al

humano (Mallat, 1989), se ha mostrado que estos animales descomponen imágenes visuales

en imágenes filtradas, cada una con distintos rangos de frecuencias y distintas orientaciones

(Campbell y Robson, 1968).

Los resultados de estos experimentos nos sugieren que un modelo adecuado para el análisis

de texturas sería aquel que nos permitiera filtrar a las imágenes por medio de filtros Gabor

sensibles a distintas orientaciones y frecuencias. Para lograr este tipo de filtrado es necesario

utilizar un detector multicanal (banco de filtros) .

Llamaremos unBanco de filtros Gaboro un Detector Multicanal Gabora un esquema de

filtrado basado en filtros Gabor, el cual, a partir de una imagen de entrada, responderá con

una cantidadk de imágenes filtradas por filtros pasa-banda Gabor, dondek es igual a la

cantidad de canales en el banco. Cada canal en el banco es sintonizado para filtrar a la imagen

de entrada a una frecuencia y orientación diferente. A cada canal del banco de filtros se le

pueden añadir diversos operadores para obtener al finalk imágenes, que en su conjunto,

forman ”características” que representan y disciernen a latextura de entrada de otras.

3.1. Función Gabor real en múltiples escalas y múltiples di-

recciones

La forma analítica de una función Gabor en el dominio espacial, con capacidad de ser sin-

tonizada a distintas orientaciones y frecuencias es la siguiente:

2� det (�)

dondem es el índice de escala yn el índice de orientación. La frecuencia de modulación

espacial es denotada porwn

y es en una sola dirección ya que utilizamos a la función Ga-

bor para detectar altura y ancho. El vectorp

desplaza el origen de la función Gabor real.

Una función Gabor para distintas orientaciones es obtenidahaciendo una transformación de

coordenadas~P = J

. La matriz de rotaciónJn

es dada por:

os �

0 � sen �

el ángulo�n

rota a la función Gabor para cualquier orientación deseada.Los parámetroswm

y �n

representan la frecuencia angularm y la orientaciónn, respectivamente. Un ejemplo con

16 filtros (4 orientaciones y 4 frecuencias) Gabor se muestraen escala log-polar en la figura

Figura 14: Representación en el dominio de frecuencias de 16filtros Gabor en escala log-polar

La forma de las funciones Gabor utilizadas en un banco de filtros con 16 canales (4 orienta-

ciones y 4 frecuencias) se muestra en la figura 15.

Figura 15: Mapas de intensidad de funciones Gabor en el dominio espacial sintonizadas acuatro orientaciones (0Æ, 45Æ, 90Æ, 135Æ) y a cuatro frecuencias (0.015, 0.03, 0.06, 0.12).

3.1.1. Esquemas anteriores

3.1.1.1. Esquema de Randen y Husoy

Varios autores han propuesto esquemas para el análisis de texturas basados en bancos de

filtros, ya sea para su clasificación o segmentación. Randen yHusøy (1999) proponen el

esquema para la segmentación de texturas que se observa en lafigura 16.

Imagen de entrada

Filtrado

No linealidad

Función suavizante

No linealidadnormalizante

Clasificador

Imágenes filtradas

Función localde energía

Mapa de clases

Vectores de características

Figura 16: Esquema multicanal propuesto por Randen y Husøy.

3.1.1.1.1. Etapa de Filtrado La primera etapa del esquema propuesto por Randen y

Husøy (1999) es la etapa de Filtrado. Suponiendo un esquema de filtrado dek canales, esta

etapa descompone a la imagen de entrada enk imágenes filtradas, cada una por un filtro con

distinta configuración. En el caso de que se utilicen filtros Gabor en este esquema, cada canal

del banco de filtros deberá estar sintonizado a una frecuencia y a una escala distinta.

3.1.1.1.2. Etapa de función de energía localLa segunda etapa, la función de energía

local, se encarga de estimar la energía de la respuesta de losfiltros sobre una región local

(Randen y Husøy, 1999). En esencia cada filtro es un filtro pasabanda sensible a una frecuen-

cia y a una escala en particular. La función local de energía es utilizada con el fin de transmitir

áreas en cada canal donde la energía pasabanda local es fuerte a un nivel de gris alto, y vice-

versa (Randen, 1997). Esta segunda etapa consiste en aplicar un operador no lineal seguido

por un filtro suavizante a cada canal del banco de filtros utilizado. Existen varias opciones de

operadores no lineales y de filtros suavizantes para esta etapa.

3.1.1.1.3. Operadores no linealesDentro de los operadores no lineales comunmente uti-

lizados se encuentran:

La magnitudj�j, utilizado por Dunn y Higgins (1995; Dunn et al., 1994);

El cuadrado(�)2, utilizado por Farrokhnia (1990) y Unser (1995);

La tangente rectificadajtanh(��)j por Jain y Farrokhnia (1991) y Randen y Husøy

(1994).

Los operadores de magnitud y el cuadrado son operadores libres de parámetros. La sigmoide

rectificada posee un parámetro de saturación� que requiere ser sintonizado. Randen y Husøy

recomiendan utilizar la sigmoide rectificada en los casos donde sea posible sintonizar este

parámetro para realizar la tarea requerida.

Para la función sigmoide rectificada Randen (Randen y Husøy,1994) recomienda fijar el

parámetro de saturación en� = 0;25 en la expresión:

jtanh(�x)j (38)

Para el caso de la sigmoide (51) propuesta por Kubota y Huntsberger (1998) se fija el parámetro

de saturación en� = 1. Algunos efectos de variar el parámetro de saturación en este último

operador se observa en la figura 17.

0 100 200 300−1

−0.5

0 100 200 300−1

−0.5

0 100 200 300−1

−0.5

0 100 200 300−1

−0.5

(a) (b)

(c) (d)

Figura 17: Función sigmoidetanh(�x) con distintos valores de saturación. (a)� = 1 (b)� = 0;25 (c) � = 0;1 (d) � = 0;05

Otra manera en que este operador puede ser visto, para simplicidad en la programación es:

tanh(�x) =

1� e

�2�x

3.1.1.1.4. Filtro suavizante Los filtros suavizantes se utilizan para hacer que la imagen

se torne algo borrosa y para reducir el ruido (González y Woods, 1996). Mientras que existe

la posibilidad de utilizar otras opciones como filtro suavizante (ej. filtro rectangular), el filtro

suavizante utilizado por Randen (Randen, 1997) es un filtro Gaussiano de la forma:

g(x; y) =

2��

2 (40)

donde�x

= �.

La respuesta de un filtro Gaussiano es un promedio ponderado de la vecindad de cada pixel,

donde el mayor peso es puesto en los pixeles cercanos al centro. Por esta razón el filtro

Gaussiano realiza un suavizado más apacible y mantiene mejor los bordes que un filtro de

promediado de similar tamaño. El resultado de aplicar un filtro suavizante Gaussiano con

distintos valores para el parámetro� se muestra en la figura 18.

(a) (b)

(c) (d)

Figura 18: Aplicación de filtros Gaussianos para la eliminación de altas frecuencias, (a) ima-gen original, (b) parámetro� = 2, (c) con parámetro� = 4, (d)� = 8.

3.1.1.1.5. No linealidad normalizante Esta cuarta etapa no es comunmente utilizada

según Randen (1997). Unser (1995) propuso y probó varias combinaciones de operadores no

lineales para la segunda y cuarta etapa del esquema propuesto. Unser (1995) propuso utilizar

el operador cuadrado seguido por un logaritmo normalizantelog(�).

3.1.1.2. Esquema de Weldon y Higgins

Weldon y Higgins (1996) proponen el esquema para un detectormulticanal que se observa

en la figura 19.

Clasificador

Imagen deentrada

h (x,y)1

h (x,y)k

i (x,y)h1

i (x,y)hk

m (x,y)1

m (x,y)k

g (x,y)1

g (x,y)pk

m (x,y)p1

m (x,y)pk

c (x,y)

Postprocesado

Imagensegmentada

i (x,y)s

Figura 19: Esquema para clasificar/segmentar imágenes de texturas propuesto por Weldon yHiggins

Este esquema fue utilizado para la segmentación de una imagen i(x; y) conN � 2 texturas

disjuntast1

; :::; t

. El método consta dek canales donde la primera etapa de cada canal

consta en filtrar a la imagen de entradai(x; y) con un filtro Gaborhj

(x; y) con1 � j � k.

Luego, a la respuesta del filtro Gabor aplicado,i

(x; y) con 1 � j � k, se le aplica el

operador magnitudj�j. Como respuesta del operador magnitud obtenemos am

(x; y) con

1 � j � k. Posteriormente, se aplica un filtro pasabaja Gaussiano denotado porgpk

(x; y) con

1 � j � k. La salida de este último paso lo denotamos porm

(x; y) con1 � j � k y se da

como entrada a un clasificador. Por último se aplica un postprocesamiento morfológico para

reducir el error de clasificación cerca de los bordes entre texturas de la imagen.

3.1.2. Configuración de filtros

El paradigma de detectores multicanal o bancos de filtros ha mostrado gran potencial en el

análisis de texturas. Algo de trabajo se ha invertido al estudio de ciertos tipos de filtros y su

configuración, sin embargo, la relación entre las diferencias entre texturas y la configuración

de los filtros necesaria para discriminarlas sigue, en gran parte, desconocida. El conocer la

configuración adecuada de un filtro en particular para la discriminación de dos texturas en

una imagen es esencial para la configuración de detectores multicanal (Dunnet al., 1994).

Figura 20: Esta figura muestra una imagen que consta de dos texturas compuesta por dos¨texeles¨ distintos,t

a la izquierda yt2

a la derecha y algunos parámetros que deben serdeterminados para configurar al filtro Gabor que las discrimine.

La configuración de un filtro Gabor se realiza al especificar cinco parámetros básicos de una

función elemental Gabor:U; V; �x

; y �. Utilizando el modelo de texturas de Dunnet al.

(1994), en el cual una imagen consiste de dos texturas distintas las cuales se conforman por

texelest1

, respectivamente (figura 20), esto es, por la regiónR

; �x

; �y

) y por la

regiónR2

; �x

; �y

).�xi

denota a la separación que existe entre texeles de alguna región

con textura compuesta por el texeli sobre el ejex, mientras que�yi

denota la separación que

existe entre texeles de alguna región con textura compuestapor el texeli sobre el ejey. A

partir de este modelo de texturas podemos especificar parámetros para un filtro que discierna

una textura de la otra.

La manera de determinar los parámetros adecuados para un filtro Gabor para dos texturas

dentro de una imagen se muestra en la tablaIII .

TablaIII : Criterios para elegir los parámetros de un filtro Gabor paradiscriminar dos texturasen una misma imagen.

Parámetro Criterio para determinar su valorV ar(x) �

= �x, tal que�x = m��n(�x

; �x

V ar(y) �

= �y, tal que�y = m��n(�y

; �y

(U; V ) U =

� Sobre la dirección de la cuadrícula de texeles

La elipse de la figura 20 muestra el contorno de la función Gaussiana del filtro Gabor. El

centro de la elipse, denotado por(x; y) representa la posición de la función elemental de

Gabor al momento que se calcula la salida del filtro Gabor en elpunto(x; y). La elección de

y �y

compromete a la variación de la salida del filtro Gabor y la exactitud de la localización

de fronteras entre texturas disímiles. Esto es, cuando�

> �x y �

el filtro captura a

múltiples texeles sin importar su posición dentro de la imagen. Aunque la posición de los

texeles varía dentro de la función Gaussiana mientras el filtro progresa a través de la imagen,

la salida o respuesta del filtro Gabor se mantiene aproximadamente constante sobre toda una

región. En el caso cuando�x

� �

o �y

� �

, la respuesta del filtro depende en si un texel

ocurre o no dentro de la función Gaussiana de la función elemental Gabor. Esto ocasiona,

como resultado del filtro, variaciones periódicas a través de la región. Para evitar variaciones

significantes en la respuesta del filtro, tanto�

como �

deben ser grandes para que el filtro

cubra a varios texeles. Si�x

son ambos grandes, la función Gaussiana del filtro se

extenderá a ambas regiones (en el caso de una imagen como la dela figura 20) ocasionando

mayor dificultad en la localización de fronteras. En la práctica, el desempeño de los filtros no

es significativamente sensible al valor de estos cocientes,por lo que se puede acordar fijarlos

al valor de la unidad,�x

y �y

3.1.3. Análisis de componentes principales

Existen problemas que surgen al intentar efectuar reconocimiento de patrones con datos

pertenecientes a espacios de dimensiones altas. Frecuentemente es conveniente hacer una

transformación de los datos a un espacio de dimensión menor.El propósito de la reducción

de dimensión de los datos es pasar de una representación de lainformación de alta dimen-

sión a una representación en un espacio de menor dimensión mientras mantenemos la mayor

cantidad de información relevante posible (Bishop, 1996).

El análisis de componentes principales o transformada de Karhunen-Loève fue por primera

vez descrita por Karl Pearson en 1901. En un principio este procedimiento fue utilizado en

problemas de biometría. La descripción de un procedimientode cómputo para llevar a cabo

el análisis de componentes principales fue realizado hasta1933 por Hotelling (Manly, 1994).

El análisis de componentes principales es un método multivariado cuyo objetivo es tomarp

variablesx1

; :::; x

y encontrar combinaciones de estas para producir nuevas variables

; :::; z

que sean no correlacionadas. Esta falta de correlación en los datos es una

característica deseable ya que nos garantiza que los índices midan diferentes ”dimensiones”

en la información. Estos índices se encuentran ordenados dela siguiente manera:

V ar(z

) � V ar(z

) � ::: � V ar(z

) (41)

dondeV ar(zi

) denota la varianza dezi

en el conjunto de datos bajo consideración. Estas

cantidadeszi

son llamadas componentes principales.

Al realizar análisis de componentes principales se espera que las varianzas de la mayoría

de los índices sean tan pequeñas tal que puedan ser descartados. Cuando esto sucede, la

variación del conjunto de datos puede ser descrita adecuadamente por un conjunto pequeño

de variableszj

. La representación consiste en:

x (42)

dondeA es la matriz formada por los primerosj vectores propios de la matriz de covarianza

de los datos. La variación de lasp variables originales es representada por las nuevas variables

cuya cantidad es menor quep. Esto es,j < p.

Debe notarse que no siempre el análisis de componentes principales funciona, esto es en

el sentido que fuerza a un conjunto grande de variables a ser representadas por un conjun-

to menor de variables transformadas. Si las variables originales no están correlacionadas,

entonces el análisis de componentes principales no es apto para reducir la dimensión de los

datos. Los mejores resultados se obtienen cuando las variables originales son altamente corre-

lacionadas, positiva o negativamente. En este caso, podemos considerar que veinte o treinta

variables pueden adecuadamente ser representadas por dos otres componentes principales

(Manly, 1994).

3.1.4. Medición de distancias multivariadas

Una gran cantidad de problemas pueden ser vistos en términosde distancias entre:

Observaciones individuales;

Muestras de observaciones;

Poblaciones de observaciones.

Varios métodos para la medición de distancias han sido propuestos y utilizados en el análisis

multivariado (Manly, 1994).

3.1.4.1. Distancias entre observaciones individuales

Si deseamos medirn individuos, y cada uno posee valores parap variablesx1

; :::; x

Los valores para el individuoi pueden ser denotados porxi1

; :::; x

y aquellos valores

para el individuoj porxj1

; :::; x

. El problema que nos interesa es el medir la ¨distancia¨

entre el individuoi y el individuoj.

3.1.4.1.1. Distancia Euclidiana Un tipo de medida de distancia que puede servir en

muchas aplicaciones es la distancia Euclidiana:

2 (43)

Sabemos que si uno de los fenómenos medidos varía mucho más que los otros, entonces, este

dominará el cálculo de las distancias. En la práctica, es usualmente deseado que todas las

variables tengan la misma influencia en el cálculo de las distancias. Esto se logra cambiando

la escala de las variables antes de hacer el cálculo de las distancias para estandarizarlas. La

estandarización se puede lograr dividiendo cada variable entre su desviación estándar para

losn individuos siendo comparados (Manly, 1994).

3.1.4.2. Distancias entre poblaciones y muestras

Han habido diversos métodos propuestos para la medición de distancias multivariadas entre

poblaciones cuando existe información disponible acerca de sus medias, varianzas y covari-

anzas (Manly, 1994).

3.1.4.2.1. Distancia de Penrose Si analizamosg poblaciones y las distribuciones multi-

variadas de estas poblaciones son conocidas parap variablesx1

; :::; x

. Sea�ki

la media

de la variablexk

de lai-ésima población y suponemos que la varianzaV

es igual para todas

las poblaciones. Penrose en 1953 propuso una medida para la distancia entre la poblacióni y

la poblaciónj.

� �

pV (k)

Una desventaja que posee la distancia Penrose para muchas aplicaciones es que esta medida

no toma en cuenta la correlación entre lasp variables (Manly, 1994).

3.1.4.2.2. Distancia de Mahalanobis Otra medida de distancia que en cambio sí toma

en cuenta la correlación entre variables es la distancia de Mahalanobis denotada por:

� �

) (45)

tal quevrs denota el elemento delr-ésimo renglón y de las-ésima columna de la matriz

inversa de la matriz de covarianza para lasp variables. Una forma cuadrática que puede

denotar a la distancia Mahalanobis es la siguiente:

= (�

� �

V (�

� �

) (46)

este vector�i

es el vector de medias para lai-ésima población yV es la matriz de covarianza.

Esta medida solo puede ser utilizada si la matriz de covarianzaV es la misma para todas las

poblaciones.

La distancia de Mahalanobis es frecuentemente utilizada para medir la distancia entre una

observación en particular y el centro de la población de la cual esta observación en particular

proviene.

Si x= x

; :::; x

son los valores deX = X

; :::; X

para el individuo cuya población

que lo origina posee valores medios� =�

; :::; �

entonces:

� �

) (48)

= (x� �)

V (x� �) (49)

Si estas ecuaciones son utilizadas para datos de muestras, la matriz de covarianzaV debe

ser reemplazada con una estimación que tome en cuenta todas las muestras disponibles. Si

existenm muestras donde lai-ésima muestra es de tamañoni

con una matriz de covarianza

muestral deCi

entonces es la aproximación de la matriz de covarianza que tome en cuenta

todas las poblaciones disponibles se denota por:

� 1)C

� 1)

En principio la distancia de Mahalanobis, para muchas aplicaciones, es una medida de dis-

tancia superior a la distancia de Penrose. La superioridad de esta medida de distancia se basa

en que la distancia Mahalanobis, a diferencia de la distancia de Penrose, utiliza información

de las covarianzas (Manly, 1994).

3.2. Esquema propuesto

El esquema propuesto para encontrar la correspondencia entre imágenes de texturas consiste

en la utilización de detectores multicanal Gabor para obtener características de cada una de las

imágenes. Luego, disminuir la dimensión de los datos por medio del análisis de componentes

principales (transformada de Karhunen-Loève), y por último medir la distancia Penrose entre

la imagen que llamamos imagen fuente y cada una de las demás imágenes, estas últimas

llamadas imágenes destino.

La imagen fuente es aquella de la cual serán medidas las distancias hacia las demás imágenes,

estas últimas llamadas imágenes destino.

Cada una de las imágenes a tratar es procesada por un detectormulticanal de la forma que se

observa en la figura 21.

Textura fuente

Filtrado Gabor

No linealidad

Función suavizante

Transformada deKarhunen-Loève

Generación denube de puntos

Figura 21: Esquema propuesto para la extracción de características de cada una de las texturasa procesar por el sistema.

La extracción de características propuesta consta en procesar a cada una de las imágenes por

cinco etapas: filtrado Gabor, aplicación de una no linealidad, una función suavizante, análisis

de componentes principales, y convertir los datos arrojados por el análisis de componentes

principales a una nube o cúmulo de puntos en un espacion-dimensional, donden es la can-

tidad de componentes principales utilizados.

3.2.1. Filtrado Gabor

La etapa de filtrado, en un esquema multicanal, aplica filtrosGabor a diferentes escalas y ori-

entaciones a la imagen de entrada. Esta etapa es semejante a aquellas aplicadas por otros au-

tores como Dunnet al. (1994) y Randen (1997), pero a diferencia de otros métodos nosotros

solamente utilizaremos la parte real de las funciones Gabor.

Las funciones Gabor reales actúan como detectores de manchas (blob detectors) (Casasent

y Smokelin, 1994) mientras que las funciones Gabor imaginarias actúan como detectores

de bordes. Malik y Perona (1994) han mostrado que las funciones Gabor imaginarias no

son útiles para la discriminación de texturas. Kumar y Pang (2000) asegura que mientras la

contribución de funciones Gabor imaginarias para el análisis de texturas es insignificante,

estas son responsables por casi el 50 % del tiempo de cómputo.

Un aspecto negativo para el uso de filtros Gabor es que son computacionalmente costosas.

Por esta razón, sumado a lo anteriormente mencionado, en nuestro trabajo solo utilizaremos

funciones Gabor reales (34) e ignoraremos las imaginarias(35).

Aunque existe evidencia experimental que sugiere que la capacidad de un detector multicanal

de discernir texturas aumenta mientras mayor sea la cantidad de canales que se utilicen (Wel-

don y Higgins, 1996), recomendamos utilizar un conjunto de 16 filtros Gabor para extraer

características de cada una de las imágenes involucradas ennuestro análisis. Este conjunto

de funciones autosimilares son obtenidas al variar el parámetro de rotación� y su frecuencia

(figura 15).

Las cuatro frecuencias espaciales que se deberán utilizar son:fm�ax

,fm�ax =2

,fm�ax =4

,fm�ax =8

frecuenciafm�ax

denota la frecuencia que permita que ocurra un texel de la textura cuyo es-

paciamiento entre texeles sea la menor. Los ángulos que se utilizarán son rotaciones de45Æ,

desde0Æ hasta135Æ (0,45,90,135 grados).

Se deberá limitar la cantidad de canales del banco de filtros debido al compromiso que existe

en la cantidad de canales y el desempeño del sistema. Además,el utilizar 16 canales en el

esquema planteado es respaldado por evidencias biológicasque aseguran una similar cantidad

de canales de procesamiento utilizados por el sistema visual humano (Daugman, 1984).

3.2.2. No linealidad

El objetivo de hacer un filtrado multicanal Gabor y posteriormente aplicar una no linealidad

es el transformar a las fronteras o bordes entre texturas en discontinuidades detectables (Ran-

den y Husøy, 1994). Mientras que varios autores (Randen y Husøy, 1994; Farrokhnia, 1990;

Kubota y Huntsberger, 1998) han determinado la sigmoide rectificada apropiada, también

puede utilizarse un simple operador:

tanh (�x) (51)

Nosotros hemos optado por utilizar el cuadrado para nuestromodelo, esto es, elevar al cuadra-

do cada elemento de la imagen de entrada. Sin embargo, damos la opción de aplicar cualquiera

de estos dos operadores mencionados.

3.2.3. Función suavizante

La función suavizante que se deberá utilizar es una función Gaussiana con parámetros tales

que eliminen, lo más posible, altas frecuencias de la imagentratada. Aunque es posible uti-

lizar otros tipos de filtros para la eliminación de las altas frecuencias, La función Gaussiana

localiza fronteras entre texturas de manera adecuada (Randen y Husøy, 1994).

3.2.4. Transformada de Karhunen Loève

Después de haber filtrado la textura, aplicado la no linealidad y suavizado la imagen obten-

emos como resultado imágenes, una por cada canal de nuestro detector multicanal (figura

3.2.4.1. Vector de observaciones

Si tomamos los valores�i

correspondientes a los niveles de intensidad en la posición(x; y) de

la i-ésima imagen (22), podemos formar un vectorX

de dimensiónd. Este vectorX(x;y)

se puede considerar como una observación de cierto fenómenodescrito por un conjunto de

d variables�i

donde el fenómeno es la textura que nos interesa y cada�

es la respuesta

del canali de nuestro banco de filtros para la posición(x; y) de lai-ésima imagen. Si este

es el caso, entonces la imagen de la textura que buscamos de dimensiónm� n puede verse

como un conjunto dem� n observaciones de la textura regida pord variables (debido a que

utilizamosd filtros y obtenemosd imágenes de salida). La estrategia para obtener los vectores

de observaciones se ilustra en la figura 22.

Figura 22: Obtención del vector de observacionesX

a partir de lasd imágenes de salidadel detector multicanal

3.2.4.2. Matriz de observaciones

A partir de este planteamiento podemos definir lo que llamaremos una matriz de observa-

ciones. Tomando al vectorX(x;y)

= [�

; :::; �

℄ como un vector que describe una obser-

vación en particular. A la matriz de observaciones la definimos como el conjunto de todas

las observacionesX(x;y)

dondex = 0; 1; 2; :::; m e y = 0; 1; 2; :::; n. El elemento�i;j

matriz de observaciones para un fenómeno dado denota al valor de laj-ésima variable para

la i-ésima observación.

El formato que deberá llevar la matriz de observaciones se muestra en la tablaIV .

TablaIV : Formato de una matriz de observaciones

Observación Variable 1 Variable 2 ... VariabledX

... �

......

m�n;1

m�n;2

... �

m�n;d

Si se plantea esta forma de preprocesamiento de nuestras imágenes, podemos aplicar la trans-

formada de Karhunen-Loève o Análisis de Componentes Principales sobre la matriz de ob-

servaciones para reducir la dimensión de nuestros datos.

Al aplicar la transformada de Karhunen-Loève podemos utilizar algunos pocos, digamos

l < d (4 o 5), componentes principales para describir nuestra textura. Al hacer esto, pasamos a

representar a cada observación de la texturaX

= [�

℄ parai = 1; 2; :::; d, comoZ(x;y)

parak = 1; 2; :::; l.

Nuestro objetivo será comparar la matriz de observaciones de la imagen fuente con la de la

imagen desino.

3.2.5. Cálculo de correspondencias entre características

Después de realizar la extracción de características de cada una de las imágenes de texturas

involucradas en nuestro sistema, debemos encontrar una métrica que nos indique si existe una

correspondencia entre dos texturas o no.

Dado que las características de cada una de las imágenes tratadas son vistas como un cúmulo

de puntos en un espaciod-dimensional, podemos medir la similitud entre un par de texturas

midiendo la distancia multivariada de sus características, es decir de los cúmulos o nubes de

puntos que las representan.

El método para medir las distancias entre los cúmulos de puntos de las texturas que se utilizará

es la distancia de Penrose. Utilizaremos la distancia de Penrose dado que esta no requiere el

uso de una matriz de covarianza. Esta cualidad, en muchas aplicaciones es indeseable, pero

en nuestro caso, el hecho de que no tome en cuenta a una matriz de covarianza es una cualidad

que nos ahorra recursos de cómputo. Además, el uso de una matriz de covarianza para nue-

stros cálculos es innecesario dado que al aplicar el análisis de componentes principales hemos

eliminado la correlación de las variables originales. Las nuevas variables transformadas, de

las cuales construimos los cúmulos de puntos, no están correlacionadas.

Al medir las distancias multivariadas entre los cúmulos de puntos de las imágenes de texturas

involucradas en nuestro sistema podremos darnos cuenta de la correspondencia entre ellas.

Los valores de la distancia entre dos imágenes serán menoresmientras la correspondencia

entre ellas sea mayor, y viceversa. Es decir, la distancia Penrose entre las características de

texturas es inversamente proporcional a la correspondencia que existe entre ellas.

Globalmente el sistema propuesto para encontrar la correspondencia entre texturas se muestra

en la figura 23.

Textura fuente

Filtrado Gabor

No linealidad

Función suavizante

Textura destino 1

Filtrado Gabor

No linealidad

Función suavizante

Textura destino 2

Filtrado Gabor

No linealidad

Función suavizante

Textura destino N

Filtrado Gabor

No linealidad

Función suavizante

Cálculo de correspondencias entre características

Distancia entre la textura fuentey las texturas destino

Figura 23: Esquema general del sistema para encontrar correspondencias entre texturas

3.3. Identificación de estructuras sedimentarias contiguas

A menudo es necesario conocer si la estructura sedimentariade dos texturas distintas corre-

sponde a una sola tomada con una contigüidad a la otra. Esto es, verificar que aun cuando dos

texturas no correspondan a ser las mismas, una sea continuación, por la derecha o izquierda,

de otra.

Un ejemplo de una textura que es continuación de otra es el caso de las texturas S14 y S15

(figura 46). Si colocamos el extremo izquierdo de la textura S15 junto al extremos derecho

de la textura S14 (buscando continuidad por la derecha) se puede observar que los extremos

de estas dos texturas empatan. De la misma manera podemos encontrar que la textura S2 es

una continuación por la derecha de S1 (figura 46).

En el pasado el verificar si una textura formada por sedimentos laminados es continuación

de otra se realizaba exclusivamente de manera visual y se carecía de un método automático o

semi-automático que verificara la contigüidad de pares de texturas.

A continuación presentamos un esquema que logra determinarla contigüidad de dos texturas.

Al realizar el análisis para encontrar la contigüidad de dostexturas se conoce que solo existen

tres posibilidades como resultado:

1. Que las dos imágenes no correspondan a la misma textura ;

2. Que las dos imágenes correspondan a la misma pero no empaten los extremos (cambio

de fase);

3. Que las dos imágenes correspondan (o casi correspondan) ala misma y empaten los

extremos;

Ejemplos para cada uno de estos casos se muestran en la figura 24.

(a) (b) (c)

Figura 24: Tipos de contiguidad que existe entre imágenes detexturas de sedimentos lamina-dos.(a) muestra dos imagenes de sedimentos laminados distinos. (b) muestra dos imágenes desedimentos laminados que corresponden a la misma textura pero no empatan sus extremos.En (c) las imagenes corresponden (o casi corresponden) a la misma textura y empatan susextremos

El método propuesto para identificar estructuras sedimentarias contiguas se basa en el conocimien-

to que se tiene acerca de las discontinuidades que se generanen las vecindades cercanas a

las fronteras entre texturas al aplicar el método propuesto. Según Dunnet al. (1994), cuando

se aplica un canal de un banco de filtros Gabor como el que hemospropuesto a una imagen

compuesta por dos texturas distintas se genera un escalón entre ellas, de igual manera, cuan-

do se aplica un canal del banco de filtros Gabor a una imagen compuesta por dos regiones

que contienen la misma textura, pero una de ellas se encuentra desfasada verticalmente, se

genera un impulso abrupto en la frontera. Como sabemos que sidos texturas que empatan en

sus fronteras y son parecidas (poseen semejante frecuenciay orientación) son vistas por el

método propuesto como una sola textura, podemos asegurar que al aplicar un canal del banco

de filtros Gabor no se generan discontinuidades (escalón o impulso) entre ellas.

Lo primero que se debe hacer para aplicar el método para determinar la contigüidad de dos

texturas que describen estructuras sedimentarias es juntar lado a lado a las dos imágenes cuya

contigüidad se desea poner a prueba. Después se puede seleccionar solamente una vecindad

que abarque a la frontera entre las dos texturas así como una región de cada textura. La figura

24 muestra algunas de estas imágenes listas para probar su contigüidad.

Ahora, para determinar si dos texturas contenidas en una imagen preparada de la manera

descrita anteriormente son contiguas o no, proponemos los siguientes criterios:

1. Si al aplicar un canal del banco de filtros Gabor a la imagen obtenemos una imagen sin

discontinuidades (escalón o salto abrupto), entonces las dos texturas son contiguas y

empatan exactamente en sus fronteras.

2. Si al aplicar un canal del banco de filtros Gabor a la imagen obtenemos una imagen

con una discontinuidad de tipo escalón, entonces las dos texturas son distintas.

3. Si al aplicar un canal del banco de filtros Gabor a la imagen obtenemos una imagen con

una discontinuidad de tipo salto abrupto o delta y se mantienen las correspondientes

regiones a cada textura a intensidad semejante, entonces las dos texturas son contiguas

pero no empatan exactamente en sus fronteras. Esto es, son las mismas texturas pero

una se encuentra desfasada verticalmente.

Para los casos en que se requiera determinar si existe o no un salto abrupto entre dos texturas

se puede utilizar un detector de bordes (a 90 grados) de Cannypara resaltar esta característica.

Un ejemplo para el criterio 1 aplicado sobre la imagen 24 (c) se observa en la figura 25. Un

ejemplo para el criterio 2 aplicado sobre la imagen de la figura 24(a) se observa en la figura

38(d). Como ejemplo para el criterio 3 se muestra en la figura 26.

Figura 25: aplicación de un canal del banco de filtros Gabor. No existe discontinuidad entretexturas, por lo que las dos estructuras sedimentarias son contiguas.

En la figura 26 se observa una imagen que representa el resultado de aplicar nuestro proced-

imiento a dos texturas idénticas desfasadas.

Figura 26: aplicación de un canal del banco de filtros Gabor a dos estructuras sedimentariasidenticas desfazadas. Existe una discontinuidad (salto) en la imagen que resulta de aplicar elfiltro Gabor y el suavizado.

Capítulo 4

Experimentación

En este capítulo se presentan algunos resultados de aplicarlos métodos propuestos en la

sección 3.2 a imágenes de texturas.

En la sección 4.1 presentamos la configuración básica adoptada para encontrar corresponden-

cias entre imágenes de texturas Brodatz y de sedimentos laminados.

En la sección 4.2 se procesan imágenes compuestas por dos texturas con el fin de observar

resultados visuales de la aplicación del método propuesto.

En la sección 4.3 se aplica el software desarrollado para encontrar correspondencias entre

imágenes de texturas Brodatz.

En la sección 4.4 se aplica el software desarrollado para encontrar correspondencias entre

imágenes de texturas de sedimentos laminados.

Como manera de análisis de las distintas métricas en espacios multivariados y de la influencia

de la transformada de Karhunen-Loève (TKL) se calculan las correspondencias entre texturas,

tanto de Brodatz como de sedimentos laminados, usando las siguientes configuraciones:

1. Distancia Euclidiana aplicada a características obtenidas después de aplicar la TKL a

la salida del banco de filtros Gabor;

2. Distancia Euclidiana aplicada a características obtenidas directamente del banco de

filtros Gabor;

3. Distancia Mahalanobis aplicada a características obtenidas directamente del banco de

filtros Gabor;

4. Distancia Penrose aplicada a características obtenidasdespués de aplicar TKL a la

salida del banco de filtros Gabor;

5. Distancia Penrose aplicada a características obtenidasdirectamente del banco de filtros

Gabor.

4.1. Configuración del sistema para pruebas

La configuración del sistema se llevó a cabo sintonizando al banco de la manera discutida en

la sección 3.1.2. Si suponemos que la ocurrencia de los texeles de una textura ocurre cada 5

pixeles, tanto enx como eny, podemos fijar a�x

y la frecuencia máximafmax

se indica en la tablaIII . De esta forma podemos deducir los valores de los 16 canales del

detector multicanal.

Los valores de configuración del detector multicanal utilizado para pruebas se muestran en la

tablaV. En todos los casos se utilizó como función no lineal la cuadrática y se usó un filtro

Gaussiano con varianza 4 y dimensión 7.

Tabla V: Configuración básica del detector multicanal propuesto para discriminar texturasBrodatz y de sedimentos laminados

Canal Filtros Gabordimensión orientación �

1 7 0 5 5 1.256637061 1.2566370612 7 0 10 10 0.628318531 0.6283185313 7 0 20 20 0.314159265 0.3141592654 7 0 40 40 0.157079633 0.1570796335 7 45 5 5 1.256637061 1.2566370616 7 45 10 10 0.628318531 0.6283185317 7 45 20 20 0.314159265 0.3141592658 7 45 40 40 0.157079633 0.1570796339 7 90 5 5 1.256637061 1.25663706110 7 90 10 10 0.628318531 0.62831853111 7 90 20 20 0.314159265 0.31415926512 7 90 40 40 0.157079633 0.15707963313 7 135 5 5 1.256637061 1.25663706114 7 135 10 10 0.628318531 0.62831853115 7 135 20 20 0.314159265 0.31415926516 7 135 40 40 0.157079633 0.157079633

4.2. Aplicación del método a imágenes compuestas de dos

texturas

A continuación presentamos los resultados de aplicar uno delos canales de nuestro método

configurado para discernir entre dos texturas dentro de una misma imagen. Esto es, aplicamos

un filtro Gabor sintonizado, elevamos la imagen resultante al cuadrado y por último aplicamos

un filtro Gaussiano. El objetivo de los experimentos es ilustrar la capacidad para discernir

entre dos texturas.

4.2.1. Experimento 1

En este experimento se procesa la imagen en la figura 27 compuesta por dos texturas artifi-

ciales distintas. Después de aplicar el método propuesto seobtiene como resultado la imagen

en la figura 28, donde se observa que el nivel de los pixeles de una de las texturas es resaltado

mientras el nivel de los pixeles de la otra textura son suprimidos. El efecto que tiene aplicar

cada uno de los pasos del método sobre la imagen original se observa en la figura 29.

Figura 27: Imagen de prueba construida por dos texturas.

Figura 28: Imagen resultado de aplicar un canal del método propuesto para discernir entredos texturas.

Figura 29: Gráfica de los valores de los pixeles de la imagen original (a). Valores de lospixeles de la imagen filtrada por un filtro Gabor sintonizado (b). Valores de los pixeles dela imagen después de aplicar a (b) el operador(�)

2(c). Resultado de aplicarle a (c) un filtrosuavizante Gaussiano (d).

En este experimento se procesa la imagen en la figura 30 compuesta por dos texturas Brodatz

distintas. Después de aplicar el método propuesto se obtiene como resultado la imagen en

la figura 31, donde se observa que el nivel de los pixeles de unade las texturas es resaltado

Figura 30: Imagen de prueba construida por dos imágenes de texturas Brodatz: D6 en el fondoy D17 en el centro.

Figura 31: Imagen resultado de aplicar un canal del método propuesto para ldiscernir entredos texturas.

Figura 32: Gráfica de los valores de los pixeles de la imagen original (a). Valores de lospixeles de la imagen filtrada por un filtro Gabor sintonizado (b). Valores de los pixeles dela imagen despues de aplicar a (b) el operador(�)

En este experimento se procesa la imagen en la figura 33, compuesta por dos texturas Brodatz

distintas. Después de aplicar el método propuesto se obtiene como resultado la imagen en la

figura 34, donde se observa que el nivel de los pixeles de una delas texturas es resaltado

Figura 33: Imagen de prueba construida por dos imágenes de texturas Brodatz: D5 a laizquierda y D92 a la derecha

Figura 35: Gráfica de los valores de los pixeles de la imagen original (a). Valores de lospixeles de la imagen filtrada por un filtro Gabor sintonizado (b). Valores de los pixeles de laimagen después de aplicarle a (b) el operador(�)

En este experimento se procesa la imagen en la figura 36, compuesta por dos texturas de

sedimentos laminados distintas. Después de aplicar el método propuesto se obtiene como

resultado la imagen en la figura 37, donde se observa que el nivel de los pixeles de una de

las texturas es resaltado mientras el nivel de los pixeles dela otra textura son suprimidos. El

efecto que tiene aplicar cada uno de los pasos del método sobre la imagen original se observa

en la figura 38.

Figura 36: Imagen de prueba compuesta por dos texturas de sedimentos laminados.

Figura 38: Gráfica de los valores de los pixeles de la imagen original (a). Valores de lospixeles de la imagen filtrada por un filtro Gabor sintonizado (b). Valores de los pixeles dela imagen después de aplicar a (b) el operador(�)

4.3. Experimentos con imágenes Brodatz

Para los siguientes experimentos se utilizaron algunas imágenes de texturas Brodatz (1966).

Estas imágenes forman un conjunto utilizado como pruebas por varios autores como Randen

y Husøy (1999). Aunque el objetivo de nuestro trabajo no es elencontrar correspondencias

entre imágenes de texturas Brodatz, consideramos importante someter a estas imágenes a

pruebas (figura 39).

Estas imágenes fueron suministradas al sistema para encontrar algunas correspondencias en-

tre ellas. También, se perturbaron algunas de estas imágenes para mostrar la sensibilidad del

sistema. Las imágenes de Brodatz perturbadas se muestran enla figura 40.

D1 D2 D3 D4

D5 D6 D8 D10

D18 D35 D36 D49

D64 D65 D94 D95

Figura 39: Imágenes de texturas Brodatz utilizadas en las evaluaciones del sistema.

D5pert D94r1 D94r2 D94r3

Figura 40: Imágenes perturbadas de prueba Brodatz. A la imagen D94 se le añadió ruidoGaussiano con� = 10 (D94r1),� = 20 (D94r2) y� = 30 (D94r3), respectivamente.

El resultado de buscar correspondencias de algunas imágenes de texturas Brodatz de acuerdo

a las configuraciones descritas en la sección 4 se muestra a continuación.

En este experimento se calculan las correspondencias entrela imagen fuente D1 y las imá-

genes destino D1, D2, D3, D4, D5, D6, D8, D10, D18, D35, D36, D49, D64, D65, D94 y

D95. La correspondencia entre las texturas se calculó para todas las configuraciones men-

cionadas en la página en la página 76. El resultado del cálculo de estas correspondencias se

muestra en las figuras 41, 42 y 43, respectivamente .

D1 D2 D3 D4 D5 D6 D8 D10D18D35D36D49D64D65D94D950

Texturas Destino

12x 10

Texturas Destino

Figura 41: Correspondencias para la textura D1 calculadas por medio de las distancias: (a)Mahalanobis sin TKL y (b) Mahalanobis con TKL.

14x 10

Texturas Destino

14x 10

Texturas Destino

Figura 42: Correspondencias para la textura D1 calculadas por medio de las distancias: (a)Euclidiana sin TKL y (b) Euclidiana con TKL.

Texturas Destino

Figura 43: Correspondencias para la textura D1 calculadas por medio de las distancias: (a)Penrose sin TKL y (b) Penrose con TKL.

De este experimento, como se ilustra en la figura 43, se puede determinar que la mejor dis-

criminación entre una imagen fuente (en este caso D1) y otrasimágenes destino se obtiene al

utilizar la métrica de Penrose entre características obtenidas al aplicar la TKL .

En este experimento se calculan las correspondencias entrelas imágenes fuente D2 y D35

con las imágenes destino D1, D2, D3, D4, D5, D6, D8, D10, D18, D35, D36, D49, D64,

D65, D94 y D95. La correspondencia entre las texturas se calculó utilizando la distancia de

Penrose con 5 componentes principales. El resultado del cálculo de estas correspondencias

se muestra en la figura 44.

D1 D2 D3 D4 D5 D6 D8 D10 D18 D35 D36 D49 D64 D65 D94 D950

Textura Destino

2.5x 10

Texturas Destino

Figura 44: Correspondencia calculada (a) para la imagen D2 yla imagen (b) D35.

De este experimento podemos determinar que las texturas quemás se parecen a (empata con)

D2 son la imagen D5 seguida por D18. Así mismo, para la texturaD35, la más parecida

resulta ser la D36.

En este experimento se calculan las correspondencias entrela imagen fuente D5 con las

imágenes destino D65, D94, D95, D5pert y D94pert y la imagen fuente D94 con las imágenes

destino D94r1, D94r2 y D94r3. La correspondencia entre las texturas se calculó utilizando

la distancia de Penrose con 5 componentes principales. El resultado del cálculo de estas

correspondencias se muestra en la figura 45.

D65 D94 D95 D5pert D94r10

18x 10

Texturas Destino

D94r1 D94r2 D94r30

Texturas Destino

Figura 45: (a) Correspondencia entre la imagen D5 y varias texturas Brodatz. (b) Correspon-dencia entre D94 y texturas D94 de Brodatz con varios nivelesde ruido Gaussiano.

De este experimento podemos deteminar que el empatamiento entre texturas con perturba-

ciones es posible. Esto se deduce después de observar cómo laimagen D5 es empatada a

la imagen D5pert en la figura 45 (a). De igual manera podemos observar en 45 (b) la gran

similitud entre la imagen D94 y ella misma con varios nivelesde ruido Gaussiano.

4.4. Experimentos con imágenes de sedimentos laminados

Para los siguientes experimentos se utilizaron imágenes desedimentos laminados. A partir de

las imágenes de la figura 7 se obtuvieron regiones de 112x112 pixeles cada uno para formar

nuestras imágenes de pruebas (figura 46). Estas imágenes fueron suministradas al sistema

para encontrar algunas correspondencias entre ellas. También, se perturbaron algunas de estas

imágenes para mostrar la sensibilidad del sistema (figura 47).

S1 S2 S3 S4

S5 S6 S7 S8

S9 S10 S11 S12

S13 S14 S15 S16

S17 S18 S19 S20

Figura 46: Imágenes de prueba de sedimentos laminados

S5pert S14r1 S14r2 S14r3

Figura 47: Imágenes perturbadas de prueba de sedimentos laminados. A la imagen S14 se leañadió ruido Gaussiano con� = 10 (S14r1),� = 20 (S14r2b) y� = 30 (S14r3), respectiva-mente.

En este experimento se calculan las correspondencias entrela imagen fuente S14 con las

imágenes destino S14r1, S14r2 y S14r3, y la imagen fuente S5 con las imágenes destino

S5pert, S14r1, S14r2 y S14r3. La correspondencia entre las texturas se calculó utilizando

la distancia de Penrose con 5 componentes principales. El resultado del cálculo de estas

S5pert S14r1 S14r2 S14r30

Texturas Destino

S14r1 S14r2 S14r30

3.5x 10

Texturas Destino

Figura 48: (a)Correspondencia calculada entre la textura S5pert y otras texturas de sedimentoslaminados. (b) Correspondencia calculada entre la imagen de sedimentos laminados S14 yS14 con varios niveles de ruido.

De este experimento podemos determinar que el empatamientoentre texturas de sedimentos

laminados con perturbaciones es posible. Esto se deduce después de observar cómo la imagen

S5 es empatada a la imagen S5pert en la figura 48 (a). De igual manera podemos notar que

entre más grande sea el nivel de ruido entre dos imágenes, mayor será la distancia entre

ellas ya que para el caso de la imagen S14 la menor distancia (empatamiento) resultó con

la imagen S14r1 (figura 49 (b)) mientras que con las imágenes S14r y S14r2 las distancias

incrementaron, respectivamente.

En este experimento se calculan las correspondencias entrela imagen fuente S1 con las imá-

genes destino S1, S2, S3, S4, S5,S6 y S7, y la imagen fuente S16con las imágenes destino

S9, S10, S12, S14, S16, S18 y S20. La correspondencia entre las texturas se calculó utilizan-

do la distancia de Penrose con 5 componentes principales. Elresultado del cálculo de estas

S1 S2 S3 S4 S5 S6 S70

Texturas Destino

S9 S10 S12 S14 S16 S18 S200

Texturas Destino

Figura 49: (a)Correspondencia calculada entre la textura S1 y otras texturas de sedimentoslaminados. (b) Correspondencia calculada entre la imagen S16 y otros sedimentos laminados.

De este experimento podemos deducir que el empatamiento de la imagen S1 resulta con la

imagen S5. Esto debido a que la distancia entre ellas es menorque la distancia entre S1 y

cualquier otra imagen destino. De igual manera el empatamiento de la imagen S16 se da con

la imagen S18.

En este experimento se analizan las dos imágenes de sedimentos laminados que se muestran

en la figura 50. Estas imágenes de sedimentos laminados son ligeramente distintas, sin em-

bargo, pertenecen al mismo sitio. El objetivo del experimento es mostrar cómo se realiza el

procedimiento de anclar puntos de una imagen como la imagen 50 (b) con la ayuda de otra,

como la imagen 50 (a).

(a) (b)

Figura 50: Imágenes distintas de sedimentos laminados pertenecietes a un mismo sitio. Laimagen (a) servirá para anclar dos puntos de la imagen (b).

Para este exerimento realizamos los siguientes pasos:

1. Seccionamos las imágenes involucradas en 35 cuadros (7 renglones y 5 columnas)

como se ilustra en la figura 51;

2. Luego, se elige un cuadro de la primera columna de la imagende la figura 50 (b) y

se busca uno que le corresponda en la primera columna de la imagen de la figura 50

(a). Esto se realiza para un cuadro de cada columna restante de 50 (b). Al terminar este

procedimiento, hemos situado la primer ancla.

3. Luego, se procede a realizar lo mismo pero para otro cuadrode la primera columna,

esto para fijar una segunda ancla.

(a) (b)

Figura 51: Imágenes seccionadas en 7 renglones y 5 columnas,respectivamente. Estas imá-genes sirven como base para realizar búsquedas de correspondencias entre las secuenciassedimentarias.

El resultado de aplicar el esquema propuesto para anclar puntos en imágenes de sedimentos

laminados por medio de la búsqueda de correspondencias entre estructuras sedimentarias se

muestra en las gráficas de las figuras 52 y 53, respectivamente.

En este caso, para anclar el primer punto, se buscaron las correspondencias entre cada textura

contenida en los cuadros del tercer renglón de la imagen de lafigura 51 (a) y las texturas

contenidas en la imagen de la figura 51 (b). De la misma manera,para anclar el segundo

punto, se buscaron las correspondencias entre cada texturacontenida en los cuadros del quinto

renglón de la imagen de la figura 51 (a) y las texturas contenidas en la imagen de la figura 51

x 1030

ColumnasRenglones

Figura 52: Correspondencias calculadas entre las texturascontenidas en el tercer renglón dela imagen de la figura 51 (a) y aquellas contenidas en la imagende la figura 51 (b).

x 1030

Columnas

Renglones

Figura 53: Correspondencias calculadas entre las texturascontenidas en el quinto renglón dela imagen de la figura 51 (a) y aquellas contenidas en la imagende la figura 51 (b).

Capítulo 5

Conclusiones y contribuciones

Las conclusiones y contribuciones más importantes de este trabajo se describen a continua-

ción:

El problema de encontrar correspondencias entre texturas yen particular el de encon-

trar la correspondencia entre imágenes de texturas formadas por sedimentos laminados

ha sido considerado usando como herramienta los filtros Gabor y el análisis de compo-

nentes principales.

El sistema propuesto para encontrar empatamiento consisteen tomar imágenes, apli-

carlas a un banco de filtros Gabor, realizar un posprocesado ycompararlas en base a un

análisis de componentes principales.

El sistema propuesto para el análisis de contigüidad consiste en formar una imagen

compuesta, aplicar un filtro Gabor, realizar un postprocesado y en la imagen resultante

buscar discontinuidades o saltos.

De los experimentos realizados podemos concluir que el uso de filtros Gabor es de

gran utilidad para el análisis de texturas. Esto debido a su baja sensibilidad a ruido y

perturbaciones, así como a su sensibilidad en orientación,que permite la detección de

cambios locales en orientación de las texturas de sedimentos laminados.

Se realizaron experimentos com imágenes de texturas y de sedimentos laminados en-

contrando que es posible realizar labores de búsqueda de correspondencia en imágenes,

distinguiendo entre imágenes de sitios distintos y logrando encontrar aquellos sitios con

textura contigua.

Se ha propuesto un método, software programado en Java, y esquema de configuración

para encontrar la correspondencia entre texturas.

Bibliografía

Ahuja, N. 1982. "Dot Pattern Processing Using Voronoi Neighborhoods". IEEE Transactionson Pattern Analysis and Machine Intelligence. 4(3):336-343 p.

American Cancer Society. 2003. Çancer Facts and Figures". http://www.cancer.org

Azencott, R., J.-P. Wang y L. Younes. 1997. "Texture Classification Using WindowedFourier Filters". IEEE Transactions on Pattern Analysis and Machine Intelligence.19(2):148-153 p.

Baumgartner, T., L. Sautter and V. Ferreira Bartrina. 1992.Reconstruction of the Historyof Pacific Sardine and Northern Anchovy Populations Over thePast Two Millennia fromSediments of the Santa Barbara Basin, California". CalCOFIReports. 33:24-40 p.

Bishop, C.M. 1996. "Neural Networks for Pattern Recognition". Oxford University Press.Primera edición. Oxford. 475 pp.

Blakemore, C. y F.W. Campbell. 1969. .On the Existence of Neurons in the Human Visu-al System Selectively Sensitive to the Orientation and Sizeof Retinal Images". Journal ofPhysiology. 203:237-260 p.

Bowyer, K.W. y P.J. Phillips. 1998. "Empirical Evaluation Techniques in Computer Vision".Wiley-IEEE Computer Society Press. Primera edición. Hoboken. 248 pp.

Bracewell, R.N. 1999. "The Fourier Transform and its Applications". McGraw-Hill. Terceraedición. Nueva York. 640 pp.

Brodatz. 1966 "Textures: A Photographic Album for Artists and Designers"Dover, NY.

Campbell, F.W. y J.G. Robson. 1968. .Application of Fourier Analysis to the Visibility ofGratings". Journal of Physiology. 197:551-566 p.

Casasent, D.P. 1995. "Gabor Wavelet Filters and Fusion for Distortion-Invariant Multi-ClassObject Detection". En: Harold Szu (ed.). Proceedings SPIE.Orlando FL. EUA. 2491:430-440p.

Casasent, D.P. y J.-S. Smokelin. 1994. Real, Imaginary, andClutter Gabor Filter Fusion forDetection with Reduced False Alarms". Optical Engineering. 33(7):2255-2363 p.

Casasent, D.P. y J.-S. Smokelin. 1994. "Neural Net Design ofMacro Gabor WaveletFilters for Distortion-Invariant Object Detection in Clutter". Optical Engineering. 33(7):2264-2271 p.

Chaney, R.D. 1993. "Feature Extraction Without Edge Detection". PhD thesis. Departmentof Electrical Engineering and computer Science. Massachusetts Institute of Technology. 157pp.

Chantler, M.J. 1994. "The Effect of Variation in IlluminantDirection on Texture Classifica-tion". PhD thesis. Department of Computing and Electrical Engineering. Heriot-Watt Univer-sity. 178 pp.

Chellappa, R. y S. Chatterjee. 1985. Çlassification of Textures Using Gaussian MarkovRandom Fields". IEEE Transactions on Acoustic, Speech, andSignal Processing. 33(4):959-963 p.

Coggins, J.M. 1982. .A Framework for Texture Analysis Based on Spatial Filtering". Ph.D.thesis. Computer Science department. Michigan State University.

Cohen, F.S. y D.B. Cooper. 1987. "Simple Parallel Hierarchical and Relaxation Algorithmsfor Segmenting Noncausal Markovian Random Fields". IEEE Transactions on Pattern Anal-ysis and Machine Intelligence. 9(2):195-219 p.

Cross, G.C. y A.K. Jain. 1982. "Markov Random Field Texture Models". IEEE Transationson Pattern Analysis and Machine Intelligence. 5(1):25-39 p.

Chan, C.-C. y C.-C. Chen. 2000. "Gabor Transforms in TextureAnalysis". En: David P.Casasent(eds.).Proceedings of SPIE. Boston MA. EUA. 2353:237-245 p.

Daugman, J.G. 1984. "Spatial Visual Channels in the FourierPlane". Vision Research.24(9):891-1117 p.

Daugman, J.G. 1985. Üncertainty Relation for Resolution inSpace, Spatial Frequency, andOrientation Optimized by Two-Dimensional Visual CorticalFilters". Journal of the OpticalSociety of America. 2(7):1160-1169 p.

De Valois, R.L., D.G. Albrecht y L.G. Thorell. 1989. "Spatial-Frequency Selectivity of Cellsin Macaque Visual Cortex". Vision Research. 22(5):545-559p.

Dunn, D.F. y W.E. Higgins. 1995. .Optimal Gabor Filters for Texture Segmentation". IEEETransactions on Image Processing. 4(7):947-964 p.

Dunn, D.F., W.E. Higgins y J. Wakeley. 1994. "Texture Segmentation Using 2-D GaborElementary Functions". IEEE Transactions on Pattern Analysis and Machine Intelligence.22(2):130-149 p.

Farrokhnia, F. 1990. "Multichannel Filtering Techniques for Texture Segmentation and Sur-face Quality Inspection". Ph.D. thesis. Michigan State University.

Ferwerda, J.A. 2001. "Elements of Early Vision for ComputerGraphics". IEEE ComputerGraphics and Applications. 21(5):22-33 p.

Gabor, D. 1946. "Theory of Communication". Journal of the Institution of Electrical Engi-neers. 93(3):429-457 p.

Geman, S. y D. Geman. 1984. "Stochastic Relaxation, Gibbs Distributions, and the BayesianRestoration of Images". IEEE Transactions on Pattern Analysis and Machine Intelligence.6(6):721-741 p.

González, R.C. y R.E. Woods. 1996. "Tratamiento Digital de Imágenes". Addison-Wesley.Primera edición. Wilmington. 773 pp.

Gulsrud, T.O. y J.H. Husøy. 2000. .Optimal Filter for Detection of Clustered Microcalcifica-tions". En: A. Sanfeliu, J.J. Villanueva, M. Vanrell, R. Alquezar, A.K. Jain, y J. Kittler (eds.).Proceedings of the 15th International Conference on Pattern Recognition. Barcelona, España.1:508-511 p.

Gulsrud, T.O. y E. Løland. 1996. "Multichannel Filtering for Texture Feature Extraction inDigital Mammograms". En 18th Annual International Conference of the IEEE Engineeringin Medicine and Biology Society. Amsterdam, Los Países Bajos. 357-358 p.

Haralick, R., K. Shanmugam e I. Dinstein. 1973. "Textural Features for Image classification".IEEE Transactions on Systems, Man, and Cybernetics, 3(6):610-621 p.

Howell, K.B. 2001. "Principles of Fourier Analysis". CRC Press. Boca Raton. 792 pp.

Hu, M.K. 1962. "Visual Pattern Recognition by Moment Invariants". IRE Transactions onInformation Theory. 8:179-187 p.

Hubel, D.H., T. Wiesel. 1962. Receptive Fields, Binacular Interaction, and Functional Archi-tecture in the Cat’s Visual Cortex". Journal of Physiology.160:106-154 p.

Hubel, D.H. y T. Wiesel. 1974. "Sequence Regularity and Geometry of Orientation in theMonkey Striate Cortex". Journal of Comparative Neurology.158:267-293 p.

Jähne, B. y H. Hau�ecker. 2000. Çomputer Vision and Applications, A Guide for Studentsand Practitioners". Academic Press. Primera edición. Londres. 679 pp.

Jain, A. K. y F. Farrokhnia. 1991. Ünsupervised Texture Segmentation Using Gabor Filters".Pattern Recognition. 24(12):1167-1186 p.

Jain, A.K., S.K. Bhattacharjee e Y. Chen. 1992. .On Texture in Document Images". En Pro-ceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Champaign,IL. 677-680 p.

Khotanzad, A. y R. Kashyap. 1987. "Feature Selection Based on Image Sysnthesis". IEEETransactions on Systems, Man, and Cybernetics, 17:1087-1095 p.

Kubota, T. y T. Huntsberger. 1998. .Adaptive Pattern Recognition System for Scene Segmen-tation". Optical Engineering, 37(3):829-835 p.

Kumar, A. y G. Pang. 2000. "Fabric Defect Segmentation UsingMultichannel Blob Detec-tors". Optical Engineering. 39(12):3176-3190 p.

Kulikowsky, J.J., S. Marcelja y P. Bishop. 1982. "Theory of Spatial Position and SpatialFrequency Relations in the Receptive Fields of Simple Cellsin the Visual Cortex". BiologicalCybernetics. 43:187-198 p.

Laws, K.I. 1980. "Textured Image Segmentation". Ph.D. thesis. University of Southern Cali-fornia.

Li, S.Z. 2001. "Markov Random Field Modeling in Computer Vision". Springer Verlag. Se-gunda edición. New York. 323 pp.

Malik, J. y P. Perona. 1994. "Prettentive Texture Discrimination with Early Vision Mecha-nisms". Journal of the Optical Society of America A. 7(5):923-932 p.

Manly, B.F.J. 1994."Multivariate Statistical Methods: A Primer". CRC Press. Segunda edi-ción. Boca Raton. 232 pp.

Marcelja, S. 1980. "Mathematical Description of the Response of Simple Cortical Cells".Journal of the Optical Society of America. 70(11):1297-1300 p.

Mao, J. y A.K. Jain. 1992. "Texture Classification and Segmentation Using MultiresolutionSimultaneous Autoregressive Models". Pattern Recognition. 25(2):173-188 p.

Mather, P.M. 1999. Çomputer Processing of Remotely-SensedImages: An Introduction".John Wiley & Sons. Segunda edición. New York. 306 pp.

Mallat, S.G. 1989. "Multifrequency Channel Decompositionof Images and Wavelet Models".IEEE Transactions on Acoustics, Speech, and Signal Processing. 37(12): 2091-2110 p.

Nakamura, S. 1991. "Metodos Numéricos Aplicados con Software". Prentice Hall,Inc. En-glewood Cliffs. Primera edición. 570 pp.

Paget, R. y D. Longstaff. 1996. .A Nonparametric Multiscale Markov Random Field Modelfor Synthesising Natural Textures". En 4th International Symposium on Signal Processingand its Applications. 2:744-747 p.

Prasad, L., S.S. Iyengar y S.S. Ayengar. 1997. "Wavelet Analysis with Applications to ImageProcessing". CRC Press. Prinera edición. Boca Ratón. 279 pp.

Press, W.H., S.A. Teukolsky, W.T. Vetterling y B.P. Flannery. 1992. "Numerical Recipes in C:The Art of Scientific Computing". Cambridge University Press. Segunda edición. Cambridge.994 pp.

Ramstad, T.A., S.O. Aase y J.H. Husøy. 1995. "Subband Compression of Images: Principlesand Examples". ELSEVIER Science Publishers. Amsterdam. 394 pp.

Randen, T. y J.A. Husøy. 1994. "Multichannel Filtering for Image Texture Segmentation".Optical Engineering. 33(8):2617-2625 p.

Randen, T. 1997. "Filter and Filter Bank Design for Image Texture Recognition". Disserta-tion submitted in partial fullfilment of the requirements for the degree of Doktor Ingenior.Norwegian University of Science and Techology. Stavanger College.

Randen, T. y J.A. Husøy. 1999. "Filtering for Texture Classification: A Comparative Study".IEEE Transactions on Pattern Analysis and Machine Intelligence. 21(4):291-310 p.

Real Academia Española. 2001. Diccionario de la Lengua Española. Vigésima seguna edi-ción. Madrid, Real Academia Española.

Reineck, H.-E. e I.B. Singh. 1981. "Depositional Sedimentary Environments, With Referenceto Terrigenous Clastics". Springer Verlag. Segunda Edición. New York. 551 pp.

Schaaf, M. 1995. "Digital Sediment Color Analyses-Development and Application toHolocene and Late Pleistocene Sediments from East Pacific DSDP/ODP Sites". Disserta-tion zur Erlangung des Doktorgrades (Dr. rer. nat.) der Fakultat fur Geowissenschaften derRuhr-Universitat Bochum.

Shi, B.E. 1998. "Gabor-Type Filtering in Space and Time withCellular Neural Net-works". IEEE Transactions on Circuits and Systems-I: Fundamental Theory and Applica-tions. 45(2):121-132 p.

Soutar, A. y J.D. Isaacs. 1969. "History of Fish PopulationsInferred from Fish Scales inAnaerobic Sediments off California". CalCOFI Reports. 15:49-51 p.

Soutar, A. y J.D. Isaacs. 1974. .Abundance of Pelagic Fish During the 19th and 20thCenturies as Recorded in Anaerobic Sediment of the Californias". Fishery Bulletin.72:257-273 p.

Sutton, R. D. y E. L. Hall. 1972. "Texture Measures for Automatic Classification of Pul-monary Disease". IEEE Transactions on Computers. (21)7:667-676 p.

Tamura, H., S. Mori e Y. Yamawaki. 1978. "Textural Features Corresponding to Visual Per-ception". IEEE Transactions on System, Man, and Cybernetics. 8(6):460-472 p.

Therrien, C.W. 1983. .An Estimation-Theoretic Approach to Terrain Image Segmentation".Computer Vision, Graphics, and Image Processing. 22:313-326 p.

Tuceryan, M. y A.K. Jain. 1990. "Texture Segmentation UsingVoronoi Polygons". IEEETransactions on Pattern Analysis and Machine Intelligence. (12)2:211-216 p.

Tuceryan, M. y A.K. Jain. 1998. "Texture Analysis". En: C.H.Chen, L. F. Pau, P.S.P. Wang(eds.). "The Handbook of Pattern Recognition and Computer Vision". World Scientific Pub-lishing Co. Segunda edición. 235-276 p.

Unser, M. 1995. "Texture Classification and Segmentation Using Wavelet Frames". IEEETransactions on Image Processing. 4(11):1549-1560 p.

Weber, D. y D.P. Casasent. 1995. "Fusion and Optimized GaborFilter Design for ObjectDetection". En Proceedings SPIE 2588: 662-675 p.

Weldon, T.P. y W.E. Higgins. 1996. "Integrated Approach to Texture Segmentation UsingMultiple Gabor filters". En Proceedings of the International Conference on Image Processing.3:955-958 p.

Aplicación de detectores multicanal Gabor para encontrar correspondencias entre imágenes de...

Documents

Transcript of Aplicación de detectores multicanal Gabor para encontrar correspondencias entre imágenes de...

Desenho de conteúdos e-learning: Quais teorias de aprendizagem podemos encontrar?

Análisis comparativo entre la vía húmeda y seca de la preparación de las muestras de sedimentos

5.1 Proyecto de Toda la Cuenca - 5.1.1 Control de Sedimentos

Cómo encontrar múscia cristiana GRATIS (y legal

Generacion y Transporte de sedimentos en la cuenca del Rio Bermejo

Relación de las cosas que el investigador curioso puede encontrar en bibliotecas y archivos de esta provincia de Sassari en la isla de Cerdeña.

Estrategias multicanal en el ámbito de la distribución: fabricante y distribuidor preocupados por ofrecer nuevas experiencias de compra diferenciadas

DISTRIBUIÇÃO DOS METAIS PESADOS EM SEDIMENTOS DA LAGOA RODRIGO DE FREITAS

Uma estratégia de combinação de filtragem multicanal de Wiener-Levinson com o método CRS de empilhamento de dados para atenuação de reflexões múltiplas

CONSTRUÇÃO DE UMA ARMADILHA DE SEDIMENTOS EM LABORATÓRIO E ANÁLISE DO ESCOAMENTO DE ÁGUA EM SEU INTERIOR COM USO DE VELOCIMETRIA A LASER

Contenido de Materia Orgánica en Sedimentos Marinos de la ...

PROPUESTA DE UNA NUEVA METODOLOGÍA PARA DETERMINAR LA EFECTIVIDAD DE LOS DIQUES EN LA RETENCIÓN DE SEDIMENTOS

Vol. 14, núm. 2 (2013). Abogados e intercesores para encontrar una buena muerte en la Costa Rica del siglo XVII

Sair para buscar, encontrar e voltar: de como surgiu uma igreja do Santo Daime no Uruguay

BALANCE VOLUMÉTRICO DE SEDIMENTOS NEÓGENOS Y CUATERNARIOS EN EL MARGEN SUD-IBÉRICO: IMPLICACIONES TECTÓNICAS

Receiver AV Multicanal - Sony

Efectos del cultivo de peces en jaulas flotantes sobre la calidad del agua y de los sedimentos en el Pacifico Mexicano

Algorithme distribué pour l'assignation de rôles dans Molecular MAC, une couche MAC multicanal