Tema 4. Características de los patrones percibidos por un SVA • Forma: – Medidas generales sobre formas formas – Descripción de contornos contornos – Momentos espaciales y descriptores descriptores de Fourier
• Color: - Diag Diagra rama ma cro cromá máti tico co y teo teorí ríaa trie triest stím ímul uloo - Espa Espaci cios os (mo (mode delo los) s) del del col color or:: RGB, RGB, HSI HSI,, ...
• Textura: - Anál nálisi isis est estruc ructu turral - Anál nálisis isis est estadí adístic sticoo - Anál Anális isis is en el domi domini nioo de Four Fourie ier r
Bibliografía BÁSICA: • R.C. González y R.E. Wo Woods, Digital Image Processing, Addi Addiso sonn Wesl Wesley ey,, 2ª 2ª edic edició ión, n, 2002 2002.. (caps. 6 y 11) • A. de la Escalera, Visión por computador: Fundamentos y métodos, Pear Pearso sonn- Pren Prenti tice ce Hall Hall,, 200 2001. 1. (caps. 3 y 6) COMPLEMENTARIA: • G.A. Baxes, Digital Image Processing, John Wliley & Sons, 1994. (cap. 5) Comput uter er Gr Grap aphi hics cs:: Pin Pinci cipl ples es and and Prac Practi tice ce, • J.D. Foley et al, Comp 2ª Edición, Edición, Addison-We Addison-Wesley, sley, 1997. (cap. 13) • M. Sonka et al., Image Processing, Analysis, and Machine Vision, PWS Publishing, 1999. (cap. 6)
Introducción (I) • Para reconocer objetos en imágenes es necesario extraer características medibles de éstos. • Estas características permiten definir vectores de características normalizados que se usan para el reconocimiento de patrones. • Algunas de las características principales extraíbles de los objetos (o de las regiones segmentadas) en una imagen, utilizadas en la etapa de reconocimiento dentro de un Sistema de Visión Artificial, son la forma, el color y la textura.
Introducción (II) • Ej Ejem empl plos os :
Forma
Color
Textura
Forma (I) Medidas generales sobre formas • Defini Definirr la la form formaa de un obje objeto to pued puedee resul resultar tar difíci difícill (ver (verbal balmen mente te o gráficamente). • Forma = figura exterior (o geometría) de un cuerpo u objeto. • Es pos posib ible le des descr crib ibir ir una una for forma ma 2D 2D por por medi medioo de alg algun unos os de de sus sus características características y propiedades (área, perímetro, …). • Medidas so sobre fo forma: – – – – – – – –
Área Perímetro Diámetro Distancias: máxima y mínima al centro de masas, media al contorno,... contorno,... Ejes mayor y menor, ángulo del eje mayor Envolvente (boun boundi ding ng box box) Número de agujeros Ratios: redondez=(4π redondez=(4πArea)/Perimetro2, Area Agujeros/Area Total, ...
Forma (II) Medidas generales sobre formas
Perímetro
Ejes mayor y menor
Área
Bounding box
Caracterización de formas: descriptores generales (I) • Medidas descritas en relación a píxeles (que pueden convertirse a unidades originales: metros, centímetros, etc). • Útiles cuando el tamaño de la forma es importante (p.ej. en aplicaciones médicas). • Pueden resultar afectadas por la definición de distancia y/o por el tipo de conectividad entre píxeles usadas. • Algunas medidas: perímetro, área, centroide, distancia media al contorno, diámetro, ejes mayor y menor, descriptores de texturas, descriptores topológicos, ratios de medidas, momentos estadísticos, descriptores de Fourier, ...
Caracterización de formas: descriptores generales (II) • Perímetro: – Número de píxeles que forman el contorno de la forma – Se obtiene el contorno binarizando la imagen, y luego se cuentan sus píxeles) – Diferente resultado si se usa 4-conectividad ó 8-conectividad (igual ocurre con otros descriptores)
• Área: – Número de píxeles de la forma (sobre la imagen binaria)
• Centroide o centro de masas: – Promedio de los valores de las coordenadas de los puntos de la forma – Se obtiene separadamente para cada una de las dos dimensiones – También puede calcularse a partir de los puntos del contorno.
Caracterización de formas: descriptores generales (III) • Eje mayor (o diámetro): – Distancia mayor entre dos puntos cualquiera de la forma
• Eje menor : – Eje perpendicular al eje mayor – Ambos ejes definen los lados del MRE – Estos ejes también están relacionados con los autovectores de la matriz de covarianzas (autoejes de las formas) usando el análisis de componentes principales Grado de simetría (se comprueba desde el eje mayor del objeto)
• • Distancias máxima y mínima entre el centroide y los puntos del contorno • Distancia media al contorno: Sea f una forma con N puntos, p∈ f un punto de f , y d ( p,contorno( f )) la distancia menor entre p y todos los puntos del contorno, entonces la distancia media al contorno β se calcula como: β = (Σ d ( p,contorno( f ))) / N
Caracterización de formas: descriptores generales (IV) • Descriptores topológicos: – La topología estudia las propiedades de una figura que quedan inafectadas por deformaciones y transformaciones geométricas. – Las propiedades topológicas permiten describir globalmente aspectos estructurales (no métricas) de un objeto. – Algunos descriptores son: * el número de agujeros n A del objeto, * el número de componentes conexas nC (aplicado a objetos compuestos), * el número de Euler E que se define como: E = nC - n A.
E=1
E=0
E=-1
Caracterización de formas: descriptores generales (V) • Ratios de forma: Sean P y A el perímetro y el área de un objeto, respectivamente. Algunos ratios de forma son: – Compacidad : P2/ A – Redondez: 4π ( A/P2) (medida inversamente proporcional a la compacidad) – Relación área/perímetro: A/P – Rectagularidad : A/area(MRE) – Elongación: M / N (siendo M el eje mayor y N el eje menor)
• Descriptores de curvatura: – Muestras de la curvatura en puntos de interés – Estadísticos de curvatura: curvatura media, varianza, desviación típica, … – Energía de curvatura B (donde k (t ) describe el contorno y P el perímetro): 1 B = ∫ k (t ) 2 dt P
Representación de formas 2D (I)
Clasificación de las técnicas de representación Representación de formas
Basadas en contornos
Contornos paramétricos
Conjuntos de puntos
Aproximación mediante curvas
Basadas en regiones
Descomposición en regiones
Regiones envolventes
Basadas en transfomadas
Características Transformadas internas lineales
Transformadas no lineales
Representación de formas 2D (II)
Clasificación de las técnicas de representación
• Representaciones basadas en contornos: – Contornos paramétricos: el perfil del contorno se representa mediante una descripción paramétrica (implicando un orden secuencial). Ejemplos: vectores (x(t),y(t)); señales complejas u(t)=x(t)+jy(t); códigos de cadena; rachas (run-lenghts); … – Conjunto de puntos característicos (landmark points): el contorno se describe mediante una colección de puntos (sin orden). – Aproximación mediante curvas: un conjunto de primitivas geométricas se ajustan al contorno. Ejemplos: aproximaciones poligonales; polígonos de perímetro mínimo; arcos circulares y elípticos; modelos autoregresivos; B-splines; ...
Representación de formas 2D (III)
Descripciones basadas en contornos
• Contornos como conjuntos de puntos característicos: – Es la manera más simple de representar una forma. – Esta representación, aunque pobre, permite obtener ciertos descriptores estadísticos de las formas (p.ej. centroide, eje mayor, …). • Aproximación de contornos mediante curvas: – El contorno de una forma se representa mediante interpolación. Resulta mejor representar un contorno por tramos que aproximen cada parte de éste mediante una primitiva geométrica (p.ej. un segmento), que describir el contorno mediante una función global. – Un método sencillo de descripción son las aproximaciones poligonales . – Se trata de encontrar un conjunto de puntos (vértices) sobre el contorno tales que permitan obtener una buena aproximación del contorno original. La manera clásica de tratar este problema es elegir como vértices los puntos con mayor curvatura local.
Representación de formas 2D (IV)
Clasificación de las técnicas de representación
• Representaciones basadas en regiones: – Descomposición en regiones: una región se divide en formas más simples (p. ej. polígonos) y es representada mediante estas primitivas. Ejemplos: polígonos; Voronoi/Delaunay; quadtrees; primitivas sintácticas; … – Regiones envolventes: una forma se aproxima mediante una primitiva geométrica predefinida (p.ej. rectángulo) que se ajusta a ella. Ejemplos: mínimo rectángulo envolvente; cierre convexo; caja de Feret; ... – Aproximación mediante características internas: una forma se representa mediante un conjunto de características asociadas a su región interna. Ejemplos: esqueleto; transformadas de distancias; matriz de forma; momentos espaciales; ...
Representación de formas 2D (V)
Descripciones basadas en regiones
• Dentro de la caracterización por división, una representación muy usada es el quadtree para almacenar la regiones resultantes de una segmentación mediante un proceso de división y unión de regiones. • Algunas técnicas de descomposición (división) para contornos cerrados separan sucesivamente ciertos segmentos en dos partes hasta que se satisface un criterio determinado.
c
a d
c
a
b
d
c
a
b
d
b
Representación de formas 2D (VI)
Descripciones basadas en regiones
• Una familia importante de técnicas basadas en regiones buscan la envolvente que encierra a una forma considerada. • Hay tres tipos de envolventes fundamentales: – Caja de Feret : menor rectángulo, orientado según una referencia específica (p.ej. los ejes cartesianos), que encierra la forma. – Menor rectángulo envolvente (MRE): menor rectángulo, orientado en cualquier dirección, que contiene la forma. – Cierre convexo: menor conjunto convexo que contiene la forma (la deficiencia convexa es la diferencia entre el cierre convexo y la forma).
Forma
Caja de Feret
MRE
Cierre convexo
Representación de formas 2D (VII)
Descripciones basadas en regiones
• Otro grupo de técnicas de representación de regiones considera un conjunto de características relativas a la región interna de la forma. • La más significativa de estas técnicas es el esqueleto que permite reducir una forma a un grafo. Esta estructura se obtiene mediante un “adelgazamiento” (thinning ) de la forma. • Algunos procedimientos de esqueletización se basan en morfología matemática. • Un método sencillo, aunque ineficiente, es el propuesto por Blum (1967) llamado transformación del eje central (MAT). El esqueleto de una forma R con contorno C se obtiene como sigue: 1) para cada punto p∈ R, se busca su vecino más cercano en C , 2) si p tiene más de un vecino en C se dice que pertenece al esqueleto (o eje central) de R.
Forma
Esqueleto
Representación de formas 2D (VIII)
Clasificación de las técnicas de representación
• Representaciones basadas en dominios transformados: – Transformaciones lineales: una transformación T tal que, dadas dos formas A y B y dos escalares α y β, se cumple: T (α A+β B) = αT ( A)+βT ( B). Una aproximación basada en transformaciones lineales representa una forma A en términos de T ( A). Ejemplos: transformadas de Fourier; transformada del coseno; transformadas wavelet ; firmas; … – Transformaciones no lineales: una transformación que no cumple la propiedad anterior. Ejemplos: transformada de Hough; operadores de morfología matemática; …
• Descriptores típicos usados: – coeficientes de la transformada – medidas de la transformada (p.ej. energía) – estadísticos de la transformada
Representación de formas 2D (IX)
Descripciones basadas en transformadas: firmas
• Dentro de las descripciones basadas en transformadas lineales podemos mencionar las que hacen uso de la transformada de Fourier , de las transformadas wavelet , y de las firmas, principalmente. • Una firma (signature) es una representación funcional 1D de un contorno. • Existen diversos métodos de generación de firmas; uno de los más simples es dibujar la distancia del centroide del objeto al contorno en función del ángulo. • Las firmas son invariantes a traslaciones pero dependientes de rotaciones y escalados (pero se puede normalizar para que resulte invariante ante estas transformaciones). r
r A
r( )
A
r( ) ( 2)A
A
A
π/4 π/2 3π/4 π 5π/4 3π/2 7π/4 2π
π/4 π/2 3π/4 π 5π/4 3π/2 7π/4 2π
Ejemplos de representaciones (I)
Códigos de cadena (descripción de contornos)
• El código de cadena de un contorno (de objeto o región) se define partiendo de un píxel cualquiera del contorno y encadenando la dirección en que se encuentran los puntos adyacentes del contorno mediante un convenio de seguimiento establecido. • Se consigue así una cadena de símbolos que determinan unívocamente al objeto, que es invariante a traslaciones.
1 2
3 0
3
2
4 5
1 0
6
7
Direcciones del código de cadena usando conectividad 4 y 8, respectivamente.
Ejemplos de representaciones (II)
Códigos de cadena (descripción de contornos)
• Con el fin de lograr invarianza frente a rotaciones se codifican las diferencias entre los dígitos del código y no el código mismo. • Para lograr invarianza respecto al punto de inicio, los dígitos del código obtenido se disponen de forma que si se lee el código se obtiene el menor entero posible con esa secuencia de dígitos. • Para evitar que pequeños cambios en el contorno de un objeto produzcan códigos diferentes se usa algún filtro de suavizado o algún escalado del objeto.
(a)
(b)
• Ejemplo: Código de cadena de conectividad 4. El punto grueso indica el nodo de inicio. Inicialmente se obtiene: 3030012122, que desplazándolo para obtener el mínimo queda: 0012122303. Finalmente, codificando las diferencias se obtiene: 0113101131
Ejemplos de representaciones (III)
Momentos espaciales (descripción de regiones)
• Los momentos espaciales de un objeto son medidas estadísticas que permiten describir regiones (objetos) en términos de sus puntos interiores. • Para una función f(x,y) continua en 2D, se define el momento de orden ( p +q) como: ∞ ∞
m pq =
p q x ∫ y f ( x, y)dxdy
∫−∞ −∞
x p y q I ( x, y ) • Para una imagen digital, la fórmula queda: m pq = ∑∑ x y • El momento central de orden ( p + q) de una imagen es: μ pq
p
= ∑∑ ( x − x) ( y − y ) q I ( x, y ) x
y
Ejemplos de representaciones (IV)
Momentos espaciales(descripción de regiones)
• Momento espacial de orden cero: Es la suma de los valores de brillo de los píxeles del objeto. Corresponde al área del objeto en imágenes binarias. m00 = ∑∑ I ( x, y ) x
y
• Momentos espaciales de orden uno: Corresponden a las sumas en la direcciones x e y, respectivamente, de los valores de brillo de los píxeles del objeto, cada una de ellas multiplicada por su respectivo valor de coordenada x o y en la imagen. m10 = ∑∑ xI ( x, y ) x
y
m01 = ∑∑ yI ( x, y ) x
y
• El centro de masas de un objeto se calcula: m m x = 10 y = 01 m 00 m 00 • Momentos espaciales de orden dos: Dan información sobre la orientación del objeto. • Hu propuso un conjunto de momentos centrales normalizados de órdenes 2 y 3 que son invariantes a traslaciones, rotaciones y escalados.
Ejemplos de representaciones (V)
Descripción basada en la transformada de Fourier • En el dominio de la frecuencia se puede tratar el problema de la invarianza a las transformaciones geométricas. • Aplicar la transformada de Fourier sobre el código de cadena o las coordenadas del contorno de un objeto. • Invarianza a traslaciones: Las componentes de Fourier de dos objetos iguales, desplazados uno respecto a otro, solo se diferencian en F (0) (componente de frecuencia cero). Eliminando esta componente hay una descripción invariante a traslaciones. • Invarianza a rotaciones: Las transformada de Fourier de un objeto girado θ radianes respecto a otro igual no girado se diferencia en un factor multiplicativo e jθ. Por ello, suelen tomarse los módulos que no cambian si el objeto está girado. • Invarianza a escalado: La transformada de Fourier de dos objetos iguales pero de diferente tamaño se diferencian en que todos los elementos de las transformada han sido multiplicados por un valor k que depende del cambio de tamaño. Dividiendo todas las componentes por una de ellas (p. ej. F (1)) se obtiene una representación invariante a escalado.
Color (I)
Introducción
• El sistema visual humano puede distinguir entre miles de colores y sólo puede diferenciar alrededor de 100 niveles de intensidad. • La percepción del color depende de las características de la luz (fundamentalmente, la luz reflejada por el objeto) y del complejo proceso de percepción realizado por el sistema visual humano (ojo-cerebro). • Las radiaciones electromagnéticas con longitud de onda entre 400 y 700 nanómetros (luz visible) estimulan los receptores humanos y producen la sensación de color.
• El color es un descriptor muy potente para diferenciar objetos. Importancia en aplicaciones de segmentación y reconocimiento de patrones. • Tratamiento imágenes color: color completo y pseudocolor.
Color (II) Diagrama cromático y teoría triestímulo • La mezcla aditiva de la luz emitida por tres linternas, una roja (de 650 nm), otra verde (de 530 nm) y otra azul (de 425 nm) permite obtener una amplia gama de colores (teoría triestímulo). • Muchos dispositivos que generan imágenes en color (tubos de televisores, monitores, pantallas de cristal líquido, pantallas de plasma, etc) se fundamentan en este principio. • En 1931 la Comisión Internacional de Iluminación (I.C.I.) convino en expresar qué cantidad, en Lúmenes, tiene que emitir cada una de tres linternas patrón para expresar todos los matices del espectro de manera aditiva. 2,5
C 2
s 1,5 e n e
A B
m u L 1
0,5
0 360
440
520
600
Longit ud de onda (nm)
680
760
Color (III) Diagrama cromático y teoría triestímulo • La obtención de un color determinado se basa en tres componentes primarios: x =
A A + B + C
y =
B A + B + C
z =
C A + B + C
donde: x+ y+ z=1. Representando en un plano XY el color asociado a cada punto ( x, y, z) se obtiene el diagrama cromático CIE (a):
(a)
(b)
Color (IV) Diagrama cromático y teoría triestímulo • Los colores comprendidos dentro del triángulo definido por los puntos R,G,B de la fig. (b) son aquéllos que se pueden obtener por mezcla aditiva de tres linternas con los colores correspondientes a los vértices del triángulo. • Los televisores y los monitores de ordenador, eligen cuidadosamente la base de tres colores (rojo, verde y azul) que usarán para construir las imágenes que presentan, de manera que el área del triangulo dentro del diagrama I.C.I sea máxima, y así poder representar el máximo posible de colores en sus pantallas. • El diagrama I.C.I da lugar a otro tipo de representación denominado HSV ( Hue-Saturation-Value). Esta representación puede ser un superconjunto de una representación RGB, en ella los valores que definen una radiación son el color ( Hue), su saturación (Saturation), y su luminosidad (Value).
Color (V) Tintas • Usando tintas, no se puede realizar la mezcla aditiva de haces de luz ya que, los colores percibidos al mezclar tintas son el resultado de una mezcla substractiva. • Al tintar un papel blanco se le van restando componentes que ya no podrá reflejar. • Se trata de escoger adecuadamente una base de colores, para que la gama de matices, que se pueda representar mezclando componentes de esta base, sea lo más extensa posible. • Las impresoras, que usan papel y tinta, toman como base la los colores: cian, magenta y amarillo (CMY).
A la izquierda mezcla aditiva de la luz tres linternas sobre una superficie negra. A la derecha mezcla substractiva de tres tintas sobre un lienzo blanco.
Color (VI)
Espacios (modelos) de color
• Una combinación de características físicas del mundo real determina lo que la visión humana percibe como el color. • Un espacio (o modelo) de color es una representación matemática de estas características. • Los espacios de color son siempre tridimensionales: – El espacio más habitual en imágenes digitales (pantallas de ordenador) es el Red/Green/Blue (RGB). – En impresión se usa el espacio C yan/Magenta/Yellow (CYM). – El espacio Hue/Saturation/Value (HSV) se usa típicamente en imágenes artísticas. – Los espacios de color basados en Intensity/Chromaticity (YUV y YIQ) se usan para transmisión de señales de televisión.
• Muchas aplicaciones de tratamiento de imágenes digitales requieren transformaciones entre el espacio RGB y otros espacios de color.
Color (VII) Espacio de color RGB • En este espacio aditivo, cada color tema valores entre 0 y 255, resultando una estructura de cubo. • Cada color se define dando sus coordenadas de R, G y B, en forma de 3-tupla: (rojo, verde, azul) con respecto al cubo.
Color (VIII) Espacio de color CMY • Espacio inverso del RGB: C = max-R M = max-G Y = max-B • Uso en imágenes impresas (una vez que la imagen se convierte a CMY no se puede visualizar correctamente en pantalla). • Tras años de experiencia, se han desarrollado técnicas para crear imágenes impresas de alta calidad y a bajo coste. • El modelo CMYK, que es una modificación del CMY donde K representa el color negro, permite este tipo de impresión con buen ratio: calidad/coste.
Color (XI) Espacio de color HSV (o HSI) • Espacio de color bastante diferente al RGB y al CMY. Operar en HSI requiere mayor precisión aritmética (coma flotante o 16-32 bits de precisión entera). Hue = Longitud de onda dominante o tono del color (ángulo entre 0º y 360º) Saturation = Saturación o fuerza del color (entre 0 y 1) Value = Intensidad del color (entre 0 correspondiente al negro y 1 al blanco) Procesamiento en modelo HSI: 1) Convertir de RGB a HSI, 2) Modificar parámetro H (o S o I), y 3) Volver a convertir a RGB.
Color (X)
Espacios de color YUV y YIQ (luminancia-crominancia) • Estos espacios usan las características de brillo y color. El espacio YUV se usa para el sistema de televisión PAL (Europa) y el YIQ para el sistema NTSC (USA). • Los dos métodos son casi idénticos, diferenciándose en las ecuaciones de conversión entre RGB y el modelo respectivo. En ambos sistemas, Y representa la luminancia o componente de brillo, e I y Q (o U y V), la crominancia o color. • Estas variables (brillo, color) se pueden cambiar mediante los botones de una televisión (u ordenador). • La ventaja de usar YUV o YIQ para enviar la señal de televisión es que se reduce la cantidad de información para definir el color. Esta compresión restringe el rango de colores en imágenes de televisión. • Ejemplo: Y = .299R + .587G + .114B Ecuaciones de conversión de RGB a YUV: U = -.147R - .289G + .437B V = .615R - .515G - .100B
Textura (I) Introducción • Las texturas ofrecen información sobre la ordenación espacial de los niveles de gris (o de los colores) en una imagen. • Son patrones visuales homogéneos, locales y repetitivos que se observan en ciertos tipos de materiales (telas, piedras, madera, etc). • Resulta importante para muchos aplicaciones de Visión Artificial: segmentación de regiones en imágenes, determinación de formas (o características) de objetos, clasificación, etc. • Al observar ciertos tipos de materiales se nota que presentan un aspecto homogéneo a pesar de no tener un nivel de gris constante. • La textura no puede definirse para píxeles aislados. • La textura viene dada por distribución espacial de los niveles de gris en una región (medida cuantitativa). • Esta característica depende del grado de resolución de la imagen.
Textura (Ib) Introducción • Textura: Uno o más patrones locales que se repiten de manera periódica. • Para el estudio y comparación de los algoritmos sobre imágenes de texturas se utilizan como referencia las imágenes de Brodatz.
Diversas imágenes del album de Brodatz, utilizadas en el análisis de texturas.
Textura (Ib) Introducción Problemas relacionados con texturas (Forsyth y Ponce, 2003) • Segmentación basada en textura: descomponer una imagen en regiones cuya textura sea uniforme • Síntesis de texturas: construir regiones grandes de textura a partir de imágenes (pequeñas) de ejemplo usadas para construir modelos de probabilidad de textura • Extracción de la forma a partir de la textura: la “deformación” de la textura pixel a pixel se usa como una característica para descubrir la forma de una region
Textura (II) Introducción • Ejemplos de texturas: pavimento (izquierda) y tejido (derecha).
• Métodos de análisis de texturas: 1) estructurales, 2) estadísticos, y 3) espectrales (uso de la transformada de Fourier).
Textura (III) Medidas cuantitativas: información bordes • El número de píxeles borde detectados en una región de tamaño fijo y las orientaciones de estos bordes ofrecen una información básica de textura. • Para regiones pequeñas de N píxeles, cada píxel p tiene dos propiedades generadas por un algoritmo de detección de bordes: la magnitud del gradiente Mag( p) y su orientación Dir ( p). • Se puede calcular la densidad de bordes como: F densidadBordes
p : Mag ( p) ≥ T = N
siendo T un umbral dado.
Textura (IV) Medidas cuantitativas : información bordes • Sea H mag( R) el histograma normalizado de magnitudes de gradiente en la región R y H dir ( R) el histograma normalizado de orientaciones de gradiente en la región R, una medida cuantitativa que describe la textura de la región viene dada por: F mag dir = ( H mag( R), H dir ( R))
• Dadas dos imágenes I 1 e I 2, se puede calcular para cada una de ellas su correspondiente par de histogramas ( H mag( R), H dir ( R)), y dichos histogramas H 1 y H 2 se comparan por medio de una medida de distancia: n
L1 ( H 1 , H 2 ) = ∑ H 1 (i ) − H 2 (i ) i =1
Textura (V) Medidas cuantitativas: Ejemplo • Sean dos imágenes de 5×5 (25 píxeles):
• • • •
F densidadBordes( I 1) = 1 y F densidadBordes( I 2) = 0.24 Imagen I 1: H mag( I 1)=(0.24, 0.76), H dir ( I 1)=(0.48, 0.52, 0.00) Imagen I 2: H mag( I 2) =(0.00, 0.24), H dir ( I 2)=(0.00, 0.00, 0.24) L1( H 1, H 2) = 2 → Texturas muy distinguibles.
Textura (VI) Medidas cuantitativas: partición binaria local • Para cada píxel p de la imagen se examinan sus 8 vecinos. • Se construye un número binario de 8 dígitos a partir de dichos vecinos: b1 b2 b3 b4 b5 b6 b7 b8 siendo bi=0 si la intensidad del píxel i es menor o igual que la del píxel p, y bi=1 en caso contrario. El valor decimal de este número estará entre 0 y 255. • Se construye un histograma con estos valores, para todos los píxeles de la imagen, con el fin de representar la textura de la imagen. • Dos imágenes o regiones se pueden compara a nivel de textura por la distancia L1 entre sus histogramas correspondientes.
Textura (VII)
Análisis: Métodos estructurales
• Se basan en el uso de primitivas de textura (llamadas téxeles) y de reglas (gramaticales) de formación . • Útiles cuando las primitivas o patrones de textura son son los suficientemente grandes y sencillos para poder ser segmentados (se habla de macrotexturas). • Para imágenes binarias, las primitivas puedes extraerse por métodos morfológicos y luego obtener las reglas de formación. • Las imágenes en niveles de gris se preprocesan primero con un filtro de tipo laplaciana de una gausiana (LoG) para obtener las primitivas de textura, luego se definen reglas de formación usando medidas basadas en las co-ocurrencias de estas primitivas. • Ejemplo: Dada la primitiva p: , y la regla de formación: S → pS, se pueden obtener la siguiente imagen binaria 2D aplicando la regla de formación en las direcciones x e y:
Textura (VIII) Análisis: Métodos estadísticos • Analizan la distribución estadística de alguna propiedad para cada uno de los píxeles de la imagen. • Se clasifican en: métodos de primer orden (aquéllos basados en el histograma), métodos de segundo orden (los basados en matrices de co-ocurrencias), y métodos de órdenes superiores. • Estadísticos de primer orden: – Se calcula el histograma de la imagen. – Si a cada valor del histograma se lo divide por el número total de píxeles de la imagen, se tiene un histograma de probabilidades de niveles de gris h. – Propiedades que se obtienen a partir de este histograma son: Media Varianza Coef. de asimetría Curtosis Entropía μ =
n
∑ ih(i) i =1
σ 2
n
= ∑ (i − μ )2 h(i ) i =1
μ 3
=
1 σ
n
3 3 ∑ (i − μ ) h(i ) i =1
μ 4
=
1 σ
n
4 4 ∑ (i − μ ) h(i ) i =1
n
− ∑ h(i ) log h(i) i =1
Textura (IX) Análisis: Métodos estadísticos (de segundo orden) • Los estadísticos basados en el histograma tienen el inconveniente de perder la información espacial. • Se obtendría la misma información para una imagen de un tablero de ajedrez con los cuadros blancos y negros intercambiados. • Para capturar las dependencias espaciales de los valores de niveles de gris, que contribuyen a la percepción de las texturas presentes en una imagen, se define una estructura 2D llamada matriz de co-ocurrencias para analizar texturas. • La matriz de coocurrencias P[i,j] se define especificando una dirección de desplazamiento d=(di,dj) y contando todos los pares de píxeles separados por d y que tienen valores de gris i y j.
Textura (X) Análisis: Métodos estadísticos (de segundo orden) • Ejemplo: Imagen de 5×5 con tres niveles de gris (0, 1 y 2). 2 0 0 1 2
1 2 1 2 0
2 1 2 2 1
0 1 2 0 0
1 2 0 1 1
Como hay tres niveles de gris, Pd [i,j] es de tamaño 3×3. Sea, por ejemplo d =(1,1). En la imagen existen 16 pares de píxeles que satisfacen esta separación espacial. La matriz Pd [i,j] resultante para este valor de d es: 0 2 2 0
2 1 3 1 j
2 2 2 2
0 1 2
i
Textura (XI) Análisis: Métodos estadísticos (de segundo orden) • Para analizar texturas pueden calcularse diferentes matrices de coocurrencias de la misma imagen con diferentes valores de d . • Algunas propiedades que pueden extraerse a partir de dicha matriz son: – Energía (o segundo momento angular ): Indica el grado de homogeneidad de la imagen. n n ∑∑ Pd (i, j )2 i =1 j =1
– Contraste: Indica la variación en la imagen. n −1
n
n
k ∑∑ Pd (i, j ) 2 , donde : i − j = k ∑ k =0 i =1 j =1 2
– Entropía: Expresa la uniformidad de la matriz de coocurrencias. n
n
− ∑∑ Pd (i, j ) logPd (i, j ) i =1 j =1
Textura (XII)
Análisis: Métodos espectrales (Fourier)
• También a partir de la transformada de Fourier de una imagen, se pueden analizar sus texturas predominantes. • El espectro de la transformada (su módulo) |F (u,v)|, resulta ideal para describir la dirección de los patrones periódicos 2D de la imagen f ( x, y). También se puede utilizar la energía del espectro: P(u,v) = |F (u,v)|2. • Se consideran dos características del espectro de Fourier de la imagen que son útiles al describir texturas: 1) los picos prominentes del espectro indican la dirección principal de los patrones de textura; 2) la localización de esos picos en el plano de frecuencias indican el periodo espacial de los patrones. • Al expresar el espectro en coordenadas polares, se tiene: S (r ,θ). Por cada dirección de θ, S (r ,θ) es una función 1D S θ(r ), y similarmente para cada frecuencia r , S r (θ).