Académique Documents
Professionnel Documents
Culture Documents
A P N D I C E
Temas de Matemticas
Introduccin
Este apndice es un vistazo rpido de algunos conceptos matemticos bsicos que se aplican en
el procesamiento de imgenes. Su propsito es instrur al lector principiante y expresar estas
frmulas y conceptos dentro del contexto de procesamiento de imgenes y de aplicaciones de
los sensores remotos.
Notacin
Una notacin muy usada en esta y otras discusiones es Sigma ( ), usada para denotar una suma
de valores.
Por ejemplo, la notacin:
10
i
i=1
es la suma de los valores de i , entre 1 y 10 que es igual a:
1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 = 55
De manera similar, el valor i puede ser un subndice que denota un conjunto ordenado de
valores. Por ejemplo,
Qi = 3 + 5 + 7 + 2 = 17
i=1
Donde:
Q1
Q2
Q3
Q4
Field Guide
=
=
=
=
3
5
7
2
457
Temas de Matemticas
Estadstica
Histograma
En los archivos de datos de las imgenes de ERDAS IMAGINE, cada valor (definido por su fila,
su columna y su banda) es una variable. ERDAS IMAGINE soporta los siguientes tipos de
datos:
1-, 2- y 4-bits
La distribucin, como se usa en estadstica, es el conjunto de frecuencias con las cuales ocurre
un evento, o la frecuencia con la cual una variable toma un valor en particular.
Un histograma es un grfico de la distribucin o frecuencia de los datos. Para los datos de una
sola banda, el eje horizontal de un histograma es el rango de todos los posibles valores de los
datos. El eje vertical es el nmero de pxeles que tiene cada valor.
number of pixels
1000
histogram
300
0
0
100
X
255
458
Son usadas para agrupar rangos de valores iguales para mejorar su manejo. Los histogramas y
otras columnas de descripcin para datos de 1, 2, 4 y 8 bits son fcilmente manejables debido a
que ellos contienen un mximo de 256 filas. Sin embargo, tener una fila en una tabla para todo
dato posible, en datos de punto flotante, complejos y enteros de 32 bits, producira una gran
cantidad de informacin. Por consiguiente, la funcin bin sirve como herramienta para reducir
datos.
ERDAS
Estadstica
Bin Number
Data Range
X < 0.01
.
.
.
98
99
0.99 X
Entonces, por ejemplo, la fila 23 de la tabla contendr el nmero de pxeles de la capa cuyo valor
est entre 0.023 y 0.024.
Tipos de Funciones Bin
Las funciones bin establecen la relacin entre los valores de los datos y las filas en una tabla.
Hay cuatro tipos de funciones bin que se usan con las imgenes en ERDAS IMAGINE:
DIRECTA. Un bin por cada valor entero. Se usa por defecto para datos enteros de 1,2,4 y
8 bits, pero puede emplearse para otro tipo de datos. Estas funciones pueden inclur un
desplazamiento para datos negativos o para datos en los cuales el mnimo valor es mayor
que cero.
Por ejemplo, una funcin bin directa con 900 bins y un desplazamiento de -601 ser la siguiente:
Field Guide
459
Temas de Matemticas
Bin Number
Data Range
X -600.5
.
.
.
599
600
601
602
603
.
.
.
898
899
297.5 X
LINEAL. Establece una relacin lineal entre los valores de los datos y los nmeros bin,
como en nuestro primer ejemplo, relacionando los datos entre 0.0 y 1.0 a nmeros bin entre
0 y 99.
460
=
=
=
=
=
LOG. Establece una relacin logartmica entre los valores de los datos y los nmeros bin.
ERDAS
Estadstica
Media
EXPLICITA. define explcitamente una relacin entre cada nmero bin y el rango de
valores.
Q 1 + Q 2 + Q 3 + ... + Q k
= --------------------------------------------------------k
o
Qi
----k
i=1
La media de datos con una distribucin normal es el valor del pico de la curvael punto en
donde la distribucin est en equilibrio.
Distribucin Normal
number of pixels
1000
255
Field Guide
461
Temas de Matemticas
Las distribuciones normales son una familia de distribuciones en forma de campana que
aparecen frecuentemente bajo ciertas circunstancias especiales. Por ejemplo, una distribucin
normal ocurre si usted compara las bandas en una imagen de un desierto. Las bandas ser muy
similares, aunque pueden tener ligeras variaciones.
Cada distribucin normal usa dos parmetros, y , para controlar la forma y localizacin del
grfico de probabilidad resultante mediante la ecuacin:
x 2
------------
2
e
f ( x ) = --------------------- 2
Donde:
x
,e
=
=
462
ERDAS
Estadstica
Var Q = E ( Q Q )
Donde:
E
=
=
En la prctica, el uso de esta ecuacin para la varianza no refleja usualmente la naturaleza exacta
de los valores usados en la ecuacin. Estos valores son solo muestras de un gran conjunto de
datos, y as , la media y la varianza de la totalidad del conjunto de datos son estimados, no se
conocen.
La ecuacin que sigue es la ms usada en la prctica. Se conoce como el estimador de varianza
imparcial de la varianza mnima, o como la varianza de la muestra (Notacin 2).
( Qi Q )
=1
Q i------------------------------------k1
Donde:
i
k
=
=
un pixel particular
el nmero de pixeles (a mayor nmero, mejor la
aproximacin)
La teora detrs de esta ecuacin se discute en los captulos sobre estimacin de puntos y
estadsticas suficientes y est cubierto en la mayora de textos de estadstica.
NOTA: La varianza se expresa en unidades cuadradas (por ejemplo, pulgadas cuadradas,
valores de datos cuadrados, etc.), de manera que puede ser un nmero mucho mayor que
cualquiera de los valores originales.
Desviacin Estndar
Field Guide
Puesto que la varianza es expresada en unidades cuadradas, un valor mas til es la raz cuadrada
de la varianza, que es expresada en unidades y puede ser correlacionada con los valores
originales (Larsen and Marx 1981). La raz cuadrada de la varianza es la desviacin estndar.
463
Temas de Matemticas
Basados en la ecuacin de la varianza de la muestra (s2), la desviacin estndar de la muestra
(sQ ) para un conjunto de valores Q se calcula as:
( Qi Q )
sQ =
i------------------------------------=1
k1
En cualquier distribucin:
aproximadamente el 68% de los valores estn entre una desviacin estndar alrededor de
la media, es decir entre -s y +s
Como se indic anteriormente, la desviacin estndar describe cmo un porcentaje fijo de los
datos varan con respecto a la media. La media y la desviacin estndar son conocidas como
parmetros, que son suficientes para la descripcin de una curva normal (Johnston 1980).
Cuando la media y la desviacin estndar se conocen, se pueden emplearse para estimar otros
clculos acerca de los datos. En los programas de computador, es ms conveniente estimar otros
clculos con la media y la desviacin estndar que repetir los clculos para cada muestra de
datos.
Los algoritmos que emplean parmetros se llaman paramtricos. Entre ms cercana parezca la
distribucin de los datos a una curva normal, ms exactos sern los estimativos paramtricos de
los datos. Los algoritmos de clasificacin de ERDAS IMAGINE que emplean archivos de
firmas (.sig) son parametricos, puesto que la media y la desviacin estndar de cada muestra o
grupo se guardan en el archivo para representar la distribucin de los valores.
Covarianza
464
ERDAS
Estadstica
Cov QR = E ( Q Q ) ( R R )
Donde:
QyR
E
=
=
( Qi Q ) ( Ri R )
i=1
C QR --------------------------------------------------------k
Donde:
i
k
=
=
un pxel particular
el nmero de pxeles
La matriz de covarianza es una matriz n x n que contiene todas las varianzas y covarianzas en
n bandas de datos. Abajo aparece un ejemplo de una matriz de covarianza para cuatro bandas
de datos:
band A
band B
band C
band D
band A
VarA
CovBA
CovCA
CovDA
band B
CovAB
VarB
CovCB
CovDB
band C
CovAC
CovBC
VarC
CovDC
band D
CovAD
CovBD
CovCD
VarD
Field Guide
465
Temas de Matemticas
La covarianza de una banda de datos consigo mismo es la varianza de la banda:
( Qi Q ) ( Qi Q )
( Qi Q )
i=1
=1
C QQ = ----------------------------------------------------------= i------------------------------------k1
k1
Por consiguiente, la diagonal de la matriz de covarianza consiste de las varianzas de cada banda.
La matriz de covarianza est organizada en un formato que almacena la informacin de
varianzas y covarianzas en el computador, as que es necesario calcularla slo una vez. Adems
esta matriz en s misma puede usarse en ecuaciones matriciales, como en el anlisis de
componentes principales.
Ver "Algebra Matricial" en la pgina 471 para mas informacin sobre matrices.
Dimensionalidad
de los Datos
La dimensionalidad espectral est determinada por el nmero de conjuntos de valores que son
empleados en un proceso. En el procesamiento de imgenes, cada banda de datos es un conjunto
de valores. Una imagen con cuatro bandas de datos se dice que tiene cuatro dimensiones.
NOTA: La letra n se usar en esta documentacin para indicar el nmero de dimensiones
(bandas) de los datos de una imagen.
Vector de Medida
n=3
V1
Band 1
V2
Band 2
V3
Band 3
1 pixel
466
=
=
banda particular
Valor del dato del pxel en la banda i , entonces el vector
de medidas para este pxel es:
ERDAS
V1
V2
V3
Cuando los vectores de medidas de varios pxeles son analizados, a menudo se calcula el vector
de media. Este es el vector de las medias de los valores en cada banda. Este vector tiene n
elementos.
Training sample
mean of values in sample
in band 1 = 1
Band 1
Band 2
Band 3
=
=
1
2
3
Espacio
caracterstico
(Feature Space)
Field Guide
467
Temas de Matemticas
Band B
data file values
255
(180, 85)
85
Band A
data file values
180
255
180
85
El grfico anterior implica dimensiones fsicas por ilustracin. Realmente, estas dimensiones se
basan en las caractersticas espectrales representadas por los datos de la imagen. A diferencia
del espacio fsico, el pxel anterior est graficado en un espacio de caractersticas. El espacio de
caractersticas es un espacio abstracto que est definido por unidades espectrales, tales como
cantidad de radiacin electromagntica.
Imgenes del
Espacio de
Caracteristicas
468
ERDAS
Band B
data file values
255
255
Band A
data file values
Field Guide
469
Temas de Matemticas
Cuando todos los conjuntos de datos (bandas) tienen distribucin normal, el diagrama de
dispersin forma un hiperelipsoide. El prefijo hiper se refiere a una forma geomtrica abstracta,
que es definida en ms de tres dimensiones.
NOTA: En esta documentacin, los ejemplos bidimensionales se usan para ilustrar conceptos
que se aplican a cualquier nmero de dimensiones de los datos. Los ejemplos bidimensionales
son ms convenientes para crear ilustraciones que se van a imprimir.
Distancia Espectral
D =
( di ei )
i=1
Donde:
D
n
i
di
ei
=
=
=
=
=
distancia espectral
nmero de bandas (dimensiones)
una banda particular
valor de archivo (nivel digital) del pixel d en la banda i
valor de archivo del pixel e en la banda i
Esta es la ecuacin para la distancia euclidiana - en dos dimensiones (cuando n = 2), ella puede
ser simplificada por el teorema de Pitgoras (c2 = a2 + b2 ), o en este caso:
D2 = (di - ei)2 + (dj - ej)2
Polinomios
Orden
Las variables en las expresiones polinomiales pueden ser elevadas a exponentes. El mayor
exponente en un polinomio determina el orden del polinomio.
Un polinomio con una variable, x , toma esta forma:
A + Bx + Cx2 + Dx3 + .... + xt
Donde:
A,B,C,D
t
=
=
coeficientes
el orden del polinomio.
NOTA: Si alguno o todos los coeficientes son cero, entonces la naturaleza pero no la
complejidad, de la transformacin cambia. Matemticamente, no puede ser cero.
470
ERDAS
Algebra Matricial
t i
xo =
i = o j = o
ak x
t i
y o =
i = o j = o
bk x
ij
ij
Donde:
t
ak y bk
=
=
i+j+j
k = i--------------2
Un ejemplo numrico de una transformacin de 3er orden es:
xo = 5 + 4x - 6y + 10x2 - 5xy + 1y2 + 3x3 + 7x2y - 11xy2 + 4y3
yo = 13 + 12x + 4y + 1x2 - 21xy + 1y2 - 1x3 + 2x2y + 5xy2 + 12y3
Las ecuaciones polinomiales se emplean en la rectificacin de imgenes para transformar
coordenadas de un archivo de entrada a coordenadas en otro sistema. El orden del polinomio
usado en este proceso es el orden de la transformacin.
Matriz de
Transformacin
En el caso de rectificacin de primer orden, de una imagen, las variables en los polinomios (X
e Y) son las coordenadas fuente de un punto de control terrestre (GCP). Los coeficientes son
calculados a partir de los GCPs y almacenados como una matriz de transformacin.
Algebra Matricial
Field Guide
471
Temas de Matemticas
Una matriz unidimensional que tenga una sola columna (i por 1) es una de las clases de vectores.
Por ejemplo, el vector de medida de un pxel es un vector de n elementos de valores de pxel,
donde n es el numero de bandas.
Las matices y vectores se designan con una letra mayscula, como M. Por ejemplo:
M =
2.2 4.6
6.1 8.3
10.0 12.4
Un valor en la matriz M ser especificado por su posicin, que es su fila y columna (en ese
orden) en la matriz. Un elemento del arreglo (un valor) ser designado por una letra minscula
y su posicin.
m3,2 = 12.4
Con vectores columna, es mas fcil usar un solo numero para designar la posicin:
2.8
G = 6.5
10.1
G2 = 6.5
Multiplicacin de
Matrices
C =
a1 a2 a3
b1 b2 b3
Donde:
xo
yo
x i, y i
xo , yo
=
=
=
=
a1 + a2xi + a3yi
b1 + b2xi + b3yi
coordenadas fuente
coordenadas rectificadas
472
ERDAS
Algebra Matricial
x0
y0
a1 a2 a3
b1 b2 b3
1
xi
yi
R =CS, or
Donde:
S
C
R
=
=
=
Los tamaos de las matrices que se indicaron anteriormente muestran la regla para multiplicar
matrices. Para ello, el nmero de columnas en la primera matriz debe ser el mismo que el
nmero de filas de la segunda matriz. Por ejemplo, si la primera matriz es a por b y la segunda
matriz es m por n, entonces b debe ser igual a m y la matriz resultante debe ser de tamao a por n.
La frmula para multiplicar dos matrices es:
( fg ) ij =
fik gkj
k=1
Field Guide
=
=
=
=
La transpuesta de una matriz se obtiene intercambiando sus filas y columnas. Para denotar la
transpuesta se usa una T, como en el siguiente ejemplo (Cullen 1972).
473
Temas de Matemticas
2 3
G = 6 4
10 12
= 2 6 10
3 4 12
474
ERDAS