Vous êtes sur la page 1sur 40

Regresin Exponencial mediante el

Mtodo de los Mnimos Cuadrados


Enviado por Mario Orlando Surez Ibujes

Regresin exponencial mediante el principio de los mnimos cuadrados -


Monografias.com

Regresin exponencial mediante el principio de los mnimos cuadrados

Fue Francis Galton (1822-1911) quien utiliz por primera vez el trmino regresin para
indicar que, aunque influida por la estatura de sus padres, la estatura de los hijos
"regresaba" a la media general.

La regresin examina la relacin entre dos variables, pero restringiendo una de ellas con
el objeto de estudiar las variaciones de una variable cuando la otra permanece constante.
En otras palabras, la regresin es un mtodo que se emplea para predecir el valor de una
variable en funcin de valores dados a la otra variable.

En todos los casos de regresin existe una dependencia funcional entre las variables. En
el caso de dos variables, siendo una de ellas (X) variable independiente y la otra (Y) la
dependiente, se habla de regresin de Y sobre X; Por ejemplo, los ingenieros forestales
utilizan la regresin de la altura de los rboles sobre su dimetro, lo cual significa que
midiendo el dimetro (variable independiente) y reemplazando su valor en una relacin
definida segn la clase de rbol se obtiene la altura, y aun sin necesidad de clculos
aprecian la altura utilizando grficas de la funcin de dependencia, altura = funcin del
dimetro.

Cuando la curva de regresin de y sobre x es exponencial, es decir para cualquier x


considerada, la media de la distribucin est dada por la siguiente ecuacin predictora:

Formatted: Font: (Default) Times New Roman, 12 pt


Ejemplo ilustrativo: Las cifras siguientes son datos sobre el porcentaje de llantas
radiales producidas por cierto fabricante que an pueden usarse despus de recorrer
cierto nmero de millas:

Miles de Millas recorridas


1 2 5 15 25 30 35 40
(X)
Porcentaje til (Y) 99 95 85 55 30 24 20 15

1) Elaborar el diagrama de dispersin.

2) Ajustar una curva exponencial aplicando el mtodo de mnimos cuadrados.

3) Calcular la ecuacin predictora.

4) Graficar la ecuacin predictora.

5) Estimar qu porcentaje de las llantas radiales del fabricante durarn 50000 millas.

Solucin:

1) Elaborando el diagrama de dispersin empleando Excel se obtiene la siguiente


figura:

Formatted: Font: (Default) Times New Roman, 12 pt

Empleando el programa Graph se obtiene la siguiente figura:


Formatted: Font: (Default) Times New Roman, 12 pt

2) Se llena la siguiente tabla:

Formatted: Font: (Default) Times New Roman, 12 pt

Resolviendo empleando Excel se muestra en la siguiente figura:


Formatted: Font: (Default) Times New Roman, 12 pt

Reemplazando valores en el sistema se obtiene:

Formatted: Font: (Default) Times New Roman, 12 pt

Resolviendo empleando Excel se muestra en la siguiente figura:


Formatted: Font: (Default) Times New Roman, 12 pt

3) Reemplazando en la ecuacin predictora se obtiene:

Formatted: Font: (Default) Times New Roman, 12 pt

4) Graficando la ecuacin predictora empleando Excel se obtiene la siguiente figura:


Formatted: Font: (Default) Times New Roman, 12 pt

En Graph se obtiene la siguiente figura:

Formatted: Font: (Default) Times New Roman, 12 pt

5) La estimacin del porcentaje de llantas radiales que durarn 50000 millas se obtiene
reemplazando en la ecuacin predictora el valor de X = 50

Formatted: Font: (Default) Times New Roman, 12 pt

Entonces el porcentaje sera de 9,106%


Leer ms: http://www.monografias.com/trabajos89/regresion-exponencial-metodo-
minimos-cuadrados/regresion-exponencial-metodo-minimos-
cuadrados.shtml#ixzz3p7NXwLQK

1. Ejemplo ilustrativo N 1
2. Ejemplo ilustrativo N 2
3. Referencias bibliogrficas

La regresin examina la relacin entre dos variables, pero restringiendo una de ellas con
el objeto de estudiar las variaciones de una variable cuando la otra permanece constante.
En otras palabras, la regresin es un mtodo que se emplea para predecir el valor de una
variable en funcin de valores dados a la otra variable.

En todos los casos de regresin existe una dependencia funcional entre las variables. En
el caso de dos variables, siendo una de ellas (X) variable independiente y la otra (Y) la
dependiente, se habla de regresin de Y sobre X; Por ejemplo, los ingenieros forestales
utilizan la regresin de la altura de los rboles sobre su dimetro, lo cual significa que
midiendo el dimetro (variable independiente) y reemplazando su valor en una relacin
definida segn la clase de rbol se obtiene la altura, y aun sin necesidad de clculos
aprecian la altura utilizando grficas de la funcin de dependencia, altura = funcin del
dimetro.

La regresin potencial tiene por ecuacin predictora:

Y la regresin recproca es:

Para el primer caso los valores siguen una ley potencial. Si la ecuacin predictora est
dada por: tomando logaritmos en ambos miembros, queda:

Donde las constantes y quedan fijadas al resolver simultneamente las ecuaciones:

Para el segundo caso, si la ecuacin predictora est dada por entonces


invirtiendo, la misma expresin se puede escribir o sea:
Donde las constantes y quedan fijadas al resolver simultneamente las ecuaciones:

Ejemplos ilustrativo N 1
Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es el
volumen (variable independiente) e Y es la presin de una masa dada de gas (variable
resultante).

X 1 2 3 4 5 6 7
Y 7 30 90 170 290 450 650

1.1) Elaborar el diagrama de dispersin.

1.2) Ajustar una curva exponencial aplicando el mtodo de mnimos cuadrados.

1.3) Calcular la ecuacin predictora.

1.4) Graficar la ecuacin predictora.

1.5) Estimar la presin de la masa de gas de volumen 9.

Solucin:

1.1) El diagrama de dispersin elaborado en Excel se presenta en la siguiente figura:


El diagrama de dispersin elaborado en Graph se presenta en la siguiente figura:

1.2) Para ajustar una curva exponencial aplicando el mtodo de mnimos cuadrados se
llena la siguiente tabla:

X Y log X log Y log X log Y (log X)2


1 7 0,0000 0,8451 0,0000 0,0000
2 30 0,3010 1,4771 0,4447 0,0906
3 90 0,4771 1,9542 0,9324 0,2276
4 170 0,6021 2,2304 1,3429 0,3625
5 290 0,6990 2,4624 1,7211 0,4886
6 450 0,7782 2,6532 2,0646 0,6055
7 650 0,8451 2,8129 2,3772 0,7142
S S log X log Y S(log X)2=
S X=28 S logX=3,7024
logY=14,4354 =8,8829 2,4890

Reemplazando valores en el sistema de ecuaciones se obtiene:

Al resolver el sistema se obtiene: log a = 0,819; = 2,351

Reemplazando valores en la ecuacin predictora expresada en logaritmos se tiene:


1.3) Para calcular la ecuacin predictora, primero se calcula el valor de a de la siguiente
manera:

Reemplazando en la ecuacin predictora se obtiene:

1.4) Graficando la ecuacin predictora mediante Excel se muestra en la siguiente


figura:

Empleando Graph se obtiene la siguiente figura:


1.5) Para estimar la presin de la masa de gas de volumen 9 se reemplaza el valor X = 9
en la ecuacin predictora

Ejemplo ilustrativo N 2
Sea el siguiente conjunto de valores, las lecturas de un experimento donde X es la
variable independiente e Y la variable resultante.

X 1 2 3 4 5 6 7
Y 1,4 1 0,9 0,7 0,6 0,55 0,5

2.1) Elaborar el diagrama de dispersin.

2.2) Calcular las constantes y aplicando el mtodo de mnimos cuadrados.

2.3) Calcular la ecuacin predictora.

2.4) Graficar la ecuacin predictora.

2.5) Estimar el valor de Y para X = 9

Solucin:

2.1) El diagrama de dispersin elaborado en Excel se muestra en la siguiente figura:

El diagrama de dispersin elaborado en Graph se muestra en la siguiente figura:


2.2) Para calcular las constantes y aplicando el mtodo de mnimos cuadrados se
llena la siguiente tabla:

X Y 1/Y X(1/Y) X2
1 1,4 0,7143 0,7143 1
2 1 1,0000 2,0000 4
3 0,9 1,1111 3,3333 9
4 0,7 1,4286 5,7143 16
5 0,6 1,6667 8,3333 25
6 0,55 1,8182 10,9091 36
7 0,5 2,0000 14,0000 49
S (1/Y) = S X(1/Y) = S X2 =
S X = 28
9,7388 45,0043 140

Reemplazando valores en el siguiente sistema se obtiene:

Al resolver el sistema se obtiene:

a = 0,5271; = 0,2160
2.3) Para calcular la ecuacin predictora se reemplaza los valores encontrados de a y ,
y se obtiene:

2.4) La grfica la ecuacin predictora elaborada en Excel se muestra en la siguiente


figura:

La grfica la ecuacin predictora elaborada en Graph se muestra en la siguiente


figura:

2.5) Para estimar el valor de Y para X = 9 se reemplaza el valor de X en la ecuacin


predictora.
REFERENCIAS BIBLIOGRFICAS
BENALCZAR, Marco, (2002), Unidades para Producir Medios Instruccionales en
Educacin, SUREZ, Mario Ed. Graficolor, Ibarra, Ecuador.

DAZA, Jorge, (2006), Estadstica Aplicada con Microsoft Excel, Grupo Editorial
Megabyte,

Lima, Per.

SUREZ, Mario, (2004), Interaprendizaje Holstico de Matemtica, Ed. Grficas


Planeta,

Ibarra, Ecuador.

SUREZ, Mario, (2011), Interaprendizaje de Estadstica Bsica

TAPIA, Fausto Ibarra-Ecuador.

Leer ms: http://www.monografias.com/trabajos89/regresion-potencial-metodo-


minimos-cuadrados/regresion-potencial-metodo-minimos-
cuadrados.shtml#ixzz3p7OWOT00

Anlisis de datos Experimentales por Mnimos Cuadrados

noviembre 4, 2011 3 comentarios

AJUSTE DE CURVAS

Uno de los objetivos en el anlisis de resultados es el llegar a establecer una relacin


cuantitativa entre dos o ms variables y mediante esta relacin poder efectuar
predicciones. Por lo general la relacin consiste en una ecuacin que expresa cmo la
variable dependiente (cuyo valor se desea predecir) es afectada por una o ms variables
independientes.

En esta unidad se ilustra la forma de establecer la posible relacin de una variable


dependiente con otra variable considerada independiente. El primer paso es disponer de
una coleccin de datos obtenidos experimentalmente. Si se simbolizan por X y Y las
variables independiente y dependiente respectivamente, y sus valores particulares por
X1, Y1, X2, Y2, etc., en una tabla se dispondran as:
X X1 X2 X3 ......... XN
Y Y1 Y2 Y3 ......... YN

El siguiente paso es representar los puntos (X1, Y1 ), (X2, Y2) . . . . , (XN, YN) en un
sistema de coordenadas rectangulares. El sistema de puntos resultantes se
llama diagrama de dispersin.

Con el diagrama de dispersin es posible representar una curva que se aproxime a los
datos, es decir, que siga la tendencia de los mismos. Tal curva se llama curva de
aproximacin.

En la figura 5.1 a) , por ejemplo, se ve que los datos experimentales se aproximan bien
a una lnea recta y se dice que entre las variables existe una relacin lineal. En b), existe
una relacin no lineal.

Las curvas mostradas enla Fig.5.1 se denominan curvas de aproximacin y describen la


tendencia de los puntos en el diagrama de dispersin. El problema general de hallar la
ecuacin de la curva de aproximacin que se ajuste mejor al conjunto de datos con los
que se obtuvo el diagrama de dispersin se denomina determinacin dela CURVA
DEAJUSTE.

Una curva de aproximacin como la de la Fig.5.1 (a) sugiere una ecuacin lineal;
(ecuacin de la recta) Y = a + bX; mientras que la de la curva en la Fig.5.1 (b) sugiere
una ecuacin cuadrtica (parablica) de la forma Y = a + bX + cX2.

La dispersin de los puntos se debe a los errores que afectan en el proceso de medicin
tanto a la variable dependiente como a la independiente. En ocasiones puede
despreciarse el error en la variable independiente al compararse con el error (o variacin
aleatoria) de la variable dependiente. Esto depender de la situacin particular de las
causas de error sobre cada variable al realizar el experimento.

ANLISIS DE REGRESIN

Uno de los propsitos principales de la curva de ajuste es estimar una de las variables a
partir de la otra. El proceso de estimacin se conoce como regresin. Si Y se va a
estimar a partir de X por medio de alguna ecuacin la llamamos ecuacin de regresin
de Y sobre X y a la curva correspondiente curva de regresin de Y sobre X.
A continuacin se presentan algunos ejemplos de relaciones denominadas funciones o
ecuaciones de prediccin:

Yc = a + bX (Lnea Recta)

Yc = a + bX + cX2 (Ecuacin de segundo grado o cuadrtica)

Yc = KXn o Yc = aXb (Ecuacin potencial)

Yc = A DX o Yc = a bX (Ecuacin exponencial)

En estos ejemplos, Yc representa el valor estimado de la variable dependiente a partir


del valor X, de la variable independiente.

Existen varios mtodos para determinar la ecuacin de regresin. El mtodo de


mnimos cuadrados , que se describe mas adelante, se considera el mejor; por
fundamentarse en el tratamiento estadstico de los datos experimentales.

Como se mencion anteriormente, los errores afectan tanto a la variable independiente


como a la variable dependiente, sin embargo en muy diversos casos la variable
independiente puede considerarse sin error (o de error despreciable) y considerar que la
dispersin es debido unicamente a los errores en la variable dependiente. En este caso se
considera que para un valor puntual de X (sin error) el valor experimental de Y se aparta
del valor que predice la curva de regresin.

MTODO DE MNIMOS CUADRADOS

Generalmente, ms de una curva de un tipo dado parece ajustarse a un conjunto de


datos. Para evitar el juicio individual en la construccin de rectas, parbolas u otras
curvas de aproximacin, es necesario obtener una definicin de la mejor curva de
ajuste, mejor parbola de ajuste, etc

Considrese la Fig.5.2 en la cual los puntos de un conjunto de datos (hipoteticamente


experimentales) se expresan por (X1 , Y1), (X2, Y2) . . . . . (Xn, Yn)

Fig. 5.2 Diferencias entre los valores de


la variable dependiente Y

y los de la curva de aproximacin C.


Para un valor dado de x, por ejemplo X1 habr una diferencia entre el valor de Y1 y el
valor correspondiente de la curva C.

Esta diferencia se denota por D1 y se conoce como desviacin, error, o residuo y puede
ser positivo, negativo o cero. Anlogamente, correspondiendo a los valores X2 , X3 . . . ,
XN obtenemos las desviaciones D2 , D3 , . . . , DN .

Una medida de la bondad de ajuste de la curva C al conjunto de datos la suministra la


cantidad D12 + D22 + .. + DN2. Si la suma es pequea el ajuste es bueno, si es grande,
el ajuste es malo.

Definicin:

De todas las curvas de aproximacin correspondientes a un conjunto de puntos dados, la


curva que tenga la propiedad de que D12 + D22 + .. + DN2 es mnimo, se conoce
como la mejor curva de ajuste.

Una curva con esta propiedad se dice que ajusta los datos por mnimos cuadrados y se
llama Curva de regresin de mnimos cuadrados o simplemente Curva de
mnimos cuadrados.

Una recta con esta propiedad se llama recta de mnimos cuadrados, una parbola con
esta propiedad se llama parbola de mnimos cuadrados, etc.

REGRESIN LINEAL.

Con el siguiente ejemplo se ilustra como puede tratarse un caso de regresin lineal. En
la tabla siguiente se dan los resultados de 12 mediciones, las X son las cargas en miles
de libras y las Y son las deflexiones correspondientes en milsimas de pulgada, en la
calibracin de un anillo tensor:

CARGA 1 2 3 4 5 6 7 8 9 10 11 12

Y 16 35 45 64 86 96 106 124 134 156 164 182

DEFLEXIN

Primero se construye el diagrama de dispersin; a partir de aqu, y segn la tendencia de


los puntos, se traza la curva de aproximacin, que resulta en la forma que se ilustra enla
Fig.5.3 (lnea no continua -).
Fig. 5.3 Grfico de Deflexin versus carga

Es razonable suponer que la relacin (curva de regresin) es lineal.

Se aplicar el mtodo de mnimos cuadrados para determinar la ecuacin de regresin.


Para una relacin lineal en general Yc = a + bX ; Yc representa el valor terico de Yi el
valor estimado de Y que corresponde a un valor particular de X.

El criterio de mnimos cuadrados requiere la determinacin de los valores de a y b


tal que Z = (Yi Yc)2 sea un mnimo (es decir, que tienda a cero). En la ecuacin de la
relacin lineal a y b se denominan coeficientes de regresin: a es la intercepcin
con el eje de las ordenadas Y y b es la pendiente de la lnea que mejor se ajusta.

Como se busca la recta que mejor se ajuste a los puntos experimentales, el intercepto
a y la pendiente b adquieren el carcter de variables; ya que estos parametros son
los que diferencian a una recta de otra.

Sea Z = (Yi Yc)2 y sustituyendo Yc = a + bX, Z = (Yi a bX)2 , que debe ser un
mnimo de acuerdo a la definicin de mejor curva de ajuste (en este caso, mejor recta
de ajuste).

Utilizando el clculo diferencial con derivadas parciales actuando sobre sumatorias, se


llega a establecer un sistema de dos ecuaciones, denominadas ecuaciones normales
para la regresin lineal o ecuaciones normales para la recta de mnimos cuadrados.

Las ecuaciones son :

Donde n es el nmero de pares ordenados (X, Y) o nmero de puntos o nmero de


observaciones, a y b son incgnitas que representan, como ya se mencion,
respectivamente, el intercepto y la pendiente de la recta de mnimos cuadrados.
Para resolver estas ecuaciones se requiere obtener X, Y, XY y X2. Para el
ejemplo del anillo tensor se tiene:

Xi Yi XY X2

1 16 16 1

2 35 70 4

3 45 135 9

4 64 256 16

5 86 430 25

6 96 576 36

7 106 742 49

8 124 992 64

9 134 1206 81

10 156 1560 100

11 164 1804 121

12 182 2184 144

= 78 1208 9971 650

Sustituyendo en las ecuaciones normales.

1208 = 12a + 78b

9971 = 78a + 650b

Resolviendo el sistema por el mtodo de suma y resta, vamos a eliminar la constante


a multiplicando la primera ecuacin por 78 y la segunda por 12:

1208 = 12 a + 78b (- 78)

9971 = 78 a + 650b ( 12 )

*****************************************

94224 =-936 a 6084b

119652 = 936 a + 7800b


25428 = 0 + 1716b

Para encontrar el valor de a sustituimos el valor de b en cualquiera de las


ecuaciones originales; en este caso se sustituye b = 14.82 en (1):

1208 = 12a + 78 (14.82)

1208 = 12a + 1156

1208 1156 = 12a

52 = 12a

Finalmente, la ecuacin de regresin queda as:

Yc = 4.3 + 14.82 X

La lnea recta que aparece cruzando el diagrama de dispersin se traz calculando dos
puntos:

P1 (0, 4.3) y P2 (8, 122.9) con esta ecuacin, y uniendo seguidamente dichos puntos
(basta con dos puntos, ya que dos puntos determinan una recta).

NOTA: Si el lector no recuerda los mtodos de solucin de un sistema de ecuaciones


(lo ideal sera que consultar un texto de matemtica habr un post de Sistemas de
Ecuaciones si es pedido) escribiremos a continuacin las frmulas para encontrar a y b:

Le queda al lector comprobar estas frmulas, deber llegar a la misma ecuacin de


regresin: Yc = 4.3 + 14.82 X. Anteriormente habamos dicho que el valor de a era
el intercepto con el eje de las ordenadas, Y; al observar la grfica notamos que,
efectivamente, la recta terica corta al eje Y en la divisin 4.3 que es el valor que ha
tomado a; el valor de b = 14.82 milsimas de pulgadas de aumento en la deflexin
del anillo cuando la carga x aumenta en1000 libras.

Con la ecuacin calculada, podemos hacer estimaciones de Y (deflexin), y haciendo


variar el valor de X (carga). Por ejemplo, si deseamos estimar la deflexin del anillo
para un valor de X = 3.5 (3500 libras); la respuesta es:

Yc = 4.3 + 14.82 (3.5) = 56.17 (milsimas de pulgada)


Conviene aclarar que con la ecuacin de regresin slo se pueden hacer
interpolaciones, ya que la ecuacin expresa funcionalmente la relacin de las variables,
pero para pares de valores comprendidos en el dominio y rango donde se ha
experimentado. En nuestro ejemplo se ha experimentado en el intervalo de1 a 12; si con
la ecuacin que hemos determinado, quisiramos estimar la deflexin para una carga
de20,000 libras; X = 20, el resultado es:

Yc = 4.3 + 14.82 (20) = 300.7 (milsimas de pulgada).

Este resultado es un tanto dudoso, pues lo ms probable es que al aplicar una carga
mayor de la que se ha experimentado el anillo tensor se deforme o hasta se rompa.

REGRESIN CURVILNEA

Funcin potencial o curva geomtrica: Yc = aXb.

Aplicando logaritmo a la funcin Yc = aXb, tenemos:

Log Yc = Log a + b Log X

Tal como hemos dicho anteriormente, la expresin S(Log Yi Log Yc)2 es un mnimo;
sustituyendo en esta expresin Log Yc por su valor, tenemos:

S(Log Yi Log a b Log X)2, es un mnimo

Al derivar parcialmente con respecto a a y respecto a b e igualar a cero las


derivadas, obtenemos las ecuaciones normales siguientes:

SLog Y = n Log a + b S Log X (1)

SLog X Log Y = Log a S Log X + b S(Log X)2 (2)

Ahora ajustemos una funcin potencial a la siguiente informacin, correspondiente al


periodo de oscilacin de un sistema resorte-masa:

m (kg) 0.20 0.40 0.60 0.80 1.00 1.20 1.40

T (s) 0.34 0.47 0.58 0.66 0.74 0.84 0.90

Se obtiene el diagrama de dispersin y su respectiva curva de aproximacin, tal como se


ilustra en la fig. 5.4 .
Fig. 5.4 Diagrama de dispersin y curva de aproximacin

El diagrama de dispersin sugiere una relacin de la forma T = Kmn ; en este caso, con
0 < n < 1. La ecuacin se puede escribir como T = amb. Aplicando logaritmo a esta
expresin: Log T = Log a + b Log m

Las ecuaciones normales toman la forma siguiente:

SLog T = n Log a + b S Log m (1)

SLog m. Log T = Log a S Log m + b S (Log m)2 (2)

El siguiente cuadro contiene los valores logartmicos necesarios para resolver las
ecuaciones normales.

mi Ti Log m Log T Log m.Log T (Log m)2 Tc


0.20 -0.46852 0.48856
0.34 -0.69897 0.32748 0.335
0.40
0.47 -0.39794 -0.32790 0.13049 0.15836
0.474
0.60
0.58 -0.22185 -0.23457 0.05248 0.04921
0.581
0.80 -0.18045 0.00939
0.66 -0.09691 0.01749 0.671
1.00 -0.13077 0.00000
0.74 0.00000 0.0000 0.750
1.20 -0.07572 0.00627
0.84 0.07918 -0.00589 0.822
1.40 -0.04575 0.07135
0.90 0.14613 -0.00669 0.887
-1.46558 0.73314
S= -1.19036 0.51526

Sustituyendo en las ecuaciones normales se tiene:

1.46558 7 Log a 1.19036 b

0.51526 1.19036 Log a + 0.73314 b

Resolviendo las ecuaciones se obtiene:


b = 0.50124 0.50

Log a = 0.12414 de esto, a = 0.75137 0.75

La ecuacin de regresin es:

Log T = 0.12414 + 0.50 Log m

de acuerdo a esta, se puede escribir T = 0.75 m0.50

Para obtener los valores tericos de T (Tc), se utiliza esta ltima expresin y estos se
representan en la ltima columna del cuadro anterior:

Ejemplo: Tc= 0.75 (0.20)0.50 = 0.335

Caso exponencial: Yc = a bX

Existen muchas transformaciones fsicas en las que la variacin de una magnitud en un


intervalo de tiempo dado es proporcional a la cantidad de dicha magnitud al principio
del intervalo. A continuacin se citan varios ejemplos.

Una propiedad de las clulas vivas es que pueden reproducirse y as aumentar en


nmero con el tiempo. El nmero de clulas nuevas producidas en un intervalo dado de
tiempo depende del nmero de clulas presentes al principio de dicho intervalo. En otras
palabras, el nmero de clulas nuevas producidas en un intervalo determinado de
tiempo es proporcional al nmero presente.

Si la diferencia de temperatura DT entre un objeto y su medio ambiente no es


demasiado grande, la rapidez de enfriamiento o de calentamiento es aproximadamente
proporcional a la diferencia de temperatura entre el objeto y su medio ambiente.

En la desintegracin radiactiva el cambio DN en el nmero de tomos padres es, para


cada intervalo de tiempo Dt, proporcional al nmero de tomos padres presentes al
comienzo del intervalo.

En los tres ejemplos anteriores, al aplicar clculo integral, se llega a una expresin del
tipo Y = a bX , que es una relacin exponencial ya que x est como exponente de una
base b.Y podra representar el nmero de bacterias N, la diferencia de temperatura DT
entre un objeto y su medio ambiente o el nmero de tomos padre N. La variable x
representa al tiempo.

En la parte de electricidad, en un circuito R-C en descarga encontramos la relacin


exponencial entre el voltaje en el capacitor y el tiempo de descarga as:

o tambin V = Vo (D)t en donde se ha tomado e-1/RC = D.


Ejemplo del caso exponencial tratado con mnimos cuadrados.

La actividad, A, de una muestra de cromo (Cr-55) medida en milicuries (mCi) a travs


del tiempo (en minutos) se da en la siguiente tabla:

TIEMPO, t (min) 0.0 2.5 5.0 7.5 10.0 15.0 20.0


ACTIVIDAD, A (mCi) 19.20 11.70 7.15 4.35 2.65 1.00 0.35

Primero representamos en una grfica la actividad en funcin del tiempo para averiguar
el tipo de ecuacin que podra corresponderle.

FIG. 5.5 ACTIVIDAD-TIEMPO DEL Cr -55.

Como se observa, le corresponde el tipo de ecuacin exponencial Yc = a bX .

A la informacin le ajustaremos, por mnimos cuadrados dicha funcin exponencial.

Aplicando logaritmos a Yc = abX tenemos: Log Yc = Log a + X Log b.

Como en los casos anteriores, interesa minimizar la expresin:

Z = S (Log Yi Log a X Log b)2

Al derivar parcialmente con respecto a a y b e igualar a cero las derivadas llegamos


a las siguientes ecuaciones normales:

SLog Yi = n Log a + Log b S Xi (1)

S X.Log Yi = Log a SXi + Log b SXi2 (2)

En este ejemplo, X representa a la variable independiente, es decir, el tiempo (t) y Y es


la variable dependiente, o sea la actividad (A). El nmero de pares ordenados es n= 7.
Dicho lo anterior y de acuerdo a las ecuaciones normales (1) y (2), la tabla necesaria es:

t (min) A (mCi) log A t*log A t2 AC


0.0 19.20 1.283301229 0.000000000 0.00 19.36
2.5 11.70 1.068185862 2.670464654 6.25 11.76
5.0 7.15 0.854306042 4.271530209 25.00 7.14
7.5 4.35 0.638489257 4.788669427 56.25 4.34
10.0 2.65 0.423245874 4.232458739 100.00 2.64
15.0 1.00 0.000000000 0.000000000 225.00 0.97
20.0 0.35 -0.455931956 -9.118639113 400.00 0.36
S= 60.0 3.811596307 6.844483917 812.50

Sustituyendo en (1) y (2)

3.811596307 = 7 Log a + 60.0 Log b (1)

6.844483917 = 60.0 Log a + 812.50 Log b (2)

Resolviendo el sistema de ecuaciones

228.6957784 = 420 Log a + 3600 Log b (1) * 60.0

47.91138742 = 420 Log a 5687.5 Log b (2) * 7

Sumando: 180.784391 = 2087.5 Log b

Log b = 180.784391/-2087.5 = 0.086603301

-0.086603301 = 0.8192
b = (Log) 1
Sustituyendo el valor de Log b en (1) y despejando:

7 Log a = 3.811596307 60.0 * 0.086603301

Log a = 1.286827767

a = (Log) 1 1.286827767 = 19.36

AC = 19.36 (0.8192)t

La expresin anterior es la ecuacin de regresin.


En la ltima columna del cuadro anterior aparecen los valores tericos de AC.
Estos valores se obtuvieron utilizando la ecuacin de regresin al sustituir en el
exponente t los valores de la primera columna de la tabla.

Ejemplo de aplicacin de ajuste de curva potencial

Para los datos mostrados en la tabla siguiente :


1.20 1.80 3.10 4.90 5.70

X
4.50 5.90 6.00 7.80 7.50

a) Representar los datos en un diagrama de dispersin:

Fig. 5.6 Diagrama de dispersin de Y versus X

b) Del diagrama de dispersin, trazar la curva de aproximacin


Fig. 5.7 Diagrama de dispersin y curva de aproximacin

de Y versus X

c) Encuentre la ecuacin de ajuste, asumiendo que es una potencial.

Para la curva de aproximacin (potencial) Y = aXb

Le aplicamos logaritmos: Log Y = Log a + b Log X

Las ecuaciones normales son: SLog Y = n Log a + b SLog X

SLog X Log Y = Log a SLog X + b S(Log X)2

Los datos necesarios son:

X Y Log X Log Y Log X . LogY (Log X)2


1.20 4.50 0.079181 0.653212 0.051722 0.006269
1.80 5.90 0.255272 0.770852 0.196777 0.065164
3.10 6.00 0.491362 0.778151 0.382354 0.241437
4.90 7.80 0.690196 0.892094 0.615719 0.476371
5.70 7.50 0.755875 0.875061 0.661437 0.571347
S = 16.70 S = 31.70 S= 2.271886 S= 3.969370 S= 1.908009 S= 1.360588
El sistema de ecuaciones es:

3.969370 = 5 Log a + 2.271886 b

1.908009 = 2.271886 Log a + 1.360588 b

Resolviendo el sistema se tiene que:

Log a = 0.649 , b = 0.318

La ecuacin de regresin es:

Log Yc = 0.649 + 0.318 Log X

Por interesarnos Yc, tomamos antilogaritmos, as:

Yc = 4.46 x0.318

NOTA: Las S significan sumatoria.

BIBLIOGRAFA

BONILLA, GILDABERTO, Estadstica I. Elementos de Estadstica Descriptiva y


Probabilidad

9 edicin, 2000. UCA Editores. El Salvador.

2. MILLER, IRWIN Y FREUND, JOHN. Probabilidad y Estadstica para Ingenieros.


Primera edicin. Mxico, Editorial Revert, 1973.

3. MILLER, FREUND Y JOHNSON. Probabilidad y Estadstica para Ingenieros.

5a Edicin. Mxico. Prentice Hall, 1997.

4. SPIEGEL/SCHILER/SRINIVASAN. Probabilidad y Estadstica, 2 Edicin, Mxico


McGraw-Hill, 2001.

5. SPIEGEL, MURRAY R. Estadstica. Mxico. McGraw-Hill, 1994


6 AJUSTE DE CURVAS POR MNIMOS CUADRADOS

En la ciencia y la ingeniera se da, a menudo, el caso de que un experimento produce un


conjunto de datos (x1,y2), (x2,y2), ..., (xn,yn). El objetivo en esta seccin es determinar
una frmula y = (x) que relacione las variables. Generalmente se dispone de un
conjunto de variables previamente establecidas, y lo que hay que hallar son los valores
ms adecuados de unos coeficientes o de unos parmetros para estas frmulas. Aunque
existen muchas funciones que se pueden usar, suele ocurrir que existe un modelo
matemtico subyacente, basado en la situacin fsica que se est estudiando y determina
la forma de la funcin salvo algunos coeficientes.

Si la relacin entre xi e yi para 1 i n, es lineal, entonces la funcin que mejor se ajusta


a los datos es una lnea de aproximacin de la forma:

y = ax + b (ver figura 3.5)

Una forma para encontrar la recta ptima es el mtodo de los mnimos cuadrados y
consiste en hallar el valor de las constantes a y b de tal manera que reduzcan al mnimo
la suma de los cuadrados de los errores entre los valores yi dados y los valores y(xi) =
axi + b en la lnea de aproximacin.

(7)

La cantidad (7) se puede considerar una funcin de dos variables a y b, a la que se le


quiere hallar un mnimo. Para que ocurra un mnimo es necesario que las derivadas

parciales sean cero. Observe que las xi e yi son puntos de datos.

Al dividir entre 2 cada una de estas ecuaciones y desarrollar las sumatorias se obtienen
las llamadas ecuaciones normales

(2)

La solucin del sistema (2), de dos ecuaciones con dos incgnitas es


(3)

Por lo tanto la recta que mejor se ajusta a los datos (xi, yi), 1 i n relacionados en
forma lineal es y = ax + b con a y b dados por (3).
El problema de aproximar un conjunto de datos (xi, yi), 1 i n con un polinomio
algebraico Pm(x) de grado m < n 1 mediante el procedimiento de mnimos cuadrados,
es similar al de y = ax + b (Ver ejercicio 24 de este captulo).
En muchos casos los datos provenientes de pruebas experimentales no son lineales por
lo que es necesario ajustarlos a una funcin que no sea un polinomio de primer grado.
Algunas veces conviene suponer que los datos tienen una relacin exponencial. Para
ello, la funcin de aproximacin debe tener la forma:

y = Beax (4) o bien

y = Bxa (5) para algunas constantes a y B

Es posible desarrollar ecuaciones normales para stas de manera anloga al desarrollo


precedente para una recta por mnimos cuadrados si las derivadas parciales se igualan a
cero. Tales ecuaciones no lineales son mucho ms difciles de resolver que las
ecuaciones lineales. Por esta razn el mtodo que suele utilizarse cuando se sospecha
que los datos tienen una relacin exponencial, consiste en considerar el logaritmo de la
ecuacin de aproximacin:

y = Beax y = Bxa
ln y = ln(Beax) ln y = ln(Bxa)
ln y = ln B + ln eax ln y = ln B + ln xa
ln y = ax + ln B (6) ln y = aln x + ln B (7)
((6) y (7) se conocen como formas linealizadas)

Observe que en (6) se presenta en una relacin lineal entre x y ln y, por lo que se pueden
usar las frmulas dadas en (3) para resolver el problema lineal cambiando yi por ln yi y
b por ln B.
Una ventaja adicional de las formas linealizadas es que las grficas de los datos en papel
Log-Log o en papel semilogartmico muestran a simple vista si estas formas son
idneas, en el sentido de que una recta representa los datos cuando se trazan de esa
manera.

Ejemplo.

Ajustar los datos

xi 1 2 4
yi 3 5.1 8.8

A funciones de la forma y = ax + b, y, y = Beax


Qu funcin aproxima mejor?

Solucin:
Para este caso se tienen tres datos, luego n=3. Se construye una tabla con los datos que
se necesitan en las frmulas (3) 3.

Para el modelo lineal:

y = ax+b................... y = 1.92143x + 1.15

Si se evala la recta en x3=4, resulta y =1.92143(4) + 1.15 = 48.83572, el error al


cuadrado entre la aproximacin dada por la recta y el valor real es (y3 ax3 b)2 = (8.8
8.83572)2 = 1.2759 x 10-3.

Para el modelo exponencial.


ln B = 0.8258, ......B = e0.0250 2.28371
Y = Beax............... Y = 2.28371e0.34645x

Para los datos de este ejercicio, aproxima mejor el modelo lineal, porque la suma de los
errores al cuadrado en el lineal, es menor que la suma de los errores al cuadrado que en
el modelo exponencial (vase la tabla anterior).

MTODO de los MNIMOS CUADRADOS

En construccin

INTRODUCCIN

Cuando se dispone de una serie de datos experimentales, con mucha frecuencia resulta provechoso
determinar la relacin matemtica entre las variables dependiente e independiente. Una forma por dems
conveniente, es a travs de una ecuacin que se ajuste a los datos; en el caso de los datos experimentales,
la ecuacin de ajuste, se llama emprica y es muy particular tanto de los datos como del fenmeno mismo.

Una vez que se han localizado los pares ordenados (x, y) de un experimento en el plano cartesiano de un
papel milimtrico, se traza o dibuja la lnea curva, segn sea la tendencia general de los puntos ordenados
(x, y) para determinar el tipo de relacin funcional que existe entre las variables. Por lo general estas
relaciones son cuatro formas bsicas o fundamentales:
Lineales
Potenciales
Exponenciales
Logartmicas
a partir de las cuales se puede identificar la representacin de los datos experimentales, lo que a su vez
facilitar la determinacin de la curva emprica.

(1) y = mx + b

en donde "m" representa la pendiente ngulo de inclinacin de la lnea. sta puede ser positiva o
negativa, y tiene un valor constante. De igual manera la ordenada al origen o intercepto "b" con el eje "y".

En el caso de las grficas; potenciales, exponenciales y logartmicas, estas presentan algunas


caractersticas similares. Por ejemplo una grfica potencial tiene por ecuacin la siguiente expresin:
(2)

donde b es una constante: si la pendiente es positiva (m>0 se tiene una curva parablica simple, en
cambio si la pendiente es negativa (m<0), la curva es de tipo hiperblica, aunque ambas curvas sean
potenciales que de paso sea dicho son un caso particular de las curvas llamadas polinmicas. Estas
graficas pueden ser linearizadas o transformadas a lnea recta en virtud de que, aplicando un cambio de
variable a la ecuacin de la siguiente manera:

(3)

La ecuacin potencial cambia a una estructura de tipo lineal. En el caso de las ecuaciones exponenciales
cuya ecuacin de la forma:

(4)

Como en el caso anterior, la linearizacin de la ecuacin exponencial se logra aplicando logaritmos a sta,
de la siguiente manera:

(5)

De la misma manera las ecuaciones logartmicas se pueden linearizar, transformndose en:

(6)

Si consideramos a los cuatro tipos de ecuaciones:

(7)

para graficarlas solo se requieren conocer los valores de m y b. As que estadsticamente un mtodo
general para determinar dichos parmetros, es el mtodo de los mnimos cuadrados, que es el de mayor
exactitud y confiabilidad.

El mtodo de los mnimos cuadrados postula que la mejor recta que pasa por los puntos (pares ordenados
x,y) ser aquella cuya suma de los cuadrados de los residuos sea mnima o tienda a cero. Es decir:

(8)
esto significa que si deseamos estimar la reproducibilidad entre varias medidas de la misma magnitud o
propiedad, siempre se presenta una desviacin del valor medido en una magnitud "d", la cual se define
como:

d = Valor medido - valor promedio de las varias medidas

(9)

Esto es, se pretende calcular una funcin generada a partir de los datos experimentales, por lo que se
plantea:

(10)

que no necesariamente es la "y" medida experimentalmente, de tal manera que si la funcin calculada es
una lnea recta entonces:

(11)

por lo que:

(12)

Como se desea un mnimo de la suma de las desviaciones, se deriva en forma parcial con respecto a m
y b.

(13)

(14)

(15)

(16)

Para encontrar el mnimo hay que igualar la primera derivada a cero, y despejando.

La funcin potencial
y=cxa

Se puede trasformar en

log y=alog x+log c

Si usamos las nuevas variables X=log x e Y=log y, obtenemos la relacin lineal

Y=aX+b.

Donde b=log c

Ejemplo:

x 10 20 30 40 50 60 70 80

y 1.06 1.33 1.52 1.68 1.81 1.91 2.01 2.11

Representamos estos datos en un diagrama doblemente logartmico mediante el


comando loglog

x=[10 20 30 40 50 60 70 80];
y=[1.06 1.33 1.52 1.68 1.81 1.91 2.01 2.11];
loglog(x,y,'ro','markersize',2,'markerfacecolor','r')
xlabel('x')
ylabel('y')
title('Funcin potencial')
Para determinar la recta de regresin, se transforma esta tabla de datos en esta otra

X=log x 1.0 1.30 1.477 1.60 1.699 1.778 1.845 1.903

Y=log y 0.025 0.124 0.182 0.225 0.258 0.281 0.303 0.324

Calculamos mediante la funcin regresion los parmetros a y c.

Escribimos el script datos_2

x=[10 20 30 40 50 60 70 80];
y=[1.06 1.33 1.52 1.68 1.81 1.91 2.01 2.11];
[a b]=regresion(log10(x),log10(y));
fprintf('exponente a= %2.3f\n',a(1));
fprintf('coeficiente c= %3.3f\n',10^b(1));

%grfica
hold on
plot(x,y,'ro','markersize',8,'markerfacecolor','r')
z=(10^b(1))*x.^a(1);
plot(x,z,'b')
xlabel('x')
ylabel('y')
title('Regresin potencial')
hold off

Corremos el script datos_2 en la ventana de comandos

>> datos_2
exponente a= 0.331
coeficiente c = 0.495

Funcin exponencial

y=ceax

Tomando logaritmos neperianos en los dos miembros resulta

ln y=ax+ln c

Si ponemos ahora X=x, e Y=ln y, obtenemos la relacin lineal

Y=aX+b

Donde b=ln c.
Ejemplo:

x 12 41 93 147 204 264 373 509 773

y 930 815 632 487 370 265 147 76 17

Representamos estos datos en un diagrama semilogartmico mediante el comando


semilogy

x=[12 41 93 147 204 264 373 509 773];


y=[930 815 632 487 370 265 147 76 17];
semilogy(x,y,'ro','markersize',2,'markerfacecolor','r')
xlabel('x')
ylabel('y')
title('Funcin exponencial')
grid on

Para determinar la recta de regresin, se transforma esta tabla de datos en esta otra

X= x 12 41 93 147 204 264 373 509 773


Y=ln y 6.835 6.703 6.449 6.188 5.913 5.580 4.990 4.330 2.833

Escribimos el script datos_3

x=[12 41 93 147 204 264 373 509 773];


y=[930 815 632 487 370 265 147 76 17];
[a b]=regresion(x,log(y));
fprintf('exponente a= %2.3f\n',a(1));
fprintf('coeficiente c = %3.3f\n',exp(b(1)));

%grficos
hold on
plot(x,y,'ro','markersize',8,'markerfacecolor','r')
x=linspace(min(x),max(x),100);
y=exp(b(1))*exp(x*a(1));
plot(x,y,'b')
xlabel('x')
ylabel('y')
title('Regresin exponencial')
hold off

Corremos el script datos_3 en la ventana de comandos

>> datos_3
exponente a= -0.005
coeficiente c = 1036.896

Vous aimerez peut-être aussi