Vous êtes sur la page 1sur 7

UNIVESIDAD NACIONAL DE COLOMBIA,

FACULTAD DE CIENCIAS,
Fundamentos de Mecnica
Informe 1: Mnimos Cuadrados,

Mtodo de Mnimos Cuadrados


Least-Squares Method
Santiago Nicols Monsalve Snchez*.
Estudiante Pregrado Ingeniera Elctrica Universidad Nacional de Colombia.
Recibido Marzo 11 de 2013

Resumen
Hace ms de dos siglos, cuando Carl Friedrich Gauss cre el Mtodo de regresin lineal de Mnimos
Cuadrados no se imagin que ste sera tan utilizado a lo largo de los aos en incontables
aplicaciones. El propsito de este informe es exponer dicho mtodo paso a paso en su forma ms
simple, la de aproximacin lineal; para de esta forma describir su funcionamiento y analizar los
beneficios principales que lo mantienen vigente hoy en da. Al realizar la experimentacin con
cualquier grupo de datos experimentales basta con entender y aplicar unos pocos conceptos
estadsticos y geomtricos para obtener concretos resultados con mnimos mrgenes de error asociado.
En pocas palabras se parte de una dispersin de puntos (datos experimentales) en un plano cartesiano
y el mtodo permite encontrar la ecuacin de la recta que ms se ajusta a dichas ordenadas (xi, yi).
Dicha recta nos brinda valiosa informacin acerca de la tendencia que siguen los datos experimentales
o la relacin entre las dos variables en cuestin por ejemplo.
Palabras claves: Regresin lineal, predictivos cuantitativos, factores predictivos, Gauss, funcin lineal,
correlacin lineal.
Abstract
More than two centuries ago, Carl Friedrich Gauss create his linear regression method of "Least
Squares", he didn't imagine that it would be so used to over the years in countless applications. The
purpose of this report is to present it step by step in its simplest form, the linear approximation and
describe its operation and analyze its main benefits that are keeping to the present. When we make any
experiment, we just need to understand and apply a few statistical and geometric concepts to our
experimental data, and we will have concrete results with minimal margins of error associated. So, in a
few words, we have a simple dispersion of points (experimental data) in a Cartesian plane and the
method allows finding the equation of the line that best fits these ordinates (xi, yi). This line gives us
valuable information about the trend followed the experimental data and the relationship between the
two variables involved, for example.
Keywords: Linear regression, predictive quantitative, predictive factors, Gauss, linear function, linear
correlation.

* snmonsalves@unal.edu.co

Universidad Nacional de Colombia., Facultad de Ciencias, Fundamentos de Mecnica, Informe 1: Mnimos Cuadrados

1. Introduccin

su comportamiento. Cabe destacar que el argumento


concreto se conoce como teorema de Gauss-Mrkov
[6].
Formalmente, ste se define como una tcnica de
anlisis numrico encuadrada dentro de la
optimizacin matemtica [7], en la que, de acuerdo
con el criterio de mnimo error cuadrtico se busca
hallar la funcin que mejor se aproxime a los datos
experimentales. En este informe me centro en la parte
ms bsica o elemental del mtodo, en la que se busca
calcular el valor de la pendiente y el punto de corte con
el eje vertical (de ordenadas) de la recta que ms se
ajuste a la distribucin lineal de puntos experimentales
del caso, de una manera muy prctica y con lo cual se
optimizan estos valores, dando la posibilidad de poder
pronosticar sucesos o situaciones en cada uno de los
casos [8].
Es as como para la ingeniera, los negocios, la
investigacin y todas las ciencias en general, el mtodo
de los mnimos cuadrados, le garantiza su tendencia
con el mnimo margen de error [5].
El objetivo del presente informe es conocer la forma
de aplicacin del mtodo de mnimos cuadrados para
pronosticar tendencias, dando a conocer su algoritmo
bsico aadiendo un ejemplo que de una mejor
comprensin del mismo, para finalmente establecer las
ventajas y limitaciones del mtodo en general [9].

El siglo XIX se enmarca como un periodo de tiempo


con fuertes cambios en todos los mbitos de la vida y el
conocimiento. Revoluciones de todas las ndoles
tendran su lugar. La ciencia y su creciente
popularidad, la economa con sus dos fuertes
revoluciones industriales, en poltica, nuevas ideas con
revoluciones burguesas y obreras; en filosofa, surgiran
los principios de la mayor parte de las corrientes de
pensamiento contemporneas; el arte y el inicio del
proceso de vanguardizacin [1].
Desde temprana edad y a lo largo de su vida
Johann Carl Friedrich Gauss demostr ser una mente
prodigiosa que se consolid como un gran matemtico,
astrnomo, geodesta y fsico alemn [2]. Entre sus
muchos trabajos le regalo a la humanidad un pequeo
mtodo de regresin lineal, el ms usado en el mundo
para el ajuste de una recta a una serie de datos, ste se
conoce como El mtodo de mnimos cuadrados [3],
tema central del presente informe.
Su historia nos remonta a los primeros aos del ya
mencionado siglo XIX, G. Piazzi descubri a Ceres,
un nuevo pequeo planeta; tras un corto tiempo de
observaciones, este astrnomo italiano, lo perdi de
vista. Pasados varios meses, el nico clculo estimado
que permiti a Zach, astrnomo alemn, reencontrar a
Ceres fue el de Gauss, quien cre un mtodo con el
que logro aproximarse mucho a la rbita real descrita
por Ceres, de esa forma haba pronosticado la
ubicacin de ste en un determinado momento [4].
Hoy en da, dicho mtodo aun es muy utilizado y la
razn es muy sencilla. Conforme su gama de
conocimiento se acrecentaba, el hombre necesit
herramientas
que
le
permitiera
modelar
matemticamente por una funcin todo tipo de
fenmenos reales. En consecuencia, fueron surgiendo
diversos modelos de pronstico que pueden
ayudarnos a determinar el comportamiento o tendencia
de la o las variables seleccionadas [5].
Dado que es bien conocido el poder de
entendimiento que nos brinda una representacin
grafica en todo estudio, la aplicacin de este mtodo se
hizo muy popular, puesto que se extiende a todo tipo
de casos dentro de las diferentes reas del
conocimiento y se adapta a diferentes necesidades al
adquirir un poco de complejidad. En pocas palabras
este mtodo es ptimo en muchos aspectos [5], pues
nos facilita la comprensin de los fenmenos y, como
consecuencia, nos permite hacer pronsticos acerca de

2. Manejo de Datos experimentales


Se determin que los datos experimentales que se
tendrn en cuenta para la prctica, por sugerencia del
docente, sern los que se encuentran en la Tabla 5 (p.
12)[10], donde se consigan los valores obtenidos en
determinado experimento para la relacin entre la
temperatura y el volumen de cierto gas (a presin
constante) pues en ella se presenta una distribucin
lineal.
Tabla No. 1: Relacin entre la temperatura y el volumen de
cierto gas (a presin constante)

T (C) V (cm^3)
62,3
27073

68,6
81,4

28492
29300

87,4

29200

98,6

30849

Nicols Monsalve, Cd. 1032464683.: Mtodo Mnimos Cuadrados

104,5

31500

116,9

32100

121,2

32000

135,0

33500

Vemos pues que los pares de medidas se comportan


visualmente segn una lnea recta y que no hay puntos
que presente anomalas.

Lgicamente no es conveniente tomar los valores


del volumen con tal magnitud, por ello la nueva tabla
ser la No. 2.
Tabla No. 2: Relacin entre la temperatura y el volumen de
cierto gas (a presin constante)

T [C]
x
62,3
68,6
81,4
87,4
98,6
104,5
116,9
121,2
135,0

V [x 10^4
cm^3]
y
2,71
2,85
2,93
2,92
3,08
3,15
3,21
3,2
3,35

Figura 2. Unin de puntos para la tabla 2 de Temperatura vs


Volumen. Vemos que al unir los puntos obtenidos no se obtiene una
funcin lineal. Cada punto (Ti, Vi) es representado con un cuadrado
azul en la grafica.

Ahora bien pasamos a utilizar el mtodo de mnimos


cuadrados, lo que quiere decir que queremos encontrar
la ecuacin de la recta que mejor se ajusta al conjunto
de
parejas
de
datos
observadas:

La recta resultante es de la forma:


Para ver la relacin de los datos de las variables
habr que trazar su grafico asociado.

Ecuacin No. 1: Formula lineal

Donde n es la interseccin con el eje de las abscisas, m


es la pendiente de la recta y E es el error o residuo entre
las observaciones y el modelo.
Ecuacin No. 2: Ecuacin Error

Lo que nos garantiza que la recta encontrada es la que


ms se ajusta a esos datos iniciales, se deben cumplir
dos condiciones:
1. Es nula la suma de las desviaciones verticales de los
puntos a partir de la recta de ajuste, as:

Figura 1. Diagrama de dispersin de puntos para la tabla 2 de


Temperatura vs Volumen. Se puede apreciar desde ya que la
relacin entre estas dos variables se asemeja a una lina. Cada punto
(Ti, Vi) es representado con un cuadrado azul en la grafica.

Universidad Nacional de Colombia., Facultad de Ciencias, Fundamentos de Mecnica, Informe 1: Mnimos Cuadrados

2. Es mnima la suma de los cuadrados de dichas


desviaciones. Ninguna otra recta dara una suma
menor de las desviaciones elevadas al cuadrado, as:
()

(Mnima).
Entonces debemos minimizar el error y una estrategia
que lo permite es la de minimizar la suma de los
cuadrados de los errores residuales, as:
Ecuacin No. 3: Suma de los cuadrados de los errores.

Donde N es el nmero de medidas, o sea una


constante. Los valores de n y m se obtienen resolviendo
el sistema de dos ecuaciones entre las ecuaciones No. 4
y No. 5.

De donde resultan las siguientes dos ecuaciones:


Ecuacin No. 6: Para n.

Como nuestra intencin es minimizar 2, se toma las


derivadas parciales de 2 respecto de n y m que son las
incgnitas y se igualan a cero; de esta forma se obtienen
dos ecuaciones llamadas ecuaciones normales del modelo,
que son resueltas para obtener los valores de n y m.

Ecuacin No. 7: Para m.

Ecuacin No. 4: Primera Ecuacin normal, para m.

Definiendo:

()

Ecuacin No. 5: Segunda Ecuacin normal, para n.

Ahora es momento de calcular nuestros m y n del caso:


Tabla No. 3: Tabla de datos y clculos

Nicols Monsalve, Cd. 1032464683.: Mtodo Mnimos Cuadrados

T
[C]

[x 10^4 cm^3]

(T)^2
[C]

[C]* [x 10^4 cm^3]

Xi

Yi

Xi^2

Xi*Yi

62,3

2,71

3881,29

168,833

68,6

2,85

4705,96

195,51

98,
6
104
,5
116
,9
121
,2

T*V

81,4

2,93

6625,96

238,502

87,4

2,92

7638,76

255,208

98,6

3,08

9721,96

303,688

104,5

3,15

10920,25

329,175

116,9

3,21

13665,61

375,249

121,2

3,2

14689,44

387,84

135

3,35

18225

452,25

875,9

27,4

90074,23

2706,255

T
[C]

[x 10^4
cm^3]

875,9

27,4

3,2

9721,9
6
10920,
25
13665,
61
14689,
44

303,68
8
329,17
5
375,24
9

9,486
4
9,922
5
10,30
41

387,84

10,24

3,054928
203
3,103335
821
3,205073
865
3,240353
993
3,353578
59
27,4

135

3,3
5

18225

452,25

11,22
25

875
,9

27,
4

90074,
23

2706,2
55

83,75
34

0,00062859
0,00217755
2,4267E-05
0,00162844
1,2806E-05
0,01050262

Resuelto todo lo anterior pasamos a calcular las


incertidumbres de n y m. Suponemos que solo los
valores de yi tienen error: yi y son iguales. Se estima a
partir de la varianza de los datos:

Y aplicando propagacin de errores:

Tabla No. 4: Tabla de suma de datos

SUM
A

3,0
8
3,1
5
3,2
1

(T)^2
[C]

T*V

[C]* [x 10^4
cm^3]

90074,23 2706,255
Operando y despejando:
Ecuacin No. 8: Error total.

Luego:

Finalmente calcularemos el Coeficiente de Correlacin


lineal r, un parmetro que nos dice que tan acertada fue
la eleccin de la recta como curva de mejor ajuste. ste
toma valores entre 0 y 1. Cunto mejor sea la
aproximacin por una recta ms cercanos a 1 sern los
valores del coeficiente r.

Tabla No. 4: Tabla con todos los datos

Xi

Yi

Xi^
2

62,
3
68,
6
81,
4
87,
4

2,7
1
2,8
5
2,9
3
2,9
2

3881,2
9
4705,9
6
6625,9
6
7638,7
6

Xi*Yi
168,83
3
195,51
238,50
2
255,20
8

Yi^
2

7,344
1
8,122
5
8,584
9
8,526
4

2,757098
285
2,808787
775
2,913807
691
2,963035
777

(n+mxy)^2
0,00221825
0,00169845
0,00026219

Ecuacin No. 9: Coeficiente r.

0,00185208

Universidad Nacional de Colombia., Facultad de Ciencias, Fundamentos de Mecnica, Informe 1: Mnimos Cuadrados

Donde:

Figura 4. Dispersin de puntos para la tabla 2 de Temperatura vs


Volumen. Se puede apreciar desde ya que la relacin entre estas
dos variables es lineal. Cada punto (Ti, Vi) es representado con un
cuadrado azul en la grafica.

Asi la ecuacin de la recta de nuestro ejercicio es:

Ello se plasma en las siguientes figuras:

4. Conclusiones
El mtodo de mnimos cuadrados es una de las mejores
tcnicas para realizar una regresin lineal a partir de
una dispersin de puntos, gracias a que sus resultados
son muy fiables y su error asociado es mnimo. Hay
que destacar que este es propiamente un mtodo de
aproximacin que depende exclusivamente de los datos
experimentales. Todas las ecuaciones aqu mencionadas
tienen una justificacin geomtrica y matemtica muy
precisa. Finalmente puedo mencionar que es un
mtodo en mi opinin de fcil comprensin y que
siempre estar vigente gracias a su amplia gama de
aplicabilidad

Figura 3. Dispersin de puntos para la tabla 2 de Temperatura vs


Volumen. Se puede apreciar desde ya que la relacin entre estas
dos variables es lineal. Cada punto (Ti, Vi) es representado con un
cuadrado azul en la grafica.

5. Referencias
[1] Wikipedia. Siglo XIX. Wikipedia. [En lnea]
[Citado el: 08 de 03 de 2013.]
http://es.wikipedia.org/wiki/Siglo_XIX

[2] Wikipedia. Carl Friedrich Gauss. Wikipedia.


[En lnea] [Citado el: 08 de 03 de 2013.]
http://es.wikipedia.org/wiki/Carl_Friedrich_
Gauss.
[3] Abdi, Herv. 2003. Least Squares.
University of Texas at Dallas. [En lnea] 2003.
[Citado el: 08 de 03 de 2013.]
6

Nicols Monsalve, Cd. 1032464683.: Mtodo Mnimos Cuadrados

http://www.utdallas.edu/~herve/AbdiLeastSquares-pretty.pdf.
[4] lvarez, Sergio A. Cruces. El metodo de
mnimos cuadrados. Universidad de Sevilla. [En
lnea] [Citado el: 09 de 03 de 2013.]
http://personal.us.es/sergio/PDocente/lectur
a.pdf.
[5] Granados, Saul. Pronsticos por mnimos
cuadrados. Scribd. [En lnea] [Citado el: 09 de
03 de 2013.]
http://es.scribd.com/doc/53014746/minimoscuadrados-trabajo-presu.
[6]Bailach, Jos Bosch. Ajuste de una recta por
mnimos. Universidad de Valencia. [En lnea]
[Citado el: 09 de 03 de 2013.]
http://www.uv.es/jbosch/PDF/RectaMinimo
sCuadrados.pdf.
[7] Wikipedia. Minimos cuadrados. Wikipedia.
[En lnea] [Citado el: 08 de 03 de 2013.]
http://es.wikipedia.org/wiki/M
%C3%ADnimos_cuadrados
[8] Ciencias, Instituto de Fsica - Facultad de.
Mtodo de mnimos cuadrados. Scribd. [En
lnea] [Citado el: 10 de 03 de 2013.]
http://es.scribd.com/doc/4746753/METODO
-DE-MINIMOS-CUADRADOS.
[9] Rojas, Yamil Armando Cerquera. Ajustes
de curvas. Scribd. [En lnea] [Citado el: 09 de 03
de 2013.]
http://es.scribd.com/doc/5707214/MinimosCuadrados.