Vous êtes sur la page 1sur 15

1

TABLA DE CONTENIDO
1.

OBJETIVOS......................................................................................................................

2.

ALCANCES......................................................................................................................

3.

INTRODUCCIN.............................................................................................................

4.

FUNDAMENTO TEORICO.............................................................................................

5.

PRIMER TRABAJO DEJADO POR EL PHD . MARN.................................................

6.

TABLAS Y FIGURAS......................................................................................................

6.1 Tablas de datos

Tabla de datos de poblacin anormal....................................................

6.2 Figuras histogramas y P-P plot..........................................................................................


7.

8.

9.

SEGUNDO TRABAJO DEJADO POR EN PHD. MARN............................................


7.1

Algoritmo del Variograma...................................................................................11

7.2

Visualizacin del programa.................................................................................11

7.3

Algoritmo del programa en VBA........................................................................11

7.4

Creacin de datos con el T.L.C iniciar el programa............................................12

TABLAS Y FIGURAS....................................................................................................
8.1

Tablas de datos generados...................................................................................13

8.2

Figuras.................................................................................................................14

CONCLUSIONES...........................................................................................................

10. REFERENCIAS...............................................................................................................

2
1. OBJETIVOS

Analizar la grfica p-p plot de los Ln de los datos dejador por el PHD Marn.

Analizar la grfica p-p plot de los Ln de los datos con un incremento de datos anormales.

Tener capacidad para comprender porque se produce cambios es la grppafica p-p plot.

Crear un algoritmo para generar datos con distribucin de gauss usando el Teorema del Limite
Central.
2. ALCANCES
En el transcurso de este informe se podr dar cuenta de que el anlisis de la curva p-p
plot del Ln de los datos nos da informacin de posibles anomalas en nuestros datos.
3. INTRODUCCIN
La necesidad de acudir a herramientas estadsticas para el anlisis de datos en todas las
reas del conocimiento, ha hecho que aparezcan con el correr de los aos nuevas
metodologas que, no obstante se centran en fundamentos probabilsticos comunes, son
especficas para cada una de las diversas disciplinas del saber. Algunos ejemplos son, entre
otros, la econometra, psicometra o la bioestadstica. La gran relevancia que tiene
actualmente a nivel mundial el tema ambiental ha hecho que los profesionales en estadstica
encaminen esfuerzos en el desarrollo de nuevas tcnicas apropiadas para el anlisis de
informacin enmarcada dentro de este contexto. Como consecuencia de este impulso surgi la
geoestadstica, teniendo como padre a George Matheron.
4. FUNDAMENTO TEORICO
PROBABILIDAD-PROBABILIDAD (PP) TERRENO
Una probabilidad-probabilidad (PP) parcela se utiliza para ver si un determinado
conjunto de datos sigue alguna distribucin especificado. Debe ser aproximadamente lineal si
la distribucin especificado es el modelo correcto.

3
La probabilidad-probabilidad (PP) trama se construye utilizando la funcin de
distribucin acumulada terica, F (x), del modelo especificado. Los valores de la muestra de
datos, en orden de menor a mayor x, se denotan (1), X (2), ..., x (n). Para i = 1, 2, ....., n, F (x
(i)) se representa frente a (i-0.5) / n.
Ejemplo
En la figura de abajo, dos conjuntos de datos se han visualizado en grficos de
probabilidad normal. El primer conjunto de datos (que se muestra en negro) realmente
proviene de una distribucin normal, por lo que la trama PP es lineal. El segundo conjunto de
datos (que se muestra en rojo) proviene de una distribucin exponencial, por lo que no es ni
siquiera cerca de simetra, y la trama del PP se desva de una lnea recta. El uso de estas
parcelas, queremos inferir correctamente que el primer conjunto de datos es normal, pero la
segunda no lo es.

4
HISTOGRAMA
En estadstica, un histograma es una representacin grfica de una variable en forma
de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados. Sirven para obtener una "primera vista" general, o panorama, de la distribucin
de la poblacin, o la muestra, respecto a una caracterstica, cuantitativa y continua, de la
misma y que es de inters para el observador (como la longitud o la masa). De esta manera
ofrece una visin en grupo permitiendo observar una preferencia, o tendencia, por parte de la
muestra o poblacin por ubicarse hacia una determinada regin de valores dentro del espectro
de valores posibles (sean infinitos o no) que pueda adquirir la caracterstica. As pues,
podemos evidenciar comportamientos, observar el grado de homogeneidad, acuerdo o
concisin entre los valores de todas las partes que componen la poblacin o la muestra, o, en
contraposicin, poder observar el grado de variabilidad, y por ende, la dispersin de todos los
valores que toman las partes, tambin es posible no evidenciar ninguna tendencia y obtener
que cada miembro de la poblacin toma por su lado y adquiere un valor de la caracterstica
aleatoriamente sin mostrar ninguna preferencia o tendencia, entre otras cosas.
En el eje vertical se representan las frecuencias, es decir, la cantidad de poblacin o la
muestra, segn sea el caso, que se ubica en un determinado valor o subrango de valores de la
caracterstica conocido como intervalo de clase. En el eje horizontal se representa el espectro
de valores posibles que toma la caracterstica de inters, evidentemente, cuando ste espectro
de valores es infinito o muy grande el mismo es
reducido a slo una parte que muestre la
tendencia o comportamiento de la poblacin, en
otras ocasiones ste espectro es extendido para
mostrar el alejamiento o ubicacin de la
poblacin o la muestra analizada respecto de un
valor de inters.
TEOREMA DEL LIMITE CENTRAL

5
El teorema del lmite central o teorema central del lmite indica que, en condiciones
muy generales, si Sn es la suma de n variables aleatorias independientes y de varianza no nula
pero finita, entonces la funcin de distribucin de Sn se aproxima bien a una distribucin
normal (tambin llamada distribucin gaussiana, curva de Gauss o campana de Gauss). As
pues, el teorema asegura que esto ocurre cuando la suma de estas variables aleatorias e
independientes es lo suficientemente grande.
Sea

la funcin de densidad de la distribucin normal definida como1

con una media y una varianza 2. El caso en el que su funcin de densidad sea

,a

la distribucin se le conoce como normal estndar. Se define Sn como la suma de n variables


aleatorias, independientes, distribuidas, y con una media y varianza 2 finitas (20):

de manera que, la media de Sn es n y la varianza n2, dado que son variables aleatorias
independientes. Con tal de hacer ms fcil la comprensin del teorema y su posterior uso, se
hace una estandarizacin de Sn como

para que la media de la nueva variable sea igual a 0 y la desviacin estndar sea igual a 1. As,
las variables Zn convergern en distribucin a la distribucin normal estndar N(0,1),
cuando n tienda a infinito. Como consecuencia, si (z) es la funcin de distribucin de
N(0,1), para cada nmero real z:

donde Pr( ) indica probabilidad y lim se refiere a lmite matemtico.

5. PRIMER TRABAJO DEJADO POR EL PHD . MARN


Agregar datos al archivo una poblacin anormal y ver la media y desviacin tpica hacer
el P-P plot
6.
6.1 Tablas de datos
#
1
2
3
4
5
6
7
8
9
10
11
12
13
14

1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
#
1
2
3
4
5
6

TABLAS Y FIGURAS
Tabla de datos de poblacin anormal

datos Ln(datos)
Datos
1,91
,65
,76
-,27
,76
-,27
,90
-,10
2,99
1,10
,49
-,71
,69
-,37
1,59
,46
2,39
,87
,87
-,14
1,88
,63
,97
-,03
1,10
,10
2,08
,73

,74
-,30
,91
-,10
2,05
,72
1,51
,41
3,03
1,11
1,12
,12
,61
-,49
,95
-,05
1,44
,37
1,16
,15
1,41
,35
1,15
,14
,86
-,15
2,65
,97
5.04
6.53
4.45
5.86
4.93
5.07

1.62
1.88
1.49
1.77
1.59
1.62

7
7
8
9
10
11
12
13
14

87
88
89
90
91
92
93
94
95
96
97
98
99
100

5.12
5.84
4.14
4.03
4.63
5.85
5.01
4.91

6.39
5.86
3.30
3.71
4.65
5.22
4.05
4.68
5.43
5.37
4.82
2.73
5.73
4.55

1.63
1.76
1.42
1.39
1.53
1.77
1.61
1.59

1.85
1.77
1.19
1.31
1.54
1.65
1.40
1.54
1.69
1.68
1.57
1.00
1.75
1.52

6.2 Figuras histogramas y P-P plot


HISTOGRAMA DE DATOS DEL PHD. MARN

HISTOGRAMA DE LN(DATOS)

P-P PLOT DE LN DE DATOS

HISTOGRAMA DE DATOS AADIDOS CON POBLACIN ANORMAL

HISTOGRAMA DE LN(DATOS+POBLACION ANORMAL)

10
P-P PLOT DE LN(DATOS+POBLACION ANORMAL)

7.

SEGUNDO TRABAJO DEJADO POR EN PHD. MARN

Hacer un programa para generar datos con distribucin de gauss usando el Teorema de
Limite Central
7.1

Algoritmo del Variograma


El algoritmo fue desarrollado en el programa VBA, de tal manera que podamos

generar 1000 grupos de 100 datos aleatorios y por cada grupo obtener un valor con el T.L.C.
Los datos sern puestos en una hoja de Excel pudiendo realizar luego la grfica del
histograma correspondiente.
7.2

Visualizacin del programa

11

7.3

Algoritmo del programa en VBA

Dim aleatorio(1 To 100) As Double


Dim alfa, beta As Double
Dim i, j As Integer
Private Sub CommandButton1_Click()
Randomize
alfa = Val(txt1.Text)
beta = Val(txt2.Text)
For i = 1 To 1000
For j = 1 To 100
aleatorio(j) = Rnd()
suma = suma + aleatorio(j)
Next
Cells(i, 1) = beta * ((suma - 100 * (1 / 2)) / ((100 ^ 0.5) / (12 ^ 0.5))) +
alfa
suma = 0
Next
End Sub
End Sub
7.4 Creacin de datos con el T.L.C iniciar el programa
Asignamos una media = 3 y una desviacin = 1

12

#
1
2
3
4
5
Media

7
3.024287
12
8
9
10
11
12
13
14
15
16

981
982
983
984
985
986
987
988
989
990
991
992
993
994

Dato
generado
3.2368601
07
2.5025089
26
8.
TABLAS Y FIGURAS
3.0441233
36
Tablas de datos generados
4.0368648 8.1
83
1.- Tabla de 1000 datos generados
2.5923189
56
2.7435083
51
Varianza
1.5668361Desviacin
75estndar
0.911503
3.0168416 0.954726727
12
72
4.0481431
27
3.9468615
91
2.5769194
39
3.8224913
52
3.0955878
63
2.2100416
71
4.1637045
81
3.7637225
11

3.4556116
01
3.2345961
33
3.5300825
71
2.5591918
59
2.6242491
5
2.1236994
56
3.1514805
68
3.8543488
66
2.5671506
21
1.6016831
39
2.0288917
03
2.9643986
12
2.5860830
34
3.3085827
91
2.7549795

13

14
8.2

Figuras

Histograma de los valores generados con el TLC

Frecuencia

15
9.

CONCLUSIONES

El p-p plot sirve para identificar la funcin ms adecuada para representar los datos.
El p-p plot ayuda a identificar posibles anomalas en el muestreo al variar la recta.
El Teorema del Limite central nos ayuda a simular datos con una media y desviacin

estndar dados.
El teorema del lmite central nos da como resultado una funcin de gauss
10. REFERENCIAS

Clases de Informtica por Ing. Chvez, Adolfo


Clases del PhD. Alfredo Marn Suarez
Clases realizadas por el Ing. Tves.
http://www.stats.gla.ac.uk/glossary/?q=node/392
http://es.wikipedia.org/wiki/Teorema_del_l%C3%ADmite_central

Vous aimerez peut-être aussi