Vous êtes sur la page 1sur 20

AO DE LA INTEGRACION NACIONAL Y RECONOCIMIENTO DE NUESTRA DIVERSIDAD

Facultad de Ingeniera Civil


UNIVERSIDAD NACIONAL DE INGENIERIA

PERFIL LONGITUDINAL
CURSO: DOCENTE: GRUPO: INTEGRANTES: VICTOR ALEXANDER NONAJULCA RETO STEVE MARCELO PIMENTEL YUPA EDGAR CARDENAS ROJAS ERNESTO CRISTIAN MORALES PUMASONGO DIEGO LIZANA OLARTE 20112023G 20114053K 20102501C 20112037H 20110008K ESTADISTICA Y PROBABILIDADES LIC. FLOR QUIONES

Lima 2012-I
Pgina 1

INDICE

Introduccin MarcoTerico Procedimiento Aplicaciones Conclusiones Recomendaciones Bibliografia

3 4 7 19 20 20 20

Pgina 2

INTRODUCCION

La estadstica trata de las tcnicas para recolectar, organizar, presentar, analizar un conjunto de datos numricos y a partir de ellos y de un marco terico, hacer las indiferencias de lugar. Es una herramienta fundamental para la investigacin cientfica y emprica en los campos de la administracin, educacin, sociologa, psicologa, medicina, gentica, informtica, ingeniera, contabilidad, economa, agricultura, etc. Esta es la razn de esta investigacin que recoge informacin de alumnos pertenecientes a la Facultad de Civiles, el cual nos llevara a tomar conclusiones en las costumbresde estudio y capacidad adquisitiva del alumnado Espero que el trabajo sea de su agrado.

Pgina 3

MARCO TEORICO
Medida de Posicin: Las medidas de posicin tienen por objetivo resumir del conjunto de datos de algunos valores que pueda representar el comportamiento de variable. Media Aritmtica Tendencia central que representa el promedio aritmtico

n : nmero total de casos xi: Valor esperado Mediana Valor que separa en dos partes iguales a los datos ordenados de forma creciente o decreciente. Moda Es el valor de la variable que posee mayor frecuencia . Medidas de dispersin Varianza La varianza Es la media de los cuadrados de las diferencias de los datos respecto a la media aritmtica. ( ) Medidas de Simetra

Pgina 4

Coeficiente de Asimetria: Curtosis: Analiza el grado de concentracin que presentan los valores alrededor de la zona central de distribucin.

Pgina 5

Pgina 6

PROCEDIMIENTO
DETERMINACIN DE LOS VALORES ATPICOS Mtodo DIAGRAMA DE CAJAS Y BIGOTES

Pregunta 1

Xmin=5 Q1=8 PARA EL CLCULO DEL Xmin Q2=9 Q2=10

Xmax=13

El IQR es de 2. Ahora 1.5 veces el valor de 2 es 3. Este vendra hacer el mximo tamao del bigote. Restamos 3 del primer cuartil: Q1-3=5. Este vendra a ser como el lmite o el extremo desde donde se pueden aceptar los datos, es decir todo dato menor a este valor de 5, son valores atpicos. Entonces el valor de 4, es un valor extremo (atpico leve), por lo tanto el bigote debe ser dibujado en 5, el cual es el menor valor que no es un atpico. Con ello Xmin=5. Para la determinacin de valores atpicos graves, hacemos 3veces el valor de 2 que es 6, procedemos a restarlo del cuartil 1 y obtenemos: 2, con esto concluimos que no hay valores atpicos graves debido a que no hay datos menores que 2, pero si existe un valor atpico leve. PARA EL CLCULO DEL Xmax

Pgina 7

El procedimiento es el mismo: De los anteriores clculos el mximo tamao del bigote es 3 Ahora adicionamos 3 del tercer cuartil: Q3+3=13. Este vendra a ser como el lmite o el extremo desde donde se pueden aceptar los datos, es decir todo dato mayor a este valor de 13, son valores atpicos. Entonces el valor de 14, es un valor extremo (atpico leve), por lo tanto el bigote debe ser dibujado en 13, el cual es el menor valor que no es un atpico. Con ello Xmax=13. Para la determinacin de valores atpicos graves, hacemos 3veces el valor de 2 que es 6, procedemos a sumarle al cuartil 3 y obtenemos: 16, con esto concluimos que el 24 es un valor atpico graves debido a que sobrepasa siendo mayor que este lmite permisible. DISTRIBUCION POR INTERVALOS Si una distribucin de 95 datos el valor mayor es 13 y el menor es 5 se tiene: Calculando el Rango se obtiene: 8 Calculando el nmero de intervalos se obtiene: 1+3.32*log(95)=7.56=8 Calculando el ancho se obtiene: 8/8=1 se obtiene: i = 1 I [5-6> [6-7> [7-8> [8-9> [9-10> [10-11> [11-12> [12-13] xi 5.5 6.5 7.5 8.5 9.5 10.5 11.5 12.5 fi 4 14 2 26 5 29 2 13 95 hi 0.042 0.147 0.021 0.274 0.053 0.305 0.021 0.137

Pgina 8

VAR1-PREGUNTA 1 Frequencia 5,00 6,00 7,00 8,00 9,00 Valid 10,00 11,00 12,00 13,00 Total 29 2 11 2 95 30,5 2,1 11,6 2,1 100,0 30,5 2,1 11,6 2,1 100,0 84,2 86,3 97,9 100,0 4 14 2 26 5 Porcentaje 4,2 14,7 2,1 27,4 5,3 Porcentaje valido 4,2 14,7 2,1 27,4 5,3 Porcentaje Acumulado 4,2 18,9 21,1 48,4 53,7

MEDIDAS DE TENDENCIA CENTRAL Media: 8.8526 horas Mediana: 9 horas Moda: 10 horas MEDIDAS DE DISPERSION Varianza: 4.148 horas2 Desviacin estndar: 2.037 horas

Pgina 9

Tabla de frecuencias relativas


0.350 0.300 0.250 alumnos 0.200 0.150 0.100 0.050 0.000 5.5 6.5 7.5 8.5 9.5 10.5 11.5 12.5 Horas de estudio

Tabla estadistica VAR1-PREGUNTA 1 N Valid Missing Media Mediana Moda Varianza Asimetria Std. Error de asimetria curtosis Std. Error de curtosis 95 0 8,8526 9,0000 10,00 4,148 -0,043 0,247 -0,720 0,490

Pgina 10

PRUEBA DE RACHAS (ANALISIS DE INDEPENDENCIA) Plantearemos la hiptesis de independencia referida al variable gasto diario. Paso 1 Planteamiento de Hiptesis. H0: La variable en estudio es dependiente. H1: La variable en estudio es independiente. Paso 2 Estableciendo el nivel de significancia El nivel de significancia esta estandarizado a un valor de =0.05 Paso 3
Prueba de Rachas para la muestra 1 VAR000 01 Valor de Prueba Casos<Valor de prueba Casos>= Valor de prueba Casos totales Numero de Rachas Z Sig. Asintotica(2-tailed) 9,00 46 49 95 2 -9,593 ,000

La tabla ofrece, por ltimo, el valor del estadstico de contraste (Z=-9,593) y su nivel crtico
(Significacin asinttica bilateral=0,00). Puesto que el nivel crtico es muy pequeo (menor que 0,05), podemos rechazar la hiptesis de independencia y concluir que la secuencia de observaciones estudiada no es aleatoria.

Pgina 11

ANALIZANDO LA NORMALIDAD POR LA PRUEBA DE KOLMOGOROV-SMIRNOV GRAFICO DE FRECUENCIAS DE LAS HORAS DE ESTUDIO

Para hacer el anlisis de Kolmogorov-smirnov, es condicin necesaria que las variables sean independientes, con ello procedemos a determinar en primer lugar el coeficiente o ndice de asimetra: Coeficiente o ndice de asimetra de Pearson:

As -0.0428

Interpretacion Se presenta una asimetra negativa o con cola hacia la izquierda.

En segundo lugar, determinemos el coeficiente de curtosis: Coef. Curtosis -0.7196 Interpretacion El valor negativo de la curtosis indica que es una distribucin pletocrtica.

Pgina 12

PROCEDIMIENTO DE LA SIGNIFICANCIA ESTADISTICA Paso 1 Planteamiento de la hipotsis H0: La distribucin de la variable en estudio NO difiere de la distribucin. H1: La distribucin de la variable en estudio difiere de la distribucin. Paso 2 Estableciendo el nivel de significancia El nivel de significancia esta estandarizado a un valor de =0.05 Paso 3
Prueba de Kolmogorov-Smirnov para la muestra 1 VAR1 N Parmetros normales Media Std. Desviacin Diferencias mas extremas Absoluta Positiva Negativa Kolmogorov-Smirnov Z Sig. Asinttica (Bilateral) a. Test distribution is Normal. b. Calculated from data. 95 8,8526 2,03673 0,177 0,146 -0,177 1,721 0,005

El Valor calculado es la z de Kolmogorov-smirnov: Z=1.721

Este estadstico Z se distribuye segn el modelo de probabilidad normal N(0,1). El SPSS utiliza el mtodo de Smirnov (1948) para obtener las probabilidades concretas asociadas a los valores estadstico Z. Este mtodo difiere el estndar (basado en las probabilidades de la curva normal estandarizada), pero es equivalente. Valor de P=0.005 Su nivel crtico (significacin asinttica bilateral = 0.005) es mucho menor al nivel de significancia (0.05) aceptamos la hiptesis de normalidad como falsa y concluimos que las puntuaciones de la variablegasto diariono se ajustan a una distribucin normal.

Pgina 13

Pregunta 2
Mtodo del teorema de cajas, para eliminar datos atpicos.

Xmin=1 Q1=5 Q2=8

Xmax=15

Q2=10

PARA EL CLCULO DEL Xmin El IQR es de 5. Ahora 1.5 veces el valor de 5 es 7.5. Este vendra hacer el mximo tamao del bigote. Restamos 7.5 del primer cuartil: Q1-7.5=-2.5. Este vendra a ser como el lmite o el extremo desde donde se pueden aceptar los datos, es decir todo dato menor a este valor de -2.5, son valores atpicos. Pero como los datos, son todos positivos, el Xmin=1 Para la determinacin de valores atpicos graves, hacemos 3 veces el valor de 5 que es 15, procedemos a restarlo del cuartil 1 y obtenemos: -10, con esto concluimos que no hay valores atpicos graves debido a que solo hay datos positivos.. PARA EL CLCULO DEL Xmax El procedimiento es el mismo:

Pgina 14

De los anteriores clculos el mximo tamao del bigote es 7.5 Ahora adicionamos 7.5 al tercer cuartil: Q3+3=17.5. Este vendra a ser como el lmite o el extremo desde donde se pueden aceptar los datos, es decir todo dato mayor a este valor de 17.5, son valores atpicos. Entonces el valor de 20, es un valor extremo (atpico leve), por lo tanto el bigote debe ser dibujado en 15, el cual es el menor valor que no es un atpico. Con ello Xmax=15. Para la determinacin de valores atpicos graves, hacemos 3 veces el valor de 5 que es 15, procedemos a sumarle al cuartil 3 y obtenemos: 25, con esto concluimos que no existe valores atpicos graves. Xminimo=1 Xmax=15 R=Xmax- Xminimo=15-1=14 El nmero aprox. de intervalos: K=1+33log(96)=7.45 *Elegimos 7 como intervalos. La amplitud del intervalo: R/K=14/7=2 Tabla de distribucin: marca de clase 2 4 6 8 10 12 14 fre. absoluta 6 10 21 18 21 8 12 fre.abs. acumulada 6 16 37 55 76 84 96 fre.abs. relativa 0.0625 0.1665 0.3852 0.5727 0.79145 0.87445 1

intervalos <1,3] <3,5] <5,7] <7,9] <9,11] <11,13] <13,15>

fre. relativa 0.0625 0.104 0.2187 0.1875 0.21875 0.083 0.125

Media: 8.0938 soles. Mediana: 8 soles. Moda: 10 soles. Varianza: 14.149 soles2.

Pgina 15

Desviacin estndar: 3.7615 soles. PRUEBA DE RACHAS Establecimiento de la hiptesis de independencia. Paso1 H0: La variable es dependiente H1: La variable es independiente Paso2 Establecimiento del nivel de significancia =0.05 Paso 3
Prueba de Racha Horas diaria Valor de prueba Casos < Valor de prueba Casos >= Valor de prueba Casos totales Numero de rachas Z Sig. asintot.(bilateral) 96 2 -9,643 ,000 8,00 41 55

Analizando la normalidad por la prueba de kolmogorov-Smimov 25 20 15 10 5 0 1 2 3 4 5 6 7 8 10 numeros de soles 12 13 14 15

numero de alumnos

Pgina 16

Cuadro ajustado a una normal

Datos Validos periodos Asimetria Error tip.de Asimetra Curtosis Error tip. De curtosis 96 4 0,196 0,246 -0,797 0,488

Pgina 17

Prueba de Kolmogorov-Smirnov para esta muestra valores N Parametros normales Most Differences Media Desviacion.sta Extreme Absoluta Positiva Negativa Z de Kolmogorov-Smirnov Sig.asintot.(bilateral) 96 8,0938 3,76152 0,121 0,118 -0,121 1,185 0,121

*Si la distribucin es normal, k tiende a o. si k tiende a 0.5, es leptocurtica, y k tiende a -0,5, es platicurtica. Coeficiente de asimetra= 0,196 Coeficiente de curtosis = -0,797 Planteo de hiptesis: H0: la distribucin de la variable en estudio NO difiere de la distribucin normal. H1:la distribucin de la variable en estudio difiere de la distribucin normal . Establecer un nivel de significancia: Nivel de significancia = 5% El valor de significancia 5%, es el mas comn. Valor calculad es la z de kolmogorov-smimov : 1,185 Valor de p: 0,121 Interpretacin: la distribucin de la variable en estudio NO difiere de la distribucin normal. Interpretacin= interpretacin= derecha platicurtica

Pgina 18

APLICACIONES
Siendo =8.0938 ; S(x)=3.76 1) Hallar la probabilidad de que el gato (g), sea mayor o igual a 10 soles. P(10g)=1- P(g<10)=1-P(z< 1- P(z<
( )

)=1- P(z<

)=

)= 1-0.695=0.305

La probabilidad es de 0.305. 2) Hallar la probabilidad de que el gato (g), sea mayor o igual a 12 soles. P(12g)=1- P(g<12)=1-P(z< 1-P(z<
( )

)=1- P(z<

)=

)=1-0.8508=0.1492

La probabilidad es de 0.1492.

3) Hallar la probabilidad de que el gato (g), sea menor a 8 soles. P(g8)=P(z


( )

)=P(z<

)=P(z<

)=0.492

La probabilidad es de 0.492.

4) Hallar la probabilidad de que el gato (g), sea mayor a 5 soles y menor a 10 soles. P(5g10)=P(
( )

( )

)= P(

)=

P(-0.823z0.507)=0.488 La probabilidad es de 0.488.

Pgina 19

CONCLUSIONES

1- El mtodo de kolmogorov-smirnov es una prueba no paramtrica que nos sirve para decidir si nuestra distribucin dada se aproxima a una distribucin normal, utilizando pruebas de hiptesis . 2- El grado de curtosis y coeficiente o ndice de asimetra de pearson nos da una idea de la geometra de la funcin de distribucin. 3- La prueba de rachas nos sirve para determinar si la variable aleatoria con la que trabajamos es independiente o no. 4- A la hora de ajustar los datos para que se forme una normal por el mtodo de kolmogorov-smirnov, por lo mismo no se puede ajustar una normal, por ende no se pudo realizar un trabajo estadstico ms riguroso. 5- En este trabajo tomamos las variables de forma independiente, no obstante la prueba de rachas nos dio que eran variables dependientes, ya que el gasto diario depende por ejemplo del distrito de origen, asi como las horas diarias dependen de la cercana de donde actualmente viven.

RECOMENDACIN
1- En la realizacin de la encuesta, se recomienda indagar, y profundizar con muchos ms datos variables, para as, los datos se actualizan y sean mucho ms confiables.

BIBLIOGRAFIA
Estadistica Descriptiva e inferencial. 5 Edicin. Manuel Crdova Zamora. Pg 299-305 Probabilidades y estadstica para ingeniera y ciencias. 7 Edicin. Devor. Pg 284-295 Probabilidad e Inferencia Estadistica. 2 edicin. Rufino Moya. Pg. 607-615

Pgina 20

Vous aimerez peut-être aussi