Académique Documents
Professionnel Documents
Culture Documents
PENSAMIENTO
Usted es responsable por su propio aprendizaje. Yo soy responsable por apoyarlo, facilitarle aprender y aprender juntos. Annimo
ESTUDIO
NECESIDAD PROBLEMA
VARIABLES
DATOS
INFORMACION
INDICADORES
ANALISIS
PRESENTACION
Compendios Boletines Informes Apoya la Formulacin de Polticas, Toma de Decisiones, Planificacin, Estudios, etc. Propicia una Institucin Informada
POBLACIN
MUESTRA Unidades de Anlisis
PLANEAMIENTO
Define el problema Determina necesidades de informacin Establece objetivos Precisa variables, datos, informacin Delimita mbitos del trabajo Identifica fuente de datos Selecciona tcnicas de recoleccin Elabora instrumentos de recoleccin Fija mtodos de anlisis
RECOLECCIN
Relevamiento Obtener datos de las fuentes Levantar informacin
PROCESAMIENTO
Tratamiento de los datos Organizacin y presentacin
ANLISIS
Significado Utilidad
PUBLICACIN Y DIFUSIN
Dar a conocer Difundir
Significado de Estadstica?
Lenguaje corriente
Ciencia
Qu es Estadstica?
Ciencia que proporciona un conjunto de
mtodos que se utilizan para recolectar, resumir, clasificar, analizar e interpretar el comportamiento de los datos, con respecto a una caracterstica materia de estudio, para la toma de decisiones.
Clasificacin:
Estadstica Descriptiva
Conjunto de mtodos que implican la recoleccin, presentacin y caracterizacin de un conjunto de datos a fin de describir en forma apropiada las diversas caractersticas de stas.
Analiza y describe datos
Estadstica Inferencial
Conjunto de mtodos o tcnicas que posibilitan
la generalizacin o toma de las decisiones en base a una informacin parcial obtenida a partir de una muestra. Efecta estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.
La prediccin se hace con un cierto grado de confianza, la cual es medida por la probabilidad.
8
Estadstica Inferencial
En ESTADISTICA utilizamos el mtodo
INDUCTIVO para INFERIR conclusiones De lo PARTICULAR a lo GENERAL
Estadstica Inferencial
Por que hablamos de INCERTIDUMBRE en
las CONCLUSIONES?
Porque existen muchas muestras posibles, pero nosotros solo OBSERVAMOS UNA !!!
11
Poblacin
Coleccin de todos los individuos, objetos u
observaciones que poseen al menos una caracterstica comn.
Ejemplo: a. Las edades de los alumnos del sistema universitario peruano. b. Los enfermos de SIDA, tratados con uno de tres tratamientos diferentes.
12
Poblacin
tiene un nmero infinito de elementos. Incluye un gran conjunto de medidas y observaciones. Hipotticamente no existe lmite en cuanto al nmero de observaciones que cada uno de ellos pueda generar. Ej: electores que votarn. Parmetro: medida resumen que describe una caracterstica de toda la poblacin. 13
Muestra
Es una parte o subconjunto representativo
de la poblacin. Al proceso de obtener una muestra se llama muestreo. extraccin de conclusiones vlidas para la poblacin de la cual se obtuvo dicha muestra. una caracterstica de la muestra.
directo con los problemas de salud. Los cuales se analizarn e interpretarn para fomentar y desarrollar una poltica sanitaria adecuada.
Investigar
17
El desarrollo del conocimiento en la ciencia, se caracteriza porque su ejecucin se lleva a cabo segn el mtodo: El mtodo cientfico.
Etapas del mtodo cientfico: - observacin del fenmeno que se estudia - formulacin de hiptesis mediante la cual puedan explicarse los hechos observados - verificacin de las hiptesis 18
El Mtodo Estadstico
1. Planeamiento de la investigacin
2. Recoleccin de datos 3. Organizacin de los datos 4. Anlisis 5. Conclusin e interpretacin de los resultados.
19
20
hechos que intenta explicar. Herramienta en la tarea cientfica. Aspirando a explicar o predecir algunos hechos independientes. 21
23
26
27
Fuentes de Informacin
Datos internos
Datos externos Fuentes primarias: obtenida directamente
de la unidad de observacin
Variable: caracterstica de la poblacin que se va a investigar y que puede tomar diferentes valores.
29
Variable cuantitativa
Se clasifican en:
(Escalar)
Discreta: surgen del procedimiento de conteo. Suelen tomar valores enteros. Continua: surgen cuando se mide alguna caracterstica. Tericamente pueden tomar cualquier valor dentro de un intervalo.
31
32
Estudios experimentales
Nominal:
= (Estado civil),
Ordinal:
> (Escolaridad)
33
Intervalo:
= , <, > + (no tiene 0 absoluto) Estadsticos: media, desviacin estndar Ejemplo: temperatura medida en grados
<, > + * / 0
Razn: = ,
ESTADISTICA DESCRIPTIVA
Aprenderemos: Obtener, organizar y analizar datos Introduccin a las probabilidades.
35
Organizacin de datos
Se muestra a continuacin el nmero de crditos aprobados por los alumnos de la UTP: 138 69 183 100 79 48 114 188 140 72 137 21 64 191 83 61 113 149 192 12 79 90 98 196 79 162 150 96 55 157 156 16 145 165 122 90 138 36 172 87 63 41 106 131 109 157 150 25 40 17 101 148 65 136 141 100 38 170 63 197 116 156 134 72 141 129 160 90 40 177 169 49 22 158 157 44 93 154 80 186 175 111 11 20 36 125 124 126 54 89 198 100 113 24 14 70 196 65 85 10 180 41 142 155 86 134 143 191
37
Organizacin de datos
Observando los datos de la anterior, NO NOS DICE NADA. diapositiva
Para lograr identificar las principales caractersticas del conjunto de datos, TENEMOS QUE ORDENAR PREVIAMENTE al conjunto de datos.
38
Son 35 casos.
La menor observacin es de 33.1 cm. La mayor observacin es de 36.5 cm. El 51.43% (18 casos) de los datos estn alrededor de los 34 cm. Son muy pocos frecuentes los casos mayores a 36 cm (03 casos). Mientras mayor sea el nmero de observaciones presentes en una serie de datos, mas complicado es 40 formar la clasificacin ordenada.
..
.. xm Totales
..
.. nm n
41
N2 = nj = n1 + n2 = 1 + 6 = 7
N5 = nj = n1 + n2 + n3 + n4 + n5 = 16 Interpretar N3: 12 familias a los ms 2 hijos
43
5
N5* = nj = n5 = 1
5
44
Frecuencia relativa
Cociente de la frecuencia absoluta de yi y el
nmero total de observaciones hi = ni / n h3 = n3 / 16 Mide la importancia que tiene cada frecuencia absoluta
45
Ejemplo:
Frecuencia relativa multiplicada por 100%, representa el porcentaje de observaciones que corresponde al valor yi
Ejemplo:
Resultado final
xi
0
ni
1
Ni
1
hi
0.0625
Hi
0.0625
N*i
16
H*i
1.0000
100 hi %
6.25
100 Hi %
100 H*i %
100.00
6.25
0.375
0.4375
15
0.9375
37.50
43.75
93.75
12
0.3125
0.7500
0.5625
31.25
75.00
56.25
15
0.1875
0.9375
0.2500
18.75
93.75
25.00
1 16
16
0.0625
1.0000
0.0625
6.25
100.00
6.25
47
ni
hi
Ni 2 5 9 14
Hi
0.7
Distribucin de frecuencia
Cuando el conjunto de datos tiene una
dispersin muy grande, se utiliza la distribucin de frecuencias. La clave esta en definir el nmero de clases Las reglas (empricas) para agrupar datos en clases son:
49
Distribucin de frecuencia
2.Localizar la menor y la mayor observacin. 3.Encontrar el rango: Rango = Obs. Mayor - Obs. Menor 4.Hallar la longitud mnima requerida:
Distribucin de frecuencias
6. Determinar nmero de observaciones que
Amplitud de clase: es la longitud del intervalo que define la clase. Marca de clase: punto medio del intervalo que representa a dicha clase.
Un intervalo de clase que no tiene lmite inferior o superior se llama Intervalo de clase abierto.
51
Distribucin de frecuencias
Histograma
Frecuencia
Histograma
54
Los polgonos de frecuencia, relacionan las puntuaciones con sus respectivas frecuencias. Se puede utilizar la frecuencia absoluta y la frecuencia relativa. Las ojivas, relaciona las puntuaciones con sus respectivas 55 frecuencias acumuladas.
20 - 24
0.10
24 - 28
0.25
- 32
11
0.55
32 - 40
0.85 1.00
57
58
y conciso (breve) 3. Cuadro propiamente dicho: encabezamiento (se explica las categoras, y el objeto de cada columna), columna principal (se anotan diferentes clases de la escala de clasificacin), cuerpo (conjunto de
celdas)
Ejemplo
Cuadro 2.1 Per: Distribucin de las mujeres de 15 a 49 aos
Por rea urbana, rural; Segn estado conyugal: 1998 Estado Conyugal Total Urbana Rural Soltera 1,760 1,335 425 Casada 2,003 1,335 668 Conviviente 896 491 405 Viuda 69 34 35 Divorciada 20 20 0 Separada 251 191 60 Total 4,999 3,406 1,593
Fuente: INEI- Encuesta Nacional Demogrfica
60
Ejemplo:
Representacin grfica
Representacin del fenmeno estadstico,
por medio de figuras geomtricas, que permita de un solo golpe de vista darse cuenta del conjunto de elementos presentados y de evidenciar sus variaciones y caractersticas.
63
Ejemplos
2,500 2,000 1,500 1,000 500 0 Soltera Casada Conviviente 2,500 2,000 1,500 1,000 500 0 Soltera Casada Conviviente
Frecuencia
Cuadro 2.1 Per: Distribucin de las mujeres de 15 a 49 aos Por rea urbana, rural; Segn estado conyugal: 1998 Total Soltera Casada Conviviente Viuda Divorciada Separada Total
Histograma
10 8 6 4 2 0 136 142 148 154 160 y mayor... Clase 120.00% 100.00% 80.00% 60.00% 40.00% 20.00% .00%
OJIVA
64
Medidas de resumen
Necesitamos medidas numricas ms exactas que nos permitan tener una mejor idea como se distribuyen los datos. Estudiaremos dos tipos de medidas de resumen: Medidas de TENDENCIA CENTRAL Medidas de DISPERCION.
65
66
67
Media
La media es la medida de tendencia central ms utilizada y puede definirse como el promedio aritmtico de una distribucin.
La media es sensible a valores extremos.
La media de datos no agrupados, se calcula:
Poblacin
x
N
Muestra
x x n
68
Ejemplo:
24, 31, 35, 35, 38, 43, 45, 50, 57
24 31 35 35 38 43 45 50 57 x 39.78 unid. 9
69
Media
La media de datos agrupados, se calcula:
xf x n
Ejemplo:
Intervalos 9.5 - 19.5 19.5 - 29.5 29.5 - 39.5 39.5 - 49.5 49.5 - 59.5 59.5 - 69.5 69.5 - 79.5 f 5 x 14.50 19 24.50 10 34.50 13 44.50 4 54.50 4 64.50 2 74.50 57 xf 72.50 465.50 345.00 578.50 218.00 258.00 149.00 2,086.50
Mediana
La mediana es el valor que divide a la distribucin en dos partes iguales. La mediana refleja la posicin intermedia de la distribucin. Ejemplo: 24, 31, 35, 35, 38, 43, 45, 50, 57
Me 38 unid.
71
Mediana
Cuando n es par, la mediana es el promedio de los valores centrales
24, 31, 35, 35, 38, 43, 45, 50, 57, 60
38 43 Me 40.5 unid. 2
La mediana, es til cuando hay valores extremos en la distribucin.
72
Mediana
Intervalos Frecuencia 9.5 - 19.5 19.5 - 29.5 29.5 - 39.5 39.5 - 49.5 49.5 - 59.5 59.5 - 69.5 69.5 - 79.5 5 19 10 13 4 4 2
fr 0.088 0.333 0.175 0.228 0.070 0.070 0.035 fr acu 0.088 0.421 0.596 0.825 0.895 0.965 1.000
Analizando, tenemos:
Los datos estn agrupados. El intervalo que contiene la mediana esta en: 29.5 39.5
Me Li Lreal
Mediana
Calculando la mediana para datos agrupados:
Intervalos f 9.5 - 19.5 19.5 - 29.5 29.5 - 39.5 39.5 - 49.5 49.5 - 59.5 59.5 - 69.5 69.5 - 79.5 5 19 10 13 4 4 2 57 fr 0.088 0.333 0.175 0.228 0.070 0.070 0.035 fr acu 0.088 0.421 0.596 0.825 0.895 0.965 1.000
74
Moda
La moda es la categora o puntuacin que ocurre con mayor frecuencia. Si todos los datos son diferentes, no hay moda. Se utiliza con cualquier tipo de medicin. Ejemplo: Considrese un laboratorio con diez empleados cuyas edades son: 20, 21, 20, 20, 34, 22, 24, 20, 27, 27. Analizando este conjunto de datos, tenemos: Los datos no estn agrupados.
Moda
Intervalos Frecuencia 9.5 - 19.5 19.5 - 29.5 29.5 - 39.5 39.5 - 49.5 49.5 - 59.5 59.5 - 69.5 69.5 - 79.5 5
19.5 29.5, por lo tanto en este intervalo se encuentra la 4 moda. La moda de datos agrupados 2 se calcula con:
76
Moda
Calculando la moda para datos agrupados:
Intervalos Frecuencia 9.5 - 19.5 19.5 - 29.5 29.5 - 39.5 39.5 - 49.5 49.5 - 59.5 59.5 - 69.5 69.5 - 79.5 5 19 10 13 4 4 2
19 5 Mo 19 .5 10 25 .59 unid. ( 19 5 ) ( 19 10 )
77
Medidas de dispersin
El comportamiento de una variable aleatoria est determinado por el azar. Por lo tanto, los valores observados difieren entre si. En algunos casos estas diferencias son pequeas, en otras son grandes. Las medidas que me miden esta variabilidad, son las de dispersin. Las medidas de dispersin que estudiaremos son: Varianza Desviacin estndar. Coeficiente de variacin
78
Medidas de dispersin
Porqu es importante conocer la dispersin de un conjunto de datos? Cuando conocemos la media, mediana y moda, solo conocemos una parte de las caractersticas del conjunto de datos. Para conocerlas mejor, debemos tambin su dispersin, o variabilidad. medir
79
( x x ) 2 s n 1
81
f ( x )2 N
f (x X )
n 1
Las medidas de datos agrupados solo son aproximaciones. Es decir, por simplicidad sacrificamos precisin.
82
2 f ( x x )
n 1
83
( x )2
N
2 ( x x ) s2 n 1
f ( x )2 N
f ( x x)2 s n 1
2
84