Académique Documents
Professionnel Documents
Culture Documents
ESTADISTICA Y PROBABILIDADES
UNIDAD I
OBJETIVOS
Al finalizar la Unidad I, el participante ser capaz de:
1.
2. 3.
Esquema Temtico
Sesin 01
Prueba de Entrada
Esquema Temtico
Sesin 02
Introduccin Conceptos Bsicos Estadstica Descriptiva e Inferencial Poblacin y Muestra Datos y Variables: discretas y continuas
Introduccin
La Estadstica es una ciencia que facilita
la solucin de problemas en los cuales necesitamos conocer caractersticas sobre el comportamiento de algn suceso o evento.
Introduccin
Esto nos da la posibilidad de tomar decisiones acertadas y a tiempo, as como realizar proyecciones del comportamiento del suceso.
Frecuentemente se realizan los clculos y el anlisis con los datos obtenidos de una muestra de la poblacin y no con toda la poblacin.
Introduccin
Conceptos bsicos
Estadstica:
Es la ciencia que se encarga de recolectar, organizar, resumir y analizar datos para despus obtener conclusiones. Se divide en Estadstica Descriptiva y Estadstica Inferencial.
Estadstica descriptiva:
Conceptos bsicos
Estadstica inferencial:
Se encarga de analizar la informacin presentada por la estadstica descriptiva mediante tcnicas que nos ayuden a conocer, con determinado grado de confianza, a la poblacin. Lo que nos permite tomar decisiones.
Conceptos bsicos
Poblacin:
Conjunto definido de TODOS los INDIVIDUOS, de donde se observa cierta caracterstica. Al nmero de integrantes de la poblacin se llama tamao de la poblacin y se representa con la letra N. Las poblaciones pueden ser finitas o infinitas.
Conceptos bsicos
Poblacin Estadstica:
Conjunto de TODOS los DATOS que se obtienen al realizar la medicin de una variable en los elementos de una poblacin.
Muestra:
Subconjunto de una poblacin, que intenta reflejar las caractersticas de la poblacin lo mejor posible.
El nmero de individuos que integran la muestra, llamado
Conceptos bsicos
Individuo:
Variable:
Caracterstica o propiedad de los individuos que se desea estudiar y se puede medir o calificar; cambia o vara con el tiempo en un individuo dado, o cambia o vara de elemento a elemento.
Conceptos bsicos
Variable Continua:
Si la variable puede tomar cualquier nmero real entre dos valores dados (decimal o entero). Ej. El peso de un individuo.
Variable Discreta:
Si la variable slo puede tomar nmeros enteros. Ej. El nmero de hijos de un individuo.
Conceptos bsicos
Variable Dicotmica:
Slo puede tomar dos valores (s no, 0 1, hombre mujer, bueno malo, encendido apagado).
Conceptos bsicos
Dato:
Valor que se obtiene al realizar la medicin de la caracterstica de la variable en estudio. Pueden ser univariados, bivariados o multivariados.
datos cualitativos.
Conceptos bsicos
Datos Cuantitativos (nmeros):
Se obtienen al calificar la caracterstica en cuestin como el sexo, estado civil, grado mximo de estudios.
Repaso
Individuo Descriptiva (Poblacin) Estadstica Inferencial (Muestra) Variables (Continua o discreta)
Datos
PREGUNTAS?
Escalas de Medicin: Nominal, Ordinal, Intervalo y Razn El redondeo de datos Fuentes de datos Mtodos y tcnicas de recoleccin de datos Organizacin de datos
I.
Se debe registrar adecuadamente el origen de datos (el da, la hora, quines fueron los responsables, qu lote se uso, entre otros).
II. Los datos deben registrarse de manera que facilite su utilizacin (hojas de registro).
Escalas de Medicin
Escala Nominal
Escala Ordinal Escala de Intervalo Escala de Razn
Escalas de Medicin
Escala Nominal:
Est asociada a variables cualitativitas y es denominada de este modo si no se pueden hacer operaciones aritmticas entre sus valores, pues stos son nicamente ETIQUETAS. Ejemplo: sexo, cdigo postal, estado civil, nmero telefnico, nmero al correr en un maratn, deporte favorito, carrera a estudiar, etc.
Escalas de Medicin
Escala Ordinal:
Los valores de la variable que tienen un ORDEN con un nivel especfico, pero no se pueden hacer operaciones aritmticas entre ellas.
Ejemplo: Psimo Malo Regular Bueno Excelente Primaria Secundaria Preparatoria - Licenciatura
Escalas de Medicin
Escala de Intervalo:
En ella existe un orden entre los valores de la variable y adems una NOCIN DE DISTANCIA aunque no se puedan realizar operaciones. El cero o punto de inicio no es nico, es ms bien un punto de referencia. Ejemplo: Escalas de temperatura, la edad de la Tierra, la lnea del tiempo de la humanidad.
Escalas de Medicin
Escala de Razn:
La magnitud tiene SENTIDO FSICO, existe el cero absoluto, existe orden, se puede determinar cuntas veces es mayor uno que otro. Ejemplo: peso, estatura, edad, distancia, dinero, etc.
Redondeo de datos
Durante el anlisis, muchas veces se divide un nmero por otro obtenindose en algunas ocasiones, un nmero infinito de decimales.
Con el objeto de hacer ms operativo el manejo de estos datos se redondean. Para cortar o redondear, se siguen las siguientes reglas.
Redondeo de datos
1ra REGLA: Para la respuesta final, debemos redondear hasta dos lugares ms de lo que haba en los datos originales. No se debe redondear en los pasos intermedios. Ejemplo : datos originales : enteros resultado final : 2 decimales.
Redondeo de datos
2 REGLA: Si la cifra que sigue es mayor a 5, se aumenta 1. Si la cifra que sigue es menor a 5, el nmero no vara. Ejemplo: Redondeo a 2 decimales 6,176 . 6,18 4,123 . 4,12
Redondeo de datos
3 REGLA: Si la cifra que sigue es 5 y el nmero anterior es par no se modifica. Pero si el nmero es impar, aumenta 1. Ejemplo: Redondeo a 2 decimales 6,545 . 6,54 1,975 . 1,98
Fuentes de Datos
FUENTES SECUNDARIAS Datos recolectados anteriormente para alcanzar otros objetivos. Constituye la primera fuente que se debe analizar. La tcnica ms utilizada son las fichas. Ejemplo: Datos publicados (en papel o en forma electrnica) en revistas especializadas, tesis, censos y en las hojas de registro anteriores.
Fuentes de Datos
LA CALIDAD DE LOS DATOS DEBE SER COMPROBADA:
De donde provienen los datos? La fuente es imparcial? Los datos comprueban o contradicen otras evidencias que se disponen? Hace falta una evidencia cuya ausencia conduzca a otra conclusin? Cuantas observaciones se tienen?
Fuentes de Datos
LOS PRINCIPALES ORGANISMOS QUE DISPONEN DE PUBLICACIONES SON:
1. Instituto Nacional de Estadstica e Informtica (INEI) 2. Organizacin Mundial del Trabajo (OIT) 3. Organizacin Mundial de la Salud (OMS) 4. Organizacin Panamericana de la Salud (OPS)
Fuentes de Datos
FUENTES PRIMARIAS Constituyen datos recolectados para el Son datos que no existan antes. trabajo.
Ejemplo: registro del tiempo que demora un mdico durante una consulta. Comprende 2 tcnicas.
Se registra un dato bajo condiciones provocadas simulando el proceso lo ms real posible. Ejemplo:
Ejemplo: Se pregunta a un paciente el tiempo que esper antes que sea atendido en el consultorio externo. Comprende 2 tcnicas: la encuesta y la entrevista.
1.
2. Al disearla se debe: Elegir lo temas generales de la encuesta Decidir forma de aplicarlo: correo, telfono o personal Plantear preguntas Realizar una prueba piloto y hacer revisiones finales Ejemplo: Encuesta para conocer el grado de satisfaccin de los asegurados a una clnica.
Ejemplo
En un estudio de investigacin de mercados para paales desechables, interesa conocer ciertas caractersticas, CARACTERISTICA Tasa de natalidad Nivel socio-econmico de la familia Textura del producto FUENTE Secundaria Primaria Primaria TECNICA Fichas Encuesta Entrevista
El Cuestionario
Junto con las hojas de registro, es la tcnica ms comn para la recopilacin de datos de fuentes primarias.
1. 2. 3.
Las preguntas deben ser coherentes con el objetivo de la investigacin. No hay preguntas de carcter general. La extensin (nmero de preguntas) depende de la necesidad de informacin a recolectar por esta tcnica. El lenguaje utilizado en la redaccin de preguntas debe ser entendible por los encuestados. Es diferente al lenguaje a usarse en el informe final
No
No formular preguntas dirigidas. Evitar adjetivos, ya que predisponen a una respuesta. Ejemplo: Cree Ud. que el precio del medicamento es alto? Si
No
Ejemplo :
Posee Ud. un seguro mdico?
Si
No2
3. 4.
Organizacin de datos
La importancia de la organizacin de los datos
Los datos deben organizarse, para entender mejor su naturaleza fundamentalmente utilizando dos mtodos : el mtodo tabular y el mtodo grfico. Si los datos no estn organizados son de poca utilidad en una investigacin o para una toma de decisiones.
Orden de datos
La ordenacin es el proceso mediante el cual los datos
estn acomodados de tal manera que se establece un orden (ascendente o descendente) entre ellos.
Ejemplo
Considera que la variable de estudio es el peso de 25
dgitos, se hace una columna con el primer dgito (decenas) y a la derecha de cada uno de ellos se escribe, en fila, slo el segundo dgito (unidades) de cada uno de los datos que tengan el mismo primer dgito.
4 5 6
Datos ordenados:
4 5 6
0,2,3,4,4,5,8,9 0,0,1,1,2,2,5,5,6,6,7,8,9
2,3,3,6
Doble tallo
Una variante de este mtodo es en lugar de dividir en un
grupo las decenas, se divide en dos grupos. El primero abarcando los dgitos del 0 al 4 y el segundo del 5 al 9.
4 4 5 5 6 6
Se identifican todos los valores diferentes y se acomodan en columna. Se agrega una segunda columna en donde se van registrando, mediante una lnea vertical, la veces que aparece el valor dado.
Ejemplo
Considera que la variable de estudio es el color de playera de
rosa
azul
blanco azul
rosa
Ejemplo
Color
Frecuencia
rosa blanco
azul caf blanco blanco azul blanco rosa gris blanco caf negro verde
IIII II IIII I
Repaso
Escalas Nominal Ordinal Intervalo Razn
Orden de datos
PREGUNTAS?
y la otra para su frecuencia f, a esta frecuencia se le llama frecuencia absoluta o frecuencia observada.
Ejemplo
Tabla de frecuencias de los pesos en kg de 25 alumnos.
xi 40 42 43 44 45 48 49 50 51
f 1 1 1 2 1 1 1 2 2
xi 52 55 56 57 58 59 62 63
f 2 2 2 1 1 1 1 2 1 25
40 45 51 55 59
42 48 51 56 62
43 49 52 56 63
44 50 52 57 63
44 50 55 58 66
66 Total
Ejemplo
1/25
xi
40 42 43
f
1 1 1
h
0.04
F 1 2
3 2/25
xi
52 55 56 57 58
f
2 2 2 1 1
h
0.08
F
14
0.04
0.04 0.08 0.04
16 18
19 20
44
45 48 49
2
1 1 1
5
6 7 8 10 12
0.04
0.04 0.08 0.08
59
62 63 66 Tot al
1
1 2 1 25
0.04
0.04 0.08 0.04
21
22 24 25
50
51
2
2
Siempre es 1
Intervalo de clase
En ocasiones es conveniente acomodar los datos en
pequeos grupos de igual tamao, llamados intervalos de clase. El punto medio o marca de clase xi, se obtiene con:
Marca de clase= Lmite inferior + lmite superior
2
El tamao del intervalo se obtiene mediante la
Ejemplo
Lmite inferior Lmite superior Lm inf + Lim sup 2
Intervalo de clase 38 42 43 47 48 52 53 57 58 62 63 67
Punto medio xi 40 45 50 55 60 65
Intervalo de clase Punto medio xi 37.5 42.5 40 40 + 2.5 45 40 2.5 42.5 47.5 47.5 52.5 50 52.5 57.5 55 57.5 62.5 60 62.5 67.5 65
Intervalo de clase 37.5 x < 42.5 42.5 x < 47.5 47.5 x < 52.5
Punto medio xi 40 45 50
Intervalo de clase [37.5 , 42.5) [42.5 , 47.5) [47.5 , 52.5) [52.5 , 57.5) [57.5 , 62.5) [62.5 , 67.5)
Punto medio xi 40 45 50 55 60 65
55 60 65
Ejemplo
Para el ejemplo de los datos de los pesos de 25 alumnos, el
valor de K:
K = 1 + 3.3 log (n) = 1 + 3.3 log (25) = 5.6. Por lo tanto se requieren aproximadamente 6 intervalos.
Y la amplitud de los intervalos sera:
Amplitud = Rango / K = (66 40) / 5.6 = 4.64. Aproximadamente 5 unidades es la amplitud de los intervalos.
Datos agrupados
52 55 56 57 58 59 62 63 66 Total 2 2 2 1 1 1 1 2 1 25 Intervalo de clase 38 42 43 47 48 52 53 57 58 62 63 - 67 Punto medio xi 40 45 50 55 60 65 Total f
40 42 43 44 45 48 49 50 51
2 4 8 5 3 3 25
h y frecuencia acumulada F:
f
F
2/25
2 4
48 52
53 57 58 62 63- 68
50
55 60 65
8
5 3 3
Total
25
2 6 14 19 22 25
4/25 8/25
Frecuencia porcentual, f% %f, se obtiene multiplicando la frecuencia relativa fr x 100. Frecuencia relativa acumulada fra, se obtiene sumando las frecuencias relativas anteriores a un dato dado. Frecuencia porcentual acumulada, f%a, se obtiene sumando las frecuencias porcentuales acumuladas a un dato dado.
0.08 x 100
2/25
H%
38 42 43 47 48 52 53 57 58 62 63- 68
40 45 50 55 60 65 Total
2 4 8 5 3 3 25
8 16
32 20 12 12 100
2 6 14 19 22 25
8 24
56
Grafica de Barras
Grafico Circular Pictograma
Grfica de Datos
Existen dos tipos de grficas mas usuales:
Otros grficos:
Polgono de Frecuencias
Es la representacin mediante un grfico de lnea. En l se
muestra la distribucin de frecuencias y est formado por segmentos de lnea que unen los puntos correspondientes a la frecuencia de cada una de las clases.
Ejemplo
Intervalo de clase 38 42 Punto medio xi 40 f 2
43 47
48 52 53 57 58 62 63 - 68
45
50 55 60 65 Total
4
8 5 3 3 25
9 8 7 6 5 f4 3 2 1 0 35
Polgono de Frecuencias
40
45
50
55
60
65
70
xi
Ejemplo
El eje y puede ser sustituido por las
h 0.2
0.15 0.1 0.05 0 35 40 45 50 55 60 65 70
xi
Ejemplo
Polgono de Frecuencia Porcentual
35 30 25
%h
20
15 10 5 0
35
40
45
50
55
60
65
xi
Histograma
Es la representacin grfica de los datos mediante una
sucesin de rectngulos.
0,95
2,95
4,95
Ejemplo
Intervalo de clase 38 42
43 47
Punto medio xi 40
45
f 2
4
Histograma
10 8 6 f 4 2 0 35 40 45 50 55 60 65 xi
48 52
53 57
50
55
8
5
58 62
63 - 68
60
65 Total
3
3 25
Ejemplo
Tambin podemos usar la frecuencia relativa
y la frecuencia porcentual.
Histograma con frecuencias relativas
0.35 0.3 0.25 h 0.2 0.15 0.1 0.05 0
35 40 45 50 55 60 65
xi
Ejemplo
Histograma con frecuencias porcentuales
35 30 25 %h 20 15 10 5 0 35 40 45 50 xi 55 60 65
Pirmide Poblacional
Una variante en el histograma es colocar en el eje x de
tal manera que las columnas quedarn en forma horizontal, es muy comn en datos poblacionales.
Ojiva
Es la representacin grfica de las frecuencias acumuladas
frecuencias acumuladas.
Ejemplo
Interva lo de clase Punto medio xi
38 42 43 47 48 52 53 57 58 62 63 - 68
40 45 50 55 60 65
2 4 8 5 3 3
2 6 14 19 22 25
Ojiva
30 25 20 F 15 10 5 0
25 22 19 14
6 0 2
35
40
45
50
55
60
65
xi
Total
25
Ejemplo
Usando la frecuencia acumulada y la
frecuencia porcentual.
Intervalo de clase 38 42 43 47 Punto medio xi 40 45 f 2 4 h 0.08 0.16 h% 8 16 H 2 6 H 0.08 0.24 H% 8 24
48 52 53 57 58 62 63- 68
50 55 60 65 Total
8 5 3 3 25
32 20 12 12 100
14 19 22 25
Ejemplo
Ojiva con frecuencia relativa acumulada
1 0.9 0.8 0.7 0.6 H 0.5 0.4 0.3 0.2 0.1 0
0.88
0.76
0.56
0.24
0.08
35
40
45
50
55
60
xi
Ejemplo
Ojiva con frecuencia porcentual acumulada
100 90 80 70 60 H% 50 40 30 20 10 0
88 76
56
24
8 0
35
40
45
50
55
60
xi
Grfico Circular
Tambin es llamado grfico de pastel. Slo se representan datos de frecuencias
Grfico Circular
Agregaremos una columna a nuestra tabla de frecuencias
Frecuencia relativa al crculo, multiplicando (fr)(360), para mostrar la parte proporcional de crculo medida en grados que corresponde a cada intervalo.
Ejemplo
Intervalo de clase 38 42 43 47 48 52 53 57 58 62 63- 68 Punto medio xi 40 45 50 55 60 65 Total f
2 4 8 5 3 3 25
h
0.08 0.16 0.32 0.20 0.12 0.12 1
(h ) (360)
28.8 57.6
115.2 72
Ejemplo
65 Grfico Circular 40 12% 8% 60 12% 55 20% 50 32% 45 16%
Ejemplo
Color Frecuenci a Conteo Color de Playera
Azul Negro Blanco Rosa Caf Verde Gris
4 7 3 4 2
Rosa Verde
4 1
Otros Grficos
La grfica de barras se traza similar al Histograma, slo que las barras
nmeros NO consecutivos.
60
Frecuencia absoluta
Grfica de barras
Alumno s
8 11 8 3 3 6 11
11 8 8 3 3 6
11
Pictograma
Similar al de barras, slo que se sustituyen por figuras,
Repaso
Tabla de Frecuencias Datos Agrupados Datos no Agrupados
Graficas
Polgono de Frecuencias
Histograma
Grafico de Barras
Grafico Circular
PREGUNTAS?