Vous êtes sur la page 1sur 62

PROBABILIDAD Y ESTADÍSTICA

UNIDAD #1
DOCENTE: ING. INGRID GIRALDO MARTÍNEZ M.SC
Unidad #1 Estadística Descriptiva
• Introducción a la Estadística.
• Tipos de datos y escalas de medición.
• Diferencias entre población, muestra, parámetro y estimador.
• Datos agrupados y tablas de frecuencia.
• Gráficos estadísticos (Histograma, ojiva, pastel, diagrama de cajas)
• Medidas de tendencia central y dispersión.
• Tipos de muestreo y elaboración de cuestionarios.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


1.1 Introducción

El término Estadística tiene dos acepciones


fundamentales. Por un lado la Estadística como
ciencia o método científico y por otro lado la
estadística o estadísticas como conjunto o
colecciones de datos. Este segundo concepto es muy
usado hoy en día para referirnos a resultados ya
elaborados en un estudio en el que se empleó la
Estadística como método. Dado que la Estadística es
una disciplina muy amplia, existen diferentes
definiciones de la misma según el enfoque en el que
se plantee. Para este curso utilizaremos la siguiente
definición:

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Definición

La Estadística es la parte del método científico que mediante el análisis


matemático nos permite obtener información sobre la realidad que nos
rodea.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Etapas de un estudio estadístico
El proceso de investigación supone un conjunto de etapas que podemos representar mediante el
siguiente esquema:

1. Planteamiento del problema: consiste en definir el objeto de la investigación y precisar el


universo o población al que se refiere el estudio.

2. Planificación del trabajo de campo: en esta etapa se toman decisiones con respecto a los
procedimientos de entrevista, características del muestreo, diseño de herramientas, etc.

3. Recopilación de información: incluye la recogida de los datos y también la depuración de la


información obtenida, es decir, tratar los problemas de la no-respuesta, los errores de campo,
los errores de oficina, los datos desaparecidos y los datos anómalos.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Etapas de un estudio estadístico
4. Análisis de los datos: esta etapa presenta varias fases:

a) Análisis descriptivo: organización (mediante tablas y gráficos) y resumen (en pocos valores
que proporcionen la máxima información posible) los datos disponibles para extraer la
información relevante en nuestro estudio.
b) Inferencia estadística: en el caso de trabajar con muestras, la inferencia se encarga de
generalizar los resultados de la muestra a la población y obtener conclusiones generales. La
inferencia se basa en suponer que la población sigue un modelo o unas distribución conocida
y los datos que tenemos son realizaciones aleatorias de ese modelo. Para cuantificar la
fiabilidad de estos resultados se recurre al cálculo de probabilidades.
c) Validación del modelo: finalmente es necesario diagnosticar la validez de los supuestos del
modelo que nos han permitido interpretar los datos y llegar a conclusiones sobre la
población.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Etapas de un estudio estadístico

5. Interpretación: obtener las conclusiones de los resultados obtenidos.


En el proceso descrito hemos definido las tres ramas fundamentales de la Estadística como
ciencia y que son objeto de estudio en las asignaturas habituales de Estadística:

1. Estadística Descriptiva.

2. Cálculo de probabilidades.

3. Inferencia.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


1.2 Conceptos Básicos

Generalmente el objetivo de un estudio estadístico es conocer información sobre alguna


característica de cierto conjunto de elementos.
Este conjunto de elementos normalmente tiene un tamaño excesivamente grande para
abarcarlo en su totalidad, por lo que nos centraremos en la obtención de información y
estudio sobre algunos de ellos, un subconjunto, que podremos hacer extensible al total.
Para matizar este problema, se suelen emplear los siguientes términos:

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Población
Conjunto de sujetos o elementos que presentan características comunes. Sobre esta población
se realiza el estudio estadístico con el fin de sacar conclusiones.

El tamaño poblacional es el número de individuos que constituyen la población. Según el


número de sujetos, el tamaño puede ser finito o infinito. Los conjuntos infinitos son algo artificial
o conceptual, ya que toda población de entidades físicas es finita. Por ejemplo:
•Población finita: el conjunto de habitantes de una ciudad, los bolígrafos producidos en una
fábrica en un día, etc.
•Población infinita: el conjunto de los números positivos.
Cuando la población es muy grande, normalmente es imposible estudiar a todos los individuos.
Supongamos que queremos saber cual es el nivel de colesterol de la población de Estados
Unidos. Por cuestiones económicas y de tiempo obvias, no está al alcance realizar un análisis de
sangre a toda la población de EEUU. Para solucionar este impedimento, se utiliza una muestra
estadística.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Muestra
Una muestra estadística es un subconjunto de datos perteneciente a una población de datos.

Características de una muestra estadística representativa

Tamaño suficientemente grande: Cuando trabajamos con muestras estamos, normalmente,


trabajando con una cantidad de datos inferior a la población. Para que una muestra estadística
sea representativa deberá ser lo suficientemente grande como para considerarse
representativa.
Por ejemplo, si nuestra población está formada por 10 millones de datos y escogemos 10, es
difícil que sea representativa. Eso sí, no siempre a mayor tamaño la muestra es más
representativa.

Aleatoriedad: La selección de los datos de una muestra estadística debe ser aleatoria. Es decir,
debe ser totalmente al azar. Si en lugar de realizarlo al azar, realizamos un proceso de selección
de datos planificado, estamos introduciendo un sesgo a la obtención de datos. Por tanto, para
evitar que la muestra sea sesgada y, por tanto, conseguir que sea una muestra representativa,
debemos hacer una selección aleatoria.
PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC
Ejemplo de muestra estadística

Supongamos que queremos realizar un


estudio sobre el gasto medio de las familias
de Ecuador en el mes de enero. Para ello
tenemos dos opciones:

1.Entrar en las cuentas bancarias de todas


las familias de Ecuador.

2.Preguntar a una cantidad de personas


representativa.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Parámetro: Es cualquier medida descriptiva o representativa de una población. Generalmente
se utilizan las letras griegas como símbolo. Ejemplos: media aritmética poblacional (μ)(mu),
desviación estándar poblacional (σ) (sigma).

Estadístico: Constituyen cualquiera de las medidas descriptivas de una muestra. Se las


simboliza con letras minúsculas de nuestro alfabeto. Ejemplos: media aritmética(x), desviación
estándar(s)

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


1.3 División de la Estadística

Estadística descriptiva
Es la parte de la estadística que permite analizar todo un conjunto de datos, de los cuales se
extraen conclusiones valederas, únicamente para ese conjunto. Para realizar este análisis se
procede a la recolección y representación de la información obtenida.

Como ejemplo de estas estadísticas podemos citar a aquellas que se obtienen generalmente en
los deportes, en los rendimientos académicos de los estudiantes de una determinada materia,
en los negocios al determinar las ventas obtenidas mensualmente en un determinado año por
una empresa en particular.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Estadística inferencial

En esta rama de la estadística, lo que se pretende es obtener conclusiones generales de una determinada
población, mediante el estudio de una muestra representativa sacada de ella, dicho de otra manera, lo que
se trata es que, con el valor de los estadísticos obtenidos, podamos establecer los valores de los parámetros.
Entonces podemos concluir que la estadística inferencial analiza o investiga a una población, valiéndose de
los datos y resultados que se obtienen de una muestra.

Ejemplos muy claros de este tipo de estadística constituyen la aplicación de nuevos tratamientos con nuevos
fármacos, o las proyecciones que pueden hacer los investigadores de mercado sobre cómo influye la
publicidad en ciertos segmentos de mercado. Esta condición vista anteriormente, ha permitido que la
estadística inferencial, tenga un crecimiento cada vez mayor, por cuanto sus aplicaciones son cada vez más
eficientes en el manejo de poblaciones; por tal motivo es que existen métodos muy variados para poder
realizar la generalización de los resultados obtenidos en el muestreo. (Pruebas de hipótesis, predicciones
futuras y más)

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


1.4 Variables
de datos

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Tipos de Variables
Variable cualitativa

Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas
con números. Podemos distinguir dos tipos:
• Variable cualitativa nominal: Una variable cualitativa nominal presenta modalidades no
numéricas que no admiten un criterio de orden. Por ejemplo:
• El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y
viudo.

• Variable cualitativa ordinal o variable cuasi cuantitativa: Una variable cualitativa ordinal
presenta modalidades no numéricas, en las que existe un orden. Por ejemplo:
• La nota en un examen: suspenso, aprobado, notable, sobresaliente.
• Puesto conseguido en una prueba deportiva: 1º, 2º, 3º,...
• Medallas de una prueba deportiva: oro, plata, bronce.
PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC
Variable cuantitativa: Una variable cuantitativa es la que se expresa mediante un número, por
tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:

Variable discreta: Una variable discreta es aquella que toma valores aislados, es decir no admite
valores intermedios entre dos valores específicos. Por ejemplo:
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continúa: Una variable continua es aquella que puede tomar valores comprendidos
entre dos números. Por ejemplo:
La altura de los 5 amigos:1.73, 1.82, 1.77, 1.69, 1.75.

En la práctica medimos la altura con dos decimales, pero también se podría dar con tres.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Ejemplos de Variables

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Taller #1 Variables

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


1.5 Escalas De Medición

Es un instrumento de medida, de acuerdo al cual se asignan valores a los datos estadísticos. Se reconocen
cuatro niveles de medición:
• Nominal.
• Ordinal.
• de intervalo.
• de razón.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC
Nominal

En la escala nominal, los valores obtenidos en las observaciones, pueden ser codificados
mediante números, donde estos números no tienen valor intrínseco, sino solo la de etiquetar;
por lo tanto, no pueden ser ordenados o medidos.

Generalmente los datos que provienen de variables cualitativas son representados en esta
escala de medición. Ejemplo: si se está determinando el estado civil de las personas, este
estado puede ser etiquetado como: casado(1),soltero(2), divorciado (3), unión libre (4).

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Ordinal
Los datos provenientes de un nivel ordinal, también generan categorías mutuamente
excluyentes (significa que una observación en particular no pude pertenecer a dos o más
categorías al mismo tiempo).

Las encuestas que utilizan una escala tipo Likert (ver Tabla), utilizan datos medidos en escala
ordinal. Ejemplo: se puede pedir que el encuestado diga cómo percibe el presente libro de
estudio, para lo cual puede contestar con cualquiera de las siguientes opciones.

En este caso, no se pueden establecer diferencias entre los valores numéricos, toda vez que
estos representan una etiqueta o código, pero si responden aun orden pre establecido.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


De Intervalo

Los datos medidos en escala de intervalo constituyen las escalas de temperatura, excepto la
medida en grados Kelvin. Con los datos que están medidos en esta escala se puede establecer
las operaciones de suma y substracción, pero no de multiplicación y división.

Ejemplo: Al decir que en una ciudad la temperatura ambiente es de 20ºC y en otra es de 40º C,
se puede establecer que la segunda ciudad tiene una temperatura más alta de 20ºC, pero no se
puede concluir que la temperatura de ésta es el doble de la otra.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


De Razón
Los datos que se obtuvieron mediante un nivel de razón, a más de poseer todas las
características anteriores, también puede trabajar con los datos en operaciones de
multiplicación y división.

Ejemplo: Dos Personas perciben como salario, la A: $300 y la B: $600.

Con esta información se puede concluir que B gana $300 más que A y que además gana el
doble que A. Esto es posible por cuanto esta variable dispone de un cero absoluto.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Clasificación de las escalas

Clasificación de las escalas Las Escalas al igual que las variables se clasifican en cualitativas y
cuantitativas, al mismo tiempo se subdividen en:
• Cualitativas:
• Escala nominal o clasificatoria
• Escala ordinal
• Cuantitativas:
• Escala discreta o discontinua
• Escala concreta o continua
• Otras escalas:
• Escala cronológica
• Escala intervalar
• Escala de razón

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Escala nominal o clasificatoria
Escala nominal o clasificatoria Este tipo de variables, no presentan un ordenamiento previo, más al
contrario es arbitraria, de ahí que se haya ideado tres parámetros para entender mejor este tipo de escala;
variable, escala y diferencia, por Ejemplo:

Variable: Profesión
Escala: Ingeniero, Médico, Abogado, Enfermero, Odontólogo
Diferencia: No existe diferencia entre los profesionales en cuanto a nivel de estudio (tercer nivel)

Variable: Provincias de la Costa del Ecuador


Escala: Esmeraldas, Manabí, Santo Domingo de los Tsáchilas, Guayas, Santa Elena, El Oro Diferencia:
Ninguna

Variable: Sexo
Escala: Masculino, Femenino
Diferencia: Ninguna

Variable: Estado civil


Escala: Soltero, Casado, Divorciado, Viudo, Unión libre
Diferencia: Ninguna

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Escala ordinal
Son variables susceptibles de ser medidas siguiendo un ordenamiento (orden), formada por una clase
mutuamente excluyente, que se agrupan de acuerdo a un orden pre asignado. Por ejemplo:

Variable: Grado de instrucción


Escala: Primaria, Secundaria, Superior, Posgrado
Diferencia: Existe diferencia entre diferentes niveles de la escala entre los estudiantes no solo años de
experiencia, sino de conocimiento

Variable: Grado de militar y/o policial


Escala: Soldado, Sargento, Suboficial, Oficial, General
Diferencia: Existe diferencia entre los grados jerárquicos no solo en Años de experiencia, sino en tiempo de
estudio

Variable: Jerearquía familiar


Escala: Hijo menor, Hijo intermedio, Hijo mayor, Madre o Padre, Padre o Madre
Diferencia: Existe diferencia entre los grados jerárquicos de la familia no solo en años de experiencia, sino en
edad

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Escala discreta o discontinua
Se dice que si la variable medida es susceptible a ser contada, se puede construir una escala discreta,
formada por números ENTEROS con incrementos fijos, donde las fracciones no son consideradas; para
esto, se debe considerar la magnitud de los números expuestos. Por ejemplo:

Variable: Número de hijos


Escala: 1 hijo, 2 hijos, 3 hijos, 4 hijos
Amplitud: Entre 4 y 1 hijos, existe una amplitud de 3 hijos

Variable: Número de visitas


Escala: De 1 a 3visitas, De 4 a 6 visitas, De 7 a 9 visitas, De 10 a 12 visitas
Amplitud: Entre 1 y 3, existe una amplitud de 2

Variable: Número de caries dental


Escala: De 1 a 3 caries, De 4 a 6 caries, De 7 a 9 caries
Amplitud: Entre 1 y 3caries, existe una amplitud de 2 caries

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Escala concreta o continua
Cuando se cuenta con variables de tipo cuantitativo continuo o concreto, se pude utilizar este tipo de
escala, cuyo requisito es el de poder presentar números relativos o racionales (fraccionados, porcentuales
y/o decimales) siendo esta medición aproximada. Por ejemplo:

Variable: Estatura Variable: Peso


Escala: 1,65m Escala: 6,5Kg
1,66 m 7,5Kg
1,67 m 8,5Kg
1,68 m 9,5Kg
1,69 m Amplitud: Entre 6,5 y 9,5 kg, existe una amplitud
Amplitud: Entre 1,65 y 1,69 m, existe una amplitud de 4,0 kg
de 0,5 m

Variable: Tiempo
Escala: 1,10h
2,10 h
3,10 h
4,10 h
Amplitud: Entre 1,10 y 4,10 h, existe una amplitud
de 4 h.
PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC
Escala dicotómica

Es aquella escala que presenta tan solo dos opciones para medir la variable, siendo esta
variable de tipo cualitativo o cuantitativo, dependiendo de la información o resultado que se
busque. Por ejemplo:

Variable Preferencia por un equipo de fútbol


Escala de medición: Liga y Barcelona
Respuesta: Liga o Barcelona

Variable. Sexo de un estudiante de la Universidad Central


Escala de medición: Masculino y femenino
Respuesta: Masculino o femenino

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Escala cronológica

Es un tipo de escala cuantitativa continua, se la utiliza para estudiar algunos fenómenos en


función al tiempo, algunos autores la tratan como si fuera una escala de variable independiente,
permite conocer un determinado fenómeno a través del tiempo, es decir permite un seguimiento
temporalizado (en el pasado, en el presente o en el futuro). Por ejemplo:

Variable. Cambios físicos de una persona


Escala de medición: al 1 año, 5 años, 25 años, 50 años, 75 años, 100 años
Respuesta: descripción de las alteraciones físicas durante su vida

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Escala intervalar

Las categorías se ordenan en unidades igualmente espaciadas, siendo posible medir las
diferencias relativas en cada punto de la escala, no existe el cero absoluto. Por ejemplo:

Variable: Medición de la temperatura corporal


Escala: Grados centígrados o Celsius (37º)
Diferencia: Números mayores o menores de 37º en la escala de temperatura

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Escala de razón
En esta escala, si existe el cero absoluto y la magnitud de diferencia entre los valores numéricos
entre sí. Por ejemplo:

Variable: Relación entre edades


Escala: Juan: 0 años (recién nacido) José: 9 años Joaquín: 18 años
Diferencia: Joaquín 18 años (9 años más que José y 18 años más que Juan)

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Taller # 2

Indique cuatro ejemplos en los cuales aparezca un


nivel de medición diferente.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


1.6 Distribución de frecuencias
Es una tabla estadística donde se presentan los datos resumidos, de tal manera que se puede
en una visión panorámica establecer un criterio sobre su comportamiento, entendiéndose por
comportamiento, la determinación aproximada de los valores centrales, la variabilidad que
presentan y si son o no relativamente simétricos con relación a un valor central. Ejemplo:

Estudio sobre tipo de


automotores que circularon Qué tipo de variable es
en quince minutos en la Tipo de Automotor?
intersección de las calles “10
de Agosto” y “Colón”

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


1.6 Tabla de Frecuencias
Para tabular los datos cuantitativos se requiere conocer los siguientes términos: Clase, marca
de clase, frecuencia absoluta, frecuencia relativa, frecuencia acumulada, frecuencia relativa
acumulada.

• Clase: Intervalos de igual longitud, que son exhaustivos y mutuamente excluyentes.


• Marca de clase: El punto medio de cada una de las clases.
• Frecuencia absoluta: Número de observaciones que se pueden clasificar en la clase.
• Frecuencia relativa: Se la obtiene dividiendo la frecuencia de la clase i para el total de
observaciones.
• Frecuencia acumulada: Resulta de sumar la frecuencia acumulada de la clase i-1 con la
frecuencia de la clase i.
• Frecuencia relativa acumulada: Se la obtiene dividiendo la frecuencia acumulada de la clase
i para el total de observaciones.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Tabla de Frecuencias

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC
Histograma de frecuencia relativa
El Histograma es un
gráfico bidimensional en
cuyo eje de las x se
encuentran las clases y
en el eje de las y las
frecuencias relativas.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Algunas preguntas
• ¿Dónde se concentran mayormente los tiempos de vida de las componentes?
• ¿Qué porcentaje de componentes tiene un tiempo de vida entre 6 y 12 meses?
• ¿Qué porcentaje de componentes tiene un tiempo de vida entre 24 y 30 meses?
• ¿Qué porcentaje de componentes tiene un tiempo de vida inferior a 12 meses?
• ¿Qué porcentaje de componentes tiene un tiempo de vida inferior a 30 meses?
• ¿Qué porcentaje de componentes tiene un tiempo de vida superior a 24 meses?

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Polígono de frecuencia relativa
El polígono es un gráfico
bidimensional en cuyo eje
de las x se encuentran las
marcas de clase y en el eje
de las y las frecuencias
relativas.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Ojiva
Es un gráfico que presenta
en el eje horizontal la
característica cuantitativa
que se está investigando y
en el eje vertical la
frecuencia relativa
acumulada.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Algunas preguntas
• ¿Qué porcentaje de componentes tiene un tiempo de vida menor a 14 meses?
• ¿Qué porcentaje de componentes tiene un tiempo de vida superior a 21 meses?
• ¿Qué porcentaje de componentes tiene un tiempo de vida entre 21 meses y 32 meses?
• ¿Cuál es el tiempo de vida de las componentes de tal forma que la mitad dure menos de ese
valor?
• ¿Cuál es el tiempo de vida de las componentes de tal forma que el 25% dure menos de ese
valor?

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC
Diferencias entre gráficos
• La diferencia está en si las variables a graficar son
continuas, discretas o cualitativas
• Diagrama de barras para variables discretas o
características cualitativas.
• Se deja una separación entre barras para
indicar los valores que no son posibles.

• Histograma para variables continuas.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Estimadores
• Posición
• Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.
• Cuantiles, percentiles, cuartiles, deciles…
• Centralización
• Indican valores con respecto a los que los datos parecen agruparse.
• Media, mediana y moda.
• Dispersión
• Indican la mayor o menor concentración de los datos con respecto a las medidas de
centralización.
• Desviación típica, coeficiente de variación, rango, varianza.
• Forma
• Asimetría
• Apuntamiento o curtosis.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC
Diagramas de Cajas
• Resumen con 5 números:
• Mínimo, cuartiles y máximo.
• Suelen dar una buena idea de la distribución.

• La zona central, “caja” contiene al 50% central de las observaciones.


• El largo de la caja se llama “rango intercuartílico” (R.I.).

• Es costumbre que “los bigotes” no lleguen hasta los extremos, sino hasta las observaciones
que se separan de la caja en no mas de 1,5 R.I.
• Mas allá de esa distancia se consideran atípica o anómalas y así se marcan.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC
Diagramas de Cajas
• Edad de un colectivo de 20 personas.

36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40

• Representar estos datos en un diagrama de Cajas y Bigotes.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Dibujar el diagrama de Caja y los Bigotes

• El bigote de la izquierda representa al colectivo de edades (Xmin , Q1 )


• La primera parte de la caja a (Q1, Q2 ),
• La segunda parte de la caja a (Q2 , Q3 ),
• El bigote de la derecha viene dado por (Q3 , Xmáx ).

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Información del diagrama
• Podemos obtener abundante información de una distribución a partir de estas
representaciones. Veamos alguna:
• La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades
comprendidas entre el 25% y el 50% de la población está dispersa que entre el 50% y el 75%.
• El bigote de la izquierda (Xmin, Q1 ) es mas corto que el de la derecha; por ello el 25% de los
mas jóvenes están centrados que el 25% de los mayores.
• El rango intercuartílico = Q3 – Q1 = 14,5; es decir, el 50% de la población está comprendida
en 14,5 años.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


1.7 Medidas de tendencia central
• Media (“mean”): Es la media aritmética (promedio) de los datos contenidos en la muestra.
Se la obtiene sumando todas las observaciones y dividiendo para el tamaño de la muestra.

• Mediana (“median”): Es un valor que divide a las observaciones ordenadas en forma


ascendente en dos grupos con el mismo número de individuos (percentil 50, segundo
cuartil).

• Moda (“mode”): Es el/los valor/es donde la distribución de frecuencia alcanza un máximo.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC
Ejemplo 1
• Para el siguiente conjunto de observaciones determine los cuartiles, P73 , D3 , D7 , la media,
la mediana y la moda.

8 3 5 6 4 7 8 1 4 4

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


1.8 Medidas de dispersión
• Amplitud o Rango (“range”): Diferencia entre el valor máximo Xn y el mínimo X1.
Rango= Xn - X1
• 2, 1, 4, 3, 8, 4 El rango es 8 – 1 = 7
• Es muy sensible a los valores extremos.

• Rango intercuartílico (“intercuartile range”)


• Es la distancia entre el primer y tercer cuartil.
• RI. = Rango intercuartílico = Q3 – Q1
• Parecida al rango, pero eliminando las observaciones mas extremas inferiores y superiores.
• No es tan sensible a valores extremos.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


• Varianza S2 (“Variance”): Mide el promedio de las desviaciones (al cuadrado) de las
observaciones con respecto a la media.

• Sus unidades son el cuadrado de las de la variable. De interpretación un poco compleja para
un principiante.

• Desviación típica (“standard deviation”) Es la raíz cuadrada de la varianza.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


• Coeficiente de variación
Es la razón entre la desviación típica y la media.
• Mide la desviación típica en forma de “qué tamaño tiene con respecto a la media”

• También se denomina variabilidad relativa.

• Es frecuente mostrarla en porcentajes


• Si la media es 80 y la desviación típica es 20 entonces CV = 20/80 = 0,25 = 25%
(variabilidad relativa)

• Es una cantidad adimensional, Interesante para comparar la variabilidad de diferentes


variables.
• Si el peso tiene CV = 30% y la altura tiene CV = 10%, los individuos presentan mas dispersión
en peso que en altura.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Ejemplo 2
Para el conjunto de observaciones del Ejemplo 1, determine el rango, la varianza, la desviación
estándar y el coeficiente de variación.

8 3 5 6 4 7 8 1 4 4

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


1.9 Muestreo
• El muestreo es una herramienta de la investigación científica, cuya función
básica es determinar que parte de una población debe examinarse, con la
finalidad de hacer inferencias sobre dicha población.

• La muestra debe lograr una representación adecuada de la población, en la que


se reproduzca de la mejor manera los rasgos esenciales de dicha población que
son importantes para la investigación.

• Para que una muestra sea representativa, y por lo tanto útil, debe de reflejar las
similitudes y diferencias encontradas en la población, es decir ejemplificar las
características de ésta.

• En la estadística se usa la palabra población para referirse no sólo a personas si


no a todos los elementos que han sido escogidos para su estudio y el término
muestra se usa para describir una porción escogida de la población.

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC


Tipos de muestreo

PROBABILIDAD Y ESTADÍSTICA ING. INGRID GIRALDO MARTÍNEZ M.SC

Vous aimerez peut-être aussi