Vous êtes sur la page 1sur 118

INDICE

INTRODUCCION………………………………………………………………… 1
CARTA DE PRESENTACION………………………………………………… 3
COMPETENCIAS……………………………………………………………… 4
CONTENIDOS ABORDADOS………………………………………………….. 6
EVIDENCIAS DE LOS TRABAJOS REALIZADOS………………………. 91
CONCLUSION……………………………………………………………………… 112
EXPERIENCIA PERSONAL…………………………………………………. 112
REFERENCIAS BIBLIOGRAFICAS………………………………………….. 114
INTRODUCCION

La estadística es la ciencia que se encarga de recolectar,


analizar y presentar datos de una forma en la que se
pueda observar los datos de una población de una forma
clara, precisa y coherente. El presente portafolio esta
realizado en base a esta ciencia, ya que esta es una
ciencia de mucho valor y peso a la hora de realizar
encuestas, estudiar una población, y establecer
resultados porcentuales.
La estadística es una ciencia en la cual de una u otra
forma todos en algún momento formamos parte de ella.
Por ejemplo, el gobierno la utiliza para medir la calidad
de vida de la población, con el fin de saber cuáles
personas cuentan con una buena economía, seguros y
una buena calidad de vida.
Pero para poder tener un buen uso de lo que es la
estadística en su totalidad, debemos conocer temas
como la media, moda y la media. Que son fundamentales
a la hora de estudiar a una población, pero antes esto es
necesario reconocer al tipo de población que se quiere
para obtener los datos que estamos buscando, es aquí
donde se utiliza el muestreo. El muestreo no es más que
seleccionar a una parte de la población que se quiere
para obtener una información.
Atreves de las medidas de tendencia central podemos
deducir el promedio de los datos obtenidos, los datos
que más se repitieron y la mediana del conjunto de los
datos.
El presente trabajo está elaborado en su totalidad de una
manera clara y precisa de tal forma que se pueda asimilar
y comprender el objetivo del mismo, que presentar la
estadística y sus componentes de una forma desarrollada
y simple. Cabe mencionar que buen manejo y uso de
estos contenidos nos abrirá un poco más al mundo
moderno ya que esta ciencia es muy utilizada en el
mundo empresarial, político, publico, etc. Por ello
presento el siguiente portafolio de tal manera que todo
el que lo estudie, comprenda cada contenido, los cuales
están conformados, por otros conceptos estadísticos que
no mencione pero que son importantes, los cuales se
verán presente en el desarrollo de este.
UNIVERSIDAD ABIERTA PARA ADULTOS
UAPA

ESTUDIANTE: KEYRI EMMANUEL SANTOS


ESTUDIA: PSICOLOGIA EDUCATIVA
MATRICULA: 2018-04704
LUGAR DONDE RESIDE: LA CAPITALISTA NAGUA
LUGAR DE NACIMIENTO: NAGUA, EL YAYAL
FECHA DE NACIMIENTO: O3 DE JUNIO DE 1999
NACINALIDAD: DOMINICANO
ESTADO CIVIL: SOLTERO
OCUPACION: EMPLEADO PRIVADO
ASIGNTAURA: ESTADISTICA GENERAL
TEMA: TRABAJO FINAL
FACILITADOR: FRANCISCO BOBONAGUA
 COMPETENCIAS

Mis competencias mediante el desarrollo del programa


de esta asignatura son varias, ya que la estadística es una
materia que pone retos como estudiante universitario y
futuro psicólogo, por lo que me concierne un buen
manejo de esta materia y de todos sus componentes.
Una de mi mayor competencia es poder dominar temas
como la probabilidad, ya que este es un tema muy
popular, el cual lo escuchamos a diario en la TV, radio,
redes sociales, etc. Por ello mi propósito fue poder
dominar este tema en su totalidad y saber utilizar
formulas probabilísticas como la de LAPLACE, la cual es
de suma importancia si queremos obtener buenos
resultados. La probabilidad es unos de los temas
estadísticos más utilizados en la vida cotidiana, como en
juego de dados, cartas, loterías, apuestas de gallos, entre
otros. Por lo que es un tema muy competente para un
futuro profesional.
Otra competencia que es de suma importancia es la
elaboración de cuadros estadísticos, que son de gran
peso a la hora de hacer encuestas, censos o determinar
el grado de importancia de un producto, persona,
partido, etc. A partir de los cuadros estadísticos podemos
deducir el porcentaje el cual determina de una manera
más clara, mejores resultados.
En general, es de mucha importancia dominar cada tema
para así poder obtener buenos resultados académicos,
los cuales podre aplicarlo en mi vida profesional, como
en mi vida personal. El buen manejo de los contenidos
servirá de herramientas no solo para esta materia si no
para todos las restantes y para mi experiencia laboral
UNIDAD I
INTRODUCCIÓN A ESTADÍSTICA
DESCRIPTIVA E INFERENCIAL

COMPETENCIAS
 Dominar el concepto de lo que es la estadística en su
totalidad.
 Conocer las distintas aplicaciones que tiene la
estadística en sus diferentes áreas y cuál es su
importancia en las mismas.
 Clasificar los tipos de estadística de estadísticas que
hay.
 Conocer que es una población.
 Saber cómo encontrar una muestra.
 Aplicar de manera correcta y saber el uso correcto
de los diferentes tipos de representación gráfica

1.1 Estadística. Definición e Importancia.


La estadística es una de las ramas de la ciencia
matemática que se centra en el trabajo con datos e
informaciones que son ya de por sí numéricos o que
ella misma se encarga de transformar en números. La
estadística, si bien es una ciencia de extracción
exacta, tiene una injerencia directa en cuestiones
sociales por lo cual su utilidad práctica es mucho más
comprensible que lo que sucede normalmente con
otras ciencias exactas como la matemática.

A diferencia de otras ramas de la matemática que


poseen una parte importante de abstracción, la
estadística tiene aplicaciones directas y concretas en
la vida real ya que toma los números y cifras de
diferentes fenómenos sociales como por ejemplo la
desocupación, la tasa de mortalidad, la de natalidad y
muchos otros datos incluso más complejos.
Podemos decir que la función principal de la
estadística es justamente la recolección y
agrupamiento de datos de diverso tipo para construir
con ellos informes estadísticos que nos den idea
sobre diferentes y muy variados temas, siempre
desde un punto de vista cuantitativo y no cualitativo.
Esto es muy importante de remarcar ya que la
estadística se convierte entonces en una ciencia que
nos habla de cantidades (por ejemplo, cuántas
personas viven en un país por metro cuadrado) pero
no nos da información directa sobre la calidad de vida
de esas personas. En este sentido podemos decir que
se presentan varias limitaciones ya que no permite
conocer más que numéricamente aspectos que
requieren un trabajo más complejo y profundo.

1.2 Clasificación de la Estadística. Descriptiva e


inferencia.

La estadística descriptiva tiene como objetivo resumir


la información contenida en los datos de la forma más
sencilla y presentable posible, obteniendo así los
parámetros que distinguen las características de un
conjunto de datos (lo que se conoce como
estadísticos). Pertenecen al ámbito de la estadística
descriptiva las tablas de frecuencias, a partir de las
cuales se obtienen los estadísticos:
 Medidas de centralización: la media en todas sus
variantes (aritmética, geométrica, ponderada), la
moda y la mediana
 Medidas de dispersión: la varianza, la desviación
típica (raíz cuadrada de la varianza) y el rango
 Medidas de tendencia central: los cuantiles y sus
desgloses (percentiles, cuartiles, deciles, etc.)
 Medidas de forma: los coeficientes de asimetría y
curtosis
 Medidas de concentración: el coeficiente Gini, a partir
del cual se obtiene la curva de Lorenz
En cambio, la inferencial asume que los datos se rigen
bajo un fenómeno aleatorio subyacente que es el que
hace que tomen un valor u otro. Es por esto por lo que
los datos pasarían a denominarse variables aleatorias.
Al existir incertidumbre, se puede igualmente
describir la población de la que sale esa muestra, pero
debemos entonces asumir un cierto error derivado de
la naturaleza probabilística de los datos.
1.3 Población y Muestra.
Cuando se realiza un estudio de investigación, se
pretende generalmente inferir o generalizar resultados
de una muestra a una población. Se estudia en particular
a un reducido número de individuos a los que tenemos
acceso con la idea de poder generalizar los hallazgos a la
población de la cual esa muestra procede.
Este proceso de inferencia se efectúa por medio de
métodos |estadísticos basados en la probabilidad.

•La población
Representa el conjunto grande de individuos que
deseamos estudiar y generalmente suele ser inaccesible.
Es, en definitiva, un colectivo homogéneo que reúne
unas características determinadas.
• La muestra
Es el conjunto menor de individuos (subconjunto de
la población accesible y limitado sobre el que
realizamos las mediciones o el experimento con la
idea de obtener conclusiones generalizables a la
población ).
El individuo es cada uno de los componentes de
la población y la muestra. La muestra debe ser
representativa de la población y con ello queremos
decir que cualquier individuo de la población en
estudio debe haber tenido la misma probabilidad de
ser elegido.
 Variable y Clasificación

Una variable es una propiedad característica de la


población en estudio, susceptible de tomar diferentes
valores, los cuales se pueden observar y medir.
Las variables pueden ser de dos tipos: cualitativas y
cuantitativas. Las variables cualitativas se clasifican a
su vez en nominales y ordinales, en tanto que las
variables cuantitativas se clasifican a su vez en
discretas y continuas.
Variables cualitativas: son aquellas que no se pueden
medir numéricamente ejemplo: nacionalidad, color
de la piel, sexo, etc.

A su vez, las variables cualitativas pueden ser:

Nominales: son datos que corresponden a


categorías que por su naturaleza no admiten un
orden. Por ejemplo: sexo (masculino y femenino);
carrera de estudio: economía, contabilidad,
administración, etc.

Ordinales: son aquellos que corresponden a


evaluaciones subjetivas que se pueden ordenar o
jerarquizar. Por ejemplo: en una competencia
artística las posiciones de los ganadores se ordenan o
jerarquizan en primer lugar, segundo lugar, tercer
lugar, cuarto lugar, etc.

Variables cuantitativas: son aquellas que tienen valor


numérico como la edad, el precio de un producto,
ingresos anuales de un consumidor, etc.
A su vez, las variables cuantitativas pueden ser:

Discretas: estas son aquellas que sólo pueden


tomar valores enteros como 1, 2, 8, -4, etc. En este
sentido, los hermano en una familia podrán ser: 1, 2,
3..., etc. Sin embargo, nunca podrán ser 1.5 o 2.3.

Continuas: son aquellas que pueden tomar


cualquier valor real dentro de un intervalo o rango.
Por ejemplo, los litros de leche ordeñados podrán ser
1.5 o 10.3 etc.

1.5 Presentación de datos estadísticos

La presentación de datos estadísticos constituye en


sus diferentes modalidades uno de los aspectos de
más uso en la estadística descriptiva. A partir
podemos visualizar a través de los
diferentes medios escritos y televisivos
de comunicación masiva la presentación de los datos
estadísticos sobre el comportamiento de las
principales variables económicas y sociales,
nacionales e internacionales.
1-Presentación escrita: Esta forma de presentación
de informaciones se usa cuando una serie de datos
incluye pocos valores, por lo cual resulta más
apropiada la palabra escrita como forma de escribir el
comportamiento de los datos; mediante la forma
escrita, se resalta la importancia de las informaciones
principales.
2-Presentación tabular: Cuando los datos
estadísticos se presentan a través de un conjunto de
filas y de columnas que responden a un
ordenamiento lógico; es de gran eso e importancia
para el uso e importancia para el usuario ya que
constituye la forma más exacta de presentar las
informaciones. Una tabla consta de varias partes, las
principales son las siguientes:
Título: Es la parte más importante del cuadro y sirve
para describir todo él contenido de este.
Encabezados: Son los diferentes subtítulos que se
colocan en la parte superior de cada columna.
Columna matriz: Es la columna principal del cuadro.
Cuerpo: El cuerpo contiene todas las informaciones
numéricas que aparecen en la tabla.
Fuente: La fuente de los datos contenidos en la tabla
indica la procedencia de estos.
Notas al pie: Son usadas para hacer algunas
aclaraciones sobre aspectos que aparecen en la tabla
o cuadro y que no han sido explicados en otras partes.

1.5.1 Representación gráfica.

1.5.2 Gráfico de barra


Gráfica de barras: Es un conjunto de rectángulos o
barras separadas una de la otra, en razón de que se
usa para representar variables discretas; las barras
deben ser de igual base o ancho y separadas a igual
distancia. Pueden disponerse en forma vertical y
horizontal.

1.5.3 Gráfico de línea.


Gráfica lineal: Son usadas principalmente para
representar datos clasificados por cantidad o tiempo;
o sea, se usan para representar series de tiempo o
cronológicas.
1.5.4 Gráficos circulares
Un gráfico circular o gráfica circular, también llamado
"gráfico de pastel", "gráfico de tarta", "gráfico de
torta" o "gráfica de 360 grados", es un

recurso estadístico que se utiliza para

representar porcentajes y proporciones. El número


de elementos comparados dentro de una gráfica
circular suele ser de más de cuatro.

1.5.5 Los Pictogramas.


Un pictograma es un signo claro y esquemático que
representa un objeto real, figura o concepto. Sintetiza
un mensaje que puede señalar o informar
sobrepasando la barrera de las lenguas.

Es un recurso comunicativo de carácter visual que


podemos encontrar en diversos contextos de nuestra
vida diaria y nos aporta información útil por todos
conocida:
UNIDAD II
Organización, Distribución y
Representación de Datos

COMPETENCIAS

 Conocer lo que es una tabla de frecuencia


cualitativa.
 Aprender a organizar datos estadísticos en tablas
de frecuencias.
 Saber presentar en una tabla de frecuencia datos
cualitativos.
3.1 Distribución de Frecuencias cualitativas

3.1.1 Concepto e importancia.


● Distribución de frecuencias: es la tabla que presenta
las categorías de una variable y sus respectivas
frecuencias.
- Nos indica cómo se distribuye la frecuencia total
entre las categorías
- Es el resumen más importante de la información
contenida en una variable cualitativa
3.1.2 Elaboración de distribución de frecuencia
cualitativa.
EJEMPLO.
Se quiere saber si un grupo de individuos esta en contra
o a favor de imágenes violentas por television, por lo
cual se han recolectados los siguientes datos.
x: 2,1,5,3,3,2,3,1,4,3,4,2,3,2,3,4,3,3,1,1
1. Encontra
2. Bastante en contra
3. Indiferente
4. Bastante a favor
5. A favor
x f
1 3
2 6
3 7
4 3
5 1
TOTAL 20

3.1.3 Presentación de datos cualitativos.


Los datos cualitativos nos arrojan ese tipo de
datos donde los encuestados se manifiestan de
forma más abierta, nos llevan a mundos
desconocidos, nos comparten sus emociones, lo
que en realidad los motiva.
Los datos cualitativos son utilizados
principalmente como el primer acercamiento al
problema, ya que nos aporta información acerca
de la existencia de una realidad en la que están
involucrados nuestros participantes.
Este paso es muy importante ya que nos
permite presentar los datos de manera
operativa para resolver las incógnitas de la
investigación. Con ellos seguimos dos pasos: La
disposición y la presentación. La disposición de
los datos cualitativos, se refiere a organizar los
datos para presentarlos de forma ordenada, de
tal forma que simplifique la información. La
presentación se refiere a no almacenar datos,
por el contrario, debemos presentarlos de
forma ordenada que permita extraer
conclusiones que nos lleven a tomar decisiones
correctas.
UNIDAD II
Organización, Distribución
y Representación de
Datos (continuación)
COMPETENCIAS

 Diferenciar los conceptos de distribución


cualitativa y distribución cuantitativa y sus
tipos.
 Saber que es el rango y como se halla en
una distribución de datos estadísticos.
 Conocer lo que es la amplitud total, el
numero de clase, ancho de clase, limite de
clase, punto medio de una clase e intervalo
de clase y como se pueden obtener.
 Determinar la frecuencia relativa y
porcentual de una clase.
 Realizar correctamente polígonos de
frecuencia.

3.2. Distribución de Frecuencias cuantitativa

3..2.1 Concepto e importancia


Son aquellas que se expresan mediante un
número, por tanto, se puede realizar
operaciones aritméticas con ellas. Puede
ser discretas o continuas.

Ejemplos de variables cuantitativas:


 El peso de las vacas de una granja.
 Estatura de los habitantes de una ciudad.
 El número de hijos en una familia.
 Número de clientes atendidos en una tienda.
 Velocidad a la que avanza un tren.
 Cantidad de pulgas que tiene un perro.
 Número de personas que visitan MateMovil.com en
un día.
 Cantidad de goles anotados en un partido de fútbol.
 La zona en la que pertenecen los
estudiantes de psicología.
Zona Frecuencia Porcentaje
Urbana 8 0.42
Rural 11 0.58
Total 19 100%

3.2.3. Rango

Se define el rango o recorrido de una variable


estadística como la diferencia entre el mayor y
el menor valor de la variable. El rango indica la
longitud del intervalo en el que se hallan todos
los datos de la distribución. El rango es una
medida de dispersión importante aunque
insuficiente para valorar convenientemente la
variabilidad de los datos. Supongamos que el
rango en que se mueven las notas de 6
exámenes es de 9 puntos. Existen muchas y
distintas posibilidades que pueden dar lugar a
ese rango, por ejemplo:
 Caso 1: 1, 3, 5, 7, 9, 10.
 Caso 2: 1, 10, 10, 10, 10, 10.
 Caso 3: 1, 1, 10, 1, 1, 1.

Como puedes observar las posibilidades


anteriores son completamente distintas aunque
todas ellas tienen el mismo rango o recorrido.
Este parámetro por tanto presenta bastantes
deficiencias en cuanto a detección de la
dispersión de los valores de la población y
consecuentemente conviene completarlo con el
estudio de otras medidas.
3.2.4 Amplitud total
La amplitud total (AT) es la diferencia entre la
puntuación de mayor valor y la de menor valor:

La amplitud total es un estadístico muy sencillo


y fácil de calcular, pero a menudo esta
simplicidad es un inconveniente. Consideremos
el siguiente ejemplo:

Los grupos A y B son bastante semejantes, pero


no los coeficientes de amplitud. La diferencia en
los coeficientes es ocasionada por la variación
introducida por una sola puntuación con valor
extremo, el 1000. Por esta razón es conveniente
disponer de otras medidas más adecuadas.
Principales características: Además de la ya
señalada, el coeficiente de amplitud total no
tiene en cuenta los valores entre extremos, que
son los que determinan su valor.

3.2.5 Número de clases


Los intervalos de clase se emplean si
las variables toman un número grande de
valores o la variable es continua.
Se agrupan los valores en intervalos que tengan
la misma amplitud denominados clases. A
cada clase se le asigna su frecuencia
correspondiente.

3.2.6 Ancho de clase


es la diferencia numérica entre el límite superior
e inferior de una clase de
datos.

3.2.7 Límites de clases.


Cada clase está delimitada por el límite inferior
de la clase y el límite superior de la clase.
3.2.8 Intervalos de clase
Rango utilizado para dividir el conjunto de
posibles valores numéricos al trabajar con
grandes cantidades de datos. Por ejemplo, si los
valores están entre 1 y 100, se podrían definir
grupos por medio de los intervalos 1-25, 26-50,
51-75, 76-100 cuando el intervalo de la clase es
25.
3.2.9 Punto medio de una clase.
El punto medio es el valor medio de un conjunto
de datos. Para un conjunto de datos con un
número impar de miembros, es el miembro del
conjunto de datos con apenas tantos valores
menos que su valor como mayor que él. Para un
conjunto de datos con un número par de
miembros, es el promedio de los dos valores
medios del conjunto de datos. El punto medio
se utiliza en estadísticas para analizar un
conjunto de datos.

3.3 Frecuencia relativa y porcentual de la clase.


La frecuencia porcentual es la frecuencia
relativa ( h i ) expresada en forma porcentual. En
otras palabras, es la frecuencia relativa ( h i )
multiplicada por 100 :

xi hi pi
8
0 0,08 %
18
1 0,18 %
24
2 0,24 %
20
3 0,20 %
16
4 0,16 %
8
5 0,08 %
4
6 0,04 %
2
7 0,02 %
3.4 Frecuencias acumuladas de la clase
La frecuencia acumulada es la suma de las
frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado.
La frecuencia acumulada se representa por Fi.
Ejemplo
Durante el mes de julio, en una ciudad se han
registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29,
30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31,
34, 33, 33, 29, 29.
xi fi Fi

27 1 1

28 2 3

29 6 9

30 7 16

31 8 24

32 3 27

33 3 30
34 1 31

31

3.5 Histograma y Polígonos de frecuencias


Un histograma es una representación gráfica de
una variable en forma de barras.
Se utilizan para variables continuas o
para variables discretas, con un gran número de
datos, y que se han agrupado en clases.
En el eje abscisas se construyen
unos rectángulos que tienen por base la
amplitud del intervalo, y por altura,
la frecuencia absoluta de cada intervalo.
La superficie de cada barra es proporcional a
la frecuencia de los valores representados.
Polígono de frecuencia
Para construir el polígono de frecuencia se toma
la marca de clase que coincide con el punto
medio de cada rectángulo.
UNIDAD III
Medidas de Tendencia
Central

COMPETENCIAS
 Las competencias sobre esta unidad es
aprender hallar la media aritmética, la
moda y la mediana en datos sin agrupar.
 Diferenciar y dominar las formula de los
cuartiles, deciles y percentiles en datos no
agrupados.
4.1 Medidas de tendencia central: definición e
importancia.

Las medidas de tendencia central son medidas


estadísticas que pretenden resumir en un solo
valor a un conjunto de valores. Representan un
centro en torno al cual se encuentra ubicado el
conjunto de los datos. Las medidas de tendencia
central más utilizadas
son: media, mediana y moda.

Las medidas de Tendencia Central son


empleadas para resumir a los conjuntos de
datos que serán sometidos a un estudio
estadístico, se les llama medidas de tendencia
central porque general mente la acumulación
más alta de datos se encuentra en los valores
intermedios. Estas medidas son utilizadas con
gran frecuencias como medidas descriptivas de
poblaciones o muestras.
4.2 Media, Mediana y Moda para datos no
agrupados.

Promedio o media
La medida de tendencia central más conocida y
utilizada es la media aritmética o promedio
aritmético. Se representa por la letra griega µ
cuando se trata del promedio del universo o
población y por Ȳ (léase Y barra) cuando se trata
del promedio de la muestra. Es importante
destacar que µ es una cantidad fija mientras que
el promedio de la muestra es variable puesto
que diferentes muestras extraídas de la misma
población tienden a tener diferentes medias. La
media se expresa en la misma unidad que los
datos originales: centímetros, horas, gramos,
etc.

Si una muestra tiene cuatro observaciones: 3, 5,


2 y 2, por definición el estadígrafo será:
Estos cálculos se pueden simbolizar:

Donde Y1 es el valor de la variable en la primera


observación, Y2 es el valor de la segunda
observación y así sucesivamente. En general,
con “n” observaciones, Yi representa el valor de
la i-ésima observación. En este caso el promedio
está dado por
De aquí se desprende la fórmula definitiva del
promedio:

Mediana
Otra medida de tendencia central es la mediana.
La mediana es el valor de la variable que ocupa
la posición central, cuando los datos se
disponen en orden de magnitud. Es decir, el 50%
de las observaciones tiene valores iguales o
inferiores a la mediana y el otro 50% tiene
valores iguales o superiores a la mediana.

Si el número de observaciones es par, la


mediana corresponde al promedio de los dos
valores centrales. Por ejemplo, en la muestra 3,
9, 11, 15, la mediana es (9+11)/2=10.

Moda
La moda de una distribución se define como el
valor de la variable que más se repite. En un
polígono de frecuencia la moda corresponde al
valor de la variable que está bajo el punto más
alto del gráfico. Una muestra puede tener más
de una moda.

4.3 Percentiles, Deciles y Cuartiles para datos


no agrupados.

CUARTILES
Los cuartiles son los tres valores que dividen al
conjunto de datos ordenados en cuatro partes
porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1,
Q2, Q3. El segundo cuartil es precisamente la
mediana. El primer cuartil, es el valor en el cual
o por debajo del cual queda un cuarto (25%) de
todos los valores de la sucesión (ordenada); el
tercer cuartil, es el valor en el cual o por debajo
del cual quedan las tres cuartas partes (75%) de
los datos
Si se tienen una serie de valores X1, X2, X3 ... Xn,
se localiza mediante las siguientes fórmulas:
- El primer cuartil:
Cuando n es par:

Cuando n es impar:

 Para el tercer cuartil


Cuando n es par:

Cuando n es impar:

DECILES
Los deciles son ciertos números que dividen la
sucesión de datos ordenados en diez partes
porcentualmente iguales. Son los nueve valores
que dividen al conjunto de datos ordenados en
diez partes iguales, son también un caso
particular de los percentiles. Los deciles se
denotan D1, D2,..., D9, que se leen primer decil,
segundo decil, etc.

Fórmulas Datos No Agrupados


Si se tienen una serie de valores X1, X2, X3 ... Xn,
se localiza mediante las siguientes fórmulas:
Cuando n es par:
Cuando n es impar:
Siendo A el número del decil.

CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas más
utilizadas para propósitos de ubicación o
clasificación de las personas cuando atienden
características tales como peso, estatura, etc.
Los percentiles son ciertos números que dividen
la sucesión de datos ordenados en cien partes
porcentualmente iguales. Estos son los 99
valores que dividen en cien partes iguales el
conjunto de datos ordenados. Los percentiles
(P1, P2,... P99), leídos primer percentil,...,
percentil 99.
 El percentil 99 supera 99% de los datos y es
superado a su vez por el 1% restante.
Fórmulas Datos No Agrupados
Si se tienen una serie de valores X1, X2, X3 ... Xn,
se localiza mediante las siguientes fórmulas:
Para los percentiles, cuando n es par:

Cuando n es impar:
Siendo A, el número del percentil.
Es fácil ver que el primer cuartil coincide con el
percentil 25; el segundo cuartil con el percentil
50 y el tercer cuartil con el percentil 75.
UNIDAD III Medidas de
tendencia central
(continuación)

COMPETENCIAS
 La competencia respecto a esta unidad es
diferenciar las medidas de tendencia en datos
agrupados y datos sin agrupar.
 Identificar las formulas y las diferencias entre
datos agrupados y sin agrupar.
 Aprender a resolver ejercicios de cuartiles,
percentiles y deciles con datos agrupados.
 Conocer y dominar la media ponderada y la
media geométrica.
4.4 Media, Mediana y Moda para datos
agrupados.

Promedio en datos agrupados


La fórmula es la siguiente:

Donde ni representa cada una de las frecuencias


correspondientes a los diferentes valores de Yi.
Consideremos como ejemplo una distribución
de frecuencia de madres que asisten a un
programa de lactancia materna, clasificadas
según el número de partos. Por tratarse de una
variable en escala discreta, las clases o
categorías asumen sólo ciertos valores: 1, 2, 3,
4, 5.

Entonces las 42 madres han tenido, en


promedio, 2,78 partos.

Mediana en datos agrupados

Si la variable es de tipo discreto la mediana será


el valor de la variable que corresponda a la
frecuencia acumulada que supere
inmediatamente a n/2. En los datos de la tabla 1
Me=3, ya que 42/2 es igual a 21 y la frecuencia
acumulada que supera inmediatamente a 21 es
33, que corresponde a un valor de variable (Yi)
igual a 3.

Si la variable es de tipo continuo es necesario,


primero, identificar la frecuencia acumulada que
supere en forma inmediata a n/2, y luego aplicar
la siguiente fórmula:

Donde:
Si la variable de interés es de tipo continuo será
necesario determinar, para cada intervalo, un
valor medio que lo represente. Este valor se
llama marca de clase (Yc) y se calcula dividiendo
por 2 la suma de los límites reales del intervalo
de clase. De ahí en adelante se procede del
mismo modo que en el ejercicio anterior,
reemplazando, en la formula de promedio, Yi
por Yc.

Moda en datos agrupados


Si la variable es de tipo discreto la moda o modo
será al valor de la variable (Yi) que tenga la
mayor frecuencia absoluta ( ). En los datos de la
tabla 1 el valor de la moda es 3 ya que este valor
de variable corresponde a la mayor frecuencia
absoluta =16.

Más adelante se presenta un ejemplo integrado


para promedio, mediana, varianza y desviación
estándar en datos agrupados con intervalos.
4.5 Percentiles, Deciles y Cuartiles para datos
agrupados.

Datos Agrupados

Como los cuartiles adquieren su mayor


importancia cuando contamos un número
grande de datos y tenemos en cuenta que en
estos casos generalmente los datos son
resumidos en una tabla de frecuencia. La
fórmula para el cálculo de los cuartiles cuando
se trata de datos agrupados es la siguiente:
k= 1,2,3
Donde:
Lk = Límite real inferior de la clase del cuartil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que
antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
Si se desea calcular cada cuartil individualmente,
mediante otra fórmula se tiene lo siguiente:
 El primer cuartil Q1, es el menor valor que es mayor
que una cuarta parte de los datos; es decir, aquel
valor de la variable que supera 25% de las
observaciones y es superado por el 75% de las
observaciones.
Fórmula de Q1, para series de Datos agrupados:

Donde:
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la
medida
f1 = la frecuencia de la clase que contiene la
medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que
contiene la medida solicitada.
Ic = intervalo de clase
 El segundo cuartil Q2, (coincide, es idéntico o similar
a la mediana, Q2 = Md), es el menor valor que es
mayor que la mitad de los datos, es decir el 50% de
las observaciones son mayores que la mediana y el
50% son menores.
Fórmula de Q2, para series de Datos agrupados:
Donde:
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la
medida
f1 = la frecuencia de la clase que contiene la
medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que
contiene la medida solicitada.
Ic = intervalo de clase
 El tercer cuartil Q3, es el menor valor que es mayor
que tres cuartas partes de los datos, es decir aquel
valor de la variable que supera al 75% y es superado
por el 25% de las observaciones.
Fórmula de Q3, para series de Datos agrupados:

Donde:
L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la
medida
f1 = la frecuencia de la clase que contiene la
medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que
contiene la medida solicitada.
Ic = intervalo de clase.
Otra manera de verlo es partir de que todas las
medidas no son sino casos particulares del
percentil, ya que el primer cuartil es el 25%
percentil y el tercer cuartil 75% percentil.

DECILES

Para datos agrupados los deciles se calculan


mediante la fórmula.

k= 1,2,3,... 9
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que
antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra fórmula para calcular los deciles:
 El cuarto decil, es aquel valor de la variable que
supera al 40%, de las observaciones y es superado
por el 60% de las observaciones.
 El quinto decil corresponde a la mediana.

 El noveno decil supera al 90% y es superado por el


10% restante.

Donde (para todos):


L1 = limite inferior de la clase que lo contiene
P = valor que representa la posición de la
medida
f1 = la frecuencia de la clase que contiene la
medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que
contiene la medida solicitada.
Ic = intervalo de clase.

CENTILES O PERCENTILES
Datos Agrupados
Cuando los datos están agrupados en una tabla
de frecuencias, se calculan mediante la fórmula:

k= 1,2,3,... 99
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que
antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:
 Primer percentil, que supera al uno por ciento de los
valores y es superado por el noventa y nueve por
ciento restante.

 El 60 percentil, es aquel valor de la variable que


supera al 60% de las observaciones y es superado
por el 40% de las observaciones.

 El percentil 99 supera 99% de los datos y es


superado a su vez por el 1% restante.
3. EJEMPLO
Determinación del primer cuartil, el séptimo
decil y el 30 percentil, de la siguiente tabla:
Salarios No. De Fa
(I. De Empleados
Clases) (f1)
200-299 85 85
300-299 90 175
400-499 120 295
500-599 70 365
600-699 62 427
700-800 36 463
Como son datos agrupados, se utiliza la fórmula

Siendo,

La posición del primer cuartil.

La posición del 7 decil.

La posición del percentil 30.


Entonces,
El primer cuartil:
115.5 – 85 = 30.75
Li = 300, Ic = 100 , fi = 90

El 7 decil:

Posición:

324.1 – 295 = 29.1


Li = 500, fi = 70

El percentil 30
Posición:

138.9 – 85 = 53.9
fi = 90
Estos resultados nos indican que el 25% de los

empleados ganan salarios por debajo de $ 334;


que bajo 541.57 gana el 57%de los empleados y
sobre $359.88, gana el 70% de los empleados.

4.6 Otras medidas de localización:


 Media ponderada
La media ponderada (MP) es una medida de
centralización. Consiste en otorgar a cada observación del
conjunto de datos (X1,X2,…,XN) unos pesos (p1,p2,…,pN)
según la importancia de cada elemento.

Cuanto más grande sea el peso de un elemento, más


importante se considera que es éste.
La media ponderada tiene numerosas aplicaciones,
por ejemplo, la nota de una asignatura donde el examen
final tiene un peso mayor al de un trabajo. O en el cálculo
del IPC (Índice de Precios de Consumo). El IPC es un
indicador de los precios de los bienes y servicios básicos
que consume la población. Para calcularlo, se otorga
pesos a los diferentes bienes (pan, fruta, vivienda,…) y se
calcula la media ponderada

 Media geométrica
La media geométrica (MG) de un conjunto de números
estrictamente positivos (X1, X2,…,XN) es la raíz N-ésima
del producto de los N elementos.

Todos los elementos del conjunto tienen que ser


mayores que cero. Si algún elemento fuese cero (Xi=0),
entonces la MG sería 0 aunque todos los demás valores
estuviesen alejados del cero.
La media geométrica es útil para calcular medias de
porcentajes, tantos por uno, puntuaciones o índices.
Tiene la ventaja de que no es tan sensible como
la media a los valores extremos.

UNIDAD IV
Medidas de Variación o
Dispersión

COMPETENCIAS
 Las competencias son saber diferenciar las medidas
de tendencias central de la de las medidas
dispersiones.
 Saber que son las medidas de dispersión.
 Reconocer que son varianzas.
 Conocer el Rango
 Aprender aplicar las distintas formulas de las
medidas de dispersión.
 Utilidad de las medidas de dispersión.

5.1 Utilidad de los estadísticos de dispersión.


Medidas de dispersión. Parámetros estadísticos que
indican como se alejan los datos respecto de la media
aritmética. Sirven como indicador de la variabilidad de
los datos. Las medidas de dispersión más utilizadas son el
rango, la desviación estándar y la varianza.
Se utiliza en multitud de ocasiones: muchos elementos se
fijan en función de los valores medios que se realizan en
estudios y todo parece depender de ella. Por eso no es
de extrañar que los parámetros que vamos a ver en esta
sección estén todos pendientes de la media. Así por
ejemplo, si tenemos una caja de nectarinas, lo normal es
que no todas tengan el mismo tamaño y es lógico que
nos fijemos en si hay una gran variación entre ellas o son
todas parecidas.
5.2 Rango.
Indica la dispersión entre los valores extremos de una
variable. se calcula como la diferencia entre el mayor y el
menor valor de la variable. Se denota como R.
Para datos ordenados se calcula como:
R = x(n) - x(1)
Donde: x(n): Es el mayor valor de la variable. x(n): Es el
menor valor de la variable.

5.3 Desviación media


La desviación media es la media aritmética de los valores
absolutos de las
desviaciones respecto a la media.

La desviación media se representa por Dx


Ejemplo:
Calcular la desviación media de la distribución:
9, 3, 8, 8, 9, 8, 9, 18

Calculamos la media aritmética para poder hallar las


desviaciones respecto a la media

Aplicamos la fórmula de la desviación media

5.4 Desviación típica y varianza


Se define la desviación típica a la raíz cuadrada de la
media de los cuadrados de las diferencias de las medidas
obtenidas con la media de los datos. Se representa
mediante la letra griega σ (sigma minúscula). Dicho valor
se puede obtener mediante cualquiera de las siguientes
expresiones:

La segunda expresión es la que normalmente se suele


utilizar ya que, si nos basamos en la tabla de frecuencias,
basta añadir una nueva columna correspondiente a xi2·fi y
totalizarla.
La desviación típica nos da información sobre cómo se
desvían los datos respecto a la media, de forma que
cuanto mayor sea más alejados están los datos de ella.
La varianza es una medida de dispersión que representa
la variabilidad de una serie de datos respecto a su media.
Formalmente se calcula como la suma de los residuos al
cuadrado divididos entre el total de observaciones.
También se puede calcular como la desviación típica al
cuadrado. Dicho sea de paso, entendemos como residuo
a la diferencia entre el valor de una variable en un
momento y el valor medio de toda la variable.

5. 5 Coeficiente de variación.
El coeficiente de variación, también denominado como
coeficiente de variación de Spearman, es una medida
estadística que nos informa acerca de la dispersión
relativa de un conjunto de datos. Su cálculo se obtiene
de dividir la desviación típica entre el valor absoluto de la
media del conjunto y por lo general se expresa en
porcentaje para su mejor comprensión.
El coeficiente de variación se puede ver expresado con
las letras CV o r, dependiendo del manual o la fuente
utilizada. Su fórmula es la siguiente
UNIDAD V
TEORÍA DE LAS PROBABILIDADES

COMPETENCIAS
 Aplicación de la probabilidad en la vida cotidiana.
 Dominar los que son sucesos dependientes e
independientes y como se utilizan.
 Diferenciar lo que son sucesos con reemplazamiento
y sin reemplazamiento.
 La ley de Bayes y como se utiliza.

6.1 Introducción a la teoría de la probabilidad.


En la vida cotidiana aparecen muchas situaciones en
las que los resultados observados son diferentes,
aunque las condiciones iniciales en las que se produce
la experiencia sean las mismas. Por ejemplo, al lanzar
una moneda unas veces resultará cara y otras cruz.
Estos fenómenos, denominados aleatorios, se ven
afectados por la incertidumbre.
En el lenguaje habitual, frases como
"probablemente...", "es poco probable que...", "hay
muchas posibilidades de que..." hacen referencia a
esta incertidumbre.
La teoría de la probabilidad pretende ser una
herramienta para modelizar y tratar con situaciones de
este tipo; Por otra parte, cuando aplicamos las técnicas
estadísticas a la recogida, análisis e interpretación de
los datos, la teoría de la probabilidad proporciona una
base para evaluar la fiabilidad de las conclusiones
alcanzadas y las inferencias realizadas. Debido al
importante papel desempeñado por
la probabilidad dentro de la estadística, es necesario
familiarizarse con sus elementos básicos, lo que
constituye el objetivo del presente tema.
6.1.2 Conceptos básicos
Probabilidad es una palabra que permite resaltar
la característica de probable (es decir, de que algo
pueda ocurrir o resultar verosímil). Se encarga de
evaluar y permitir la medición de la frecuencia con la
que es posible obtener un cierto resultado en el marco
de un procedimiento de carácter aleatorio..
La probabilidad, por lo tanto, puede definirse como
la razón entre la cantidad de casos prósperos y la
cantidad de cuestiones posibles.

6.1.3 Probabilidad y sus propiedades.


1. La suma de las probabilidades de un suceso y su
contrario vale 1, por tanto la probabilidad del suceso
contrario es:
p(A) = 1 – p(A)

2. Probabilidad del suceso imposible es cero.


p(∅) 0

3. La probabilidad de la unión de dos sucesos es la


suma de sus probabilidades menos la probabilidad de
su intersección.
p(A ∪ B) = p(A) + p(B) – p(A∩B)

4. Si un suceso está incluido en otro, su probabilidad es


menor o igual a la de éste.
A ⊂ B ⇒ p(A) ≤ p(B)
Si A está incluido en B entonces la probabilidad de A es
menor o igual que la probabilidad de B.

5. Si A1, A2, ..., Ak son incompatibles dos a dos entonces:


p(A1 ∪ A2 ∪ ... ∪ Ak) = p(A1) + p(A2) + ... + p(Ak)

6. Si el espacio muestral E es finito y un suceso es S = {x1,


x2, ..., xn} entonces:
p(S) = p(x1) + p(x2) + ... + p(xn)

Ejemplo:
La probabilidad de sacar par, al tirar un dado, es:
P(par) = P(2) + P(4) + P(6)

6.1.3 Dependencia e independencia de sucesos.


• Sucesos independientes
Dos sucesos A y B son independientes entre sí cuando el
hecho de que se verifique uno de ellos no influye en la
probabilidad de que se verifique el otro.

A y B son independientes ⇔ P ( A ∩ B ) = P (A) · P (B)


• Sucesos dependientes
Dos sucesos son dependientes entre sí cuando el hecho
de que se verifique uno de ellos influye en la
probabilidad de que se verifique el otro.

La probabilidad de dos sucesos A y B de dos


experimentos simples sucesivos en un experimento
compuesto dependiente es:

A y B son dependientes ⇔ P( A ∩ B) = P (A) · P (B/A)


P( A ∩ B) = P (B) · P (B/A)

6.1.5 Sucesos con reemplazamiento y sin


reemplazamiento.
La probabilidad con re-emplazo es cuando la muestra es
siempre la misma, es decir, si tomamos de una caja unas
fichas, luego las fichas se devuelven a la caja, cuestión
que la muestra sigue siendo la misma.
La probabilidad sin re-emplazo es cuando la muestra
varía a medida que realizamos el experimento, por
ejemplo, si sacamos fichas de una caja, luego no se
regresan a la muestra, por lo que la muestra ya no es la
misma.
 6.1.4 Teorema de Bayes para sucesos
condicionados.
El teorema de Bayes es utilizado para calcular la
probabilidad de un suceso, teniendo información de
antemano sobre ese suceso.
Podemos calcular la probabilidad de un suceso A,
sabiendo además que ese A cumple cierta característica
que condiciona su probabilidad. El teorema de Bayes
entiende la probabilidad de forma inversa al teorema de
la probabilidad total. El teorema de la probabilidad total
hace inferencia sobre un suceso B, a partir de los
resultados de los sucesos A. Por su parte, Bayes calcula la
probabilidad de A condicionado a B.
 Fórmula del teorema de Bayes
Para calcular la probabilidad tal como la definió Bayes en
este tipo de sucesos, necesitamos una fórmula. La
fórmula se define matemáticamente como:

Donde B es el suceso sobre el que tenemos información


previa y A(n) son los distintos sucesos condicionados. En
la parte del numerador tenemos la probabilidad
condicionada, y en la parte de abajo la probabilidad total.
En cualquier caso, aunque la fórmula parezca un poco
abstracta, es muy sencilla. Para demostrarlo, utilizaremos
un ejemplo en el que en lugar de A(1), A(2) y A(3),
utilizaremos directamente A, B y C.
• EJEMPLO.
Una empresa tiene una fábrica en Estados Unidos que
dispone de tres máquinas A, B y C, que producen envases
para botellas de agua. Se sabe que la máquina A produce
un 40% de la cantidad total, la máquina B un 30% , y la
máquina C un 30%. También se sabe que cada máquina
produce envases defectuosos. De tal manera que la
máquina A produce un 2% de envases defectuosos sobre
el total de su producción, la máquina B un 3%, y la
máquina C un 5%. Dicho esto, se plantean dos
cuestiones:
P(A) = 0,40 P(D/A) = 0,02
P(B) = 0,30 P(D/B) = 0,03
P(C) = 0,30 P(D/C) = 0,05
1.Si un envase ha sido fabricado por la fábrica de esta
empresa en Estados Unidos ¿Cuál es la probabilidad de
que sea defectuoso?
Se calcula la probabilidad total. Ya que, a partir los
diferentes sucesos, calculamos la probabilidad de que
sea defectuoso.
P(D) =[ P(A) x P(D/A) ] + [ P(B) x P(D/B) ] + [ P(C) x P(D/C) ]
= [ 0,4 x 0,02 ] + [ 0,3 x 0,03 ] + [ 0,3 x 0,05 ] = 0,032
Expresado en porcentaje, diríamos que la probabilidad
de que un envase fabricado por la fábrica de esta
empresa en Estados Unidos sea defectuoso es del
3,2%.2. Siguiendo con la pregunta anterior, si se adquiere
un envase y este es defectuoso ¿Cuáles es la
probabilidad de que haya sido fabricado por la máquina
A?¿Y por la máquina B?¿Y por la máquina C?
Aquí se utiliza el teorema de Bayes. Tenemos
información previa, es decir, sabemos que el envase es
defectuoso. Claro que, sabiendo que es defectuoso,
queremos saber cual es la probabilidad de que se haya
producido por una de las máquinas.
P(A/D) = [P(A) x P(D/A)] / P(D) = [0,40 x 0,02] / 0,032 =
0,25
P(B/D) = [P(B) x P(D/B)] / P(D) = [0,30 x 0,03] / 0,032 =
0,28
P(C/D) = [P(C) x P(D/C)] / P(D) = [0,30 x 0,05] / 0,032 =
0,47
Sabiendo que un envase es defectuoso, la probabilidad
de que haya sido producido por la máquina A es del 25%,
de que haya sido producido por la máquina B es del 28%
y de que haya sido producido por la máquina C es del
47%.
UNIDAD V
(continuación)

COMPETENCIAS
 Las competencias de esta unidad es conocer lo que
son distribuciones discretas y sus tipos.
 Identificar las distribuciones continuas y su
clasificación.

6.2. Distribuciones de probabilidad discreta.


Se denomina distribución de variable discreta a aquella
cuya función de probabilidad solo toma valores positivos
en un conjunto de valores de X finito o infinito
numerable. A dicha función se le llama función de masa
de probabilidad.
6.2.1 Variables aleatorias discretas.
Se denomina variable aleatoria discreta aquella que sólo
puede tomar un número finito de valores dentro de un
intervalo.
Por ejemplo, el número de componentes de una manada
de lobos, puede ser 4 ó 5 ó 6 individuos pero nunca 5,75
ó 5,87.
Otros ejemplos de variable discreta serían el número de
pollos de gorrión que llegan a volar del nido o el sexo de
los componentes de un grupo familiar de babuinos.

6.2.2 Valor esperado


• En estadística la esperanza matemática (también
llamada esperanza, valor esperado, media
poblacional o media) de una variable aleatoria {\ X} X
, es el} [X]{E} [X]} o que formaliza la idea de valor
medio de un fenómeno aleatorio.
• Cuando la variable aleatoria es discreta, la esperanza
es igual a la suma de la probabilidad de cada posible
suceso aleatorio multiplicado por el valor de dicho
suceso. Por lo tanto, representa la cantidad
promedio que se "espera" como resultado de un
experimento aleatorio cuando la probabilidad de
cada suceso se mantiene constante y el experimento
se repite un elevado número de veces. Cabe decir
que el valor que toma la esperanza matemática en
algunos casos puede no ser "esperado" en el sentido
más general de la palabra (el valor de la esperanza
puede ser improbable o incluso imposible).

6.2.3 Distribución Binomial.


• En estadística, la distribución binomial es una
distribución de probabilidad discreta que cuenta el
número de éxitos en una secuencia de n ensayos de
Bernoulli independientes entre sí, con una
probabilidad fija p de ocurrencia del éxito entre los
ensayos. Un experimento de Bernoulli se caracteriza
por ser dicotómico, esto es, solo dos resultados son
posibles. A uno de estos se denomina «éxito» y tiene
una probabilidad de ocurrencia p y al otro,
«fracaso», con una probabilidad2 q = 1 - p. En la
distribución binomial el anterior experimento se
repite n veces, de forma independiente, y se trata de
calcular la probabilidad de un determinado número
de éxitos. Para n = 1, la binomial se convierte, de
hecho, en una distribución de Bernoulli.
6.2.4 Distribución de Poisson
• La distribución de Poisson es una distribución de
probabilidad discreta que se aplica a las ocurrencias
de algún suceso durante un intervalo determinado.
Nuestra variable aleatoria x representará el número
de ocurrencias de un suceso en un intervalo
determinado, el cual podrá ser tiempo, distancia,
área, volumen o alguna otra unidad similar o
derivada de éstas.
6.3 Distribuciones de probabilidad Continua.
Una distribución continua describe las probabilidades de
los posibles valores de una variable aleatoria continua.
Una variable aleatoria continua es una variable aleatoria
con un conjunto de valores posibles (conocido como el
rango) que es infinito y no se puede contar.

6.3.2 Variables aleatorias continuas.


Una variable aleatoria continua es una función X que
asigna a cada resultado posible de un experimento un
número real. Si X puede asumir cualquier valor en algún
intervalo I (el intervalo puede ser acotado o desacotado),
se llama una variable aleatoria continua. Si puede asumir
solo varios valores distintos, se llama una variable
aleatoria discreta.
Si X es una variable aleatoria, estamos frecuentemente
interesado en la probabilidad de que X asume un valor en
cualquier rango. Por ejemplo, si X el último precio
cotizado del las acciones de Conglomerado Colosal, y
observamos que el precio está entre $10 y $20 60% del
tiempo, diríamos
La probabilidad de que X tome un valor entre $10 y $20
es 0.6.
Escribimos esta declaración matemáticamente como
sigue:
P(10X20)=
6.3.3 Distribución de probabilidad uniforme: Área como
medida de probabilidad.
• La distribución de probabilidad uniforme es un
ejemplo de una distribución de probabilidad es
continua. Una distribución de probabilidad es
continua cuando los resultados posibles del
experimento son obtenidos de variables aleatorias
continuas, es decir, de variables cuantitativas que
pueden tomar cualquier valor, y que resultan
principalmente del proceso de medición.
Ejemplos de variables aleatorias continuas son:
• La estatura de un grupo de personas
• El tiempo dedicado a estudiar
• La temperatura en una ciudad
Es una distribución en el intervalo [a,b] en la cual las
probabilidades son las mismas para todos los posibles
resultados, desde el mínimo de a hasta el máximo de b.
El experimento de lanzar un dado es un ejemplo que
cumple la distribución uniforme, ya que todos los 6
resultados posibles tienen 1/6 de probabilidad de
ocurrencia.

6.3.4 Distribución de probabilidad normal


La distribución normal (en ocasiones llamada distribución
gaussiana) es la distribución continua que se utiliza más
comúnmente en estadística. La distribución normal es de
vital importancia en estadística por tres razones
principales:
• Muchas variables continuas comunes en el mundo
de los negocios tienen distribuciones que se
asemejan estrechamente a la distribución normal.
• La distribución normal sirve para acercarse a
diversas distribuciones de probabilidad discreta,
como la distribución binomial y la distribución de
Poisson.
• La distribución normal proporciona la base para la
estadística inferencial clásica por su relación con el
teorema de límite central.
En la distribución normal, uno puede calcular la
probabilidad de que varios valores ocurran dentro de
ciertos rangos o intervalos. Sin embargo, la probabilidad
exacta de un valor particular dentro de una distribución
continua, como la distribución normal, es cero. Esta
propiedad distingue a las variables continuas, que son
medidas, de las variables discretas, las cuales son
contadas. Como ejemplo, el tiempo (en segundos) se
mide y no se cuenta. Por lo tanto, es factible determinar
la probabilidad de que el tiempo de descarga para una
página principal en un navegador de la Web esté entre 7
y 10 segundos o que la probabilidad de que el tiempo de
descarga esté entre 8 y 9 segundos, o la probabilidad de
que el tiempo de descarga esté entre 7.99 y 8.01
segundos. Sin embargo, la probabilidad de que el tiempo
de descarga sea exactamente de 8 segundos es cero.
UNIDAD VI
EL MUESTREO

COMPETENCIAS
 Aprender lo que es una muestra y para que se
utiliza.
 Saber diferenciar lo que son poblaciones finitas e
infinitas con sus respectivas formulas, y la forma en
que se aplican.

6.1 Métodos de cálculo del tamaño de una muestra.


El tamaño muestral dependerá de decisiones estadísticas
y no estadísticas, pueden incluir por ejemplo la
disponibilidad de los recursos, el presupuesto o el equipo
que estará en campo.
Antes de calcular el tamaño de la muestra necesitamos
determinar varias cosas:
Tamaño de la población. Una población es una colección
bien definida de objetos o individuos que tienen
características similares. Hablamos de dos tipos:
población objetivo, que suele tiene diversas
características y también es conocida como la población
teórica. La población accesible es la población sobre la
que los investigadores aplicaran sus conclusiones.
Margen de error (intervalo de confianza). El margen de
error es una estadística que expresa la cantidad de error
de muestreo aleatorio en los resultados de una encuesta,
es decir, es la medida estadística del número de veces de
cada 100 que se espera que los resultados se encuentren
dentro de un rango específico.
Nivel de confianza. Son intervalos aleatorios que se usan
para acotar un valor con una determinada probabilidad
alta. Por ejemplo, un intervalo de confianza de 95%
significa que los resultados de una acción probablemente
cubrirán las expectativas el 95% de las veces.
La desviación estándar. Es un índice numérico de la
dispersión de un conjunto de datos (o población).
Mientras mayor es la desviación estándar, mayor es la
dispersión deCÁLCULO DEL TAMAÑO DE LA MUESTRA
DESCONOCIENDO EL TAMAÑO DE LA POBLACIÓN
La fórmula para calcular el tamaño de muestra cuando se
desconoce el tamaño de la población es la siguiente:

En donde
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de
proporción)
CÁLCULO DEL TAMAÑO DE LA MUESTRA CONOCIENDO
EL TAMAÑO DE LA POBLACIÓN
La fórmula para calcular el tamaño de muestra cuando se
conoce el tamaño de la población es la siguiente:
En donde, N = tamaño de la población Z = nivel de
confianza, P = probabilidad de éxito, o proporción
esperada Q = probabilidad de fracaso D = precisión (Error
máximo admisible en términos de proporción).
la población.

6.1.1 Tamaño de la muestra para poblaciones finita.


b) Población Finita: La firma empresarial ENBUS va a
realizar un estudio para determinar el nivel de
satisfacción de los clientes que consumen productos
lácteos en Santiago. Este estudio tiene una población de
quince mil clientes (N= 15,000) distribuidos en los
diferentes supermercados de la ciudad de Santiago.
Determinar el tamaño de la muestra a partir de las
siguientes informaciones: •Datos
• Nivel de confianza = 90% (Z α/2= 1.645)
• Error permitido = 5%
• P = 0.5
• Q = 0.5

6.1.2 Tamaño de la muestra para poblaciones infinitas.

a) Población Infinita: La firma empresarial ENBUS va a


realizar una encuesta política en Santiago y necesita
determinar el tamaño de la muestra a partir de las
siguientes informaciones: Datos
• Nivel de confianza = 95% (Z α/2= 1.96)
• Error permitido = 5%
• P = 0.5
• Q = 0.5
UNIDAD VI
EL MUESTREO
(CONTINUACIÓN)

COMPETENCIAS

 Aprender a utilizar y a diferenciar cada uno de los


métodos de muestreo y dominar cada una de las
formulas con la que le corresponde.
 6.2 Métodos de Muestreo
Los métodos de muestreo pueden ser de dos tipos:
aleatorios y no aleatorios, dependiendo del método de
obtención de la muestra. En los primeros, la selección de
los elementos de la muestra es aleatoria e independiente
de la opinión de cualquier persona (investigador o
entrevistador). En los segundos, esta condición no
siempre se cumple. En ambos casos, pueden
seleccionarse elementos de la población (por ejemplo,
empleados) o grupos de elementos (por ejemplo,
familias).

6.2.1 Muestreo aleatorio simple para poblaciones


finitas e infinitas.
La fórmula relaciona el tamaño de muestra necesario
cuando el universo es finito con el tamaño necesario
cuando el universo es infinito:

Donde n0 es el tamaño de muestra necesario para un


universo infinito y N es el tamaño del universo finito. Es
posible demostrar que el tamaño de muestra cuando
usamos reemplazo (nr) es siempre igual al tamaño
necesario para universo infinito (nr=n0). Si eso sucede,
podemos afirmar que

Por lo tanto, el tamaño de muestra cuando no usamos


reposición siempre es menor al necesario si usamos
reposición. Este resultado coincide con la intuición: si
estamos empleando reposición y por azar incluimos un
individuo más de una vez en la misma muestra, el efecto
es similar a reducir el tamaño de la muestra ya que
observo menor diversidad de individuos. Del mismo
modo, si el universo es infinito, ambos métodos
coinciden, dado que la probabilidad de seleccionar al
mismo individuo dos veces en la misma muestra tiende a
ser infinitamente pequeña.
6.2.2 Muestreo aleatorio estratificado.
El muestreo estratificado es una técnica de muestreo
probabilístico en donde el investigador divide a toda la
población en diferentes subgrupos o estratos. Luego,
selecciona aleatoriamente a los sujetos finales de los
diferentes estratos en forma proporcional. Es importante
tener en cuenta que los estratos no deben superponerse.
Que los subgrupos se superpongan dará a algunos
individuos mayores probabilidades de ser seleccionados
como sujetos. Esto niega completamente el concepto de
muestreo estratificado como un tipo de muestreo
probabilístico.
Igualmente importante es el hecho de que el
investigador debe utilizar un muestreo
probabilístico simple dentro de los diferentes estratos.
Los estratos más comunes utilizados en el muestreo
aleatorio estratificado son la edad, el género, el nivel
socioeconómico, la religión, la nacionalidad y el nivel de
estudios alcanzado.

6.2.3 Muestreo por conglomerados.


En el muestreo por conglomerados, en lugar de
seleccionar a todos los sujetos de la población
inmediatamente, el investigador realiza varios pasos para
reunir su muestra de la población.
En primer lugar, el investigador selecciona grupos o
conglomerados y de cada grupo selecciona a los sujetos
individuales, ya sea por muestreo aleatorio
simple o muestreo aleatorio sistemático. El investigador
también puede optar por incluir a todo el conglomerado,
no sólo a un subconjunto.

6.2.4 Muestreo sistemático.


El muestreo sistemático es una técnica de muestreo
aleatorio que los investigadores eligen con frecuencia
por su sencillez y calidad regular.

En el muestreo aleatorio sistemático, el investigador


primero escoge aleatoriamente la primera pieza o sujeto
de la población. A continuación, el investigador
seleccionará a cada enésimo sujeto de la lista.
El procedimiento del muestreo aleatorio sistemático es
muy fácil y se puede hacer manualmente. Los resultados
son representativos de la población a menos que se
repitan ciertas características de la población por cada
enésimo individuo, lo que es muy poco probable.
6.2.5 Muestreo de conveniencia.
El muestreo de o por conveniencia es una técnica de
muestreo no probabilístico donde los sujetos son
seleccionados dada la conveniente accesibilidad y
proximidad de los sujetos para el investigador.
Los sujetos de una investigacion específica, son
seleccionados para el estudio sólo porque son más fáciles
de reclutar y el investigador no está considerando las
características de inclusión de los sujetos que los hace
representativos de toda la población.

6.2.6 Muestreo subjetivo


En este caso las unidades de la muestra se eligen en
función de algunas de sus características de manera
racional y no casual. Una variante de esta técnica es
el muestreo compensado o equilibrado, en el que se
seleccionan las unidades de tal forma que la media de la
muestra para determinadas variables se acerque a la
media de la población. La cual funciona en base a
referencias o por recomendación.
 EVIDENCIAS DE LOS
TRABAJOS ABORDADOS

Principio del formulario


Es una medida de posición:
Select one:
a. Desviación Típica.
b. Moda.
c. Amplitud.
d. Varianza.
4

Una distribución estadística viene dada por la


siguiente tabla

La media aritmética es:


Select one:
a. 2.5
b. 2.4
c. 2.8
d. 3
4

Un inversionista compra 2000 acciones en 5


sesiones diferentes en la bolsa. El precio de
compra en cada sesión se adjunta en la siguiente
tabla:
PrecioNº
acciones
9 300
8,7 600
8,4 200
8 500
7,8 400
Calcula el precio de compra medio.
Select one:
a. 8.7
b. 8.36
c. 8.4
d. 8.2
4

La mediana es una medida de tendencia central


que se usa cuando:
Select one:
a. La muestra es heterogénea.
b. Los datos son impares.
c. La muestra es simétrica.
d. La muestra es asimétrica.

La moda de la siguiente serie de números 5, 3, 4,


7, 8, 10, 5, 5, 4, 3 es:
Select one:
a. 10
b. 3
c. 4
d. 5
4

¿Cuál de los siguientes es un estadístico


descriptivo de posición?
Select one:
a. Varianza.
b. Media Geométrica.
c. Media Ponderada.
d. Percentil.

La media de la siguiente serie de números 5, 3, 4,


7, 8, 10, 5, 5, 4, 3 es:

Select one:
a. 5.5
b. 5.3
c. 5
d. 5.4
Feedback
4

Una distribución estadística viene dada por la


siguiente tabla

La media aritmética es:


Select one:
a. 7.06
b. 5.25
c. 7.9
d. 7.6

4
F1 Answer 1 4

Media Aritmética Answer 2 4.76

Mediana Answer 3 5

n5 Answer 4 0.1

n7 Answer 5 0.14

f6 Answer 6 10

F2 Answer 7 8

F8 Answer 8 0.1

F4 Answer 9 0.14

f8 Answer 10 5

f3 Answer 11 8

n8 Answer 12 0.1

Moda Answer 13 6

n2 Answer 14 0.08

n6 Answer 15 0.2
4

La mediana de la siguiente serie de números 5, 3,


4, 7, 8, 10, 5, 5, 4, 3 es:
Select one:
a. 3
b. 10
c. 5
d. 4

La mediana es:
Select one:
a. 15.71
b. 15.4
c. 15.5
d. 15.313

Es una medida de centralización:


Select one:
a. Mediana.
b. Desviación Estándar.
c. Varianza.
d. Rango.

Dada la distribución estad8ística


La moda es:

a. 1 y 5
b. Solo 5
c. Solo 1
d. 3
4

Dada la distribución estadística


La moda es:
Select one:
a. 15.313
b. 15.71
c. 15.8
d. 15.
Principio del formulario
El Coeficiente de Variación es:
Select one:
a. Un estadístico de Centralización adimensional.
b. Una medida de Variación conjunta entre dos
variables y Un índice de simetría.
c. Una medida de Variación conjunta entre dos
variables.
d. Un estadístico de Dispersión Adimensional.
e. Un índice de simetría.
2
Select one:

a. 1.26
b. 3.16
c. 3
d. 2
e. 3.03
2

Es un estadístico de dispersión:
Select one:
a. Todas Ciertas.
b. Amplitud.
c. Desviación Media.
d. Rango intercuartílico
e. Coeficiente de Variación.
2

Para comparar correctamente, desde un punto de vista


descriptivo, dos o más variables debe usarse:
Select one:
a. Desviación Estándar.
b. Amplitud.
c. La Desviación Media.
d. La Covarianza.
e. El Coeficiente de Variación.
2

Es un índice de dispersión:
Select one:
a. Moda.
b. Media Aritmética.
c. Cuartiles.
d. Desviación Estándar.
e. Mediana

Select one:
a. 7.06
b. 7.6
c. 0.26
d. 7.2
e. 0.56
2
Select one:
a. 2
b. 2.4
c. 2.8
d. 1.2
e. 2.6
2

Cuando la muestra es asimétrica, el mejor estadístico de


centralización que puede usarse es:
Select one:
a. Media Geométrica.
b. Mediana.
c. Media Aritmética.
d. Media Armónica.
e. Moda.
2

Es un Estadístico de Dispersión:
Select one:
a. Media Armónica.
b. Mediana.
c. Rango.
d. Moda.
e. Media Geométrica.

La Varianza Muestral es:


Select one:
a. El cuadrado de la Desviación Típica y Un estadístico
de dispersión.
b. Un estadístico de dispersión.
c. La raíz cuadrada de la Desviación Típica.
d. El cuadrado de la Desviación Típica
e. El cociente entre la Media y los Grados de Libertad
2

Si multiplicas por 6 todos los valores de una


distribución:
Select one:
a. Coeficiente de Variación no varía.
b. La Media no varía.
c. Todas las opciones son falsas.
d. La Desviación Estándar se multiplica por 36.
e. Varianza se multiplica por 6.
2

¿Con cuál de los siguientes estadísticos, puede


compararse el grado de dispersión (variabilidad) de
distintas muestras, en las que se utilizan unidades de
medida distintas?
Select one:
a. Desviación Típica.
b. Rango o Amplitud.
c. Coeficiente de Variación.
d. Error Típico.
e. Varianza.
2

El Coeficiente de Variación se calcula:


Select one:
a. Dividiendo la Media por la Desviación Típica.
b. Dividiendo la Media por la Varianza.
c. Multiplicando la Desviación Típica por la Media.
d. Multiplicando la Varianza por la Media.
e. Dividiendo la Desviación Típica por la Media.
2

Los datos originales a menudo necesitan ser


transformados, codificados para facilitar el cálculo.
¿Qué consecuencias tiene en el cálculo de la Media, la
Desviación Típica y el Coeficiente de Variación el hecho
de que a todos los elementos de una muestra se les
reste una constante?
Select one:
a. Ninguno de estos estadísticos varían.
b. Los tres estadísticos varían.
c. La Media no varía, el resto sí.
d. La Media y el Coef. de Variación varían, la Desv.
Típica no.
e. La Media varía, el resto no.
2

Select one:
a. 7.26
b. 0.56
c. 7.06
d. 0.26
e. 0.86

2
Es un índice de dispersión adimensional:
Select one:
a. Desviación Estándar.
b. Amplitud o Rango.
c. Desviación Media.
d. Coeficiente de Variación.
e. Varianza.
d9e0TWgFG9
CONCLUSION
Al finalizar este portafolios pude obtener una forma más
clara de ver lo que es la estadística, pude aprender a
manejar lo que son sus respectivas formulas en su
totalidad. Fueron temas de mucha importancia para LA
PROBALIDAD, PRESENTACION DE DATOS EN GRAFICOS,
EL MUESTREO. Ya que fueron un gran reto a la hora de
estudiarlos, porque son temas un poco complejos y hay
que saber colocar la información en el lugar que le
corresponde, sino todo dará un resultado de los datos
establecidos.
Espero que todos los temas, como los cuartiles,
percentiles, deciles, medidas de tendencias central,
medidas de variación y todo los demás sean para
enriquecer el autoconocimiento de cada persona.

EXPERIENCIA PERSONAL
Mi experiencia personal en cuanto la materia en general
y cada uno de los contenidos del programa fueron un
gran reto. ¿Por qué fue un reto? Desde antes de
seleccionar esta materia ya había escuchado compañeros
diciendo que era una materia dura, por lo que me
propuse esforzarme y poner todo de mi parte para
comprender los temas que el facilidor impartía desde sus
inicios con la clase.
Gracias a que puse d mi parte y me esforcé pude
comprender las explicaciones de los temas y poder
resolver mis tareas propuestas, a tal modo que pude
lograr dominar los temas en general. A medida que iba
investigando los contenidos del programa para así
realizar un buen portafolios, fui reforzando mis
conocimientos previos que tenía sobre los distintos
temas, lo que me ayudo a ampliar mis conocimientos e ir
más preparado a recibir mi prueba de evaluación final.
Puedo decir que al terminar el desarrollo de este
programa cuento con conocimientos, que hace unos
meses atrás no contaba, fue de provecho realizar este
portafolio ya que puedo refrescar mi mente de lo que el
facilitador impartió al principio de la clase. Considero que
pude lograr mi objetivo de aprender los temas de este
programa. Pude alcanzar mi meta de esforzarme más, lo
que me costó mucho tiempo y horas de trasnocho, pero
eso que sembré será con el fin de descosechar buenos
frutos en mis notas académicas.
REFERENCIAS
(Bembibre., 2011)
(Rodrigo, 2010)
(Verial, 2018)
(Alejandro, 2006)
(VILLASANTE, 2019)

Vous aimerez peut-être aussi