Académique Documents
Professionnel Documents
Culture Documents
Materia
Datos prima
Proceso
Procesode
deproducción
producción Producto Estadístico
Producto
(Descriptivo ó inferencial)
Maquinaria
Computadoras
Investigador
Mano de obra
Estadística
Descriptiva Inferencial
POBLACION
Muestra:
Subconjunto de la población. Conjunto
de unidades elementales que son
objeto de observación.
Parámetro:
Es una característica o
índice estadístico obtenido Estadígrafo o MUESTRA
de toda una población. estadístico:
Generalmente es Es una característica
desconocido y se desea obtenida de una
estimar. muestra.
Unidad de análisis(Unidad elemental). Es aquel (individuo ú objeto) a la que se le aplica el
Mg. Anne Aniceto C. 9
instrumento de medición.
Definiciones Básicas
Población, es la colección de todos los elementos
(individuos u objetos) que poseen al menos una
característica en común.
Parámetro, es una medida resumen (constante) que
describe una característica de toda una población; para
determinar su valor es necesario utilizar toda la
información de la población (censo).
Unidad de Análisis o unidad elemental, es el elemento
(individuo u objeto) de la población que posee las
características que se van a estudiar o analizar.
Mg. Anne Aniceto C. 10
Mg. Anne Aniceto C. 11
Población
Muestra
Parámetro
Estadígrafo
VARIABLES
Presentación Recolección
de datos de datos
Procesamiento
de datos
Variable
Cualitativa Cuantitativa
Gráfico polar o de
Gráfico de barras
sectores circulares
Primarias Secundarias
• •
• • • ••
•• •
Muestra • •• •
Problema Representativa
Mide Variables
Identifica
Población
• • Describe muestra, gráficas,
• • • estadísticas
• • • •
• •• • • • • •
•• •
• • • • • Efectúa pruebas Construye intervalos
• • • • • • de hipótesis de confianza
• • • •
• • • • ••
• • ••• • Toma decisiones
Estima parámetros
sobre parámetros
Identifica parámetros, variables.
Selecciona tamaño de muestra,
significancia, confiabilidad.
Resuelve problema
Diseña experimento, plan de muestreo
Mg. Anne Aniceto C. 34
ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA
Donde:
n: Es el tamaño de la muestra.
N: Tamaño de la población.
Z: Factor de confiabilidad. Es 1,96 cuando se tiene un
nivel de confianza del 95% (valor de distribución
normal estandarizada correspondiente al nivel de
confianza escogido).
S2 : Varianza obtenida por antecedentes o prueba piloto
d: Es el margen de error permisible. Establecido por el
investigador.
Mg. Anne Aniceto C. 35
ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA
1). Para variables cuantitativas, la varianza (S2) es
conocida o se estima a través de una muestra piloto.
a) Para poblaciones infinitas o tamaños de población
desconocida: 2 2
Z S
n 2
d
b) Para poblaciones finitas o conocidas:
2 2
NZ S
n 2
d ( N 1) Z S
2 2
Donde:
n: Es el tamaño de la muestra.
N: Tamaño de la población.
Z: Factor de confiabilidad. Es 1,96 cuando se tiene un
nivel de confianza del 95% (valor de distribución
normal estandarizada correspondiente al nivel de
confianza escogido).
P = 0,5
Q = 1-P = 0,5
d: Es el margen de error permisible. Establecido por el
investigador.
Mg. Anne Aniceto C. 39
Tipos de Muestreo
Probabilístico No
(Aleatorio) Probabilístico
Accidental
Aleatorio Simple
Muestreo Probabilístico
Procedimiento
1. Elaborar el listado de personas o elementos (Población de
estudio) sin ningún ordenamiento en particular.
2. Generar tantos números aleatorios como el tamaño de la
muestra (n). Cuyos valores deben estar entre 1y N.
3. Elaborar el listado de la muestra, seleccionando los
elementos de acuerdo con la ubicación proporcionada por los
números aleatorios.
3. Muestreo Estratificado
Procedimiento:
Datos:
N = 830
n = 263 alumnos
Distribuir la muestra por años de estudio y utilizamos la técnica
de muestreo aleatorio estratificado. Donde:
n
K
N Mg. Anne Aniceto C. 50
Población y muestra de alumnos del colegio secundario
“Renovación” por años de estudio del 2005
Años de estudio Secciones Nº alumnos Tamaño de la muestra (n)
1º A NA=44 nA=14
n * N1 263* 213
N1= 213 B 42 13 n1 67.49 68
N 830
C 42 68 13
D 44 14
n1 * N A 68 * 44
nA 14
E 41 14
2º A 44 13 N1 213
N2= 181 B 46 15
C 46 57 15
D 45 14
3º A 42 13
N3= 62 B 40 13
C 42 51 13
D 38 12
4º A 48 15
N4=140 B 46 44 14
C 46 15
5º A 44 14
N5= 134 B 46 43 15
C 44 14
Total 19 N = 830
Mg. Anne
n=263
Aniceto C. 51
Mg. Anne Aniceto C. 52
Técnicas de muestreo
Muestreo No Probabilístico
1. Muestreo Accidental
Primer caso:
Segundo caso:
Objetivos:
Descripción Gráfica
Descripción Numérica
Variable fj hj
C1 f1 h1
C2 f2 h2
... ... ...
Ck fk hk
h
j 1
j h1 h2 .... hk 1
p j h j * 100% ; j 1, 2 ,...., k
k
p
j 1
j p1 p2 .... pk 100
Brazos 14
Dedos 22
Ojos 7
Piernas 11
Total 54
k
f
j 1
j n
Mg. Anne Aniceto C. 77
fj
h j ; j 1,2,....,n
n
Número de Proporción de
Parte Lesionada Accidentes accidentes
(fj ) (hj )
Brazos 14 0.259
Dedos 22 0.407
Ojos 7 0.130
Piernas 11 0.204
Total 54 1.000
k
h
j 1
j 1
Mg. Anne Aniceto C. 78
h j % h j *100%; j 1,2,....,n
Número de Porcentaje de
Parte Lesionada Accidentes accidentes
(fj) (hj%=pj)
Brazos 14 25.9%
Dedos 22 40.7%
Ojos 7 13.0%
Piernas 11 20.4%
Total n = 54 100.0%
k
p
j 1
j 1 00
20
15 14
Count
11
10
7
0
Brazo Dedos Ojos Pierna
Parte Lesionada
Ojo
7, 13.0%
Brazo
14, 25.9%
Dedo
22, 40.7%
X1 f1 h1 F1=f1 H1=h1
X2 f2 h2 F2=f1+f2 H2=h1+h2
2 1 2 4 1
3 2 3 2 0
3 2 1 3 2
3 3 1 2 4
Mg. Anne Aniceto C. 83
Valor de X Frecuencia Frecuencia Frecuencia Frecuencia
Xj absoluta Relativa Absoluta Relativa
fj hj Acumulada Acumulada
(Número de
Ausencias) (Número (Proporción Fj Hj
de Días) de días)
0
1
2
3
4
Total
Mg. Anne Aniceto C. 84
Número Número Proporción
de de Días de días
j Ausencias Fj Hj
Xj fj hj
1 0 1 0.05 1 0.05
2 1 4 0.2 5 0.25
3 2 7 0.35 12 0.6
4 3 6 0.3 18 0.9
5 4 2 0.1 20 1.0
---- Total 20 1.0 ---- ----
Aire acondicionado 1
Guardería 2
Ofertas permanentes 3
Playa de estacionamiento 4
Tarjeta de crédito 5
35 1.0000
8
8
7
Frequency
6
5
4
3
2
2
0
30.0 48.4 66.8 85.2 103.6 122.0 140.4
Gasto
0.08
0.06
densidad
0.04
0.02
40 45 50 55 60 65
x
xf i i i
n
• Mediana Cuantil de orden α α=0,5 para el caso de
la mediana. Se determina el intervalo mediano con
αn
n Fi 1
C Li 1 (ci )
fi
Mg. Anne Aniceto C. 106
Medidas de dispersión
Miden el grado de dispersión (variabilidad) de los
datos, independientemente de su causa.
• Amplitud o Rango:
Diferencia entre observaciónes extremas.
– 2,1,4,3,8,4. El rango es 8-1=7
– Es muy sensible a los valores extremos.
• 𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛
• Rango intercuartílico :
– Es la distancia entre primer y tercer cuartil.
• Rango intercuartílico = P75 - P25
– No es tan sensible a valores extremos.
Mg. Anne Aniceto C. 107
• Varianza S2 : Mide el promedio de las desviaciones (al
cuadrado) de las observaciones con respecto a la media.
1
S ( xi x )2
2
n i
– Es sensible a valores extremos (alejados de la media).
– Sus unidades son el cuadrado de las de la variable
Desviación típica
Es la raíz cuadrada positiva de la varianza. Tiene las
misma unidades que la variable de estudio.
0.05
0.04
0.04
0.03
0.03
0.02
0.02
0.01
0.01
x s x 2s
68.5 % 95 %
0.00
0.00
150 160 170 180 190 150 160 170 180 190
S
CV
x
Es la razón entre la desviación típica y la media.
(𝑄3 −𝑄−)
C.Ap.= K=
𝐶. 𝐴𝑝 = 𝐾 =
(𝑄 3 1 𝑄1)
2(𝑃90 −𝑃10 )
2(𝑃90 − 𝑃10 )
x s
68 %
0.0
-3 -2 -1 0 1 2 3
Mg. Anne Aniceto C. 113
ESTADÍSTICA BIDIMENSIONAL
Analiza el comportamiento conjunto de dos variables
en una unidad de estudio, es decir busca la asociación
o relación que existe entre ambas, se representa
como un conjunto de pares de datos (X,Y), donde:
X : es la variable independiente (llamado factor)
Y : es la variable dependiente (llamado resultado)
Ejemplos:
• Peso y talla de un grupo de personas
• Gasto en publicidad y volumen de ventas
• Nivel de estudios y región de procedencia
• Ingresos y nivel socioeconómico
• Coeficiente intelectual y rendimiento académico
……..ESTADÍSTICA BIDIMENSIONAL…………..
x
Y1 y2 ... yj ... yl fi. ni.
i1
f. j
b) Con relación al total de fila : h. j
n
f ij
c) Con relación al total de columna : hij
n
20
16.0
Frecuencia (%)
15
10.7 10.7
9.3 9.3
10 8.0 8.0
6.7
0
Costa Sierra Selva
f eij
k l
2
El estadístico se define como: ij
2 i 1 j 1
Donde: eij
fij : son las frecuencias observadas de la muestra
eij : son las frecuencias esperadas , se obtiene f f . j
eij i.
k: número de categorías de la variable en fila n
l: número de categorías de la variable en columna
Nivel de estudios
Región de Total
Primaria Secundaria Superior
procedencia
n e.1 n e.2 n e.3 n
40 80 60 180
Costa
35 35 30 100
Sierra
Selva 30 40 25 95
x f i i.
a) Media o promedio de la variable X : x i 1
n
l
l
d) Varianza de la variable Y : f.j yi y2
j1
S2y
n
ij i
Covx, y i 1 j 1
f x xy y
k l
ij i j
Covx, y i 1 j 1
n
d) Coeficiente de correlación de Pearson (R): mide el grado de
asociación lineal entre las variables X e Y
cov(X , Y )
R Donde: 1 R 1
S xS y
Estatura en Peso en kg
cm [50, 60> [60, 70> [70, 80>
[160, 165> 12 18 3
[165, 170> 15 25 8
[170, 175> 4 10 5
[175, 180> 1 3 10
a) Hallar las distribuciones marginales
b) Interprete f22 , f33 , f41, f1. , f.2
c) Encuentre e interprete el peso y la talla promedio
d) Encuentre la covarianza entre peso y estatura
e) Hallar el coeficiente de correlación de Pearson
Mg. Anne Aniceto C. 127
REGRESION Y CORRELACION LINEAL SIMPLE
13 40 20
15 44 0
19 69 0 5 10 15 20
18 55
Tipos de diagrama de dispersión
Covarianza de dos variables X e Y
• La covarianza entre dos variables, Sxy, nos indica si la
posible relación entre dos variables es directa o
inversa:
1
S xy ( xi x )( yi y )
– Directa: Sxy > 0 n i
– Inversa: Sxy < 0
– Incorrelacionadas: Sxy = 0
iRelación Relación
nversa directa casi
perfecta Variables
perfecta
negativa incorrelacionada
s
-1 +1
Mg. 0
Anne Aniceto C. 134
correlaciones positivas
330 130
120
280
110
230 100
90
180 80
70
130 60
50
80 r=0,1 r=0,4
40
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
110 100
100 90
90 80
80
70
70
60
60
50 50
40 r=0,6 40 r=0,8
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
100
90
80
70
60
50
40 r=1
30
140 150 160 170 180 190 200
80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
ˆ a bx
y
138
Mg. Anne Aniceto C.
Interpretación de los
coeficientes de regresión lineal
• La pendiente b1(b): indica el cambio promedio en la
variable respuesta (y), cuando la variable predictora
(x) aumenta en una unidad adicional.
• El intercepto b0 (a)indica el valor promedio de la
variable respuesta (y), cuando la variable predictora
(x) es igual a cero. Sin embargo carece de
interpretación práctica si dicho valor está fuera del
rango del conjunto de valores X.
• Y= b0 + b1 X o también Y= a + bX
y na b x
xy a x b x 2
yˆ y b1 ( x x )
Mg. Anne Aniceto C. 140
Otras fórmulas adicionales
S xy
S r
b 2XY
a y bx Sx S y
SX
Sx
2 x 2
x 2
Sy
2 y 2
y2
n n
Análisis de Regresión y
Correlación lineal
Salidas en SPSS
Registro de Pesca de sardinas (toneladas m.) y el precio de venta (soles por
kg).
2
S
R 1
2 e
2
S Y
8,00
7,00
precio de las sardinas
6,00
5,00
4,00
3,00
2,00
Silla I A A A B B B C C C D D D
Silla II B C D A C D A B D A B C
12 maneras diferentes
m! 4! 4! 4x3x2!
Vm (m n)! V4 (4 2)! 2! 2! 4x3 12
n 2
Solución.
5!
m=5
V5 (5 5)! 5 x 4 x 3 x 2 x 1 120
5
n=5
PERMUTACIONES:
Solución
:Como n = 3 , el número de permutaciones sin repetición
será:
xyz yxz zxy
P(3,3) 3! 3 x 2 x 1 6
xzy yzx zyx
Mg. Anne Aniceto C. 158
ANALISIS
COMBINATORIO
Permutaciones sin repetición:
b) De “ n ” elementos diferentes tomados de “ r ” en “ r ” con r < n
De “ n ” elementos diferentes , el número de permutaciones
diferentes sin repetición tomados de “ r ” en “ r ” está dado
por:
Ejemplo
Si A = { a , b, c, d} . Cuantas ordenaciones diferentes
pueden formarse tomando grupos de a 2 ?
Solución
:n = 4 ; r = 2 como:
n!
4! P(n, r)
P(4,2) 4 x 3 12 (n - r)!
2!
Mg. Anne Aniceto C. 159
ANALISIS
COMBINATORIO
COMBINACIONES :
Las combinaciones son las diferentes grupos de “n”elementos
que se pueden formar tomándolos de “ r ” en “ r ” , donde
0 < r n ; de modo que cada grupo difiere del otro en por lo
menos un elemento.
n!
C(n, r)
r!(n r)!
Mg. Anne Aniceto C. 160
ANALISIS
COMBINATORIO
COMBINACIONES :
Ejemplo :
De un grupo de 10 libros ¿Cuántas selecciones de 4 libros se
pueden hacer?
Solución:
n = 10 ; r = 4 C(n, r)
n!
r!(n r)!
10! 10!
C(10,4)
4!(10 4)! 4!6!
10! 10 x 9 x 8 x 7 x 6! 10 x 9 x 8 x 7
210
4!6! 4! . 6! 4 x 3 x 2 x1
Mg. Anne Aniceto C. 161
PROBABILIDADES
EXPERIMENTO ALEATORIO:
Un experimento aleatorio o estadístico es cualquier
experimento u operación cuyo resultado no puede predecirse
con exactitud antes de realizarse el experimento.
Ejemplos:
• Lanzar un dado y observar el número que aparece en
la cara superior.
• De un lote de bombillas de luz , extraer uno que sea
defectuoso.
ESPACIO MUESTRAL:
Es el conjunto formado por todo los resultados posibles del
experimento aleatorio. Denotaremos por la notación
(omega) o con la letra S
SUCESO O EVENTOS
Se llama suceso o evento , cualquier subconjunto del
espacio muestral . A los sucesos generalmente se les
denota por letras mayúsculas , tales como A , B , C, etc.
Entonces : A es un suceso A
Relacionando con la teoría conjuntista al
espacio muestral se le llama el universo y el
; luego:
(universo) se llama suceso seguro.
(nulo) se llama suceso imposible.
PROBABILIDAD DE UN SUCESO
Sea el suceso o evento A del espacio muestral ;
la probabilidad de A denotada por P(A) es la razón
entre el número de resultados favorables al suceso
A y el número total de resultados del espacio
muestral.
n(A) nº de casos favorables
P(A) P(A)
n nº de casos posibles
Solución:
Sean los sucesos :
A : No asistan a clase no menos de 8 estudiantes
A = { 8 , 9 , 10 , .....................}
B: No asisten a clase no más de 5 estudiantes.
B={0,1,2,3,4,5}
C : No asisten a clase a 6 ó 7 estudiantes .
C={6,7}
A B
Ejemplo 1:
Ejemplo 1:
Solución:
Espacio muestral: n( ) = 200
Suceso A : Seleccionar un alumno matriculado en M. B.
120 3
n(A) 120 P(A)
200 5
Suceso B : Seleccionar un alumno matriculado en Est.
90 9
n(B) 90 P(B)
200 20
Suceso (A B) : Seleccionar un alumno matriculado en M.B. y
Estadística.
50 1
n(A B) 50 P(A B)
200 4
Como se sabe que : P(A B) P(A) P(B) - P(A B)
3 9 1 4
P(A B) - P(A B)
5 20Mg. Anne
4 Aniceto C. 5 174
PROBABILIDADES
Ejemplo 2:
En un salón de clase de 40 alumnos, 30 de ellos
postulan a la UNAC y 26 a la UNMSM . Se elige al azar
un alumno de este salón. ¿Cuál es la probabilidad de que
sea un alumno que postula a ambas Universidades?
Solución:
Sabemos que :
Solución:
Evento B: A lo sumo tres contadores:
n(B) C(7,2) x C(4,4) C(7,3) x C(4,3)
7! 4! 7! 4!
n(B) 21 140 161
2! . 5! 4!.0! 3! . 4! 3!.1!
161
P(B) 0.348
462
Mg. Anne Aniceto C. 177
Probabilidad Condicional
Ejemplo 1: Se dispone de 11 Hojas de Registro Laboral,
pertenecientes a trabajadores masculinos y femeninos agrupados
por el turno en que labora
Sexo M F
Turno (Masculino) (Femenino) Total
D (Día) 5 3 8
N (Noche) 1 2 3
Total 6 5 11
Comprobando:
3
P(F ) = 11 3
D 8 P(F )=
D 8
11
P(A B)
P(B )
A P(A)
Se despeja
P(A B) P(A) P B ( A)
Mg. Anne Aniceto C. 182
Aplicación:
P(V1 V2 ) 0,25
0.12 0.12
0.20
0.12 0.48 0.60
P(D/2)= 0,15
P(2) = 0,30 2=0,15 P( 2 D) = 0,30 0,15 = 0,045
P(D/3)= 0,25
3=0,25 P( 3 D) = 0,50 0,25 = 0,1250
0,19
Mg. Anne Aniceto C. 195
Respuesta B:
P( 3 D) 0.1250
P( 3 / D) 0.6579
P( D) 0.1900