Vous êtes sur la page 1sur 78

INTRODUCCION AL ANLISIS DE DATOS

TEMA 1. CONCEPTOS BSICOS


POBLACIN, COLECTIVO O UNIVERSO: CONJUNTO DE PERSONAS O COSAS AL QUE SE
REFIERE EL OBJETO DE LA INVESTIGACIN.
MUESTRA: SUBCONJUNTO REPRESENTATIVO DE UNA POBLACIN.
PARMETRO: VALOR NUMRICO QUE DESCRIBE UNA CARACTERSTICA DE LA POBLACIN.
ESTADSTICO: VALOR NUMRICO QUE DESCRIBE UNA CARACTERSTICA DE LA MUESTRA.
VARIABLE CUALITATIVA: SON LAS VARIABLES QUE EXPRESAN DISTINTAS CUALIDADES,
CARACTERSTICAS O MODALIDAD. CADA MODALIDAD QUE SE PRESENTA SE DENOMINA
ATRIBUTO O CATEGORA, Y LA MEDICIN CONSISTE EN UNA CLASIFICACIN DE DICHOS
ATRIBUTOS. LAS VARIABLES CUALITATIVAS PUEDEN SER DICOTMICAS CUANDO SLO
PUEDEN TOMAR DOS VALORES POSIBLES, COMO S Y NO, HOMBRE Y MUJER O SER
POLITMICAS CUANDO PUEDEN ADQUIRIR TRES O MS VALORES. DENTRO DE ELLAS
PODEMOS DISTINGUIR:
1. VARIABLE CUALITATIVA ORDINAL O VARIABLE CUASICUANTITATIVA: LA VARIABLE PUEDE
TOMAR DISTINTOS VALORES ORDENADOS SIGUIENDO UNA ESCALA ESTABLECIDA,
AUNQUE NO ES NECESARIO QUE EL INTERVALO ENTRE MEDICIONES SEA UNIFORME, POR
EJEMPLO: LEVE, MODERADO, FUERTE.
2. VARIABLE CUALITATIVA NOMINAL: EN ESTA VARIABLE LOS VALORES NO PUEDEN SER
SOMETIDOS A UN CRITERIO DE ORDEN, COMO POR EJEMPLO LOS COLORES.
VARIABLES CUANTITATIVAS: SON LAS VARIABLES QUE TOMAN COMO ARGUMENTO,
CANTIDADES NUMRICAS, SON VARIABLES MATEMTICAS. LAS VARIABLES CUANTITATIVAS
ADEMS PUEDEN SER:
DISCRETAS: NO INCLUYE DECIMALES (NUMERO DE HIJOS, AVIONES QUE
ATERRIZAN EN UN AEROPUERTO)
INTRODUCCION AL ANLISIS DE DATOS
TEMA 1. CONCEPTOS BSICOS
CONTINUAS: ADMITE DECIMALES (ALTURA, PESO, TEMPERATURA, NOTAS
ACADMICAS ETC)
ESCALAS DE MEDIDA: ASIGNAN NUMEROS A OBJETOS O CARARCTERSTICAS,
SEGN CIERTAS REGLAS.
ESCALA NOMINAL: SLO PERMITE ASIGNAR UN NOMBRE AL ELEMENTO MEDIDO. ESTO
LA CONVIERTE EN LA MENOS INFORMATIVA DE LAS ESCALAS DE MEDICIN.
LOS SIGUIENTES SON EJEMPLOS DE VARIABLES CON ESTE TIPO DE ESCALA:
NACIONALIDAD.
NMERO DE CAMISETA EN UN EQUIPO DE FTBOL.
NMERO DE DNI.
A PESAR DE QUE ALGUNOS VALORES SON FORMALMENTE NUMRICOS, SLO ESTN
SIENDO USADOS PARA IDENTIFICAR A LOS INDIVIDUOS MEDIDOS.
ESCALA ORDINAL: ADEMS DE LAS PROPIEDADES DE LA ESCALA NOMINAL, PERMITE
ESTABLECER UN ORDEN ENTRE LOS ELEMENTOS MEDIDOS.
EJEMPLOS DE VARIABLES CON ESCALA ORDINAL:
PREFERENCIA A PRODUCTOS DE CONSUMO.
ETAPA DE DESARROLLO DE UN SER VIVO.
CLASIFICACIN DE PELCULAS POR UNA COMISIN ESPECIALIZADA.
INTRODUCCION AL ANLISIS DE DATOS
TEMA 1. CONCEPTOS BSICOS
MADUREZ DE UNA FRUTA AL MOMENTO DE COMPRARLA.
ESCALA DE INTERVALO: ADEMS DE TODAS LAS PROPIEDADES DE LA ESCALA ORDINAL,
HACE QUE TENGA SENTIDO CALCULAR DIFERENCIAS ENTRE LAS MEDICIONES.
LOS SIGUIENTES SON EJEMPLOS DE VARIABLES CON ESTA ESCALA:
TEMPERATURA DE UNA PERSONA.
UBICACIN EN UNA CARRETERA RESPECTO DE UN PUNTO DE REFERENCIA
(KILMETRO 85 RUTA 5).
SOBREPESO RESPECTO DE UN PATRN DE COMPARACIN.
NIVEL DE ACEITE EN EL MOTOR DE UN AUTOMVIL MEDIDO CON UNA VARA
GRADUADA.
ESCALA DE RAZN: CUANDO UNA ESCALA TIENE TODAS LAS CARACTERSTICAS DE UNA
ESCALA DE INTERVALO Y ADEMS UN PUNTO CERO REAL EN SU ORIGEN
EJEMPLO: SUPONGA QUE EL PESO DE CUATRO PIEZAS FUNDIDAS DE METAL SON 2.0, 2.1, 2.3
Y 2.5 KG. EL ORDEN (ORDINAL) Y LA DIFERENCIA (INTERVALO) EN LOS PESOS PUEDE SER
COMPARADO. AS, EL INCREMENTO DE PESO DE 2.0 A 2.1 ES DE 0.1 KG, EL CUAL ES EL MISMO
QUE EL QUE EXISTE ENTRE 2.3 Y 2.4 KG. TAMBIEN, CUANDO COMPARAMOS LOS PESOS DE 2.0 A
2.4 KG, SE ENCUENTRA UNA RAZN SIGNIFICATIVA: EL PESO DE UNA PIEZA DE METAL DE 2.4
KG ES UN 20% MS PESADA QUE UNA QUE PESE 2.0 KG. EXISTE UN CERO NATURAL O REAL
PARA LA ESCALA, AS 0KG IMPLICA NO PESO.
INTRODUCCION AL ANLISIS DE DATOS
TEMA 1. CONCEPTOS BSICOS
DISTRIBUCION DE FRECUENCIAS
PRCTICA COMN DE ORGANIZACIN DE LOS DATOS REGISTRADOS QUE PERMITE AGRUPAR
DE MANERA ORDENADA, ASCENDENTE O DESCENDENTE, UNA GRAN MASA DE DATOS.
1. FRECUENCIA ABSOLUTA (nI) N DE OBSERVACIONES EN CADA CATEGORA
2. FRECUENCIA RELATIVA O PROPORCIN (pI) SE OBTIENE DIVIDIENDO LA FRECUENCIA
ABSOLUTA ENTRE EL N TOTAL DE OBSERVACIONES (N).
SE PUEDE EXPRESAR EN PORCENTAJE (pI): SE MULTIPLICA CADA UNA DE LAS
PROPORCIONES POR 100.
3. FRECUENCIA ABSOLUTA ACUMULADA (nA) ACUMULAR (SUMAR), DESDE LA CATEGORA DE
MENOR VALOR DE LA VARIABLE A LA DE MAYOR VALOR LAS FRECUENCIAS ABSOLUTAS.
4. FRECUENCIA RELATIVA ACUMULADA O PROPORCIN ACUMULADA (PA) ID.. LAS
PROPORCIONES. ES EL COCIENTE ENTRE LA FRECUENCIA ABSOLUTA ACUMULADA Y EL TOTAL
DE OBSERVACIONES.
SE PUEDE EXPRESAR EN PORCENTAJE ACUMULADO (PA): ID.. LOS PORCENTAJES. ES EL
VALOR DE LA PROPORCIN ACUMULADA POR 100.
INTRODUCCION AL ANLISIS DE DATOS
TEMA 1. CONCEPTOS BSICOS
Frecuencia Frecuencia
DATOS VARIABLE Frecuencia absoluta Frecuencia relativa Relativa
ESTUDIO absoluta acumulada acumulada
1 3 3 3/14 0,21428571 0,21428571
2 4 7 4/14 0,28571429 0,5
3 1 8 1/14 0,07142857 0,57142857
4 2 10 2/14 0,14285714 0,71428571
5 1 11 1/14 0,07142857 0,78571429
6 3 14 3/14 0,21428571 1
14 1
- LA DISTRIBUCIN DE FRECUENCIAS DE LOS VALORES DE UNA VARIABLE CONTINUA DEBE
REALIZARSE TENIENDO EN CUENTA LOS LMITES EXACTOS DE MEDIDA, NO LOS VALORES
INFORMADOS.
LMITES EXACTOS = VALOR INFORMADO 0,5
INTRODUCCION AL ANLISIS DE DATOS
TEMA 1. CONCEPTOS BSICOS
- NO NECESARIAMENTE LOS INTERVALOS DEBEN TENER LA MISMA AMPLITUD (LIMITE
SUPERIOR-LIMITE INFERIOR +1) NI LOS INTERVALOS EXTREMOS DE LA DISTRIBUCIN
DEBEN ESTAR CERRADOS
LA ESTATURA EN CM DE 100 NIOS SE RECOGE EN LA SIGUIENTE TABLA:
ESTATURA NUMERO DE NIOS
79-81 10
76-78 25
73-75 45
72-70 20
FREC.
FRECUENCIAS RELATIVAS
FRECUENCIAS ABSOLUTAS FREC. RELATIVAS
ESTATURA ABSOLUTAS ACUMULADAS ACUMULADAS
69,5-72,5 20 20 20/100 0,2 0,2
72,5-75,5 45 65 45/100 0,45 0,65
75,5-78,5 25 90 25/100 0,25 0,9
78,5-81,5 10 100 10/100 0,1 1
100 1
INTRODUCCION AL ANLISIS DE DATOS
TEMA 1. CONCEPTOS BSICOS
REPRESENTACIONES GRAFICAS
PARA VARIABLES CATEGRICAS O ATRIBUTOS, COMO EL SEXO, PROFESIN, ETC., SE QUIERE
CONOCER LA FRECUENCIA Y EL PORCENTAJE DEL TOTAL DE CASOS QUE "CAEN" EN CADA
CATEGORA.
UNA FORMA MUY SENCILLA DE REPRESENTAR GRFICAMENTE ESTOS RESULTADOS ES
MEDIANTE DIAGRAMAS DE BARRAS O DIAGRAMAS DE SECTORES.
EN LOS GRFICOS DE SECTORES, TAMBIN CONOCIDOS COMO DIAGRAMAS DE "TARTAS", SE
DIVIDE UN CRCULO EN TANTAS PORCIONES COMO CLASES TENGA LA VARIABLE, DE MODO
QUE A CADA CLASE LE CORRESPONDE UN ARCO DE CRCULO PROPORCIONAL A SU
FRECUENCIA ABSOLUTA O RELATIVA.
100; 22%
150; 33%
ALEMAN
BRITANICO
NORDICOS
200; 45%
INTRODUCCION AL ANLISIS DE DATOS
TEMA 1. CONCEPTOS BSICOS
LOS DIAGRAMAS DE BARRAS SON SIMILARES A LOS GRFICOS DE SECTORES.
SE REPRESENTAN TANTAS BARRAS COMO CATEGORAS TIENE LA VARIABLE, DE MODO QUE LA
ALTURA DE CADA UNA DE ELLAS SEA PROPORCIONAL A LA FRECUENCIA O PORCENTAJE DE
CASOS EN CADA CLASE.
2
1
NUMERO
DE HIJOS
0 2 4 6 8
ESTOS MISMOS GRFICOS PUEDEN UTILIZARSE TAMBIN PARA DESCRIBIR VARIABLES
NUMRICAS DISCRETAS QUE TOMAN POCOS VALORES (NMERO DE HIJOS, ETC.).
INTRODUCCION AL ANLISIS DE DATOS
TEMA 1. CONCEPTOS BSICOS
PARA VARIABLES NUMRICAS CONTINUAS, TALES COMO LA EDAD, LA TENSIN ARTERIAL O EL
NDICE DE MASA CORPORAL, EL TIPO DE GRFICO MS UTILIZADO ES EL HISTOGRAMA
12
F
R 10
A
E B
C S 8
U O
L 6
E
N U
4
C T
I A
2
A S
S
0
20-25 25-30 30-40 40-50
PESOS
INTRODUCCION AL ANLISIS DE DATOS
TEMA 1. CONCEPTOS BSICOS
EJEMPLOS:
COMPLETA LA TABLA DE FRECUENCIAS CON LOS DATOS QUE PROPORCIONA LA SIGUIENTE GRFICA
7
6
5
4
FAMILIAS

3
2
1
0
1 2 3 4
NUMERO DE HIJOS
FAMILIAS FRECUENCIAS FRECUENCIAS
NUMERO DE (FRECUENCIAS ABSOLUTAS FRECUENCIAS RELATIVAS
HIJOS ABSOLUTAS) ACUMULADAS RELATIVAS ACUMULADAS
1 5 5 0,4 0,4
2 6 11 0,4 0,8
3 2 13 0,1 0,9
4 1 14 0,1 1
14 1,0
INTRODUCCION AL ANLISIS DE DATOS
TEMA 1. CONCEPTOS BSICOS
PROPIEDADES DE LA DISTRIBUCIN DE FRECUENCIAS
TENDENCIA CENTRAL: LUGAR DONDE SE CENTRA LA DISTRIBUCIN
ASIMETRIA: GRADO EN EL QUE LOS DATOS SE REPARTEN EN FUNCIN DE LA TENDENCIA
CENTRAL
VARIABILIDAD: CMO SE CONCENTRAN EL RESTO DE LAS OBSERVACIONES DE LA
DISTRIBUCIN EN TORNO AL PROMEDIO O TENDENCIA CENTRAL.
INTRODUCCION AL ANLISIS DE DATOS
TEMA 1. CONCEPTOS BSICOS
INTRODUCCION AL ANLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIN
LA MEDIDAS DE CENTRALIZACIN NOS INDICAN EN TORNO A QU VALOR (CENTRO) SE
DISTRIBUYEN LOS DATOS.
1. MEDIA ARTIMTICA
BUSCA SER EL CENTRO DE GRAVEDAD DE LA DISTRIBUCIN.
ES LA SUMA DE LOS VALORES DE LA DISTRIBUCIN, DIVIDIDO POR LA FRECUENCIA TOTAL.
n
n
Xi X i ni
i 1 i 1
X X
N N
EJEMPLO:
SE HA PREGUNTADO A 50 FAMILIAS EL NMERO DE HIJOS QUE TENIA. LOS DATOS SE
RECOGEN EN LA SIGUIENTE TABLA. CUL ES EL NMERO MEDIO DE HIJOS?
N HIJOS (X) ni
0 20
1 15
2 10
3 3
4 2
INTRODUCCION AL ANLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIN
X ni Xni
0 20 0
1 15 15
n
2 10 20 Xin
i 1 52
3 3 9 X 1,04
4 2 8 N 50
50 52
CON LOS SIGUIENTES DATOS AGRUPADOS, CALCULAR LA MEDIA ARITMTICA
X ni
1-5 2 AL TRABAJAR CON DATOS AGRUPADOS, ES NECESARIO CALCULAR LA MARCAS DE
6-8 3 CLASE
9-11 2
12-18 3
10 LimiteSUPERIOR Limiteinf erior
X
2
X ni X Xni n
1-5 2 6/2=3 6 Xin
6-8 3 14/2=7 21 i 1 92
X 9,2
9-11 2
12-18 3
20/2=10 20
30/2=15 45
N 10
10 92
INTRODUCCION AL ANLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIN
PROPIEDADES
LA SUMA DE LAS DESVIACIONES DE LOS VALORES CON RESPECTO A LA MEDIA ES
SIEMPRE CERO.
AL APLICAR UNA TRANSFORMACION LINEAL DEL TIPO Y=Bx+a (ESO SIGNIFICA UN CAMBIO
DE ORIGEN Y ESCALA) LA MEDIA DE LA NUEVA VARIABLE SE VER AFECTADA POR ESE
CAMBIO DE LA SIGUIENTE FORMA Y bX a
NO SE PUEDE CALCULAR CUANDO LA DISTRIBUCIN EST AGRUPADA EN INTERVALOS Y
TANTO EL INTERVALO MNIMO O MXIMO NO TIENEN LOS LMITES DEFINIDOS (YA QUE NO
PODEMOS CALCULAR LAS MARCAR DE CLASE.
CON EL EJEMPLO ANTERIOR:
n
( X i X )ni (3 9,2)2 (7 9,2)3 (10 9,2)2 (15 9,2)3 ( 6,2)2 ( 2,2)3 0,82 5,83
i 1
0
INTRODUCCION AL ANLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIN
SABIENDO QUE LA MEDIA DE UNA DISTRIBUCIN ES 5,2, SI APLICAMOS UN CAMBIO DE
ORIGEN DE a=5 UNIDADES Y UN CAMBIO DE ESCALA DE b=2, CUL SER LA MEDIA DE LA
NUEVA VARIABLE?
Y bX a
Y 2(5,2) 5 15,4
2. MEDIANA
LA MEDIANA ES EL VALOR QUE DIVIDE EXACTAMENTE EN DOS A LA DISTRIBUCIN, ES DECIR
DEJA EL 50% DE LOS DATOS A UN LADO Y EL 50% RESTANTE AL OTRO.
SI LOS DATOS NO ESTN ORDENADOS, ES NECESARIO ORDENARLOS DE MENOR A MAYOR.
CALCULAR LA MEDIANA CON LAS SIGUIENTES DISTRIBUCIONES
20 10 3 5 18
SE ORDENAN LOS DATOS 3 5 10 18 20
EN ESTE CASO COMO TENEMOS UN NMERO IMPAR DE DATOS, LA MEDIANA SER EL VALOR
CENTRAL 3 5 10 18 20 Md = 10
INTRODUCCION AL ANLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIN
20 10 3 5
ORDENAMOS LOS DATOS 3 5 10 20
EN ESTE CASO COMO TENEMOS UN NMERO PAR DE DATOS, TOMAMOS LOS DOS DATOS
CENTRALES 3 5 10 20 Y CALCULAMOS UNA MEDIA ENTRE ESOS DOS DATOS.
Md 5 10 7,5
2
INTRODUCCION AL ANLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIN
X LIMITES ni na
EXACTOS INVERTIMOS EL ORDEN DE LA TABLA
1-5 0,5-5,5 2 2
6-8 5,5-8,5 3 5
HACEMOS
N 5 Y AHORA BUSCAMOS ESE VALOR EN LA COLUMNA
9-11 8,5-11,5 2 7
12-18 11,5-18,5 3 10
2
10 DE FRECUENCIA ABSOLUTAS ACUMULADAS (EL VALOR QUE IGUALA
O SUPERE)
X ni na EL INTERVALO CRTICO, ES DECIR DONDE SE ENCUENTRA LA MEDIANA ES EL
11,5-18,5 3 10 5,5- 8,5
8,5-11,5 2 7 N n
5,5-8,5 3 5 2 d
0,5-5,5 2 2 AHORA APLICAMOS LA FRMULA M d LINF I
n
C
10
M d 5,5 5 2 (8 6 1) 8,5
3
INTRODUCCION AL ANLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIN
X ni na N 12 6
11,5-18,5 3 12 2 2
8,5-11,5 4 7 BUSCAMOS EL 6 EN LA COLUMNA DE FRECUENCIAS ABSOLUTAS ACUMULADAS
5,5-8,5 3 4 (COMO NO ENCONTRAMOS EL 6, BUSCAMOS EL PRIMER VALOR QUE LO SUPERE,
0,5-5,5 2 2
EN ESTE CASO EL 7)
12
EL INTERVALO CRTICO SER EL 8,5 - 11,5
12 4
M d 8,5 2 (11 9 1) 8,5 23 10
4 4
3. MODA
ES AQUEL VALOR QUE MS VECES SE REPITE, EL QUE MAYOR FRECUENCIA ABSOLUTA TIENE.
SE PUEDE CALCULAR CON CUALQUIER TIPO DE VARIABLE.
X nI
ROJO 5
BLANCO 7
AMARILLO 10
MO AMARILLO
INTRODUCCION AL ANLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIN
X nI
1 2 MO 2
2 5
3 4
CALCULAR LA MODA CON DATOS AGRUPADOS
X LIMITES ni
EXACTOS
1-5 0,5-5,5 2 BUSCAMOS EL INTERVALO QUE MS SE REPITE. EN ESTE CASO
6-8 5,5-8,5 3 TENEMOS DOS, POR LO TANTO ESTAMOS ANTE UNA DISTRIBUCION
9-11 8,5-11,5 2
BIMODAL.
12-18 11,5-18,5 3
TENEMOS QUE CALCULAR DOS MODAS
10
E
EL PRIMER INTERVALO CRTICO ES 5,5 -8,5, EL VALOR DE LA MODA ES EL PUNTO MEDIO
M O 5,5 8,5 14 7
2 2
EL SEGUNDO INTERVALO ES EL 11,5 18,5
M O 11,5 18,5 30 15
2 2
INTRODUCCION AL ANLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIN
MEDIDAS DE POSICIN (NO CENTRAL)
NOS INDICAN LA POSICIN DE UN SUJETO RESPECTO A SU GRUPO DE REFERENCIA
SE LLAMAN CUANTILES. DENTRO DE LOS CUANTILES ENCONTRAMOS CUARTILES, DECILES Y
PERCENTILES.
CUARTILES
SON TRES VALORES QUE DIVIDEN EN CUATRO UNA DISTRIBUCIN
nk
4
DECILES
SON NUEVE VALORES QUE DIVIDEN EN DIEZ UNA DISTRIBUCIN
nk
10
PERCENTILES
SON NOVENTA Y NUEVE VALORES QUE DIVIDEN EN CIEN UNA DISTRIBUCIN
nk
100
INTRODUCCION AL ANLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIN
CALCULAR EL PRIMER CUARTIL, SEPTIMO DECIL Y PERCENTIL 72
X LIMITES nI na
EXACTOS 15 1
3,75
18-20 17,5-20,5 2 15 PRIMER CUARTIL 4
15-17 14,5-17,5 4 13 EL INTERVALO CRITICO ES (5,5 -9,5)
10-14 9,5- 14,5 3 9
6-9 5,5-9,5 4 6 nk n
2-5 1,5-5,5 2 2 Q1 LINF 4 d
I 5,5 3,75 2(9 6 1) 7,25
15 nc 4
SEPTIMO DECIL
15 7 10,5 EL INTERVALO CRTICO ES (14,5 -17,5)
10
nk n
D7 LINF 10 d I 14,5 10,5 9(17 15 1) 15,625
nC 4
1572 10,8
PERCENTIL 72 EL INTERVALO CRTICO ES (14,5- 17,5)
100
nk n
P72 LINF 100 d I 14,5 10,8 9(17 15 1) 15,85
nC 4
INTRODUCCION AL ANLISIS DE DATOS
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIN
TAMBIN PODEMOS CALCULAR EL VALOR DEL PERCENTIL, CONOCIENDO EL VALOR DE LA
PUNTUACIN.
SI SABEMOS QUE LA PUNTUACIN ES 12, QU PERCENTIL LE CORRESPONDE
X LIMITES nI na EL VALOR X=12, SE ENCUENTRA EN EL INTERVALO (9,5 14,5)
EXACTOS
18-20 17,5-20,5 2 15
15-17 14,5-17,5 4 13 ( Pk LINF )nC 12 9,5 3
9,5- 14,5 3 9 nd 6
10-14
I (14 10 1)
6-9 5,5-9,5 4 6 k 100 100
2-5 1,5-5,5 2 2 n 15
15
7,5
6 1,5 6
5 100 100 0,5100 50
15 15
EL VALOR X=12 SE CORRESPONDE CON EL P50
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
LA VARIABILIDAD MIDE EL GRADO EN EL QUE LAS PUNTUACIONES SE ALEJAN O
APROXIMAN A LA TENDENCIA CENTRAL.
CUANTO MS SE ACERQUEN MENOR VARIABILIDAD DE LAS PUNTUACIONES (HABR MS
HOMOGENEIDAD ENTRE LOS DATOS)
CUANTO MS SE ALEJEN, MAYOR SER LA VARIABILIDAD (LOS DATOS SON MENOS
HOMOGNEOS, DIFIEREN MS ENTRE S)
AMPLITUD O RANGO
ES LA DIFERENCIA ENTRA LA PUNTUACION MAYOR Y MENOR DE LA DISTRIBUCIN
AT X MAX X MIN
X ni
(PUNTUACION DE UN EXAMEN) (FRECUENCIA ABSOLUTA)
5 10
6 5
7 15
8 12
9 8
40
1
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
COMO LAS NOTAS DE UN EXAMENES SON VARIABLES CONTNUAS, CALCULAMOS LOS
LMITES EXACTOS.
X ni
(PUNTUACION DE UN EXAMEN) (FRECUENCIA ABSOLUTA)
4,5 - 5,5 10
5,5 - 6,5 5
6,5 - 7,5 15
7,5 - 8,5 12
8,5 - 9,5 8
40
LA AMPLITUD TOTAL O RANGO AT 9,5 4,5 5
VARIANZA Y DESVIACIN TPICA
n n
X i2 2 X i2ni 2
S X2 i 1 X S X2 i 1 X
n n
2
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
EJEMPLO
APLICAMOS UN APRUEBA A UN GRUPO DE 100 ALUMNOS, OBTENIENDO LOS SIGUIENTES
RESULTADOS. CALCULAR LA VARIANZA Y LA DESVIACIN TPICA
INTERVALOS ni
57 4
8 10 7 LIMITES X ni Xni X2ni
11 - 13 26 EXACTOS
14 - 16 41 4,5 7,5 (4,5+7,5)/2= 6 4 24 364= 144
17 19 14 7,5 10,5 (7,5+10,5)/2= 9 7 63 817=567
20 - 22 8 10,5 13,5 (10,5+13,5)/2= 12 26 312 14426=3744
100 13,5 16,5 (13,5+16,5)/2= 15 41 615 22541= 9225
16,5 19,5 (16,5+19,5)/2= 18 14 252 32414 =4536
19,5 22,5 (19,5+22,5)/2= 21 8 168 4418= 3528
100 1434 21744
X 1434 14,34
100
S X2 21744 14,34 217,44 205,64
2
100
11,80
3
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
LA DESVIACIN TIPICA ES LA RAIZ CUADRADA DE LA VARIANZA
SX 11,80 3,435
PROPIEDADES
USA TODOS LAS PUNTUACIONES DE LA DISTRIBUCIN PARA SU CLCULO
MIDEN LA VARIABILIDAD DE LOS DATOS CON LA MEDIA ARITMTICA (SOLO PUEDE USARSE
SI UTILIZAMOS ESE PROMEDIO)
SON NO NEGATIVAS (POSITIVAS O CERO). SER CERO CUANDO TODAS LAS
PUNTUACIONES SEAN IGUALES Y POSITIVA EN EL RESTO DE CASOS.
SI APLICAMOS UN CAMBIO DE ORIGEN Y ESCALA, SLO AFECTAR AL CAMBIO DE ESCALA,
YA QUE LA VARIANZA DE UNA CONSTANTE ES CERO. EL CAMBIO DE ESCALA QUEDAR
ELEVADO AL CUADRADO.
Y bX a
SY2 b2 X
SY bX
4
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
CUASIVARIANZA.
MEDIDA DE DISPERSION USADA EN INFERENCIA, ES IGUAL QUE LA VARIANZA, PERO
DIVIDIMOS POR n-1
n n
( Xi X )2 ( X i X )2
Sn2 1 i 1 Sn i 1
n 1 1 n 1
COEFICIENTE DE VARIACIN
USADO PARA PODER COMPARAR LA VARIABILIDAD DEDISTRIBUCIONES MEDIDAS EN
DISTINTAS UNIDADES
SX
CV 100
X
ES PREFERIBLE USARLO CUANDO AMBAS MEDIAS SON IGUALES Y MAYORES DE CERO
LA VARIABILIDAD ES MENOR CUANTO MAS CERCANO A CERO SE ENCUENTRE.
EJEMPLO
DEL EJERCICIO ANTERIOR HEMOS VISTO QUE LA MEDIA VALE 14,34 Y LA DESVIACIN
TPICA 3,435. CON ESTOS DATOS PODEMOS DECIR QUE LA MEDIA ES REPRESENTATIVA
PARA EL CONJUNTO DE DATOS?
5
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
CV 3,435 100 23,954%
14,34
LA REPRESENTATIVIDAD DE LA MEDIA ES RELATIVAMENTE ALTA (CERCANA A CERO Y
MENOR QUE 0,5)
ESTUDIAR LA VARIABILIDAD DE DOS DISTRIBUCIONES A Y B, CON LOS SIGUIENTES
DATOS: MEDIA Y VARIANZA DE A 20,2 Y 16,4, SIENDO LOS DATOS DE B, MEDIA 21,3 Y
17,2
PRIMERO CALCULAMOS LAS DESVIACIONES TPICAS DE AMBAS DISTRIBUCIONES
SA 16,4 4,05
SB 17,2 4,15
CVA 4,05100 20,05% CVB 4,15100 19,484%
20,2 21,3
LA DISTRIBUCIN B TIENE MENOS VARIABILIDAD, EL RESULTADO ES MENOR (SU MEDIA
REPRESENTA MEJOR A LA DISTRIBUCIN)
LA DISTRIBUCIN DE A TIENE MAYOR VARIABILIDAD, SU MEDIA REPRESENTA PEOR AL
RESTO DE DATOS DE LA DISTRIBUCIN.
6
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
AMPLITUD O RECORRIDO SEMI-INTERCUARTILICO
EN DISTRIBUCIONES ASIMTRICAS, ES NECESARIO USAR MEDIDAS DE DISPERSIN
DISTINTAS A LA VARIANZA Y DESVIACIN TIPICA
Q3 Q1 P75 P25
Q
2 2
SLO NOS INFORMA DE LA VARIABILIDAD DEL 50% DE LAS OBSERVACIONES
COMPRENDIDAS ENTRE LOS CUANTILES.
EJEMPLO
LOS SIGUIENTES DATOS REPRESENTAN LAS NOTAS QUE PUEDEN OBTENER UN
GRUPO DE 200 ALUMNOS. SE PIDE CALCULAR EL RECORRIDO O AMPLITUD SEMI-
INTERCUARTILICO
X LIM. ni na 75200 150 25200 50
EXACTOS
9 8,5 9,5 20 200 100 100
8 7,5 8,5 42 180
EL PRIMER INTERVALO CRTICO ES 7,5 8,5
7 6,5 -7,5 10 138
P 7,5 150 138 8,5 7,5 7,786
6 5,5 -6,5 50 128
5 4,5 -5,5 78 78
200
75 42
7
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
EL SEGUNDO INTERVALO CRTICO ES 4,5 5,5
P25 4,5 50 0 5,5 4,5 5,141
78
LA AMPLITUD SEMI- INTERCUARTILICA ES: Q 7,786 5,141 1,3225
2
INDICE DE ASIMETRA DE PEARSON
LA ASIMETRA ESTABLECE EL NMERO DE PUNTUACIONES QUE SE COLOCAN A UN
LADO U OTRO DE LA MEDIDA DE TENDENCIA CENTRAL.
X MO
AS SX
CUANDO X MO AS = 0 LA DISTRIBUCIN ES SIMTRICA
SI X MO AS > 0 LA DISTRIBUCION ES ASIMTRICA POSITIVA O ASIMTRICA A LA
DERECHA
8
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
SI X MO AS < 0 LA DISTRIBUCIN ES ASIMTRICA NEGATIVA O ASIMTRICA A LA
IZQUIERDA
CALCULAR LA ASIMETRA
X 1276 6,38
X LIM. ni Xni X2ni
EXACTOS
9 8,5 9,5 20 180 9220= 1620 200
8 7,5 8,5 42 336 8242= 2688
7 6,5 -7,5 10 70 7210= 490
S X2 8548 6,38 2 2,04
6250= 1800
6
5
5,5 -6,5
4,5 -5,5
50
78
300
390 5278= 1950
200
200 1276 8548 SX 2,04 1,43
PARA LA MODA ELEGIMOS EL INTERVALO QUE MS SE REPITE 4,5 5,5
M O 4,5 5,5 10 5
2 2
AS 6,38 5 0,965
EL INDICE DE ASIMETRA ES: ASIMTRICA POSITIVA
1,43
9
TEMA 3
MEDIDAS DE VARIABILIDAD Y ASIMETRIA
PUNTUACIONES DIFERENCIALES
ESTAS PUNTUACIONES NOS PERMITEN HACER COMPARACIONES ENTRE DISTINTAS
zX X X
VARIABLES.
SX
LA MEDIA DE LAS PUNTUACIONES DIFERENCIALES ES SIEMPRE CERO Y SU DESVIACIN
TPICA ES UNO.
UNA VEZ TIPIFICADAS UNAS PUNTUACIONES DIRECTAS NOS INDICAN COMO SE
APARTAN CADA UNA DE ESAS PUNTUACIONES CON RESPECTO A LA MEDIA, MEDIDAS
EN DESVIACIONES TPICAS.
TIPIFICAR LAS PUNTUACIONES DIRECTAS, SABIENDO QUE LA MEDIA ES 7 Y LA
DESVIACIN TPICA 2
X X X X X
SX
9 9 -7= 3 3/2 =1,5
8 8 -7=1 =0,5
7 7-7 =0 0
6 6-7 =-1 -1/2=-0,5
5 5 -7 =-2 -2/2= -1
10
TEMA 4
ANLISIS CONJUNTO DE DOS VARIABLES
VARIABLES CUALITATIVAS
ELABORAMOS UNA TABLA DE CONTINGENCIA ENTRE LAS DOS VARIABLES CUALITATIVAS.
PARA ESTUDIAR SI ESAS DOS VARIABLES TIENEN RELACION ENTRE SI, CALCULAMOS EL
COEFICIENTE DE CONTINGENCIA.
EJEMPLO
ESTUDIAR EL EFECTO DEL USO DE UN MEDICAMENTO O UN PLACEBO EN LA MEJORA O
NO DE UNA ENFERMEDAD. EL ESTUDIO SE REALIZA ENTRE 201 PACIENTES. LOS DATOS
SE RECOGEN EN LA SIGUIENTE TABLA DE CONTINGENCIA
CON MEDICAMENTO CON PLACEBO
MEJORAN 75 45
NO MEJORAN 28 53
LOS VALORES NUMRICOS QUE ENCONTRAMOS DENTRO DE LA TABLA SON LAS
FRECUENCIAS OBSERVADAS
CON MEDICAMENTO CON PLACEBO
MEJORAN 75 45 120
NO MEJORAN 28 53 81
103 98 n= 201
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Pgina 1
TEMA 4
ANLISIS CONJUNTO DE DOS VARIABLES
CON MEDICAMENTO CON PLACEBO
CALCULAMOS LAS
MEJORAN 120 103 61,5 120 98 58,5 120
FRECUENCIAS TERICAS
201 201
NO MEJORAN 81 103 81 98 39,5 81
41,5 201
201
103 98 n= 201
CALCULAMOS LA DIFERENCIA ENTRE VARIABLES OBSERVADAS Y LAS TERICAS
CON MEDICAMENTO CON PLACEBO LA SUMA DE LAS DIFERENCIAS
MEJORAN 75 61,5 =13,5 45 58,5 = -13,5 ANTERIORES SIEMPRE DA CERO
NO MEJORAN 28 41,5 =-13,5 53 39,5 =13,5
2
ne nt
CALCULAMOS EL ESTADISTICO X2
nt
2 2 2 2
75 61,5 45 58,5 28 41,5 53 39,5
X2
61,5 58,5 41,5 39,5
2 2
13,52 13,5 13,52 13,5
2,963 3,115 4,392 4,614 15,084
61,5 58,5 41,5 39,5
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Pgina 2
TEMA 4
ANLISIS CONJUNTO DE DOS VARIABLES
C X2
EL COEFICIENTE DE CONTINGENCIA ES 0 C 1
X2 n
CUANTO MS NOS ACERQUEMOS A 1, MAYOR RELACIN HABR ENTRE LAS VARIABLES
CUANDO EL COEFICIENTE DE CONTINGENCIA ES CERO, SIGNIFICA QUE LAS VARIABLES NO
TIENEN RELACIN ENTRE ELLAS
CUANDO LA TABLA TIENE EL MISMO NMERO DE FILAS Y COLUMNAS, PODEMOS
C k 1
ESTABLECER UN VALOR MXIMO DEL COEFICIENTE
k
EN NUESTRO EJEMPLO TENEMOS DOS FILAS Y DOS COLUMNAS, POR LO TANTO EL VALOR
MXIMO QUE PUEDE ALCANZAR ES
C 2 1 0,707
2
C 15,084 0,2642
NUESTRO COEFICIENTE SER 15,084 201
EL VALOR OBTENIDO ES MENOR DE LA MITAD DE MXIMO POSIBLE, POR LO QUE LA
RELACION EN MEDIO-BAJA
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Pgina 3
TEMA 4
ANLISIS CONJUNTO DE DOS VARIABLES
EJEMPLO:
EN UN ESTUDIO SE INVESTIG LA RELACIN ENTRE LA ANSIEDAD DE EJECUCIN (BAJA
ALTA) Y LA REALIZACIN CORRECTA DE UNA TAREA (SI NO) EN 400 PERSONAS. EN
LA TABLA SE MUESTRAN ALGUNAS FRECUENCIAS OBSERVADAS Y ENTRE PARNTESIS,
ALGUNAS FRECUENCIAS TERICAS.
COMPLETAR LA TABLA DE CORRELACIN
SI NO
68 ----
BAJA 160
(84,8) (---)
--- 96
ALTA 240
(---) (112,8)
212 --- 400
OBTENEMOS LAS CANTIDADES BUSCADAS POR DIFERENCIA, RECORDANDO QUE LAS
FRECUENCIAS MARGINALES SE OBTIENEN SUMANDO LAS FILAS Y LAS COLUMNAS
SI NO
68 160-68=92
BAJA 160
(84,8) (160-84,8)=75,2
240-96=144 96
ALTA 240
(240-112,8)=127,2 (112,8)
212 188 400
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Pgina 4
TEMA 4
ANLISIS CONJUNTO DE DOS VARIABLES
VARIABLES CUANTITATIVAS
ELABORAMOS UNA TABLA DE CORRELACIN
VENDEDOR FLUIDEZ VENTAS REPRESENTAR GRFICAMENTE, CALCULAR LA
VERBAL (X) DIARIAS (Y) RELACIN LINEAL ENTRE LAS VARIABLES
1 10 2
2 50 4 6
3 50 5
4 60 3 5
5 20 1 50, 5
4

VENTAS DIARIAS
50, 4
3
60, 3
2
10, 2
1
20, 1
0
0 20 40 60 80
FLUIDEZ VERBAL
CALCULAMOS LA COVARIANZA
X Y
S XY X Y
n
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Pgina 5
TEMA 4
ANLISIS CONJUNTO DE DOS VARIABLES
X 190 38
VENDEDOR FLUIDEZ VENTAS XY
VERBAL (X) DIARIAS (Y)
1 10 2 20
5
2 50 4 200
Y 15 3
3 50 5 250 5
4 60 3 180
5 20 1 20
190 15 670
S XY 670 38 3 20
5
AL TENER SIGNO POSITIVO PODEMOS DECIR QUE EL COEFICIENTE DE CORRELACION DE
PEARSON TENDR SIGNO POSITIVO
PARA MEDIR ESA FUERZA LINEAL ENTRE VARIABLES, CALCULAMOS EL COEFICIENTE DE
CORRELACIN DE PEARSON
S XY
rxy 1 rxy 1
S X SY
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Pgina 6
TEMA 4
ANLISIS CONJUNTO DE DOS VARIABLES
X2 Y2 2
S X2 9100 38
VENDEDOR FLUIDEZ VENTAS XY
VERBAL (X) DIARIAS (Y) 376
1 10 2 20 102=100 22=4 5
2
2 50 4 200 502=2500 16
250 502=2500 25 SY2 55 3 2
3 50 5 5
4 60 3 180 602=3600 9
5 20 1 20 202=400 1
190 15 670 9100 55
SX 376 19,391
SY 2 1,414
rxy 20 0,73 COMO EL VALOR ES BASTANTE CERCANO A UNO PODEMOS
19,391 1,414
AFIRMAR QUE CASI EXISTE FUERTE RELACIN LINEAL POSITIVA ENTRE LAS DOS
VARIABLES.
CUANDO rXY =1 EXISTE UNA RELACION LINEAL PERFECTA Y POSITIVA ENTRE VARIABLES
(CUANDO X AUMENTA Y AUMENTA EN LA MISMA CANTIDAD, Y VICEVERSA)
CUANDO rXY = -1 EXISTE UNA RELACION LINEAL PERFECTA Y NEGATIVA ENTRE LAS
VARIABLES (CUANDO X AUMENTA Y DISMINUYE, Y VICEVERSA)
CUANDO rXY = 0 NO EXISTE RELACIN LINEAL ENTRE LAS VARIABLES
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Pgina 7
TEMA 4
ANLISIS CONJUNTO DE DOS VARIABLES
REGRESION LINEAL
UNA VEZ DETERMINADA LA RELACION LINEAL ENTRE LAS VARIABLES, LA REGRESIN
LINEAL NOS PERMITE HACER PREDICCIONES.
DEBEMOS DETERMINAR LA RECTA DE REGRESIN A TRAVS DE Yi' a bX i SIENDO b LA
PENDIENTE DE LA RECTA Y a LA ORDENADA EN EL ORIGEN.
S XY
b
S X SY Y a bX a Y -bX
b 20 0,053 a 3 (0,053 38) 0,986
376
Y ' 0,986 0,053X
CUAL SERA EL VALOR DE LA VENTA DIARIA SI UN VENDEDOR CONSIGUIERA UNA
PUNTUACIN EN LA PRUEBA DE FLUIDEZ VERBAL DE 80?
Y ' 0,986 0,053 80 5,23
A LAS PUNTUACIONES Y OBTENIDAS MEDIANTE LA RECTA DE REGRESIN SE LES LLAMA
PUNTUACIONES PRONOSTICADAS.
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Pgina 8
TEMA 4
ANLISIS CONJUNTO DE DOS VARIABLES
A LA DIFERENCIA ENTRE LAS PUNTUACIONES DIRECTAS Y LAS PRONOSTICADAS SE LE
DENOMINAN ERRORES E Y Y '
SY2 SY2' SE2 LA VARIANZA DE LAS PUNTUACIONES DIRECTAS ES IGUAL A LA SUMA DE
LAS VARIANZAS DE LAS PUNTUACIONES PRONOSTICASAS MS LA VARIANZA DE LOS
RESIDUOS.
LOS RESULTADOS OBTENIDOS EN UN TEST DE AGUDEZA VISUAL (X) DE SIETE PERSONAS
EN UNA INVESTIGACIN SOBRE LA MIOPIA SON LOS SIGUIENTES:
SY2' 4 rxy 0,68 CALCULAR LA VARIANZA DE LOS RESIDUOS
2 SY2' SY2' 4
rxy SY2 SY2 8,65
SY2 rxy 2 0,682
SY2 SY2' SE2 SE2 SY2 SY2' SE2 8,65 4 4,65
SY2'
LA PROPORCION DE VARIANZA EXPLICADA rxy 2 NOS INDICA SI EL AJUSTE LINEAL
SY2
QUE HEMOS CALCULADO ES VLIDO PARA HACER PREDICCIONES. TAMBIN SE PUEDE
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Pgina 9
TEMA 4
ANLISIS CONJUNTO DE DOS VARIABLES
CALCULAR SI CONOCEMOS EL COEFICIENTE DE CORRELACION LINEAL, SIMPLEMENTE LO
ELEVAREMOS AL CUADRADO.
SE UTILIZA LA REGRESIN LINEAL PARA PRONOSTICAR EL RENDIMIENTO DE UN GRUPO
DE ESTUDIANTES EN FUNCIN DE SU MOTIVACIN. CUAL SER EL COEFICIENTE DE
CORRELACIN DE PEARSON ENTRE AMBAS VARIABLES SI LA PROPORCIN DE
VARIANZA EXPLICADA ES rXY2 =0,36
rxy2 0,36 rxy 0,36 0,6
LOS RESULTADOS OBTENIDOS EN UNA MUESTRA DE ADOLESCENTES EN LAS VARIABLES
ESTRS DEL ENTORNO FAMILIAR (X) Y AGRESIVIDAD DE LOS ADOLESCENTES (Y) SON:
X 7 MEDIA DE X CALCULAR SY
Y 7,4 MEDIA DE Y
S2
b 0,9 PENDIENTE DE LA rxy 2 1 E 0,8485 1 0,6272
RECTA ENTRE X E Y SY2 SY2
rxy 0,8485 COEF.CORRELACION
DE PEARSON 0,6272 1 0,8485 0,6272 S 2
SE2 0,6272 VARIANZA DE LOS SY2 1 0,8485 Y
ERRORES
DE PRONOSTICOS SY2 2,24 SY 2,24 1,5
ANA M. RAMIREZ ANAYA C.A LAS PALMAS GC Pgina 10
TEMA 5. NOCIONES BSICAS DE PROBABILIDAD
EXPERIMENTO ALEATORIO ES UN PROCESO QUE REPETIDO DE FORMA INDEFINIDA
TIENE UN RESULTADO QUE NO SE PUEDE PREDECIR CON CERTEZA.
ESPACIO MUESTRALES EL CONJUNTO DE RESULTADOS POSIBLES DE UN
EXPERIMENTO ALEATORIO.
EJEMPLO:
AL LANZAR UN DADO PERFECTO, LOS POSIBLES RESULTADOS SON: E= 1, 2, 3, 4, 5, 6
SUCESO SIMPLE O ELEMENTAL: CONSTA DE UN SOLO RESULTADO (OBTENER UN 6)
SUCESO COMPUESTO: CONSTA DE DOS O MS RESULTADOS (OBTENER NMERO
PAR)
SUCESO IMPOSIBLE: NO PUEDE OCURRIR NUNCA (OBTENER UN 8)
SUCESO UNIN: OCURRE A O B, O A AMBOS A LA VEZ
A 2,3 B 3,4,5
A B 2,3,4,5
SUCESO INTERSECCIN: OCURRE A Y B AL MISMO TIEMPO.
A 2,3 B 3,4,5
A B 3
ANA M. RAMREZ ANAYA C.A. LAS PALMAS DE GC Pgina 1
TEMA 5. NOCIONES BSICAS DE PROBABILIDAD
CUANDO LA INTERSECCION NO CONTIENE NINGN ELEMENTO EN COMN SE DICE
LOS SUCESOS SON INCOMPATIBLES O MUTUAMENTE EXCLUYENTES.
A 2,3 B 4,5
A B
SUCESO COMPLEMENTARIO: FORMADO POR LOS SUCESOS QUE NO PERTENECEN
AL SUBCONJUNTO A
A 1,3,5
A 2,4,6
TEOREMA DE LA SUMA:
ESTABLECE LA PROBABILIDADDE QUE OCURRA EL SUCESO A O B
P A B P( A) P(B) P( A B)
ANA M. RAMREZ ANAYA C.A. LAS PALMAS DE GC Pgina 2
TEMA 5. NOCIONES BSICAS DE PROBABILIDAD
LANZAMOS AL AIRE UNA VEZ UN
DADO, DEFINIENDO DOS SUCESOS:
A = OBTENER UN NMERO MENOR
QUE TRES Y B = OBTENER UN
NMERO IMPAR. EN EL DIAGRAMA
DE VENN SE REPRESENTA UNA
OPERACIN ENTRE AMBOS
SUCESOS.
SE ESTABLECE UN NUEVO SUCESO C =OBTENER UN NMERO PAR.
CUL ES P A C
P A C P( A) P(C ) P( A C )
P A C 2 3 1 4
6 6 6 6
LA ZONA SOMBREADA ESTABLECE LA SITUACIN A B
ANA M. RAMREZ ANAYA C.A. LAS PALMAS DE GC Pgina 3
TEMA 5. NOCIONES BSICAS DE PROBABILIDAD
EN UN ESPACIO MUESTRAL HAY DOS SUCESOS A Y B. SABEMOS QUE P(A)= 0,4
P(B) 0,75 Y QUE P A B 0,55 . CUAL ES LA PROBABILIDAD DE LA
INTERSECCIN DE A Y B?
P(B) 1 P(B) 1 0,75 0,25
P A B P A PB P A B
0,55 0,4 0,25 P A B
P A B 0,4 0,25 0,55 0,1
PROBABILIDAD CONDICIONADA: CUANDO LA APARICIN DE UN SUCESO DEPENDE
DE LA APARICIN DE OTRO.
P A B
P AB
P B
EN ESTE CASO EL HECHO CIERTO ES B Y EL SUCESO CONDICIONADO ES A.
ANA M. RAMREZ ANAYA C.A. LAS PALMAS DE GC Pgina 4
TEMA 5. NOCIONES BSICAS DE PROBABILIDAD
EN UNA CLASE, LA MITAD SON CHICOS Y LA OTRA MITAD SON CHICAS. LA MITAD
DE LOS CHICOS Y LA MITAD DE LAS CHICAS HAN ELEGIDO INGLS COMO
OPTATIVA. SI ELEGIMOS UNA PERSONA AL AZAR DE ESTA CLASE CUL ES LA
PROBABILIDAD DE QUE SEA CHICA Y ESTUDIE INGLS?:
P(chica) 0,5 P ingles 0,5
chica
P ingles chica P ingles chica
P ingles 0,5
chica P(chica) 0,5
P ingles chica 0,5 0,5 0,25
CUANDO DOS SUCESOS SON INDEPENDIENTES P A B P A PB
LA PROBABILIDAD DE CADA UNO DE ESOS SUCESOS NO INFLUYE EN LA
OCURRENCIA O NO DEL OTRO.
LANZAMOS UN DADO PERFECTO DOS VECES CONSECUTIVAS, CUAL ES LA
PROBABILIDAD DE SACAR UN CUATRO Y UN SEIS
EN ESTE CASO AL LANZAR EL DADO DOS VECES, NINGUNO DE LOS RESULTADOS
INFLUYE EN EL OTRO.
ANA M. RAMREZ ANAYA C.A. LAS PALMAS DE GC Pgina 5
TEMA 5. NOCIONES BSICAS DE PROBABILIDAD
P 4 6 P(4) P(6) 1 1 1 0,03
6 6 36
TENEMOS UNA URNA CON CUATRO BOLAS BLANCAS Y DOS NEGRAS. SI SACAMOS
UNA BOLA (NO LA VOLVEMOS A METER EN LA URNA) Y SACAMOS UNA SEGUNDA
BOLA, CUL ES LA PROBABILIDAD DE QUE LA PRIMERA SEA BLANCA Y LA
SEGUNDA NEGRA?
AL NO REEMPLAZAR LA BOLA, EL PRIMER SUCESO S QUE INFLUYE EN EL SEGUNDO
P(B) 4 P( N ) 2 ESTAS PROBABILIDADES APARECEN EN LA PRIMERA
6 6
EXTRACCIN
P NB 2 EN LA SEGUNDA EXTRACCIN HAY UNA BOLA MENOS EN LA URNA.
5
PB N P(B) P N 4 2 8 0,27
B 6 5 30
ANA M. RAMREZ ANAYA C.A. LAS PALMAS DE GC Pgina 6
TEMA 5. NOCIONES BSICAS DE PROBABILIDAD
TEOREMA DE BAYES
LA IMPORTANCIA DE ESTE TEOREMA SE ENCUENTRA EN QUE POR EJEMPLO
SABIENDO LA PROBABILIDAD DE TENER UN DOLOR DE CABEZA DADO QUE SE TIENE
GRIPE, SE PODRA SABER (SI SE TIENE ALGN DATO MS), LA PROBABILIDAD DE
TENER GRIPE SI SE TIENE UN DOLOR DE CABEZA.
GRFICA 2: REPRESENTACIN GRFICA DEL PORCENTAJE DE ALUMNOS EN DOS
ASIGNATURAS (A Y B) SEGN HAYAN REALIZADO O NO UNA PEC (PRUEBA DE
EVALUACIN CONTINUA). EN LA ASIGNATURA A HAY MATRICULADOS 100
ALUMNOS Y, EN LA ASIGNATURA B, 100 ALUMNOS
120
100
30
80
60
60 SI
NO
40
70
20 40
0
ASIGNATURA A ASIGNATURA B
60304070 TENIENDO EN CUENTA LOS
DATOS REPRESENTADOS EN LA GRFICA 2, SI ELEGIMOS UN ALUMNO AL AZAR
CUL ES LA PROBABILIDAD DE QUE HAYA REALIZADO LA PEC?:
P A 100 0,5 P(B) 100 0,5
200 200
P(PEC ) P( A) P PEC P(B) P PEC B 0,5 0,60 0,5 0,30 0,45
A
ANA M. RAMREZ ANAYA C.A. LAS PALMAS DE GC Pgina 7
TEMA 5. NOCIONES BSICAS DE PROBABILIDAD
SI ELEGIMOS UN ALUMNO AL AZAR, TENIENDO EN CUENTA LOS DATOS
REPRESENTADOS EN LA GRFICA 2, CUL ES LA PROBABILIDAD DE QUE EST
MATRICULADO EN LA ASIGNATURA A Y HAYA ENTREGADO LA PEC?: A) 0,1; B) 0,2;
C) 0,5
P PEC P( A PEC )
A P( A)
0,60 P( A PEC ) P( A PEC ) 0,60 0,5 0,30
0,5
ELEGIDO UN ALUMNO AL AZAR, TENIENDO EN CUENTA LOS DATOS PRESENTADOS
EN LA GRFICA 2, HA RESULTADO QUE HA ENTREGADO LA PEC CUL ES LA
PROBABILIDAD DE QUE EST MATRICULADO EN LA ASIGNATURA B?: A) 0,2; B) 0,4;
C) 0,5
P(B) P PEC
P B
B 0,5 0,3 0,33
PEC P(PEC ) 0,45
ANA M. RAMREZ ANAYA C.A. LAS PALMAS DE GC Pgina 8
TEMA 5. NOCIONES BSICAS DE PROBABILIDAD
SITUACIN 2: EL 20% DE LOS ALUMNOS DE UNA DETERMINADA UNIVERSIDAD
CURSAN EL GRADO EN PSICOLOGA (P). EL 70% DE ELLOS ELIGE EL ITINERARIO DE
PSICOLOGA CLNICA (C), EL 20% EL DE PSICOLOGA EDUCATIVA (E) Y EL 10% EL
DE PSICOLOGA DEL TRABAJO (T).
P( P) 0,20
P C P 0,70
P E P 0,20
P T P 0,10
TENIENDO EN CUENTA LA SITUACIN 2, ELEGIMOS UN ALUMNO AL AZAR CUL ES
LA PROBABILIDAD DE QUE NO CURSE EL GRADO EN PSICOLOGA?
P P 1 0.20 0.80
TENIENDO EN CUENTA LA SITUACIN 2, ELEGIMOS UN ALUMNO AL AZAR CUL ES
LA PROBABILIDAD DE QUE CURSE EL GRADO EN PSICOLOGA Y HAYA ELEGIDO EL
ITINERARIO DE PSICOLOGA CLNICA?
P P C P( P) P C P
P P C 0,20 0,70 0,14
ANA M. RAMREZ ANAYA C.A. LAS PALMAS DE GC Pgina 9
TEMA 5. NOCIONES BSICAS DE PROBABILIDAD
TABLA 3: ELECCIN DEL ITINERARIO EN EL GRADO DE PSICOLOGA EN FUNCIN
DEL SEXO DE LOS ESTUDIANTES DE SEGUNDO DE GRADO QUE ASISTEN A UN
CENTRO ASOCIADO DE LA UNED
ITINERARIO
CLINICA EDUCA CION TRABAJO
SEXO HOMBRE 5 15 25
MUJER 25 15 5
ITINERARIO
CLINICA EDUCACION TRABAJO
SEXO HOMBRE 5 15 25 45
MUJER 25 15 5 45
30 30 30 90
P H 5 0,16 P H 15 0,5 P H 25 0,833
C 30 E 30 T 30
P(H ) 45 0,5 P(M)= 45 0,5
90 90
P M 25 0,83 P M 15 0,5 P M 5 0,16
C 30 E 30 T 30
ANA M. RAMREZ ANAYA C.A. LAS PALMAS DE GC Pgina 10
TEMA 5. NOCIONES BSICAS DE PROBABILIDAD
ITINERARIO
CLINICA EDUCACION TRABAJO
SEXO HOMBRE 5/90=0,05555 15/90=0,16666 25/90=0,27777 45/90=0,5
MUJER 25/90=0,2777 15/90=0,16666 5/90=0,05555 45/90=0,5
30/90=0,333 30/90=0,3333 30/90=0,3333 90/90=1
P(H ) P H C PH E PH T 0,05 0,16 0,27 0,5
PH C 5 0,05 P H E 15 0,166 P H T 25 0,27
90 90 90
P H P(H C ) 0,05 0,16
C P(C ) 0,33
ELEGIMOS UN ALUMNO AL AZAR Y RESULTA SER HOMBRE, CUL ES LA
PROBABILIDAD DE QUE HAYA ELEGIDO EL ITINERARIO CLINICA
P C P HC
P CH 0,33 0,16 0,11
P( H ) 0,5
ANA M. RAMREZ ANAYA C.A. LAS PALMAS DE GC Pgina 11
TEMA 5. NOCIONES BSICAS DE PROBABILIDAD
ANA M. RAMREZ ANAYA C.A. LAS PALMAS DE GC Pgina 12
TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
SI REPETIMOS UN EXPERIMENTO ALEATORIO, OBTENEMOS LOS RESULTADOS
POSIBLES, CADA UNO CON SU PROBABILIDAD.
UNA VARIABLE ALEATORIA ES UNA FUNCIN QUE ASIGNA UN NMERO REAL A CADA
UNO DE LOS RESULTADOS DE UN EXPERIMENTO ALEATORIO.
FUNCIN DE PROBABILIDAD DE UNA VARIABLE DISCRETA ES AQUELLA FUNCIN QUE
ESTABLECE PARA CADA VALOR DE LA VARIABLE, LA PROBABILIDAD DE QUE STA
ADOPTE ESE VALOR
f (X ) P X x
LANZAMOS UN DADO PERFECTO, LOS POSIBLES RESULTADOS SON:
X 1 2 3 4 5 6
f(x) 0,166 0,166 0,166 0,166 0,166 0,166
UNA FUNCIN DE PROBABILIDAD PUEDE REPRESENTARSE A TRAVS DE UN DIAGRAMA
DE BARRAS
ANA M. RAMREZ ANAYA. CA LAS PALMAS DE GC Pgina 1
TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
0,2
0,166 0,166 0,166 0,166 0,166 0,166
0,15
0,1
Series1
0,05
0
1 2 3 4 5 6
LAS FUNCIONES DE PROBABILIDAD SON SIEMPRE POSITIVAS O NULAS (NUNCA
NEGATIVAS) f (X ) 0
LA SUMA DE TODAS LAS PROBABILIDADES DE CADA VALOR DE X ES SIEMPRE IGUAL A 1
FUNCIN DE DISTRIBUCIN RECOGE LA PROBABILIDAD ACUMULADA DESDE EL INICIO
DE LA DISTRIBUCIN, HASTA EL DATO QUE NOS INDIQUEN.
F(X ) P X x
CON EL EJEMPLO ANTERIOR, CUAL SER LA PROBABILIDAD DE QUE CONSIGAMOS UN
VALOR MENOR O IGUAL A 4
P( X 4) P( X 1) P( X 2) P( X 3) P( X 4) 0,166
0,166 0,166 0,166 0,664
ANA M. RAMREZ ANAYA. CA LAS PALMAS DE GC Pgina 2
TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
ES EL MISMO CONCEPTO DE FRECUENCIA RELATIVA ACUMULADA
X f(X) F(X) F(x) ES SIEMPRE POSITIVA O NULA F(X ) 0
1 0.166 0.166
2 0.166 0.322 F(X)=0 PARA VALORES INFERIORES AL VALOR MS PEQUEO DE LA
3 0.166 0.498 DISTRIBUCIN.
4 0.166 0.664
5 0.166 0.83 F(X)=1 PARA VALORES SUPERIORES AL MAYOR VALOR DE LA
6 0.166 1 DISTRIBUCIN
F(X) ES UNA FUNCIN NO DECRECIENTE, YA QUE VA ACUMULANDO PROBABILIDADES.
P( x1 X x2 ) F ( x2 ) F ( x1)
SIGUIENDO CON EL EJEMPLO
P1 X 4 F (4) F (1) 0,664 0,166 0,498
MEDIA O ESPERANZA MATEMTICA
E( X ) x f ( x)
1 0,166 2 0,166 3 0,166 4 0,166 5 0,166 6 0,166 3,486
VARIANZA
ANA M. RAMREZ ANAYA. CA LAS PALMAS DE GC Pgina 3
TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
2
2 E( X 2 ) E( X )
E ( X 2 ) 12 0,166 22 0,166 32 0,166 42 0,166 52 0,166 62 0,166
15,106
2
2 15,106 3,486 2,954
DISTRIBUCIN BINOMIAL
ESTA DISTRIBUCIN SOLO PUEDE TOMAR DOS VALORES (VARIABLES DICOTMICAS)
GENERALMENTE 0 Y 1
ESTA DISTRIBUCIN TIENE COMO PARAMETROS LOS VALORES n (NUMEROS DE VECES
QUE REPETIMOS EL EXPERIMENTO) Y p (PROBABILIDAD DE OBTENER XITO)
POR LO TANTO LA PROBABILIDAD DE FRACASO SER q = 1-p
MEDIA E( X ) np
VARIANZA 2 npq
ANA M. RAMREZ ANAYA. CA LAS PALMAS DE GC Pgina 4
TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
LANZAMOS AL AIRE UNA MONEDA NO TRUCADA 10 VECES, CUAL ES LA PROBABILIDAD
DE SACAR 4 CARAS.
ESTAMOS ANTE UNA DISTRIBUCIN BINOMIAL SIENDO n=10, x=4. SIENDO LA
PROBABILIDAD DE SACAR CARA p=0,5
BUSCAMOS EN LA TABLA I P( X 4) 0,2051
CUL SER SU MEDIA Y SU VARIANZA
n p 10 0,5 5
2 n pq 210 0,5 0,5 2,5
EL 20% DE LOS ALUMNOS DE UNA DETERMINADA UNIVERSIDAD CURSAN EL GRADO EN
PSICOLOGA (P). EL 70% DE ELLOS ELIGE EL ITINERARIO DE PSICOLOGA CLNICA (C),
EL 20% EL DE PSICOLOGA EDUCATIVA (E) Y EL 10% EL DE PSICOLOGA DEL TRABAJO
(T).
ELEGIMOS AL AZAR 10 ALUMNOS Y DEFINIMOS LA VARIABLE ALEATORIA X COMO
NMERO DE ALUMNOS QUE CURSAN EL GRADO EN PSICOLOGA, LA MEDIA Y
VARIANZA DE X ES?
10 0,2 2
2 10 0,2 0,8 1,6
ANA M. RAMREZ ANAYA. CA LAS PALMAS DE GC Pgina 5
TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
RATA SITUADA EN UN LABERINTO CON CUATRO SALIDAS (A,
B, C Y D) EQUIPROBABLES
SI COLOCAMOS UNA RATA EN UN LABERINTO, COMO EL
RECOGIDO EN LA FIGURA, Y LA VARIABLE ALEATORIA X
TOMA EL VALOR 1 CUANDO LA RATA ESCOGE LA SALIDA A Y
0 EN OTRO CASO. CUNTO VALE LA MEDIA DE X?:
X f(X) Xf(X)
1 1/4 1/4 x f ( x) 0,25
0 3/4 0
1 1/4
SI ELEGIMOS AL AZAR 10 ALUMNOS CUL ES LA PROBABILIDAD DE QUE
EXACTAMENTE 2 CURSEN EL GRADO EN PSICOLOGA?
PARA n=10, x=2 Y p=0,2 BUSCAMOS EN LA TABLA I
P( X 2) 0,3020
ANA M. RAMREZ ANAYA. CA LAS PALMAS DE GC Pgina 6
TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
SI ELEGIMOS AL AZAR 10 ALUMNOS CUL ES LA PROBABILIDAD DE QUE NINGUNO
CURSE EL GRADO EN PSICOLOGA?:
PARA n=10, x=0 Y p=0,2 BUSCAMOS EN LA TABLA I
P( x 0) 0,1074
SE SABE QUE UN 30% DE LAS PERSONAS QUE ACUDEN A UNA PRIMERA CONSULTA EN
UN CENTRO DE PSICOLOGA CLNICA PRESENTAN UN TRASTORNO DEPRESIVO. SI
ELEGIMOS AL AZAR UNA MUESTRA DE 10 PERSONAS QUE ACUDEN AL CENTRO, LA
PROBABILIDAD DE QUE DOS O MS NO TENGAN DEPRESIN ES?
n =10, p =0,30 q= 0,70 x 2
LA PROBABILIDAD DE QUE DOS O MS PERSONAS NO TENGAN DEPRESIN, EQUIVALE A
QUE NINGUNA O UNA S TENGAN DEPRESIN
P( X 2) P( X 2) P( X 1)
BUSCAMOS EN LA TABLA II
P( X 1) 0,1493
ANA M. RAMREZ ANAYA. CA LAS PALMAS DE GC Pgina 7
TEMA 6 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
CUL ES LA PROBABILIDAD DE QUE UN ESTUDIANTE QUE RESPONDE AL AZAR LAS 20
PREGUNTAS DE UN EXAMEN DE VERDADERO O FALSO ACIERTE MS DE 15?
n =20, x =15 Y p=0,5 BUSCAMOS EN LA TABLA II
P( X 15) 1 P( X 15) 0,9941
LA PROBABILIDAD DE QUE UN PACIENTE CON ESQUIZOFRENIA SE RECUPERE CON UN
TRATAMIENTO DETERMINADO ES DE 0,40. UN PSICLOGO EST TRATANDO INDIVIDUAL
E INDEPENDIENTEMENTE A 10 PACIENTES CON ESTE TRASTORNO. LA PROBABILIDAD
DE QUE SE RECUPEREN AL MENOS 7 PACIENTES ES DE?
n =10, x=6, p=0,40 EN LA TABLA II
P( X 7) 1 P( X 6) 0,9452
ANA M. RAMREZ ANAYA. CA LAS PALMAS DE GC Pgina 8
TEMA 7. DISTRIBUCIONES CONTINUAS
PARA LAS VARIABLES CONTINUAS NO ES POSIBLE QUE SE DE P(X=a)
DISTRIBUCIN NORMAL
X N ;
ESTA DISTRIBUCIN SE CORRESPONDE CON UNA FAMILIA EN LA QUE EN TODOS LOS
CASOS DEPENDEN DE SU MEDIA Y SU DESVIACIN TPICA
TIENE FORMA DE CAMPANA, QUE SER:
MS APUNTADA CUANTO MENOR SEA SU DESVIACIN TPICA
MENOS APUNTADA CUANTO MAYOR SEA SU DESVIACIN TPICA
ANA M. RAMREZ ANAYA. C.A. LAS PALMAS DE GC Pgina 1
TEMA 7. DISTRIBUCIONES CONTINUAS
CUANDO LA VARIABLE X SE TIPIFICA (RESTANDO LA MEDIA Y DIVIDIENDO POR LA
DESVIACIN TIPCA) LA VARIABLE QUEDA:
Z N 0,1
PROPIEDADES:
SIMTRICA RESPECTO A SU MEDIA
TIENE DOS PUNTOS DE INFLEXION
ES ASINTTICA CON RESPECTO AL EJE DE ABCISAS
AL CALCULAR Z, LO QUE ESTAMOS
HACIENDO, EN REALIDAD, ES UN CAMBIO
DE VARIABLE POR EL CUAL MOVEMOS LA
CAMPANA DE GAUSS CENTRNDOLA EN
EL 0 DEL EJE X, Y MODIFICAMOS EL
ANCHO PARA QUE LA DESVIACIN TPICA
SEA 1.
AL TIPIFICAR ESTAMOS
HOGOMEGEIZANDO LA DISTRIBUCIN,
PARA PODER USAR LAS TABLAS.
ANA M. RAMREZ ANAYA. C.A. LAS PALMAS DE GC Pgina 2
TEMA 7. DISTRIBUCIONES CONTINUAS
SI UNA VARIABLE SE DISTRIBUYE NORMALMENTE CON MEDIA 1 Y DESVIACIN TPICA
3. CUL ES LA PROBABILIDAD DE OBTENER VALORES MENORES O IGUALES A -2?
COMO LA VARIABLE NO TIENE MEDIA 0 Y DESVIACIN TPICA 1, ESTAMOS OBLIGADOS A
TIPIFICAR.
P X 2 P Z 2 1 PZ 1 0,1587 TABLA III
3
PARA UNA DISTRIBUCIN NORMA TIPIFICADA, CUL ES LA PROBABILIDAD DE
OBTENER VALORES MAYORES 0,25
P Z 0,25 1 P Z 0,25 1 0,5987 0,4013 TABLA IV
PARA UNA DISTRIBUCIN DE MEDIA 1 Y DESVIACIN 3. CUL ES LA PROBABILIDAD DE
OBTENER VALORES ENTRE -2 Y 5?
TIPIFICAMOS
P 2 X 4 P 2 1 Z 4 1 P 1 Z 1 PZ 1 PZ 1
3 3
0,8413 0,1587 0,6826
ANA M. RAMREZ ANAYA. C.A. LAS PALMAS DE GC Pgina 3
TEMA 7. DISTRIBUCIONES CONTINUAS
LAS NOTAS DE UN EXAMEN REALIZADO POR 4000 ALUMNOS SE DISTRIBUYE
NORMALMENTE CON MEDIA 4,7 Y DESVIACIN TIPICA 3. CUNTOS ALUMNOS
OBTUVIERON UNA CALIFICACIN MENOR O IGUAL QUE 5?
P X 5 P Z 5 4,7 P Z 0,1 0,5398
3
CALCULAMOS EL NUMERO DE ALUMNOS CON UNA NOTA DE CICO O MENOS
4.000 x 0,5398 =2.159,2 =2159 ALUMNOS
EN UNA DISTRIBUCIN NORMAL TIPIFICADA, QU PERCENTIL SE CORRESPONDE CON
EL VALOR Z=0,44?
BUSCAMOS EN LA TABLA EL VALOR 0,44 Y OBSERVAMOS QUE LA PROBABILIDAD ES
0,6700
POR LO QUE EL PERCENTIL ES EL 67.
EN UNA DISTRIBUCIN NORMAL TIPIFICADA, EL PERCENTIL 97 ES?
EL PERCENTIL 97 ES AQUEL VALOR QUE DEJA POR DEBAJO DE S EL 97% DE LOS
DATOS Y POR ENCIMA UN 3%
BUSCAMOS EN LA DENTRO DE LA TABLA EL VALOR 0,9700 (O EL MS CERCANO)
Z =1,88
ANA M. RAMREZ ANAYA. C.A. LAS PALMAS DE GC Pgina 4
TEMA 7. DISTRIBUCIONES CONTINUAS
LAS PUNTUACIONES DE UN TEST DE MEMORIA SIGUEN UNA DISTRIBUCIN NORMAL
CON MEDIA 100 Y DESVIACIN TIPICA 12. EL PERCENTIL 67 ES?
EN LAS TABLAS HALLAMOS EL VALOR DEL PERCENTIL 67 TIPIFICADO.
PARA UNA PROBABILIDAD 0,67, EL VALOR DE Z=0,44
CUANDO TIPIFICAMOS HACEMOS
Z X
EN NUESTRO EJEMPLO
Z 0,44 100 12
P 100
0,44 67 0,44 12 P67 100 (0,44 2) 100 P67
12
P67 105,28
APROXIMACIN DE LA DISTRIBICION BINOMIAL A LA NORMAL
CUANDO ESTAMOS ANTE UNA DISTRIBUCIN BINOMIAL CON VALORES MAYORES A 20,
TENEMOS QUE APROXIMAR A LA DISTRIBUCIN NORMAL, REALIZANDO UNA
CORRECCIN POR CONTINUIDAD (RESTANDO 0,5 POR LA IZQUIERDA Y SUMANDO 0,5
POR LA DERECHA)
ANA M. RAMREZ ANAYA. C.A. LAS PALMAS DE GC Pgina 5
TEMA 7. DISTRIBUCIONES CONTINUAS
LANZAMOS AL AIRE 100 VECES UNA MONEDA NO TRUCADA Y CALCULAMOS LA
PROBABILIDAD DE QUE SALGAN MS DE 48 CARAS Y LA PROBABILIDAD DE QUE
SALGAN AL MENOS DE 48 CARAS.
ESTAMOS ANTE UNA DISTRIBUCIN BINOMIAL CON n= 100 Y p= 0,5
APROXIMAMOS A LA NORMAL
P X 48 P X 49 P Z 49 0,5 100 0,5 P Z 1,5 PZ 0,3
100 0,5 0,5 5
1 PZ 0,3 1 0,3821 0,6179
P X 48 P Z 48 0,5 100 0,5 P Z 2,5 PZ 0,5
100 0,5 0,5 5
1 0,3085 0,6915
ANA M. RAMREZ ANAYA. C.A. LAS PALMAS DE GC Pgina 6
TEMA 8. ESTIMACIN
ESTIMACIN DE LA MEDIA
LA MEDIA DE UNA DISTRIBUCIN MUESTRAL DE LA MEDIA ES IGUAL A LA MEDIA DE
LA POBLACIN. ESO INDICA QUE LA MEDIA MUESTRAL ES UN ESTIMADOR
INSESGADO DE LA MEDIA POBLACIONAL
X
2
LA VARIANZA DE UNA DISTRIBUCIN MUESTRAL DE LA MEDIA ES IGUAL A
n
SU DESVIACIN TIPICA NOS INDICA LA PRECISIN DE LA ESTIMACION DE LA
n
MEDIA, CUANTO MENOR SEA LA DESVICIN TIPICA DE LA POBLACIN, MENOR
SER EL ERROR TPICO DE LA MEDIA
PARA MUESTRAS GRANDES n 30 , LA FORMA DE LA DISTRIBUCION MUESTRAL DE
LA MEDIA ES IGUAL A LA DISTRIBUCIN NORMAL, AUNQUE LA DISTRIBUCIN
ORIGEN DE LA MUESTRA NO SEA NORMAL.(APLICACIN DEL TEOREMA CENTRAL
DEL LMITE). CUANTO MAYOR SEA n, MENOR SER EL ERROR TPICO DE LA MEDIA.
COMO NO ES FACTIBLE TRABAJAR CON TODA UNA POBLACIN, ESTIMAREMOS LOS
PARMETROS POBLACIONES A TRAVS DE ESTADSTICOS MUESTRALES.
1
TEMA 8. ESTIMACIN
X
2
X X
2 Sn2 1
X n 1
SI EXTRAEMOS UNA MUESTRA ALEATORIA DE 25 ELEMENTOS DE UNA POBLACIN
NORMAL EN LA QUE LA VARIANZA VALE 9, CUNTO VALE LA DESVIACIN TIPICA DE
LA DISTRIBUCION MUESTRAL DE LA MEDIA?
2 9 0,36
2
X n 25
X
0,36 0,6
SABEMOS QUE EL ERROR TPICO DE LA DE LA MEDIA VALE 1,5 Y EL TAMAO DE LA
MUESTRA ES 100. CUANTO VALE LA VARIANZA DE LA POBLACIN? Y LA DESVIACIN
TIPICA?
2 2
2 1,52
X n 100
2 1,52 100 225 225 15
2
TEMA 8. ESTIMACIN
ESTIMACIN DE LA PROPORCIN
CUANDO ESTIMAMOS UNA PROPORCIN,
P P
2
P1 P
P n
A MEDIDA QUE EL TAMAO DE LA MUESTRA CRECE POR EL TEOREMA CENTRAL DEL
LMITE, LA DISTRIBUCIN TIENDE A LA NORMAL
CUANDO LA PROBABILIDAD ES 0,5 O MS, MS ELEMENTOS DEBE TENER LA MUESTRA
PARA APROXIMARSE A LA NORMAL.
EN UN CENTRO ESCOLAR HAY 500 ALUMNOS MATRICULADOS EN LA ASIGNATURA A Y
500 EN LA B. EN AMBAS ASIGNATURAS HAY 400 MUJERES. SI QUEREMOS UNA
MUESTRA DE 100 ALUMNOS PARA REALIZAR UNA ENCUESTA CON UNA PROPORCIN
DE MUJERES Y HOMBRES EN CADA ASIGNATURA IDENTICA A LA DEL CENTRO
ESCOLAR CUANTOS ALUMNOS VARONES DE CADA ASIGNATURA DEBE TENER LA
MUESTRA?
PROPORCIN DE MUJERES Y HOMBRES EN LA ASIGNATURA A Y B ES:
400 0,8 100 0,20
500 500
SI LA MUESTRA ES DE 100 ENTONCES 100 X 0,20 =20 HOMBRES
POR LO TANTO 10 HOMBRES DE CADA UNA DE LAS ASIGNATURAS.
3
TEMA 8. ESTIMACIN
INTERVALOS DE CONFIANZA
PARA CALCULAR EL TAMAO DE UNA MUESTRA CUANDO ESTIMAMOS LA MEDIA DE UNA
DISTRBUCION NORMAL CON VARIANZA POBLACIONAL CONOCIDA
Z2 2
1
n 2
2
EMAX
SIENDO EL ERROR DE ESTIMACIN MAXIMO
E MAX
Z
1
2 n
AL CALCULAR UN INTERVALO PRETENDEMOS QUE LA MEDIA QUE ESTAMOS
ESTIMANDO SE ENCUENTRE DENTRO DE L CON UNA PROBABILIDAD 1 LLAMADA
NIVEL DE CONFIANZA
LA PROBABILIDAD DE QUEDAR FUERA DE ESE INTERVALO SE DIVIDE EN LOS DOS
EXTREMOS QUE QUEDAN A CADA LADO DE ESE INTERVALO Y QUE VALEN
2
LOS INTERVALOS DEPENDEN DE LOS DATOS QUE TENGAMOS:
CONOCEMOS LA DESVIACIN TIPICA DE LA POBLACIN
LA DISTRIBUCIN ES NORMAL O SI NO ES NORMAL PERO EL TAMAO DE LA
MUESTRA ES GRANDE (TEOREMA CENTRAL DE LMITE)
4
TEMA 8. ESTIMACIN
X Z1 ;X Z
2 n 1
2 n
NO CONOCEMOS LA DESVIACIN TIPICA DE LA POBLACIN, POR LO QUE USAMOS
LA CUASIDESVIACIN TIPICA DE LA MUESTRA
LA DISTRIBUCIN ES NORMAL O SI NO ES NORMAL PERO EL TAMAO DE LA
MUESTRA ES GRANDE (TEOREMA CENTRAL DE LMITE)
X tn;1 s
n 1;X tn;1 snn1
2 n 2
NO CONOCEMOS LA DESVIACIN TIPICA DE LA POBLACIN, POR LO QUE USAMOS
LA CUASIDESVIACIN TIPICA DE LA MUESTRA
LA DISTRIBUCIN ES NORMAL O SI NO ES NORMAL PERO EL TAMAO DE LA
MUESTRA ES MAYOR DE 100 (TEOREMA CENTRAL DE LMITE)
X Z1
s
n 1;X Z
s
n 1
2 n 1
2 n
INTERVALO PARA LA PROPORCIN
5
TEMA 8. ESTIMACIN
n 5
P(1 P)
P Z P(1 P) ; P Z P(1 P)
1
2
n 1
2
n
EJERCICIOS
PARA UN NIVEL DE CONFIANZA DE 0,95 CUANTO VALE Z
1
2
1 1 0,95 0,05 0,05 0,025 1 1 0,025 0,975
2 2 2
AHORA BUSCAMOS EN LA TABLA DE LA NORMAL EL VALOR DE Z QUE SE
CORRESPONDE CON LA PROBABILIDAD 0,975Z=1,96
PARA MEDIR LA INTELIGENCIA EMOCIONAL SE EXTRAE UNA MUESTRA DE 100
JOVENES. SABEMOS QUE LA DESVIACION TIPICA DE LA VARIABLE EN LA
POBLACIN VALE 6, CUANTO SER EL ERROR DE ESTIMACIN MXIMO DE LA
MEDIA PARA UN NIVEL DE CONFIANZA DE 0,95?
E MAX
Z1
2 n
6
TEMA 8. ESTIMACIN
1 0,95 1 0,95 0,05 0,025 1 1 0,025 0,975
2 2
Z0,975 1,96
EMAX 1,96 6 1,176 1,2
100
LA INTELIGENCIA PRCTICA, MEDIDA EN UNA ESCALA DE 0 A 40, SE DISTRIBUYE
NORMALMENTE EN LA POBLACIN DE ADOLESCENTES CON UNA DESVIACIN
TPICA DE 6. SUPONIENDO QUE SE DESEA UN ERROR DE ESTIMACIN NO
SUPERIOR A 2, CON UN NIVEL DE CONFIANZA DE 0,95 QU TAMAO DEBE TENER
LA MUESTRA?
1 0,95 0,05 0,025 1- 0,975 Z0,975 1.96
2 2
Z2 2
1 2 2
n 2
2 n 1,96 2 6 34,57 35
EMAX 2
CALCULAR EL INTERVALO PARA LA MEDIA, SABIENDO QUE PARA ESA MUESTRA
DE 35 ADOLESCENTES HEMOS OBTENIDO UNA INTELIGENCIA PRECTICA MEDIA
DE 28
X EMAX ; X EMAX 28 2;28 2 26;30
7
TEMA 8. ESTIMACIN
LA VARIABLE DEPRESIN SE DISTRIBUYE NORMALMENTE EN LA POBLACIN DE
ANCIANOS. SE MIDI DICHA VARIABLE EN UNA MUESTRA ALEATORIA DE 16
ANCIANOS, OBTENIENDO UNA MEDIA DE 80 Y UNA CUASIVARIANZA DE 100.
CUANTO VALE EL ERROR TPICO? Y EL ERROR DE ESTIMACIN MXIMO PARA
UN NIVEL DE CONFIANZA DE 0,99?
Sn 1 100 10 2,5
SX
n 16 4
0,01
1 0,99 0,01 0,005 1 0,995
2 2 2
TRABAJAMOS CON UNA MUESTRA Y NO CONOCEMOS LA VARIANZA DE LA
POBLACION, POR LO QUE TRABAJAREMOS CON LA DISTRIBUCIN T STUDENT,
CON n-1 GRADOS DE LIBERTAD
t16 1;0,995 2,947
Sn
EMAX t
n 1;1
1 2,947 100 7,37
2 n 16
8
TEMA 8. ESTIMACIN
EN UNA MUESTRA ALEATORIA DE 100 UNIVERSITARIOS, 75 ESTN A FAVOR DEL
MOVIMIENTO 15-M. DADA LA PROPORCIN DE UNIVERSITARIOS A FAVOR Y PARA
UN NIVEL DE CONFIANZA DE 0,99 CUAL SER EL ERROR MXIMO DE
ESTIMACIN? CUALES SON LOS LMITES DEL INTERVALO?
1 0,99 0,01 0,005 1 0,995 Z0,995 2,57 2,58 2,575
2 2 2
75 1 75
P(1 P) 2,575 100 100
E Z 2,575 0,75 0,25 0,11
MAX 1
2 n 100 100
LOS LIMITES SON:
P EMAX ; P EMAX 0,75 0,11;0,75 0,11 0,64;0,86
9

Vous aimerez peut-être aussi