Vous êtes sur la page 1sur 23

Formas de

Representacin

Bioestadstica

Cualitativas

Estudia Variables

Se Clasifican en

Tabular
Grfica

Descriptivas

Mediasde punto

Inferencial

Ji - cuadrado

Formas de
Representacin

Tabular
Grfica

Cuantitativas

Medidas de
tendencia central
Descriptiva
Medidas de punto
Inferencial

Pruebas de
hiptesis.

Variables

Cualitativa

Cuantitativa

Escalas

Escalas

Ordinal

Nominal

Razn

Permite
establecer
relaciones de
tipo "mayor que"
o "menor que"

medidas que nos


permite
identificar
sujetos como
"iguales" o
"diferentes".

Ocupa el nivel mas


alto de la escala,
posee un 0 absoluto
que indica ausencia
total de la
carcterisitica.

Intervalo

Conocer la
distancia entre
dos mediciones
cualesquiera.

Posee un cero
relativo, un
cero no
verdadero.

Parmetro Medida calculada a partir de una poblacin.


Estadstico Medida calculada a partir de una muestra.

Estadstica Inferencial

Estadstica Descriptiva

Permite sacar conclusiones generales de


una poblacin, basndose en los datos
de una muestra.
Ayuda a conocer algunos aspectos de la
poblacin mediante el conocimiento de
ciertos aspectos de la muestra.

Pueden medirse los valores especficos del


fenmeno colectivo o variable en estudio.
Formas para organizar y reducir el volumen de
datos. Se apoya en:
Tablas
Grficas
Medidas numricas de resumen.
Medidas de tendencia Central.

Variable Cualitativa
Presentacin
de datos de
variables
cualitativas.

En Forma
escrita
Proposito
General:
Elaborados
como fuente
de
informacion
estadistica.
Usualmente
tienen gran
cantidad de
datos.

En forma Grfica

Tabular

Proposito
Especifico:
Elaborados
con fin de
analisis y
clculo.

Grfica
Bidireccional

Diagrama de
Barras
Simples

Grfica de
Datos
Agrupados

Cuadro de
Asociacion de
doble entrada
Pie

Barras
Segmentadas

Partes de una Tabla

Ttulo En
Maysculas.

# De
Cuadro

CUADRO No. 1
GRUPO DE PACIENTES MASCULINOS MAYORES DE 15 AOS DE LA CLNICA LA OBSCURIDAD
GUATEMALA 2013
Nota de encabezado
(Solo se tomaron en cuenta a los pacientes ms frecuentes)

Se droga
No se droga
total

Hombres 15 -25
20
30
50

Hombres 26 -35
15
15
30

Hombres 36-45
10
15
25

Nota: los datos estn actualizados respecto a la fecha indicada


Fuente: Clnica

Total
45
60
105

Cuerpo del
cuadro

Grficas
Barras Simples : Excelentes para las distribuciones simples de frecuencias, a escala cualitativa. Se puede utilizar
cifras absolutas o cifras relativas.

Grfica Bidireccional : Dos direcciones, puede comparar variables, se puede representar en porcentaje, se
utiliza la misma escala en dos sentidos y esta parte de la linea 0.

Diagrama de Sectores (Pie): Tamao relativo de los componentes de un total, presentaciones populares. Se
puede presentar en cifras relativas y absolutas.

Barras Agrupadas: Es muy til para datos de asociacin, permite la comparacin de las variables. (Identificar
componentes. Espacio, Claridad y Simplicidad).

Barras Segmentadas: La informacin va segmentada, es usado para representar datos de asociacin. Se


coloca la informacin seguida de otra, presenta la dificultad de no ser tan clara. Es conveniente no usar ms
de tres variables.

Cuadro asociacin de doble entrada: doble variables, todos los datos del encabezado se escriben en
mayscula. Puede ser utilizado para la realizacin de una grfica.

Fuma
No Fuma
total

Hombres

Mujeres

75
25
100

15
85
100

Total
90
110
200

Variable Cuantitativa
Variable
Cuantitativa.
Se clasifican
en
continua

discreta

Se da cuando
los valores
nmericos
que forman la
variable en un
intervalo
cualquiera
son infitinos.

Es la variable
cuyos valores
nmericos se
pueden contar
o son finitos en
un intervalo
cualquiera.

En forma
Grfica

Tabular
Serie
Simple
Distribucion
simple de
frecuencias

Distribucion en
clases o
Inertervalos
de clase

Ovija
de
Galton

Polgono de
frecuencias

Histograma

Serie Simple Consiste en ordenar ascendente o descendente los datos en una tabla. Se maneja
cuando se obtienen menos de 30 datos.

Distribucin simple de frecuencias En la columna I se ponen los datos de la variable y en la segunda


la frecuencia del mismo. Se maneja cuando se obtienen de 30 a 50 datos.

Distribucin en clases o intervalos de clase Consiste en agrupar los datos en clases o intervalos;
acompaados de sus respectivas frecuencias. Para elaborar una Distribucin en Intervalos de Clase es
necesario establecer el nmero de clases o intervalos a utilizar as como la amplitud que tendrn
dichos intervalos. Se maneja cuando se obtienen ms de 60 datos.
1.

Rango, Recorrido o Amplitud de la variable: es necesario escudriar los datos porque se requiere
de la amplitud que exista entre ellos. La amplitud de la variable no es ms que la diferencia
existente entre el valor ms bajo (XS) y el valor ms alto (XL). Su smbolo es una R.
R = XL- XS

2. Numero de clases o intervalos: clculo de la cantidad de intervalos a utilizar se realiza en funcin


del total de elementos o sujetos en la distribucin, ya sea una poblacin (N) o bien una muestra (n),
apoyndose en la frmula de Sturgess. Su smbolo es una K.
K = 1 + 3.322 X (log N)
Los valores 1 y 3.322 son constantes en la frmula.
3. Amplitud de los intervalos o clases: Para calcular la amplitud que debern tener los intervalos se
requiere de los resultados obtenidos en los dos pasos anteriores. Su smbolo es una i.

Lmites
Lmites de clase:
Luego de haber calculado el No. de clases y la amplitud de las mismas, se procede a la
elaboracin de los intervalos o clases. Es recomendable iniciar con el valor ms bajo de los datos
para luego se va sumando la amplitud de intervalo calculada (i) para ir formando las clases.
Lmites Aparentes
Los lmites de una clase son aparentes cuando stos no permiten espacio entre un lmite y otro, los
Intervalos han sido elaborados en forma continua.
150 -155
155- 160
160- 165

Si nos dieran los datos 155 ira aqu.


160 va aqu.

Lmites Absolutos
Si hay espacio entre los lmites. Los intervalos en forma discreta.
13- 19
20-26
27- 36
Lmites reales
Se calculan imites reales si los intervalos han sido elaborados en forma discreta y se requiere su
continuidad.
()

LS (i): lmite superior de la clase (i)


LI (i + 1): lmite inferior de la clase siguiente (i+1)
Edad
13- 19
20-26
27- 36

f
6
9
8

Para calcular los lmites reales realizamos lo siguiente:


Edad
12.5- 19.5
19.5-26.5
26.5- 36.5

f
6
9
8

Se llama as porque la separacin


o distancia entre lmite inferior y
superior de cada clase es
siempre el mismo.

Constantes

Intervalos de
amplitud

En una distribucin los intervalos


son de amplitud variable cuando
la distancia entre lmite inferior y
lmite superior vara de una clase
a otra.

Variable
Se utiliza cuando los valores de la
distribucin que se est
estudiando estn muy dispersos,
por lo que al agruparlos con
intervalos constantes, algunos
quedaran con frecuencia de
cero.

Frecuencia Absoluta

Frecuencias Relativa

Es el nmero de veces
que aparece un
determinado valor.
Se simboliza con una f o fi.
La suma de las
frecuencias absolutas da
como resultado el total de
datos que corresponde al
tamao de la muestra (n)
o de la poblacin (N) que
se estudia.

Es el cociente entre una


frecuencia absoluta y el
nmero total de los
datos.
Se simboliza con una fr.
La frecuencia relativa
tambin puede
multiplicarse por 100
para expresarla en
porcentaje.

Edades Recuento
55-58
IIIII II
59-62
IIIII II
63-66
IIIII IIIII IIIII I
67-70
IIIII IIIII IIII
Total

f
7
7
16
14
44

fa
7
14
30
44

Frecuencia
acumulada
Es la suma
acumulativa, de las
frecuencias absolutas.
Se simboliza con una
fa.

Se conoce tambin
como punto medio, es el
valor que representa a
cada clase y se localiza
justo al centro del
intervalo.
()

Limites Reales
54.5 -58.5
58.5 62.5
62.5 66.5
66.5 70.5

Grficas
Histograma:

Histograma
Frecuencia

Marca de Clase

15
10
5
0

Limites Reales

mc
56.5
60.5
64.5
68.5

fr
0.16
0.16
0.36
0.32
1

fra
0.16
0.32
0.68
1

()

Poligono de Frecuencia:
15

Frecuencia

10
5
0

Marca de clase

Frecuencias
acumuladas

Ojiva de Galton:

Limites Reales

Medidas de punto
Medidas
de punto
Proporciones

Razones

Una proporcin es la
relacin o
comparacin entre
dos grupos, uno es una
parte del todo y el otro
es el total o universo.

Una razn es la relacin o


comparacin que se hace
entre dos grupos diferentes,
que pueden ser de igual o
diferente naturaleza, para
determinar si ellas son iguales
o si una es mayor que la otra.

P=

Porcentajes
Un porcentaje es una
proporcin
multiplicada por cien.

C = total del primer grupo


d = total del segundo grupo
k = es una base, una unidad
seguida de ceros (10, 1000,
etc.).

Por cada K del segundo


grupo d hay Resultado del
total del primer grupo C.

media
medidas de
tendencia
central

mediana
moda
cuartiles

Medidas
Descriptivas

medidas de
posicin

deciles
percentiles
desviacin
estandar

medidas de
dispercin

varianza
coheficiente de
variacin

Medidas de tendencia
central
Media (,x)
Es el valor promedio de los datos, es la medida de tendencia central ms importante, debido a la
representatividad que posee los datos de la variable en estudio. Su uso es adecuado cuando las

distribuciones son simtricas o aproximadas a la forma normal.


Datos agrupados en frecuencias Datos agrupados en intervalos

Mediana (Me)
Identifica el valor que se encuentra en el centro de los datos. Es decir que nos permite separa por la mitad un
conjunto de datos. Tambin es llamado valor medio. Como primer paso se ordenan los datos de menor a
mayor. Es adecuado utilizarla cuando una distribucin se aparta de lo normal (distribuciones sesgadas).

Datos agrupados en frecuencias

Datos agrupados en intervalos

Posicin (n)

Si la serie es par, el valor de la mediana


se calcula con el promedio de los dos
valores centrales dividido dos.

Moda (Mo)
Es aquel valor que tiene la frecuencia mayor o es el valor particular que ocurre ms frecuente que
cualquier otro. Es la medida de tendencia central menos confiable. Su utilizacin es prioritariamente
con datos cualitativos.

Datos agrupados en frecuencias

Datos agrupados en intervalos

El dato con mayor frecuencia.


Se tiene una muestra con los valores: 1,2,4,4,3,7,2,4,3,2,5 y 2.
1,2,2,2,2,3,3,4,4,4,5,7
Mo= 2

= fmayor- fanterior
= fmayor- fposteior

Se tiene una muestra con valores 20, 20, 23, 24, 25, 25, 26 y 30.
Mo= 20 y 25, se dice que es bimodal.

Medidas de Posicin
Estos valores son de la misma familia de la mediana, por lo que para calcularlos en las distribuciones de datos
agrupados en intervalos podemos utilizar la frmula de la mediana, solo que el total de los datos en lugar de
dividirlo dentro dos, lo dividimos dentro de 4 para los cuartiles, entre 10 para los deciles y entre 100 para los
percentiles o centiles.

Cuartiles (Qk)
Los cuartiles dividen los datos en cuatro partes iguales. Cada una de las partes representa una cuarta parte, o
el 25% de las observaciones. El segundo Cuartil equivale a la mediana.
Q4 NOEXISTE! (se dividen en 4 pero son 3)

Valor Q1: 25% bajo ese valor


75% sobre ese valor

Valor Q2: 50% bajo ese valor


50% sobre ese valor

Valor Q3: 75% bajo ese valor


25% sobre ese valor

Arreglo Simple
(

Datos Agrupados
(

Deciles (Dk)
Los deciles dividen los datos en 10 partes iguales. El quinto decil equivale a la mediana.

Arreglo Simple
(

Datos Agrupados
(

Percentiles o Centiles (Pk/Ck)


Los deciles dividen los datos en 100 partes iguales.

Arreglo Simple
(

Datos Agrupados
(

La mediana es igual al cuartil segundo, decil quinto y centil 50


Me = Q2 = D5 = C50
El cuartil primero es igual al centil 25
Q1 = C25
El cuartil tercero es igual al centil 75
Q3= C75
El Decil primero es igual al centil decimo.
D1 = C10

Medidas de Dispersin
Mide la dispersin de los datos con respecto a la media la distribucin es simtrica entonces
media=moda=mediana; Las medidas ms utilizadas son: rango, varianza, desviacin estndar y coeficiente
de variacin.

Rango, Recorrido o Amplitud


Mide la extensin total de un conjunto de datos y se calcula utilizando nicamente dos nmeros.
R = medicin ms grande (XL) medicin ms pequea (Xs)

Varianza o Variancia
Cuantifica la variabilidad de los datos respecto al valor de la media elevada al cuadrado. La varianza para la
muestra se representa mediante una s y la notacin para poblacin .

Datos no agrupados
de una muestra
(

Datos agrupados de
una muestra

Datos no agrupados de
una poblacin
(

Datos agrupados de
una poblacin
(

Desviacin Estndar o Desviacin Tpica


Es la raz cuadrada de la varianza. Los smbolos son s si es una muestra y poblacin si es una poblacin.
Coeficiente de variabilidad
Se usa para comparar la variabilidad entre dos o ms muestras medidas en las mismas unidades o no. Los
datos que se expresan en porcentaje en la cual se compara la desviacin estndar con el respectivo valor del
promedio de los datos.

Regresin y Correlacin
Regresin Lineal

Consiste en determinar un modelo lineal que sea capaz de poder realizar estimaciones a travs del tiempo. En un modelo
de regresin lineal simple, solo existen dos tipos de variables, la variable independiente y la variable dependiente.
La ecuacin general del modelo de regresin simple es la siguiente:
Variable
dependiente
Interseccin
con eje y.

Independiente
Pendiente de
la recta

La pendiente de la recta puede ser positiva o negativa, si es positiva se dice que la relacin es
directamente proporcional (si X aumenta, Y tambin). En caso contrario si es negativa es inversamente
proporcional (si X aumenta, Y disminuye).
La pendiente de la recta indica el cambio por cada unidad de medida por cada variable
independiente.

Coeficiente de correlacin: Se utiliza para medir la intensidad de la variable independiente con la


dependiente, este coeficiente determina si existe buena, regular o mala relacin entre las variables.
Diagrama de dispersin: Sirve para graficar los puntos en parejas ordenadas de la variable
dependiente con la independiente. A travs de l se puede observar el tipo de pendiente de la recta,
si la relacin va ser directa o inversa y puede observarse tambin que tan diversos estn los puntos.

Conjuntos
Conjuntos

Es un grupo de elementos u
objetos especificos en tal
forma que se puede afirmar si
cualquier objeto dado
pertenece o no a la
agrupacin.

Formas de
representarlos

enumerativa

{a,e,i,o,u}

descriptiva

{las vocales}

Tipos de
conjuntos

grfica

Finitos: que se
pueden contar

Infinitos: no se
pueden contar.

Operaciones
entre
conjuntos
Vacios: no
existen, estan
vacios.

ae
u
io

Unin

Interseccin

Es la
agrupacion de
dos o ms
conjuntos.

Es la
agrupacin de
los elementos
en comn.

Universo: conjunto que contiene todos los elementos.


Elemento: objeto, animal o cosa que forma parte de un conjunto.
Subconjunto: conjunto contenido en otro conjunto.
Diagrama de Venn: Forma grfica de representar un conjunto.

Teora de la probabilidad
Probabilidad

Probabilidad subjetiva

P=

Probabilidad objetiva

Clasica o apriori

Relativa o A posteriori

Puede calcularse sin


necesidad de buscar o
esperar datos.

Se necesita
experimentar o probar
antes.

X= Evento
de inters

Probabilidad de un Evento

Probabilidad Marginal: Se tiene inters en un solo un evento. P=

Probabilidad Conjunta: Se tiene inters en dos eventos al mismo tiempo, en una tabla es una
interseccin.

Probabilidad de dos eventos mutuamente excluyentes: Es la probabilidad de que ocurra uno u otro de
dos eventos mutuamente excluyentes.
Mutuamente excluyentes: que no pueden ocurrir al mismo tiempo.

Probabilidad de dos eventos NO mutuamente excluyentes: Es aquella en la cual se desea saber la


probabilidad de que ocurra uno u otro de dos eventos no mutuamente excluyentes.
No mutuamente excluyentes: pueden estar presentes al mismo tiempo.
(

Probabilidad condicional: No utiliza al universo como denominador. El numerador es el nmero de


veces que aparece el evento de inters con la caracterstica condicionante, y como denominador el
total de la caracterstica condicionante.

Probabilidad de dos eventos independientes: Se calculan dos probabilidades, una marginal y una
condicional, si el resultado obtenido es el mismo esto quiere decir que las variables son independientes,
si el resultado es diferente existe relacin entre las mismas.

Distribucin Normal

Es simtrica
=0y
1 68%
2 95%
3 91%

Encuentre el rea bajo la curva entre z=0 y z=1.5


La campana se toma como 1.

1.5

Para Z=1.5 0.9332 (ver Tabla)


Para Z=0 0.5000
0.9332- 0.5000 = 0.4332

P ( -0.79<Z0.54)
Z=0.54 0.7054
Z=-0.79 0.2148
-0.79

0.54

0.7054 - 0.2148= 0.4906

P (Z>0.72)
Z=0.72 0.7642
1 - 0.7642= 0.2358
0.72

o busco -0.72

P (Z>Z1)= 0.8944
1 0.8944= 0.1056 (cola)
Z1= -1.25
-Z1

P (Z= 2) = 0
Por definicin cuando Z es igual a n nmero o es igual a -n, es igual a 0.

Aplicacin de la Distribucin
Normal Estndar
La distribucin normal estndar se aplica a cualquier problema de distribucin normal. Para cambiar el eje x
por el eje z se realizara a travs de la siguiente formula.
Eje x

Media
Desviacin estndar

La frmula anterior puede ser utilizada nicamente con poblaciones.

En un estudio sobre niveles de glucosa, en una poblacin de 276 recin nacidos,


se encontr un promedio de 82mg/dl y una desviacin estndar de 6,2mg/dl.
Suponiendo que los datos se distribuyen normalmente, determine lo siguiente:
a. Probabilidad de escoger al azar a un recin nacido con glicemia menor de
80mg/dl

P (Z<0.32) = 0.3745
b. La probabilidad de escoger a un recin nacido con nivel de glicemia mayor de
85mg/dl.
P (Z>0.48) = 0.6844
1-0.6844 = 0.3156

c. El porcentaje de recin nacidos con nivel de glicemia menor a 74mg/dl.

-1.29 = 0.0985
0.0985*100 = 9.85%
d. El nmero de recin nacidos con nivel de glicemia de 82mg/dl o ms asciende a.

Media

276*0.5= 138
e. La probabilidad de escoger un recin nacido que tenga los valores de glicemia entre 79.51
y 84.49mg/dl.

-0.40 0.3446

0.40 0.6554
P (-0.40<Z<0.40) = 0.3108
0.6554 0.3446 = 0.3108

Muestreo
Muestreo

Se lleva a cabo para elegir a


los sujetos de estudio en un
plan de investigacin. Se
realiza cuando las poblaciones
son muy grandes y por falta de
recursos o de tiempo no se
investiga a cada sujeto.

El muestreo se divide en

Probabilisitico

Es aquel donde cada


sujeto de estudio tiene
la misma probabilidad
de ser elegido.

No probabilisitco

Es aquel donde los sijetos de


estudio se determinan por
medio de carcterisitcas que
el investigador necesita.

Cantidad de Posibilidades en el Muestreo

Muestreo con reemplazo


Numero de formas =
Muestreo sin reemplazo
Numero de formas =
Calculadora = Shift

(nCr)

Estimacin de Medias
Datos 30 Se trabaja con distribucin normal.
Datos < 30 Se trabaja con t- student

Se reunieron 31 datos referentes al peso del saln 322. Calcule el promedio y la


desviacin de la (media poblacional) a travs de un intervalo con un nivel de
confianza del 95%.
159, 150, 198,180, 130, 165, 205, 130, 140, 101, 115, 115,128, 200, 208, 186, 117, 182, 170, 105, 127,
128,150, 100, 129, 100, 137,118, 170, 101.
= 140.23lbs
S = 33.7 lbs.

NC=95%
= significancia
=5% = 0.05
= 0.0250
= 0.975
Z= 0.975 1.96

: Estimador puntual
z(
): coeficiente de confiabilidad
: Error Estndar
140.23 (1.96) (

140.23 + 11.86= 152.09


140.23 11.86 = 128.37
[128.37 152.09]

Interpretacin: Con el 95% de confiabilidad se


puede decir que la media del peso de los
estudiantes del saln 322 se encuentra entre
[128.37 152.09]

Estimador
Puntual

Error
Estndar

Precisin
Mximo error de
Estimacin
Error

Coeficiente de
confiabilidad

> 0.05 Si utiliza factor de correccin (FC)


0.05 No utiliza Factor de Correccin

Factor de correccin (FC)

Afecta al (Error estndar)

En una muestra de 144 pacientes se determin el valor medio de la presin,


el cual corresponde a 18mmhg. Si determino que la varianza de la
poblacin es de 4. Determine lo siguiente.
a. El error estndar

b. El coeficiente de confiabilidad para un nivel de confianza de 90%


NC= 90%

Z (1-0.05) = z0.95 = 1.645

c. Construya un intervalo de confianza con una significancia 7.40%


0.370
= 1-0370 =0.963 Busco el rea
Z= 0. 1.79

d. Si existe una poblacin de sujetos de estudios equivalente a 600. Encuentre el error


estndar.

Error Estndar

18 (1.79) (0.17)

Coeficiente de confiabilidad

Estndar
Puntual

18 + 0.39 = 18.30
18 0-39 = 17.7
[17.7 18.30] mmHg

Con un nivel de confianza de 92% se puede concluir que la media de la


poblacin () se encuentra entre [17.7 18.30] mmHg

e. Encuentre el mximo error de estimacin (con la poblacin y sin la poblacin)


N=600

)(
o
o

Sin la poblacin (1.79)(0.17) = 0.30


Con la poblacin (1.79)(0.15) 0.27

Distribucin t- student

Criterio para usar z o t

Poblacin
muestra
grande
z

muestra
pequea

Muestra

muestra
grande

Estimador
Puntual

Todo lo contrario es z

Coeficiente de
confiabilidad

Error
Estndar

Se tom una muestra de 16 nios recin nacidos a los cuales se les determino la
concentracin media de bilirrubina en el suero. El valor de la concentracin media es de

=5.98mg/100cc con una desviacin de 3.5mg/100cc

a. Cul es el valor del estimador puntual?


La media de la muestra es el estimador puntual!
5.98mg/100cc
b. Cul es el valor del coeficiente de confiabilidad?
5%
n=16
n-1 =15
Grados de libertad (gl) =15

0.3250
= 1-03250=0.975

busco el rea
Coeficiente de confiabilidad =2.1315
c. Cul es el valor de error estndar?

d. Construya un intervalo de confianza con una significancia igual al 5%


5.98 (2.1315)(0.875)
5.98+1.87 = 7.85
5.98-1.87= 4.11
Con 95% de confiabilidad se puede concluir que la media de la poblacin
() se encuentra entre [4.11 7.85] mg/100cc
e. Construya un intervalo de confianza con un nivel de confianza de 90%
5.98 (1.7530)(0.875)
5.98+1.53 = 7.51
5.98-1.53= 4.45
busco el rea

Con 90% de confiabilidad se puede


concluir que la media de la poblacin ()
se encuentra entre [4.45 7.51] mg/100cc

Intervalo de confianza para


la proporcin de una
poblacin
Se utilizara z para los intervalos de proporcin. Si tiene la poblacin y muestra deber calcular
para determinar si es mayor de 0.05 y utilizar factor de correccin.

Estimador
Puntual

Error
Estndar

Coeficiente de
confiabilidad

En una muestra aleatoria simple de 125 varones desempleados, expulsados todos ellos de la
escuela preparatoria, entre las edades de 16 - 21 aos inclusive 88 de ellos declararon que
eran consumidores de bebidas alcohlicas, construya un intervalo de confianza de 95% para
la proporcin de la poblacin.
N=125
n=88
NC= 95% z=1.96
(

0.704 (1.96) (0.04)


0.704+ 0.0784 =0.7824
0.704- 0.0784 = 0.6256

se encuentra entre [0.63 0.78]


Con el 95% de confiabilidad se puede concluir que la

Tamao de Muestra
D=2d

Dimensin

d=

Amplitud

Poblacin Infinita
Medias

Proporciones

q =1-p

Poblacin Finita
Medias

Proporciones


( )

p=

Prueba de Hiptesis
es la que el
investigador
supone.

Desde el punto de vista


estadstico una hiptesis
es una suposicin de
algo que se supone
referente a una muestra
o poblacin.

Prueba de
hiptesis

Alterna (Ha)
Las hiptesis
estadsticas se
dividen en
Es la contraparte de
la alterna o bien la
que se presume o
carcteristica
estudiada.

Nula (Ho)

Cuando se rechaza la nula, se acepta la alterna.


Cuando se acepta la alterna se dice que es Estadsticamente significativo.
Z calculada

Z crtico= 1-

Prueba de Hiptesis para la media de una poblacin (): Para realizar una prueba
de hiptesis se recomienda seguir un procedimiento ordenado.

Paso 1.

Paso 2

Paso 3

Paso 4

Paso 5

Paso 6

Datos

Planteamiento
de hiptesis

Regla de
decisin

Estadstico
Clculado

Decisin

Conclusin

Condicin de la hiptesis
Verdadera
Falsa
Accin Posible No rechaza Ho Accin Correcta
Error tipo II
Rechazar Ho
Error tipo I
Accin correcta
Este error se conoce tambin
como Error alfa. Alfa () es la
probabilidad de cometer un
Error tipo I
Tipo I
La probabilidad decometer
error tipo II es el valor de Beta,
se llama Error tipo o error de
aceptacin.

Error

Tipo II

Se desea saber si es posible concluir que el consumo medio diario de caloras de la


poblacin rural de un pas en desarrollo es de menos de 2000. Una muestra de 500
individuos produjo un consumo medio de 1985 y una desviacin estndar de 210. Alfa
de 0.05
Paso 1 (Datos)
n=500
x=1985
s= 210
(

Paso 2 (Planteo de hiptesis)


Ho: 2000
Ha: <2000
Paso 3
No Rechazar
Ho.

Z crtico

Z(1-0.05) Z(0.95)=1.645

Paso 4 (Estadstico calculado)

Paso 5 (Regla de decisin)

Z calculada > z crtico


No rechaza Ho
Paso 6 (Conclusin)
Con un 95% se concluye que la media calrica de la poblacin rural de un pas en
desarrollo es mayor o igual que 2000.

Estadstico P Prueba
En toda prueba de hiptesis el estadstico p nos permite comparar la proporcin de p con
la significancia para poder tomar la decisin final.

Condicin general

P
P>

Rechaza Ho
No Rechaza Ho

El valor de P, viene de z calculado

Prueba de Hiptesis (t-student)


t calculada

Unilateral

Bilateral

t crtico=

Prueba de hiptesis para la proporcin de una poblacin


Poblacin
estimada

Supuesta poblacin
qo= 1-po

Prueba de independencia
(ji- cuadrado)
Se puede establecer la asociacin o relacin que existe entre dos
variables cualitativas.
Todos los pasos de la prueba de hiptesis son iguales excepto el de
estadstico calculado.
Cuando las variables cualitativas son dipotmicas (2 categoras) los
cuadros de contingencia son de 2x2
Primero criterio Clasificacin
1
2
Totales
Segundo Criterio
1
A
B
A+B
Clasificacin
2
C
D
C+D
A+C
B+ D
n

Para calcular el estadstico de prueba para una tabla de contingencia


de 2x2.
(
)
(
)(
)(
)(
)
Para buscar el valor de Ji crtico en la tabla se hace a travs de los
grados de libertad (gl). Y el valor de la significancia.
gl= (nmero de filas -1) (nmero de columnas -1)
gl= 1 tablas de 2x2.
Si Ji calculado > ji critico Se rechaza Ho

Son unilaterales a la derecha nicamente.


La distribucin
no es simtrica
Es significativa cuando se rechaza la hiptesis nula (Existe relacin).

Prueba de Ji- cuadrado


matriz mayor 2x2
Todos los pasos de la prueba de hiptesis son iguales excepto el de
estadstico calculado.
Se utiliza la siguiente frmula para el clculo del estadstico de prueba.
Valores Observados

)
Valores Esperados

Cantidad de elementos dentro la matriz


Oi
Valor
observado

Ei
Ei =

Oi- Ei
Al valor observado se
le resta el resultado
de la operacin
anterior.

(Oi-Ei)

(Oi-Ei) / Ei

El resultado lo
elevamos al
cuadrado

El resultado en la
casilla anterior, divido
lo de la segunda.

Vous aimerez peut-être aussi