Académique Documents
Professionnel Documents
Culture Documents
1 Los datos son los hechos y lo nmeros que se renen, analizan y resumen para su representacin e interpretacin. Los datos se renen mediante las siguientes escalas de medicin: Los elementos son las entidades acerca de las cuales se renen los datos. Una variable es una caracterstica de inters de los elementos. Por ejemplo: rendimiento, olsa, relacin precio rendimiento, etc. Una poblacin es un conjunto !ormado por todos los elementos que son o jeto de estudio estadstico. Una muestra es un su conjunto representati"o de la po lacin. La inferencia estadstica es el proceso de reunir datos o tenidos de una muestra para hacer estimaciones o pro ar hiptesis acerca de las caractersticas de una po lacin. Una variable categrica o atributo es de car#cter cualitati"o. Una variable numrica es de car#cter cuantitati"o. Los datos rele"ados para un estudio estadstico pueden ser de di!erente naturaleza: Cualitativos cuando el resultado de la o ser"acin se e$presa en !orma nominal, mediante el empleo de categoras. %onocidos como varia!l"s #at"$%ri#as. Cua&titativos cuando el dato surge de un conteo o de una medicin que arroja como resultado un "alor numrico. &enominados varia!l"s &u'(ri#as. Por otra parte las varia!l"s &u'(ri#as pueden ser clasi!icadas as: Discretas, cuando toman solamente "alores numera les, que surgen generalmente de un conteo. Continuas, cuando pueden tomar cualquier "alor dentro de un cierto rango, por lo general constituyen el resultado de alguna medicin. '()U*(+ &( &,-.) %U,L/-,-/0.): Una )istri!u#i%& )" *r"#u"&#ias es un resumen ta ular de un conjunto de datos que muestra el nmero 1!recuencia2 de artculos en cada una de "arias clases que no se traslapan. La *r"#u"&#ia r"lativa de una clase es la !raccin o proporcin de elementos que pertenecen a esa clase. 3recuencia relati"a de una clase 4 !recuencia de la clase 5 n. La !recuencia porcentual de una clase es la !recuencia relati"a multiplicada por 677.
.tra !orma de presentar la distri ucin de !recuencias de una "aria le es mediante el empleo de gr#!icos. Por ejemplo: 8r#!ico de arras o diagrama de arras: es una !orma gr#!ica de representar datos cualitati"os que se han resumido en una distri ucin de !recuencias, de !recuencias relati"as o !recuencias porcentuales.
s prite pepper coca 0 5 10 15 20
.tro gr#!ico que se utiliza especialmente cuando se analizan causan de algn pro lema, en el cual las categoras se ordenan por !recuencias decrecientes. 9ste gr#!ico permite identi!icar r#pidamente los !actores m#s !recuentes, con el o jeti"o de centrar los es!uerzos en el ataque de los mismos.
35 30 25 20 15 10 5 0 a plica ciones tem a s otros
'()U*(+ &( &,-.) %U,+-/-,-/0.): Una )istri!u#i%& )" *r"#u"&#ias es un resumen ta ular de un conjunto de datos que muestra el nmero 1!recuencia2 de artculos en cada una de "arias clases que no se traslapan. Los tres pasos necesarios para de!inir las clases en una distri ucin de !recuencias con datos cuantitati"os son: 62 &eterminar la cantidad de clases no traslapantes: :2 &eterminar el ancho de cada clase ;2 &eterminar los lmites de clase N+'"ro )" #las"s, 2
)e !orman al especi!icar los inter"alos que se utilizar#n para agrupar los datos. )e recomienda usar entre < y :7 clases. (l propsito es emplear su!icientes clases para mostrar la "ariacin de los datos. A&#-o )" #las"s, )e recomienda igual ancho para todas las clases, la decisin de cantidad y ancho de clases no son independientes. Una mayor cantidad de clases se traduce en menor ancho, y "ice"ersa. Para determinar el ancho se comienza por identi!icar los "alores m#$imos y mnimos. 3rmula: ,ncho apro$imado de clase 4 0alor m#$imo = "alor mnimo 5 cantidad de clases L.'it" )" #las"s, )e de en escoger los lmites de clase de tal manera que cada "alor pertenezca a una sola clase. (l lmite in!erior de clase es el "alor mnimo posi le y el lmite superior es el "alor m#$imo posi le de los datos de la clase. (l /u&to '")io )" #las" 0'ar#a )" #las"1 es el "alor promedio entre los lmites in!erior y superior de la clase. Por ejemplo: -iempo de auditora 1das2: 6: 6> 6? 6@ 6 6< 6@ 6A < :7 :A :: :; :: :6 ;; :@ 6> 6@ 6B 6; -iempo 67C6> 6<C6? :7C:> :<C:? ;7C;> -otal 3recuencia , soluta > @ < : 6 :7 *% 6: 6A :: :A ;: C
DISTRI2UCIN DE 3RECUENCIAS RELATIVAS 4 DE 3RECUENCIAS PORCENTUALES La *r"#u"&#ia r"lativa es la proporcin de la cantidad total de artculos que pertenecen a una clase: 3recuencia relati"a de clase 4 !recuencia de clase 5 n La *r"#u"&#ia /or#"&tual de una clase es la !recuencia relati"a multiplicada por 677. Por ejemplo: -iempo 67C6> 6<C6? :7C:> :<C:? ;7C;> 3cia. , soluta > @ < : 6 3cia. 'elati"a 7.:7 7.>7 7.:< 7.67 7.7< 3cia. Porcentual :7 >7 :< 67 < 3
-otal
:7
6.77
677
.tra !orma de presentar la distri ucin de !recuencias de una "aria le es mediante el empleo de gr#!icos. Por ejemplo: La Gr5*i#a de Puntos es un eje horizontal muestra el inter"alo de los "alores para los datos. 9ste muestra los detalles de los datos, y es til para comparar la distri ucin de datos para dos o m#s "aria les. Un -isto$ra'a se traza colocando la "aria le de inters so re el eje horizontal y la !recuencia, la !recuencia relati"a o la !cia. porcentual en el eje "ertical. %ada !cia. de clase se representa trazando un rect#ngulo cuya ase es el inter"alo de clase so re el eje horizontal y cuya altura es la !cia. correspondiente. Los rect#ngulos adyacentes de un histograma se tocan entre s. (l /ol.$o&o )" *r"#u"&#ias es la representacin en el histograma de las marca de clase.
DISTRI2UCIN ACUMULADA La )istri!u#i%& )" *r"#u"&#ias a#u'ula)as muestra la cantidad de elementos con "alores menores que, o iguales al lmite superior de clase para cada clase. Una distri ucin de *r"#u"&#ias r"lativas a#u'ula)as muestra la proporcin de elementos y que una distri ucin de *r"#u"&#ias /or#"&tual"s a#u'ula)as muestra el porcentaje de elementos con "alores menores o iguales al lmite superior de cada clase. Por ejemplo: -iempo *enor que o igual a 6> *enor que o igual a 6? *enor que o igual a :> *enor que o igual a :? *enor que o igual a ;> 3cia. , soluta ,cumulada > 6: 6A 6? :7 3cia. 'elati"a ,cumulada 7.:7 7.B7 7.@< 7.?< 6.77 3cia. Porcentual ,cumulada :7 B7 @< ?< 677
+ota: )i los datos hu ieran sido redondeados en dcimos, los lmites de er#n e$presarse en dcimos. )i stos estu"iesen representados en centsimos, los lmites se e$presar#n en centsimos. Una clase a ierta por un e$tremo es aquella que slo tiene un lmite in!erior de clase, o un lmite superior de clase 1podra ser ;< o m#s2. A&5lisis "6/loratorio )" )atos, (l )ia$ra'a )" tallo 7 -o8as se puede emplear para mostrar simult#neamente el orden del rango y la !orma de de un conjunto de datos. Para construirlo 4
primero ordenamos los dgitos principales de cada dato a la izquierda de una lnea "ertical, a la derecha se registra el ltimo dgito para cada dato con!orme se re"isan las o ser"aciones en el orden que se registraron. Las unidades de hoja indican como multiplicar lo nmeros del tallo, por ejemplo Unidad de hoja 4 67. Las ta ulaciones cruzadas y los diagramas de dispersin sir"en para resumir los datos en !orma que re"elen la relacin entre "aria les. Ta!ula#i%& #ru9a)a es un mtodo que se puede utilizar para resumir de manera simult#nea los datos para dos "aria les. Por ejemplo: ("aluacin de calidad Dueno *uy Dueno ($celente Total 67C6? >: ;> : A@ :7C:? >7 B> 6> 66@ ;7C;? : >B :@ AB >7C>? 7 B :: :@ -otal @> 6<7 BB ;77
Un )ia$ra'a )" )is/"rsi%& es la representacin gr#!ica de la relacin entre dos "aria les cuantitati"as. Por ejemplo: )emana +mero de 0olumen de comerciales "entas 6 : <7 : < <A ; 6 >6 > ; <> < > <>
ESTAD:STICA DESCRIPTIVA, MEDIDAS DE LOCALI;ACIN
Media (s una medida de localizacin central de un conjunto de datos. )e calcula sumando todos los "alores de los datos y di"idiendo el resultado entre el nmero de o ser"aciones. &atos sin agrupar: x1 x= n La '")ia r"#orta)a se o tiene eliminando los "alores mnimos y m#$imos de un conjunto de datos, calculando entonces el promedio de los "alores restantes. Mediana: (s otra medida de localizacin central de los datos. (s el "alor intermedio cuando los "alores de los datos se ordenan en !orma ascendente. %on un nmero impar de o ser"aciones, la mediana es el "alor intermedio. Para un nmero par de o ser"aciones, la mediana es el promedio de los dos "alores intermedios. Moda: (s el "alor de los datos que se presentan con m#s !recuencia. 5
Percentiles: &a in!ormacin acerca de cmo se distri uyen los "alores so re el inter"alo, desde el menor hasta el mayor. (l pCsimo percentil es un "alor tal que por lo menos p por ciento de las o ser"aciones son menores o iguales que este "alor y por lo menos 1677Cp2 por ciento de las o ser"aciones son mayores o iguales que este "alor. i= (p/100).n Cuartiles: )on percentiles espec!icos E6 4 primer cuartil o percentil :<. i = (25/100).n E: 4 segundo cuartil o mediana. i = (50/100).n E; 4 tercer cuatil o percentil A<. i = (75/100).n )i el cuartil no es entero, se redondea. (l "alor entero inmediato mayor que i indica la posicin del pCsimo percentil. )i i si es entero, el pCsimo percentil es el promedio de los "alores de los datos u icados en los lugares i e i +1. Rango: (s una medida de "aria ilidad, de!inida como el "alor m#$imo menos el "alor mnimo. Rango Intercuartil: (s la di!erencia entre el tercer y primer cuartil. Varian a: )e asa en la di!erencia entre el "alor de cada o ser"acin 1$ i2 y la media. La di!erencia entre cada xi y el promedio 1 x 2 para calcular la "arianza las des"iaciones respecto al promedio se ele"an al cuadrado.
3%r'ula )" la varia&9a )" u&a /o!la#i%&, ( xi ) 2 2 = = n 3%r'ula )" la varia&9a )" la 'u"stra, ( xi x ) 2 S2 = = n 1 Desviacin est!ndar: )e de!ine como la raz cuadrada positi"a de la "arianza. 3%r'ula )" la )"svia#i%& "st5&)ar )" u&a /o!la#i%&, ( xi x ) 2 = = 2 n 3%r'ula )" la varia&9a )" la 'u"stra, ( xi x ) 2 S2 = = s2 n 1 6
Coeficiente de Variacin: (s una medida relati"a de "aria ilidad porque e"ala la des"iacin est#ndar en relacin con la media. )e calcula di"idiendo la des"iacin est#ndar entre la media y multiplicando el cociente por 677.
cv = s 100 = x
(l coe!iciente de "ariacin es un estadstico til para comparar la dispersin de "aria les que tienen distintas des"iaciones est#ndar y distintos promedios. Valores 9: 0alor calculado di"idiendo la des"iacin est#ndar respecto al promedio, 1 x 2 entre la des"iacin est#ndar s. representa la cantidad de des"iaciones est#ndar que hay entre el "alor xi y el promedio.
zi =
xi x s
Resumen de cinco n"meros: 62 0alor mnimo. :2 E6 ;2 *ediana >2 E; <2 0alor m#$imo Un )ia$ra'a )" #a8a es un resumen gr#!ico de los datos asado en un resumen de cinco nmeros. )e traza un rect#ngulo desde el primer cuartil hasta el tercero, que indica la u icacin del <7F intermedio de los datos. Unas lneas punteadas llamadas igotes, que "an en los e$tremos de la caja y muestran la u icacin de datos mayores que el tercer cuartil y menores que el primero. -am in se muestran las u icaciones de los "alores atpicos.
M#DI$ P%&D#R$D$ ' M$&#(% D# D$T%) $*R+P$D%) Media Ponderada: (s la media para un conjunto de datos, que se o tiene asignando a cada o ser"acin un peso o !actor que re!leja su importancia dentro del conjunto.
(w x ) x=
i i
wi
Media de la muestra para datos agrupados: Para calcular la media de la media para datos agrupados, tratamos al punto medio de cada clase. )ea Mi el punto medio de la clase i, y fi la !recuencia de la clase i. G n = f i = tamaHo de la muestra.
x=
fi M i = n
7
f i ( M i x ) 2i S = = n 1
2
fi ( M i )2 = = n
2
UNIDAD Nro. < PRO2A2ILIDAD 4 VARIA2LES ALEATORIAS Un e-perimento aleatorio es un ensayo que tiene "arios resultados posi les y no se puede anticipar cual de ellos "a a suceder hasta que no se realiza el e$perimento en cuestin. )e denomina espacio muestral al conjunto !ormado por todos los resultados posi les de un e$perimento. )e denomina evento a cualquier su conjunto del espacio muestral, el cual puede estar !ormado por un resultado o una com inacin de resultados. La probabilidad es un nmero entre cero y uno que mide la chance de ocurrencia de un e"ento. REGLAS DE CONTEO
COM2INACIONES 4 PERMUTACIONES
Regla de conteo para #-perimentos de etapas m"ltiples )i un e$perimento se puede descri ir como una sucesin de K etapas, en las que hay n6 resultados posi les en la primera etapa, n: en la segunda, etc., la cantidad total de resultados e$perimentales es igual a 1n62, 1n:2,I1nJ2. Una representacin gr#!ica para entender un e$perimento y enumerar resultados en "arias etapas es un diagrama de #r ol. Regla de conteo para combinaciones:
n n! C k = (n k )!k!
Permite contar la cantidad de resultados e$perimentales cuando en un e$perimento se de en seleccionar n o jetos entre un conjunto de N o jetos. Regla de conteo para permutaciones:
n n! P k = ( n k )!
Permite calcular el nmero de resultados e$perimentales al seleccionar n o jetos de un conjunto de N o jetos, donde es importante el orden de seleccin. )i los mismos n o jetos se seleccionan en otro orden se considera que se trata de un resultado e$perimental distinto. ASIGNACIN DE PRO2A2ILIDADES $signacin de probabilidades Los tres mtodos m#s comunes son el cl#sico, de !recuencia relati"a y su jeti"o. )in importar el mtodo que emplee, las pro a ilidades asignadas de en satis!acer dos requerimientos #sicos de la pro a ilidad. (stos son: 62 La pro a ilidad asignada a cada resultado e$perimental de e estar entre 7 y 6. :2 La suma de las pro a ilidades para los resultados e$perimentales de e ser igual a uno. 9
(l '(to)o #l5si#o es apropiado cuando los resultados e$perimentales son equipro a les. %uando se utiliza este mtodo se satis!acen los dos requerimientos. Por ej.: lanzar un dado 65B. (l mtodo de frecuencia relativa .frecuencial/ de asignar pro a ilidades es apropiado cuando se cuenta con datos para estimar la proporcin del tiempo en que ocurrir# el resultado e$perimental si el e$perimento se repite un nmero grande de "eces. (l mtodo sub0etivo de asignacin de pro a ilidades es m#s apropiado cuando es irreal suponer que los resultados son equipro a les y cuando se tienen datos poco rele"antes. EVENTOS 4 SUS PRO2A2ILIDADES La probabilidad de un evento es igual a la suma de las pro a ilidades de los puntos muestrales de un e"ento. %alcularemos la pro a ilidad de un e"ento al sumar las pro a ilidades de los puntos muestrales que lo !orman. 'epaso: , D = , unin DC indica los resultados !a"ora les a ,, a D, o am os. , D = , interseccin DC indica los resultados comunes a , y D. )i , D 4 Cconjunto "acoC signi!ica que , y D son e$cluyentes. )i A B signi!ica que , y D son no e$cluyentes. )i , D 4 L es decir que el e"ento , y su complemento son e$cluyentes y e$hausti"os. complemento de un evento se de!ine de la siguiente manera: &ado un e"ento ,, el complemento de , 1,%2 se de!ine como el e"ento !ormado por todos los puntos muestrales que no est#n en ,. en consecuencia, P1,2 K P1,%2 4 6 (l c#lculo de la pro a ilidad mediante el complemento es el siguiente P1,2 4 6 = P1,%2 La unin de , y D es el e"ento que contiene todos los puntos muestrales que pertenecen a , o a D, o a am os. La unin de , y D se representa con A 2. &ado dos e"entos, , y D, la interseccin de , y D es el e"ento que contiene los puntos muestrales ue pertenecen simult#neamente a , y a D, y se representa como A 2. Las cantidades P1,2 y P1D2 se denominan pro a ilidaes simples o marginales. LE4 ADITIVA 0EVENTOS NO E=CLU4ENTES1 (sta ley proporciona una !orma de calcular las pro a ilidades de que ocurra el e"ento , o el D, o de am os. (nunciado: (l
10
Los dos primeros trminos en ella P1,2 K P1D2 se asocian con todos los puntos muestrales de , D. )in em argo, como todos los puntos muestrales en la interseccin , D est#n en , y D al mismo tiempo, al calcular P1,2 K P1D2 de hecho contamos dos "eces a cada uno de los puntos en , D. al restar P1, D2 corregimos el do le conteo. EVENTOS MUTUAMENTE E=CLU4ENTES )e dice que dos e"entos son mutuamente e$cluyentes si no tienen puntos muestrales en comn. (sto es, los e"entos , y D son mutuamente e$cluyentes si, cuando ocurre uno, el otro no puede ocurrir. Un reuisito es que su interseccin no de e contener puntos muestrales. Ley aditi"a para los e"entos e$cluyentes:
PRO2A2ILIDAD CONDICIONAL La pro a ilidad de un e"ento se "e in!luida por la ocurrencia de otro e"ento relacionado. )i tenemos un e"ento con pro a ilidad P1,2, si o tenemos y ocurre un e"ento relacionado D, quisiramos apro"echar esta in!ormacin para calcular una nue"a pro a ilidad del e"ento ,. este nue"a pro a ilidad se llama pro a ilidad condicional P1, MD2. La notacin Mindica el hecho de que se considera la pro a ilidad del e"ento , dada condicin de que ha ocurrido el e"ento D. (nunciado:
P( A B) = P( A B) P( B)
PR%1$1I,ID$D C%&(+&T$ %ada uno de los "alores e$presa la pro a ilidad de la interseccin de dos e"entos, las pro a ilidades se llaman pro a ilidades conjuntas. *ide las chances de que am os e"entos ocurran simult#neamente.
#V#&T%) I&D#P#&DI#&T#) Dajo condiciones de independencia estadstica, la pro a ilidad conjunta es igual al producto de las marginales 1pro a ilidades simples2 , o sea, que el hecho de que haya sucedido D no a!ecta la ocurrencia del e"ento ,. (nunciado: P ( A B ) =P ( A) LE4 MULTIPLICATIVA 0EN GENERAL CON O SIN INDEPENDENCIA1 )e usa para determinar las pro a ilidades de una interseccin de dos e"entos.
P ( A B) = P( B) P ( A B)
LE4 MULTIPLICATIVA PARA EVENTOS INDEPENDIENTES )e usa para determinar las pro a ilidades de una interseccin de dos e"entos. &os e"entos son independientes si no est#n relacionados y tampoco la pro a ilidad del e"ento se a!ecta por si ocurri el otro e"ento.
P ( A B ) = P ( A) P ( B )
VARIA2LES ALEATORIA 4 DISTRI2UCIN DE
PRO2A2ILIDADES
Una variable aleatoria es una descripcin numrica del rsultado de un e$perimento. Por ejemplo: nmero que sale al arrojar un dado, cantidad de caras de una moneda, etc. 11
Variable aleatoria discreta es la que toma un nmero !inito o in!inito de "alores numera les. Variable aleatoria continua es la que toma cualquier "alor dentro del rango para el cual est# de!inida. Los resultados e$perimentales que se asan en escalas de medicin como el tiempo, el peso, la distancia se pueden descri ir mediante "aria les aleatoria continuas. DISTRI2UCIONES DISCRETAS DE PRO2A2ILIDAD &escri e como se distri uyen las pro a ilidades de los di!erente "alores de la "aria le aleatoria. Las pro a ilidades de la "aria le aleatoria tiene que satis!acer los siguientes requisitos: f(x) es mayor o igual a 7 para todos los "alores de x. las pro a ilidades de en sumar 6. 3uncin de pro a ilidad uni!orme discreta: f(x) = 1/n. VALOR ESPERADO (s una medida de localizacin central de una "aria le aleatoria. La ecuacin es la siguiente:
E ( x) = = xf ( x)
Para calcular el "alor esperado de una "aria le aleatoria de emos multiplicar $ 1cada "alor de ella2 por !1$2 1su propa ilidad correspondiente2 y despus sumar todos los productos o tenidos. VARIAN;A (s un promnedio ponderado de las des"iaciones de una "aria le aleatoria respecto a su promedio, ele"ados al cuadrado. Los !actores de ponderacin son las pro a ilidades.
Var ( x) = 2 = ( x ) 2 . f ( x)
Lo esencial de la !rmula es la des"iacin, x , que mide lo alejado que se encuentra un "alor determinado del "alor esperado de la "aria le aleatoria. DESVIACIN ESTANDAR )e de!ine como la raz cuadrada positi"a de la "arianza:
12
UNIDAD Nro. B MODELOS DE PRO2A2ILIDADES MODELOS PARA VARIA2LES DISCRETAS Una "aria le aleatoria discreta toma un nmero !inito o in!inito de "alores numera les, es decir, unicamente toma "alores enteros que generalmente pro"ienen de un conteo. ($iste una !uncin de pro a ilidad p1$2 que asigna pro a ilidades a los "alores de la "aria le. (sta !uncin de e cumplir con las siguientes condiciones: 2 3 p.-i/ 3 4 p.-/ es una pro a ilidad y por lo tanto no puede tomar "alores negati"os ni mayores a uno. 5 p.-i/ 6 4 La suma de pro a ilidades repartidas entre los "alores de la "aria le de e ser igual a uno.
La !uncin matem#tica ue de!ine a p1$2 depende del pro lema que se analiza. Un tipo de !enmeno que aparece con mucha !recuencia son los denominados ensa7os de 1ernoulli8 #nsa7os de 1ernoulli: e$perimento aleatorio con dos resultados posi les, cuyas pro a ilidades permanecen constantes, y sus resultados son independientes en cada inento. -iene la siguientes caractersticas: Posee slo dos resultados posi les, denominados $ito si la unidad o ser"ada posee la caracterstica de estudio, y !racaso si no la tiene. ,m os resultados son e$cluyentes. La pro a ilidad de $ito es p y la pro a ilidad de !racaso es 16Cp2. La pro a ilidad de $ito se asume constante en cada intento del e$perimento. Los resultados de cada intento son independientes.
La "aria le asociada a este e$perimento toma "alor 6 si se registra un $ito, y 7 si se "eri!ica un !racaso. Las principales propiedades de una "aria le de tipo 1ernoulli son las siguientes: (speranza : 0arianza:
Var ( x ) = 2 = p (1 p )
E ( x) = = p
($tendiendose ste !enmeno a un nmero acotado de unidades o ser"adas 1personas o cosas2 podemos determinar la pro a ilidad de o tener C $itos en & ensayos respetidos de un e$perimento de Dernoulli en el cual las pro a ilidades de $ito en cada intento "ale /.
13
DISTRI2UCIN DE PRO2A2ILIDAD 2INOMINAL (s una distri ucin discreta de pro a ilidad y se relaciona con un e$perimento de etapas mltiples 1 inominal2. Distribucin 1inominal: modelo quepermite calcular la pro a ilidad de o tener C $itos en & intentos repetidos de un e$perimento Dernoulli. -ienen cuatro propiedades: 62 (l e$perimento consiste en una sucesin de n intentos o ensayos idnticos. :2 (n cada intento o ensayo son posi les dos resultados. , uno lo llamaremos $ito y al otro !racaso. ;2 La pro a ilidad de $ito, representada por p, no cam ia de intento o ensayo a otro. (n consecuencia, la pro a ilidad de !racaso, representada por 1 p, no cam ia de un intento a otro. >2 Los intentos o ensayos son independientes 1pues p no cam i2. )i e$isten las propiedades :, ; y > se dice que los intentos se generan mediante un proceso de Dernoulli. )i adem#s e$iste la propiedad 6 se dice que se tiene un e$perimento inominal. En un experimento binominal nos intersa el nmero de xitos que su eden en los n intentos . 3uncin de pro a ilidad inominal:
n x ( n x ) f ( x) = x p (1 p )
p p#$babi"i%a% %e (n &it$ en )(a"*(ie# intent$ (1-p) p#$babi"i%a% %e (n +#a)a!$ en )(a"*(ie# intent$. O tambin
p(k ) = P( X = k ) = n! p k q n k k!( n k )!
n n'me#$ %e intent$! k ,a"$# *(e a%$pta "a ,a#iab"e. p p#$babi"i%a% %e &it$ en )a%a intent$. Los par#metros de este modelo son & 1nmero de intentos2 y / 1pro a ilidad de $ito en cada intento2. 'ecordemos que p es constante en cada intento y que los resultados son independientes. &e acuerdo a los "alores de & y / empleados se modi!ican las propiedades gr#!icas de la distri ucin de pro a ilidades o tenidas. Las principales propiedades de esta distri ucin son las siguientes: 14
Var ( x ) = 2 = n. p (1 p )
Desviacin est!ndar
DISTRI2UCIONES CONTINUAS DE PRO2A2ILIDAD Distribucin de probabilidad uniforme )iempre que la pro a ilidad sea proporcional a la longitud del inter"alo, la "aria le tiene distri ucin uni!orme.
f ( x ) ={ 0 en )(a"*(ie# $t#a pa#te 1 a pa#a a & b
Var ( x ) = ( a ) 2 12
Desviacin est!ndar
DISTRI2UCIN DE PRO2A2ILIDAD NORMAL )i ien e$isten di!erentes !unciones de densidad de pro a ilidad que sir"en para modelar distintos tipos de !enimenos relaes, pero una de las m#s utilizadas en la pr#cti"a es la distri ucin normal, que permite representar el comportamiento de "aria les con distri uciones simtricas. Curva normal Una "aria le continua puede tomar in!initos "alores dentro del rango en el cual est# de!inida, y generalmente pro"iene de una medicin. ($isten una !uncin que mide concNntracin de pro a ilidad alrededor de cada "alor que toma la "aria les, que se denomina *u&#i%& )" )"&si)a) )" /ro!a!ili)a) &or'al f.-/ y es una cur"a continua que puede adoptar una amplia "ariedad de !ormas di!erentes. La distri ucin normal tiene !orma de campana y su !uncin de densidad de pro a ilidad es la siguiente:
f ( x) =
La cur"a normal tiene dos par#metros: - 2. que determinan el lugar y 2 la !orma de la distri ucin de pro a ilidad normal. G coinciden con las # 2!
( x " ) 2
15
principales propiedades de la "aria le, el "alor esperado y la "arianza. Por lo tanto el par#metro descri e la posicin de la distri ucin y 2 modela su dispersin.
%aractersticas: 1) La !amilia completa de distri uciones de pro a ilidad normales se di!erencia por su media y su des"iacin est#ndar . :2 (l punto m#s alto de la cur"a normal es la media, que tam in es la mediana y la moda de la distri ucin. ;2 La media de la distri ucin puede ser cualquier alor numrico: negati"o, cero o positi"o. >2 La distri ucin de pro a ilidad normal es simtrica, y su !orma a la izquierza de la media es una imagen especular de la !orma a la derecha. Las colas, se prolongan al in!inito en am as direcciones y nunca tocan el eje central. <2 La des"iacin est#ndar determina el ancho de la cur"a. B2 Las pro a ilidades para la "aria le aleatoria normal est#n dadas por #reas ajo la cur"a. (l #rea total ajo la cur"a para la distri ucin de pro a ilidad normal es 6. &e ido a que la distri ucin es simtrica, el #rea total ajo la cur"a a la izuierza es 7.<7 y el #rea hacia la derecha es 7.<7. DISTRI2UCIN DE PRO2A2ILIDAD NORMAL ESTANDAR )e dice que una "aria le aleatoria que tiene distri ucin normal con media cero y des"icin est#ndar uno tiene distribucin normal est!ndar. )e usa 9 para indicar esta "aria le aleatoria normal especial. Los c#culos se lle"an a ca o determinando las #reas ajo la gr#!ica de la !uncin de densidad de pro a ilidad. Para la distri ucin de pro a ilidad normal est#ndar se han determinado las #reas ajo la cur"a normal, y se muestran en ta las que se pueden usar para calcular pro a ilidades. Por ejemplo se puede calcular la pro a ilidad de que el "alor z, para la "aria le aleatoria normal est#ndar, quede entre 7.77 y 6.77 es to es P17.77 O z O 6.772 4 7.;>6; 1 uscado en la ta la2. Por lo tanto hemos determinado que la pro a ilidad de un "alor z entre z 4 C6.77 y z 4 K6.77 es: P1C6.77 O z O 7.772 K P17.77 O z O 6.772 4 7.;>6; K 7.;>6; 4 7.B@:B Probabilidades acumuladas p1! " :2 4 p1! 4 72Kp1! 4 62Kp1! 4 :2 4 Distribucin Normal
Conversin a la est!ndar
z= x "
distribucin normal
)e demuestra que si la "aria le $ tiene distri ucin normal con par#metros y . la "aria le trans!ormada en z tam in tiene distri ucin normal con media cero y "arianza uno, y se
16
denomina est#ndar normal. Por ejemplo: suponemos que cierta distri ucin tiene =10 y =2. /%u#l es la pro a ilidad de que la "aria le aleatoria $ est entre 67 y 6>P. 0(an%$ x = 10. z = (x - ) / = (10110)/2 = 0 - )(an%$ x = 14. z = (x - ) / = (14110)/2 = 4/2 = 2. 2! %e)i#. *(e "a p#$babi"i%a% %e *(e x e!t ent#e 10 - 14 *(e%a %ete#mina%a p$# "a p#$babi"i%a% e*(i,a"ente %e *(e z e!t ent#e 0 - 2 en "a %i!t#ib()i3n n$#ma" e!t4n%a#. 5i (!am$! z = $%&& en "a tab"a ,em$! *(e "a p#$babi"i%a% e! 0.4772.
17
UNIDAD Nro. D IN3ERENCIA ESTAD:STICA Una po lacin es el conjunto !ormado por todos los elementos ue son o jeto de un estudio estadstico. Una muestra es un su conjunto representati"o de la po lacin. La inferencia estadstica tiene como propsito construir estimaciones y prue as de hiptesis acerca de las caractersticas de una po lacin por medio de la in!ormacin contenida en un muestra. (l o jeti"o del muestreo es tratar de in!erir 1apro$imar2 las propiedades de una po lacin, sin necesidad de o ser"ar todos sus elementos. Las propiedades de la po lacin se conocen como par!metros, mientras que las propiedades de la muestra se denominan estimadores. ($isten "arios moti"os que justi!ican el uso de muestras: -amaHo de la po lacin: el nmero de elementos puede ser !inito o muy grande. %ostos: cada medicin u o ser"acin cuesta dinero, y pocas "eces hay recursos su!icientes como para o ser"ar e$hausti"amente una po lacin. -iempo: muchas "eces los resultados del an#lisis estadstico se necesitan con urgencia, y no hay posi ilidades de esperar hasta que se o ser"e una po lacin completa. Limitaciones tcnicas: e$isten casos en que la o ser"acin implica la destruccin de la unidad, como por ejemplo la "ida til de un artculo. Precisin: una muestra correctamente diseHada es capaz de producir resultados muy precisos. Para poder o tener conclusiones "#lidas so re la po lacin, una muestra de e reunir las siguientes condiciones #sicas: 9omogeneidad: de e ser e$trada de la misma po lacin. Independencia: las o ser"aciones no tienen que estar mutuamente condicionadas entre s. Representatividad: de e re!lejar lo mejor posi le las caractersticas del conjunto del cual pro"iene. M+#)TR#% ($isten dos !ormas #sicas de seleccionar una muestra: Mu"str"o &o al"atorio en este caso se arma en ase al criterio esta lecido por el responsa le del estudio. )u con!ormacin depende !undamentalmente del juicio personal y de la e$periencia del o ser"ador. (ste mtodo tiene la "entaja de que la con!ormacin de la muestra es m#s simple, r#pida y econmica, pero posee la des"entaja de que no se puede cuanti!icar el error de muestreo 1di!erencia entre una propiedad de la po lacin y su estimacin muestral2. (s importante que el o ser"ador conozca muy ien las caractersticas de la po lacin muestreada para asegurarse de que la muestra sea realmente representati"a, pues de lo contrario se corre el riesgo de o tener conclusiones incorrectas. Mu"str"o al"atorio en este caso todas las unidades de la po lacin tienen chance de ser elegidas, y la seleccin se hace usando mtodos del azar. )i ien su implementacin es generalmente m#s la oriosa, porque e$ige la aplicacin de procedimientos estadsticos, garantiza o jeti"idad en el armado de la muestra, y tiene la "entaja desde el punto de "ista estadstico que en este caso s se puede e"aluar el error de muestreo.
18
ESTIMACIN PUNTUAL Un "alor numrico nico que se usa como estimacin de un par#metro po lacional. Para estimar el "alor de un par#metro de po lacin se calcula una correspondiente caracterstica de la muestra, que se denomina estadstico de muestra o medida muestral . Por ejemplo para estimar la media de la po lacin y la des"iacin est#ndar de la po lacin 2, se toman datos para calcular los correspondientes estadsticos de la muestra: la media muestral x y la des"iacin est#ndar de la muestra s.
x=
x
n
S2 =
( xi x ) 2 = n 1
x1 se usa p como estimacin de la n proporcin de la po lacin. (ste procedimiento estadstico se denomina estimacin puntual.
)e dice que x es el estimador puntual de la media po lacional , s es el estimador puntual de la des"iacin est#ndar po lacional 2, y que p es el estimador puntual de la proporcin p po lacional. , los "alores numricos o tenidos para x . s o p en una muestra se les llama estimaciones puntuales del par#metro. +inguna de las estimaciones puntuales son e$actamente iguales a los par#metros po lacionales correspondientes. )e espera esta "ariacin porque se usa una muestra, no un censo de toda la po lacin para o tener la estimacin. (l "alor a soluto de la di!erencia entre estimacin puntual insesgada y el par#metro po lacional correspondiente se llama error de muestreo. Para una media muestral, la des"iacin est#ndar y la proporcin muestrales, los errores de muestreo son Q x 1 67 6s 1 267 6 p - p'( respecti"amente. DISTRI2UCIONES MUESTRALES )i consideramos que un e$perimento es el proceso de elegir una muestra aleatoria simple, la media de la muestra x es la descripcin numrica del resultado del e$perimento. (n consecuencia la media de la muestra, x es una "aria le aleatoria. Por lo tanto, al igual que las otras "aria les aleatorias, x tiene una media o "alor esperado, una "arianza y una distri ucin de pro a ilidad, como los di"ersos "alores posi les de x son el resultado de distintas muestra aleatorias simples, a la distri ucin de x se le llama distribucin muestral de x . (l conocimiento de esta distri ucin muestral y de sus propiedades permitir# hacer a!irmaciones pro a ilsticas acerca de lo cercano que se encuentre la media de la muestra x de la media de la po lacin .
DISTRI2UCIN MUESTRAL DE x La distri ucin muestral de x es a distri ucin de pro a ilidad de todos los "alores posi les de la media muestral x . (l conocimiento de la distri ucin muestral de x permitir# hacer 19
a!irmaciones pro a ilsticas acerca del error de muestreo incurrido cuando se usa x para estimar . VALOR ESPERADO DE x (s igual a la media de la po lacin de donde se e$trae la muestra. VARIAN;A DE x 2
Var ( x) = n
E ( x) =
DESVIACIN ESTANDAR DE x
x = n
x = des"iacin est#ndar de la distri ucin muestral de x = des"iacin est#ndar de la po lacin. n 4 tamaHo de la muestra.
)iempre que: a2 la po lacin sea in!inita, o 2 la po lacin se !inita y tam in el tamaHo de la muestra sea mayor o igual que el <F del tamaHo de la po lacin. (l "alor de x es til para determinar lo alejado que pueda estar la media de la muestra de la media po lacional. &e ido al papel que desempeHa x , en el c#lculo de los posi les errores de muestreo, a x se le conoce como error est!ndar de la media.
20
Una "ez que o tenemos el resultado, consultamos la ta la de distri ucin de pro a ilidad normal est#ndar y "emos cual es el #rea entre z47 y z4 resultado ecuacin anterior, por ejemplo sera 7.:<6@ K 7.:<6@ 4 7.<7;B. DISTRI2UCIN MUESTRAL DE
p
La distri ucin muestral de p es a distri ucin de pro a ilidad de todos los "alores posi les de la porporcin muestral de p . Para determinar lo cercano que est# la porporcin muestral p de la proporcin po lacional p, necesitamos comprender las propiedades de la distri ucin muestral de p : su "alor esperado, su des"iacin est#ndar y la !orma de su distri ucin. VALOR ESPERADO DE
p p
(l "alor esperado de p , la media de todos los "alores posi les de como sigue: E ( p ) = p 8$n%e E ( p ) = ,a"$# e!pe#a%$ %e p p = p#$p$#)i3n p$b"a)i$na" DESVIACIN ESTANDAR DE
p =
p (1 p ) n
p
se puede e$presar
)iempre que: a2 la po lacin sea in!inita, o 2 la po lacin se !inita y tam in el tamaHo de la muestra sea mayor o igual que el <F del tamaHo de la po lacin. VALOR PRACTICO DE LA DISTRI2UCIN MUESTRAL DE
p
)iempre que se selecciona una muestra aleatoria simple y que el "alor de la proporcin de la muestra p se usa para estimar el "alor de la proporcin po lacional p, podemos predecir que hay cierto error de muestreo. (l error de muestreo es el "alor a soluto de la di!erencia entre el "alor proporcional de la muestra p y el "alor de la proporcin po lacional. (l "alor pr#ctico de la distri ucin muestral de p es que se puede usar para proporcionar in!ormacin prop a ilstica acerca del error de muestreo.
21
ESTIMADORES 4 PARAMETROS
La po lacin se puede caracterizar numricamente a tra"s de ciertos "alores denominados par!metros, que descri en sus principales propiedades. Un par#metro es un "alor !ijo 1no aleatorio2 que caracteriza a una po lacin determinada. (n general un par#metro es una cantidad desconocida, ya que cuando tra ajamos con po laciones grandes resulta complicado o ser"ar todos sus elementos. (n estos casos se procura in!erir las propiedades de la po lacin mediante el empleo de muestras. Las cantidades que descri en las propiedades de la muestra 1que se usan para apro$imar los par#metros de la po lacin2 se denominan estimadores. (n conclusin un estimador es una cantidad que tiene las siguientes caractersticas: Puede tener "arios resultados posi les. +o es posi le predecir s "alor antes de sacar la muestra y calcularlo. )i un estadstico es una "aria le aleatoria, es posi le determinar su distri ucin de pro a ilidades 1distri ucin de muestreo2 y se pueden calcular sus principales propiedades. La di!erencia entre el "erdadero "alor del par#metro y una estimacin del mismo se conoce como error de estimacin: %omo el "alor del par#metro es desconocido, en realidad no es posi le esta lecer e$actamente cuanto "ale ese error para cada una de las estimaciones realizadas. Pero si conocemos la distri ucin de pro a ilidades del estimador, se puede calcular el error m#$imo de estimacin para di!erentes ni"eles de precisin.
9 # =
ESTIMACIN DE PARAMETROS
Una de las herramientas de la in!erencia estadstica es la estimacin de par#metros, que consiste en apro$imar el "alor de un par#metro desconocido mediante el empleo de un estimador muestral. -ipos de estimacin: estimacin puntual. estimacin por inter"alos. (n la estimacin puntual, con los datos de la muestra se calcula alguna cantidad estadstica que permita apro$imar el "alor del par#metro desconocido. (n la estimacin por intervalos se calcula un rango o inter"alo de "alores que tiene una cierta pro a ilidad de incluir al par#metro desconocido.
Un uen estimador de e reunir ciertas propiedades. &os de las m#s importantes son: INSEGADE; )i el "alor esperado del estimador es igual al par#metro po lacional, se dice que el estimador es insesgado.
9) = E (
Por consiguiente el "alor esperado o media de todos los "alores posi les de un estadstico de muestra insesgado es igual al par#metro de po lacin que se estima. CONSISTENCIA Un estimador es consistente si al aumentar el tamano de la mustra la "arianza del estimador tiende a cero.
Si n
9) ! Var (
.tra propiedad es la: E3ICIENCIA )e dice que un estimador puntual con menor des"iacin est#ndar tiene mayor e!iciencia relati"a que otro. Ga que tiende a proporcionar estimaciones m#s cercanas al par#metro po lacional. Por ejemplo un estimador con esas propiedades es la media aritmtica, ya que: E ( x ) = La media aritmtica es un estimador insesgado.
2
n
Var ( x ) =
)i n aumenta, la "arianza de la media tiende a cero, y por lo tanto la media aritmtica es un estimador consistente.
La "entaja de la estimacin puntual es que, al proporcionar un nico "alor, es m#s !#cil de calcular e interpretar. )u principal limitacin es que no tiene asociada ninguna cantidad que permita e"aluar el error de estimacin.
ESTIMACIN DE INTERVALOS
&e ido a que el estimador puntual no da in!ormacin acerca de que tan cerca se encuentra la estimacin respecto al par#metro po lacional, los estadsticos pre!ieren usar una estimacin del intervalo, la cual proporciona in!ormacin acerca de la precisin de la estimacin. Una estimacin del inter"alo de un par#metro po lacional se construye al restar y sumar un "alor, denominado margen de error, a una estimacin puntual. Una estimacin del inter"alo de la media po lacional tomar# la !orma siguiente: x R :a#;en %e e##$# G una estimacin del inter"alo de una proporcin po lacional tomar# la !orma siguiente: p R :a#;en %e e##$#
#rror Muestral (l "alor a soluto de la di!erencia entre un estimador puntual insesgado y el par#metro de po lacin se llama error de muestreo. Para el caso de una media muestral que estima una media po lacional, el error de muestreo se de!ine: (rror de muestreo 4 Q x 1 6 (n la pr#ctica no se puede determinar el "alor del error muestral porque no se conoce . )in em argo, la distri ucin del muestreo de x se puede usar para hacer declaraciones de pro a ilidad acerca del error de muestreo. Por ejemplo: con una muestra de tamaHo n4677, y una des"iacin est#ndar de de po lacin de x 4 n 4 :75S6774 :. )i usamos la ta la de #reas de la distri ucin de pro a ilidad normal est#ndar, "eremos que ?<F de los "alores de una "aria le aleatoria con distri ucin normal quedan dentro de una distancia igual a R 6.?B des"iaciones est#ndar de la media. &e ido a que la distri ucin de muestreo de x se puede apro$imar mediante una distri ucin normal, ?<F de los "alores de x de en estar dentro de R 6.?B x de la media . (s decir, R 6.?B x 4 6.?B T 1:24 ;.?:. )i una media de muestra est# en la regin identi!icada como ?<F de los "alores de x origina un error muestral Q x 1 6 de ;.?: o menos. (s decir, -a7 u&a /ro!a!ili)a) )" E.FG )" Hu" la '")ia )" u&a 'u"stra ori$i&" u& "rror 'u"stral )" B.F< o '"&os. (ste enunciado es una declaracin de precisin acerca del error de muestreo. (l "alor ;.?: que proporciona un l#mite superior del error de muestreo, se conoce como mar$en de error.
2 para los niveles de confian a de uso m!s com"n Valores de +i"el de %on!ianza z
Puesto que el ?<F de la medias muestrales posi les dar#n un inter"alo que incluye a la media po lacional, el inter"alo se esta lece en el nivel de confian a de ?<F. (l "alor 7.?< se conoce como coeficiente de confian a y la estimacin del inter"alo x R ;.?: se llama inter"alo de con!ianza del ?<F. (l procedimiento para estimar el inter"alo de una media po lacional siempre que se tenga una muestra grande y se suponga que se conoce la des"iacin est#ndar po lacional es la siguiente:
&onde s es la des"iacin est#ndar de la muestra, 16CU2 es el coe!iciente de con!ianza y z 2 es el "alor de z que de!ine un #rea 2 en la cola o e$tremo superior de la distri ucin de pro a ilidad normal est#ndar.
&onde 16CU2 es el coe!iciente de con!ianza y z 2 e! e" ,a"$# e&t#eme %e#e)<$ %e "a %i!t#ib()i3n %e p#$babi"i%a% n$#ma" e!t4n%a#.
z *(e %a (n 4#ea
en e"
La +is,ri "ci-n , es una !amilia de distri uciones de pro a ilidad similares, con una +is,ri "ci-n , espec!ica que depende de un par#metro conocido como grados de libertad% , medida que aumenta la cantidad de grados de li ertad, la di!erencia entre la distri ucin t y la distri ucin de pro a ilidad normal est#ndar se hace m#s pequeHa.
s n
x , 2
&onde s es la des"iacin est#ndar de la muestra, 16CU2 es el coe!iciente de con!ianza y , 2 es el "alor , que da un #rea 2 en el e$tremo derecho de la distri ucin , con n = 6 grados de li ertad. Por ejemplo: n46<, s4B.@:, media4<;.@A para determinar una estimacin del inter"alo del ?<F de con!ianza. *uestra46<,
x , 0.05 2 6.82 15 1
,s, el margen de error es ;.A@ y la estimacin dl inter"alo de con!ianza del ?<F para el promedio po lacional es de <7.7? a <A.B<.
53.87 3.78
es el margen de error.
Una "ez que seleccionamos un coe!iciente de con!ianza de 6C U se puede determinar z 2 . (ntonces, si tenemos un "alor para V, podemos determinar el tamaHo de muestra n que se necesita para dar cualquier margen de error. 3rmula: ( z 2) 2 2 n= E2 %on este tamaHo de muestra se o tiene el margen deseado de error con el ni"el de con!ianza elegido.
%uando el tamaHo de la muestra es grande se puede hacer ase"eraciones de precisin acerca del error. Way una pro a ilidad de 6 = U de que el "alor de la proporcin po lacional origine un erro muestral igual a Por consiguiente la cantidad
z 2 p o menos.
z 2 p es el margen de error.
p z 2
&onde 6CU es el coe!iciente de con!ianza y z 2 es el "alor de z que origina un #rea 2 en la cola o e$tremo superior de la distri ucin de pro a ilidad normal est#ndar. Tama:o de la muestra para una estimacin del intervalo de una proporcin po; blacional
( z 2) 2 p )1 p ) E2 2n e!ta e)(a)i3n e" (!(a#i$ %ebe e!pe)i+i)a# e" ma#;en %e e##$# %e!ea%$ 2. e" (!(a#i$ tambin e!pe)i+i)a e" ni,e" %e )$n+ian=a - )$n " e" ,a"$# )$##e!p$n%iente a z 2 . n=
Para !inalizar, una alternati"a a la estimacin puntual consiste en calcular un inter"alo de con!ianza, que es un rango de "alores de la "aria le que tiene una pro a ilidad conocida de incluir al "erdadero "alor del par#metro.
P ( .i .s ) =1 es decir, e$iste una pro a ilidad 16CU2 de que el inter"alo XLi,LsY
incluya al pr#metro desconocido con!ianza y 16CU2 se denomina ni"el de con!ianza, que generalmente se !ija en ?7, ?< ??F.
PRUE2A DE HIPTESIS
La prue a de hiptesis es un procedimiento estadstico en el que se pone ajo prue a una hiptesis so re el "alor de un par#metro desconocido. %a prueba de &ip'tesis( onsiste en formular una &ip'tesis sobre el )alor de la media pobla ional( * reali+ar una prueba estad#sti a que le permita onfirmar o re &a+ar esa suposi i'n. , se usa para omprobar una afirma i'n a er a de una par-metro des ono ido. 27
Para implementar el procedimiento, el primer paso consiste en especi!icar claramente las hiptesis del pro lema: 9iptesis &ula 1922, que es la hiptesis puesta ajo pue a. 9iptesis $lternativa 1942, cque es una contrahiptesis que se acepta como "#lida en el caso de que la hiptesis nula sea rechazada.
. . =) aparece siempre en la hiptesis La parte de igualdad de la e$presin 1sea nula. La hiptesis alternati"a es lo que trata de esta lecer la prue a.
Para decidir en que caso hay que rechazar la hiptesis nula, es imprescindi le esta lecer un criterio que permita esta lecer si e$isten di!erencias signi!icati"as, o estadsticamente signi!icati"as entre lo hipotetizado y la realidad. Por ejemplo: el "alor hipotetizado en W 7 es de >7 horas. )acamos la muestra, calculamos la media aritmtica de los datos, y si $ no cae demasiado lejos de >7, se acepta la hiptesis nula. Un criterio pr#ctico para esta lecer cual es la di!erencia m#$ima acepta le, podra ser considerando : ; des"os alrededor del "alor hipotetizado en W7, y si x cae !uera de ese rango se rechaza la hiptesis nula.
28
%ondicin de la Po lacin Wo 0erdadera %onclusin ,ceptar Wo 'echazar Wo %onclusin %orrecta (rror de -ipo /
(n la pr#ctica la persona que e!ecta la prue a de hiptesis especi!ica la m#$ima pro a ilidad permisi le, llamada nivel de significancia para la prue a, de cometer un error de -ipo /. )e acostum ran los "alores 7.77< y 7.76 para el ni"el de signi!icancia. )i se controla la pro a ilidad de cometer un error de -ipo / seleccionando un pequeHo "alor de ni"el de signi!icancia, tendremos un alto grado de con!ianza en que sea correcta la conclusin de rechazar W7. (n la mayora de las aplicaciones de prue as de hiptesis se controla la pro a ilidad de cometer un error de tipo /, no siempre se controla la de incurrir en un error de tipo //. &e ido a la incertidum re asociada a cometer un error de tipo //, en estadstica se recomienda usar [no rechazar W7\ en lugar de [aceptar W7\.
Primer Paso: esta lecer las hiptesis nula y alternati"a apropiadas. Por ejemplo: W7: ] ^ ; W6: ] ; 29
)egundo Paso: la metodologa de la prue a de hiptesis requiere que especi!iquemos la pro a ilidad m#$ima permisi le de incurrir en el error de -ipo /, esta pro a ilidad se llama &iv"l )" si$&i*i#a&#ia para la prue a. (l ni"el de signi!icancia se denota mediante U y representa la pro a ilidad de incurrir en un error de -ipo / cuando la hiptesis nula es cierta como igualdad. Tercer Paso: la pregunta de si un promedio muestral o ser"ado x est# en la regin de rechazo se puede contestar si se calcula un "sta).sti#o )" /ru"!a. (n el caso de muestras grandes donde se supone que se conoce la des"iacin est#ndar po lacional :
z=
x ! n
! es el "alor promedio po lacional que aparece en W 7 y n es el tamaHo de la muestra. La distri ucin de muestreo de la estadstica de prue a z es la distri ucin de pro a ilidad normal est#ndar_ el "alor calculado de z se puede usar para determinar si la media muestral x est# en la regin de rechazo.
Cuarto Paso: de ido a que la estadstica de prue a z tiene una distri ucin de pro a ilidad normal est#ndar podemos usar la ta la para hallar el "alor z con un #rea de signi!icancia de U 4 17.76 7.7<2 en el e$tremo in!erior de la distri ucin. (l "alor de la estadstica de prue a que de!ine la regin de rechazo se llama valor #r.ti#o para la prue a 1por ejemplo para U 7.76 por ta la z 4 C :.;;2. Por medio del "alor crtico podemos esta lecer la prue a de rechazo: 'echazar W7 si z C:.;; 1"alor de ta la para el ni"el de signi!icancia2. La regla de rechazo e$presa que si la media muestral da un "alor de la estadstica de prue a menor que = :.;; se rechaza la hiptesis nula ] ^ ; y se concluye que es cierta la hiptesis alternati"a ] ;. La r"$i%& )" r"#-a9o "st5 s%lo "& u& "6tr"'o )" )" la )istri!u#i%& )" 'u"str"o /or "so s" lla'a /ru"!a )" -i/%t"sis u&ilat"ral.
z=
x ! s n
Para una prue a de hiptesis ilateral, se puede rechazar la hiptesis nula si el inter"alo de con!ianza no a arca a ] 7.
VALORES
/ 4 LA DISTRI2UCIN t
)e puede interpretar al "alor p como el ni"el o ser"ado de signi!icancia para la prue a. (l "alor p es menor que el ni"el de signi!icancia U se puede rechazar la hiptesis nula. (s di!cil o tener "alores p directamente de una ta la de distri ucin t. Por eso lo mejor que se puede hacer es especi!icar un inter"alo del "alor p entre 7.7< y 7.7:<.
PRUE2A 2ILATERAL
Por ejemplo con un ni"el de signi!icancia de U4 7.7<, los estadsticos = t7.7:< y t 7.7:< son los "alores crticos para la muestra. %onsultamos la ta la de la distri ucin t y "emos que con nC6 4 @C64 A grados de li ertad, Ct7.7:<4 C:.;B< y Kt7.7:<4 K:.;B<. ,s la regla de rechazo ser#: 'echace W7 si t C:.;B< o si t :.;B<.
%$n%e p =
p0 (1 p0 ) n
?rmula para determinar la regin de rec<a o para una prueba de <iptesis de una proporcin poblacional
32
z=
p p! p0 (1 p0 ) n
PRUE2A DE INDEPENDENCIA
%uando se tra aja con datos clasi!icados segn dos criterios, cada uno con "arias categoras, se puede disponer la in!ormacin en una ta la de do le entrada denominada ta!la )" #o&ti&$"&#ia . (l uso de las ta las de contingencia generalmente tiene como o jeti"o compro ar la relacin entre dos "aria les categricas. (sta compro acin se lle"a a ca o empleando una nue"a distri ucin llamada aiC%uadrado 2 . La prue a de independencia: 92 por ejemplo: el ni"el de satis!accin con las acti"idades de capacitacin y el gnero del empleado son independientes. 94 por ejemplo: el ni"el de satis!accin depende del gnero del empleado. )i se rechaza W7 se estara compro ando que los !actores no son independientes, indicando en este caso que el grado de satis!accin mostrado por el personal con las acti"idades de capacitacin realizadas por la empresa depende del gnero de los empleados 8nero 3emenino *asculino -otales Poco satis!echo : :7 :: )atis!echo :< :@ <; *uy satis!echo 6: 6; :< -otales ;? B6 677
. ser"amos que en toda la muestra 677 personas, hay ;? mujeres y B6 hom res. ($presado en !racciones es ::5677_ <;5677 y :<5677. )ea eij la !recuencia esperada en la categora de_ rengln i y la columna j de la ta la de contingencias. %on esta notacin reconsideremos el c#lculo de la !recuencia esperada para las mujeres 1rengln i462 que est#n poco satis!echos o insatis!echos esto es, la !recuencia esperada e6,:. 3recuencia esperadas en la ta la de contingencias, suponiendo independencia
#i 1 =
-otales ;? B6 677
2=
Don)*:
( fi 1 #i 1 )2 #i 1
i 1
f i 1 !recuencia o ser"ada para la categora en el rengln i y la columna j de la ta la de contingencias. #i 1 !recuencia esperada para la categora en el rengln i y la columna j de la ta la de contingencias, asada en la hiptesis de independencia.
(n la ecuacin se usa la do le sumatoria para indicar que se de en hacer los c#lculos para todas las celdas de la ta la de contingencias. La prue a de independencia siempre es unilateral y la regin de rechazo est# en la cola superior de la distri ucin aiC%uadrado 2 . ,l re"isar las !recuencias esperadas en la ta la "emos que son < o m#s para cada categora, en consecuencia se puede continuar con el c#lculo del estadstico ai cuadrada y "er si el grado de satis!accin de la capacitacin guarda relacin con el gnero. (l nmero de grados de li ertad para la distri ucin ji se determina multiplicando el nmero de renglones menos 6 por el nmero de columnas menos 6, es decir 1:C62.1;C 62 4 1621:2 4 : grados de li ertad. %on U4 7.7<_ 2 e! 2 0.05 = 5.99.
)e$o
)atis!accin
3cia. . ser"ada
3cia. esperada
&i!erencia (
&i!erencia : (
fi 1
#i 1
f i 1 1 #i 1
)
f i 1 1 #i 1
)2
f i 1 1 #i 1 )2/ #i 1
6.?67 34
3em.
Poco )atis.
7.A@
6.::
6.>?
:< 6: :7 :@ 6; 677
2 0.05 4 <.??.
Por consiguiente rechazamos la hiptesis nula de independencia y concluimos que el ni"el de satis!accin no es independiente respecto al se$o de los participantes. 'esumen: 6. Plantear la hiptesis nula y alternati"a. 92 la "aria le de columna es independiente de la "aria le de rengln. 94 la "aria le de columna no es independiente de la "aria le de rengln. :. -omar una muestra aleatoria y anotar las !recuencias o ser"adas para cada celda de la ta la de contingencia. 3. ,plicar la ecuacin #i 1 =
2=
( fi 1 #i 1 )2 #i 1
i 1
5. 'egla de rechazo: con el estadstico de prue a 'echazar W7 si 2 2 a )iendo U el ni"el de signi!icancia para la prue a, si hay n renglones y m columnas en la ta la, hay 1nC62 1mC62 grados de li ertad.
35
[ ( x
x )( 3 i 3 ) $
C!v( x. 3 ) =
1 n 1
[x
3i n x 3
(l signo de con"arianza indica el tipo de asociacin entre las dos "aria les: un "alor positi"o indica co"ariacin directa =a medida que aumenta $, aumenta yC mientras que el "alor negati"o e$presa co"ariacin de tipo in"ersa. , mayor "alor de la co"arianza 1"alor a soluto2 e$iste una asociacin m#s !uerte entre "aria les.
36
I&t"r/r"ta#i%& )" la #ovaria&9a: %uadrante // %uadrante / %uadrante /// %uadrante /0 Los puntos del cuadrante / corresponden a los "alores de $i mayores que $C y a "alores de yi mayores que y. Los puntos del cuadrante // a "alores de $i menores que $C y a los "alores de yi mayores que yC y as sucesi"amente. (l "alor de 1$iC$C21yiCyC2 de e ser positi"o para los puntos u icados en el cuadrante /, negati"o para puntos del //, positi"o para puntos del /// y negati"o para los del punto /0. )i el "alor de s $y es positi"o, los puntos que tu"ieron la m#$ima in!luencia so re s $y de en estar en los cuadrantes / y ///. Por consiguiente, una "alor positi"o de s $y indica una asociacin positi"a entre $ e y. )in em argo si el "alor de s $y es negati"o, los puntos que tu"ieron mayor in!luencia so re s$y est#n en los cuadrantes // y /0. Por consiguiente, un "alor negati"o de s $y indica una asociacin lineal negati"a entre $ e y. %omo la co"arianza no es !#cil de interpretar se suele calcular otra cantidad estadstica denominada coe!iciente de correlacin y se calcula de la siguiente !orma:
r = C!v ( x. 3 ) Sx S3
)e di"ide la co"arianza por el producto de los des"os de las "aria les, o tenindose un ndice adimensional que "ara entre C6 y K6. )i el coe!iciente de correlacin tiende a 6 en "alor a soluto indica un !uerte grado de asociacin lineal entre las "aria les, y cuando tiende a cero e$presa un d il grado de asociacin lineal. %uando el coe!iciente de correlacin es e$actamente igual a uno en "alor a soluto, signi!ica que e$iste una asociacin lineal per!ecta entre $ e y. Un coe!iciente de correlacin igual a cero indica ausencia del "alor del coe!iciente de correlacin.
(n la regresin lineal simple, la gr#!ica de esa recta 0 es la ordenada al origen de la recta, E ( 3 ) es su dependiente y es la media o "alor esperado de 3 se relaciona 1 positi"amente con x . %omo los "alores de 0 1 no se conocen, se de en estimar usando los datos de la muestra. )e calculan los estadsticos de la muestra a y en la ecuacin de regresin. . teniendo as la siguiente ecuacin:
9 = 3 a+Jx
a =3 J x
Para "eri!icar que tan ien representada el modelo estimado entre $ e y se puede superponer superponer la recta o tenida so re el diagrama de dispersin, y e!ectuar un control "isual del ajuste o tenido. 'esiduos: des"os entre "alores o ser"ados de la "aria le dependiente y los "alores estimados en ase al modelo ajustado. Un estimador que se usa ha itualmente s el des"o de los residuos, denominado "rror "st5&)ar )" "sti'a#i%&, que mide la dispersin de la "aria le dependiente en torno a la recta de regresin y se calcula del siguiente modo:
S# =
( 3i 3i)
n 2
%uanto m#s grande sea el erro est#ndar, mayor ser# la "aria ilidad de 3 en torno al modelo ajustado, y por ende "a a ser menor la representati"idad de la recta o tenida.
38
+o es !#cil interpretar el "alor del error est#ndar, por lo cual es til calcular el #o"*i#i"&t" )" )"t"r'i&a#i%&, que mide el porcentaje de "ariacin de 3 al "ariar x que es e$plicado por la recta de regresin_ es una medida de la ondad del ajuste para una ecuacin de regresin, y se calcula de la siguiente manera:
r 2 =1
( 3i 3i ) ( 3i 3i )
2 2
(l coe!iciente de determinacin es una cantidad adimensional que "ara entre cero y uno. %uando el coe!iciente "ale e$actamente uno, indica que el 677F de la "ariacin de 3 es e$plicado por el modelo, es decir que ha ra ajuste per!ecto porque todos los puntos est#n so re la recta estimada.
39
:NDICES SIMPLES
(l o jeti"o es "alorar el ni"el de cam io de una "aria le a lo largo de un determinado perodo de tiempo, o en di!erentes localizaciones. La "aria le analizada puede ser un precio, una cantidad consumida o cualquier otra "aria le de inters. Un ndice relati"o simple permite comparar la "ariacin e$perimentada por una sola cantidad entre el perodo actual y el perodo tomado como ase. R*lati+o sim,l*
r 2 =1
( 3i 3i ) ( 3i 3i )
2 2
)e o tiene di"idiendo la cantidad o ser"ada en el perodo actual so re la cantidad medida en el perodo ase =multiplicado por 677 para que el resultado quede e$presado en porcentajeC.
:NDICES COMPUESTOS
Los ndices compuestos relacionan la suma de cantidades medidas en el perodo actual con respecto a la suma de esas cantidades en el perodo ase. )i las cantidades se agregan directamente, sin considerar ningn !actor de peso, se o tiene el .&)i#" r"lativo &o /o&)"ra)o:
5c =
)in em argo a !in de e"aluar el impacto real que tu"o la "ariacin, se utiliza el .&)i#" r"lativo /o&)"ra)o 0o a$r"$a)o 7 /o&)"ra)o1 :
5c =
&onde E son las cantidades medidas en el perodo actual y en el perodo mientras que P son los !actores de ponderacin. $n)ic*s )* ,r*cios ,on)*ra)os
40
)iempre que se determinen los pesos 1o !actores de ponderacin2 !ijos a partir del consumo en el aHo ase, al ndice agregado y ponderado se llama .&)i#" )" Las/"7r"s. (n el .&)i#" )" Paas#-" los pesos se asan en el perodo de uso t y no en el periodo ase. (l ndice de Laspeyres tiene la "entaja de que solamente es necesario conocer los "alores consumidos en el perodo ase. %omo esos "alores se mantienen !ijos, cualquiera sea el perodo que se analice se puede realizar una comparacin m#s directa de los ndices o tenidos. La principal des"entaja es que no tiene en cuenta los cam ios registrados en la estructura de consumo, por lo que no re!leja la "erdadera situacin actual. (l ndice de Paasche tiene la "entaja de que re!leja los cam ios e$perimentados en la estructura de consumo, rindando una "isin m#s realista so re la "ariacin registrada. )u des"entaja es que require disponer de los "alores de consumo para cada perodo que se quiera comparar, y que los ndices de di!erentes perodos no pueden ser contrastados directamente.
41
La in+$#ma)i3n ,i!(a" *(e p#$p$#)i$na e!te tip$ %e ;#4+i)$ n$ e! (na p#(eba +$#ma" a)e#)a %e "a p#e!en)ia %e %at$! atHpi)$!. !in$ m4! bien (na <e##amienta %e %ia;n3!ti)$. 5i bien "a %ete#mina)i3n %e )(4"e! $b!e#,a)i$ne! p(e%en !e# $(t"ie#! ,a#Ha !e;'n e" !$+tNa#e )$n!i%e#a%$. (n )#ite#i$ )$m'nmente (ti"i=a%$ e! )$n!i%e#a# )$m$ (n %at$ atHpi)$ a*(e" *(e e!t a m4! %e 1.5 ,e)e! e" #an;$ inte#)(a#ti". A!H. "$! "Hmite! pa#a !epa#a# $(t"ie#! !e )a")("an %e "a !i;(iente mane#a .58 = 41 - 1.5 75 .S8 = 46 9 1.5 75 %$n%e .58 = "Hmite in+e#i$# pa#a !epa#a# $(t"ie#!
.S8 = "Hmite !(pe#i$# pa#a !epa#a# $(t"ie#! 2! %e)i#. *(e !e )$n!i%e#a#4n ,a"$#e! atHpi)$! "$! *(e !e en)(ent#en en e" inte#,a"$ (X/#n!# 7 .58) - (.S8 : X/a3!r) 3 "$! b#a=$! !e e&ten%e#4n <a!ta "$! ,a"$#e! *(e n$ !$n atHpi)$!.
J
O1 LCO O3 AC L5O AC A )$ntin(a)i3n !e e!tab"e)en a";(na! #e"a)i$ne! 'ti"e! pa#a "ee# e" %ia;#ama
O(t"ie#!
O(t"ie#!
5Si 0a +is,ri "ci-n #s sim trica o a!ro"imadamente sim trica; La %i+e#en)ia ent#a "a me%iana - e" p#ime# )(a#ti". e! i;(a" a "a %i+e#en)ia ent#e e" te#)e# )(a#ti" - "a me%iana. M# - 41 = 46 < M# La %i!tan)ia ent#e e" p#ime# )(a#ti" - e" ,a"$# m4! pe*(eG$ %e "a !e#ie e! i;(a" a "a %i!tan)ia ent#e e" ma-$# ,a"$# - e" te#)e# )(a#ti". 41 < X /#n!r = X /a3!r - 46 La me%ia. "a me%iana - e" ,a"$# m$%a" )$in)i%en. M#+ia= M#=M!+! 55Si 0a +is,ri "ci-n #s asim trica derec#a; La %i+e#en)ia ent#a "a me%iana - e" p#ime# )(a#ti". e! men$# a "a %i+e#en)ia ent#e e" te#)e# )(a#ti" - "a me%iana. M# - 41 = 46 < M# La %i!tan)ia ent#e e" p#ime# )(a#ti" - e" ,a"$# m4! pe*(eG$ %e "a !e#ie e! men$# a "a %i!tan)ia ent#e e" ma-$# ,a"$# - e" te#)e# )(a#ti". 41 < X /#n!r = X /a3!r - 46 La me%ia e! ma-$# *(e "a me%iana - e!ta e! ma-$# *(e e" ,a"$# m$%a". M#+ia > M# >M!+! 42
555Si 0a +is,ri "ci-n #s asim trica i$%uierda; La %i+e#en)ia ent#a "a me%iana - e" p#ime# )(a#ti". e! ma-$# a "a %i+e#en)ia ent#e e" te#)e# )(a#ti" - "a me%iana. M# - 41 > 46 < M# La %i!tan)ia ent#e e" p#ime# )(a#ti" - e" ,a"$# m4! pe*(eG$ %e "a !e#ie e! ma-$# a "a %i!tan)ia ent#e e" ma-$# ,a"$# - e" te#)e# )(a#ti". 41 < X /#n!r > X /a3!r - 46 La me%ia e! men$# *(e "a me%iana - e!ta e! men$# *(e e" ,a"$# m$%a". M#+ia = M# = M!+! 2!te %ia;#ama e! 'ti" pa#a #ea"i=a# e" an4"i!i! e&p"$#at$#i$ %e "$! %at$! (e!pe)ia"mente )(an%$ !e %i!p$ne %e p$)a! $b!e#,a)i$ne!). - m(- ap#$pia%$ )(an%$ !e e!t#ati+i)an "$! %at$! - !e %e!ean )$mpa#a# "a! p#in)ipa"e! p#$pie%a%e! %e "$! %at$! %ent#$ %e )a%a e!t#at$. 2n e!te !enti%$. pe#mite )$mpa#a# La p$!i)i3n. me%iante "a (bi)a)i3n %e "a me%iana -. !i !e in)"(-e en e" ;#4+i)$. %e "a me%ia. La %i!pe#!i3n. a t#a,! %e" tamaG$ %e "a )aKa (75)% La +$#ma. a pa#ti# %e "a! #e"a)i$ne! men)i$na%a!.
>$# eKemp"$ ,am$! a !(p$ne# *(e e!t#ati+i)am$! "a! )a"i+i)a)i$ne! $bteni%a! en "a e,a"(a)i3n %e (na a!i;nat(#a en %$! ;#(p$!. en "$! )(a"e! !e (!a#$n e!t#ate;ia! pe%a;3;i)a! %i+e#ente!. L$! #e!("ta%$! (p#e,iamente $#%ena%$! %e men$# a ma-$#) +(e#$n P#(p$ 1 P#(p$ 2 30 50 40 65 45 75
n
50 80
55 83
60 85
70 90
Q1 Q3 40,00 60,00 65,00 "5,00
7 7
Media Mn Mx Mediana 50,00 30,00 70,00 50,00 75,43 50,00 !0,00 "0,00
43
677
A<
%ali!icacin
<7
:< 6 :
8rupo
0$m$ !e p(e%e ap#e)ia# a !imp"e ,i!ta. "a %i!pe#!i3n %e "$! %at$! e! !imi"a# en amb$! ;#(p$!. 2n )(ant$ a "a p$!i)i3n. e" P#(p$ 2 $bt(,$ (na )a"i+i)a)i3n p#$me%i$ !(pe#i$# a "a %e" P#(p$ 1 -. mient#a! *(e en e" P#(p$ 1 "a %i!t#ib()i3n e! !imt#i)a. en e" P#(p$ 2 "a %i!t#ib()i3n %e "a! )a"i+i)a)i$ne! e! a!imt#i)a )$n !e!;$ a "a i=*(ie#%a.
44