Académique Documents
Professionnel Documents
Culture Documents
$ ORV GRFHQWHV (O PRWLYR TXH PH LPSXOVy DO DUPDGR GH HVWH PDWHULDO IXH HO SHQVDU TXH SRGUtD VHUYLU SDUD TXH HQ pO DOJXQRV GRFHQWHV HQFRQWUDUDQ XQD PRGDOLGDG DOWHUQDWLYD SDUD GHVDUUROODU HQ HO DXOD ORV WHPDV SURSXHVWRV (O HVTXHPD GH WUDEDMR TXH SURSRQJR QR HV HO ~QLFR SRVL EOH 7DPSRFR VR\ OD ~QLFD GRFHQWH TXH OR KD OOHYDGR D OD SUiF WLFD /R TXH Vt SXHGR DILUPDU HV TXH D WUDYpV GH VX DSOLFDFLyQ KH ORJUDGR REWHQHU ORV PHMRUHV UHVXOWDGRV FRQ ORV DOXPQRV 7DQWR XVWHGHV FRPR \R FRWLGLDQDPHQWH QRV HQIUHQWDPRV DO GHVDItR TXH LPSOLFD HQVHxDU \ HQFRQWUDU ORV FDPLQRV PiV DGHFXDGRV SDUD OOHYDU DGHODQWH HO SURFHVR GH HQVHxDQ]D DSUHQGL]DMH 3RU HVH PRWLYR FRQItR HQ TXH HVWH PDWHULDO SRGUi UHVXOWDUOHV ~WLO (O SUHVHQWH WUDEDMR QR SUHWHQGH VHU XQ FRPSHQGLR GH 3UREDELOLGDG \ (VWDGtVWLFD (Q pO PH KH OLPLWDGR D H[SRQHU ORV WHPDV TXH FRQVLGHUR PiV UHOHYDQWHV SDUD VX HQVHxDQ]D HQ OD (VFXHOD
0 (XJHQLD QJHO
7(0$
1',&(
3ULPHUD SDUWH (VWDGtVWLFD
3*,1$
,QWURGXFFLyQ--------------------------------------------------------------------------------
1 2
$QiOLVLV GH YDULDEOHV FXDOLWDWLYDV Primer ejemplo: una variable cualitativa no ordenable.------------------------------- 4 Frecuencia absoluta.Tabla de distribucin de frecuencias.Diagrama de Barras. Medida de Posicin: Modo. Frecuencias relativas y porcentuales. Diagrama Circular. Segundo ejemplo: una variable cualitativa ordenable.-------------------------------- 7 Frecuencias acumuladas. Medida de Posicin: Mediana. Tercer ejemplo: dos variables.------------------------------------------------------------ 10 Tabla de distribucin conjunta. Diagrama de barras adyacentes. $QiOLVLV GH YDULDEOHV FXDQWLWDWLYDV Primer ejemplo: una variable cuantitativa discreta.------------------------------------ 13 Diagrama de Bastones y de Puntos. Medida de Posicin: Media Aritmtica. 16 Segundo ejemplo: dispersin.-----------------------------------------------------------Medidas de Dispersin: Rango o amplitud, Varianza y Desvo standard. Tercer ejemplo: una variable cuantitativa continua.----------------------------------- 20 Intervalos o Clases.Tabla de distribucin de frecuencias para variables cuantitativas continuas. Histograma y Polgono de frecuencias. Ojiva. Clculo de las medidas para variables cuantitativas continuas: Media aritmtica, Varianza, Desvo, Modo y Mediana. 8Q WLSR GH FRPSDUDFLyQ Primer ejemplo: dos conjuntos de datos con igual media y distinto desvo.------ 30 Segundo ejemplo: dos conjuntos de datos con distinta media y distinto desvo.- 31 Coeficiente de variacin.
(MHUFLFLR LQWHJUDGRU-------------------------------------------------------------------------
8Q SUREOHPD GLVWLQWR---------------------------------------------------------------------
33
37
II
,QWURGXFFLyQ------------------------------------------------------------------------------- ([SHULPHQWRV
39
'HILQLFLyQ GH SUREDELOLGDG Definicin axiomtica de probabilidad.------------------------------------------------ &yPR DVLJQDU SUREDELOLGDGHV Primer ejemplo.----------------------------------------------------------------------------Espacios muestrales equiprobables.La teora clsica de la probabilidad. Segundo ejemplo.--------------------------------------------------------------------------La teora frecuencial de la probabilidad. &XDQGR ORV VXFHVRV QR VRQ PXWXDPHQWH H[FOX\HQWHV Ejemplo.--------------------------------------------------------------------------------------
(VSDFLRV PXHVWUDOHV \ VXFHVRV Primer ejemplo: Espacios muestrales.--------------------------------------------------- 41 Segundo ejemplo: Sucesos.--------------------------------------------------------------- 42 Tercer ejemplo: Operaciones entre sucesos. Sucesos mutuamente excluyentes.- 43
Experimentos aleatorios.---------------------------------------------------------- 40
45 47 49
'HSHQGHQFLD H LQGHSHQGHQFLD GH VXFHVRV Primer ejemplo: Probabilidad condicional. Probabilidad de la interseccin.----- 53 Segundo ejemplo: Diagrama de rbol.--------------------------------------------------- 55 Tercer ejemplo: Sucesos independientes.----------------------------------------------- 57
51
59 60
9DULDEOH DOHDWRULD \ GLVWULEXFLRQHV GH SUREDELOLGDG Primer ejemplo: Variable aleatoria.------------------------------------------------------ 62 Funcin de probabilidad de una variable aleatoria discreta. Esperanza. Segundo ejemplo: Funcin de densidad de probabilidad de una variable aleato- 65 ria continua. 0RGHORV Primer ejemplo: Modelo Binomial.------------------------------------------------------ 68 Segundo ejemplo: Modelo Normal. Funcin Normal Standard.-------------------- 71
%LEOLRJUDItD--------------------------------------------------------------------------- 82
III
(67$'67,&$
,1752'8&&,1
La funcin principal de la estadstica es elaborar principios y mtodos que nos ayuden a tomar decisiones frente a hechos inciertos.
De las dos ramas de la estadstica que son OD GHVFULSWLYD y OD LQIHUHQFLDO el inters de este material se centra en la primera y el objetivo del mismo es la presentacin y desarrollo de los temas bsicos partiendo de ejemplos de distintas situaciones concretas. La estadstica descriptiva nos permite, ante un problema en particular, OD UHFROHF FLyQ GH ORV GDWRV OD RUJDQL]DFLyQ GH ORV PLVPRV SRU PHGLR GH WDEODV \ JUiILFRV SDUD YLVXDOL]DUORV PHMRU HO UHVXPHQ SRU PHGLR GHO FiOFXOR GH ODV PHGLGDV TXH SXH GDQ FDUDFWHUL]DUORV \ ILQDOPHQWH HQ OR SRVLEOH OD H[WUDFFLyQ GH FRQFOXVLRQHV
/D UHFROHFFLyQ del conjunto de datos de inters constituye la primera etapa de la Estadstica Descriptiva. El tipo de datos a relevar, surge de la definicin de la situacin o problema y de la poblacin a estudiar que puede ser cualquier conjunto de individuos (personas u objetos). Por ejemplo, nos puede interesar describir las particularidades de un determinado conjunto de alumnos, comparar distintos grupos de jvenes, caracterizar los hogares de los que provienen ciertas personas, etc.
Luego
de elegida la poblacin de estudio, se relevan todas las caractersticas de ella que resulten de inters y a la vez que respondan al problema planteado1. Por ejemplo: el peso, la cantidad de hermanos, la edad, el lugar de residencia, etc. Si son varias las caractersticas que se quieren analizar de la poblacin, es conveniente volcar los datos relevados en una matriz denominada PDWUL] GH GDWRV. La matriz facilitar posteriormente la RUJDQL]DFLyQ \ UHVXPHQ de los mismos para as poder extraer todas las conclusiones posibles del problema planteado2.
Si la poblacin a estudiar es infinita o muy grande, es conveniente elegir una muestra, con lo cual se disminuye el costo econmico y temporal del estudio. En el caso de seleccionar una muestra, sta debe ser representativa de la poblacin, es decir que debe reunir todas las caractersticas de la misma. Si la muestra es representativa, es la poblacin en miniatura y es slamente a travs de ella que podemos inferir o extrapolar en forma vlida los resultados obtenidos a la poblacin en su totalidad. Ver: ESTADSTICA DESCRIPTIVA. Aplicacin a un caso concreto. Sara E. Elizondo, Mara E. ngel. Ed. Rocamora. 1
',67,1726 7,326 '( 9$5,$%/(6 Si queremos estudiar una poblacin en particular, tendremos caractersticas de ella que nos resulten de inters; por ejemplo VH[R HGDG DxR GH QDFLPLHQWR VXHOGR WLSR GH YLYLHQGD WLSR GH WUDEDMR WLHPSR GXUDFLyQ HWF. Cada una de estas caractersticas toman distintos valores segn cada individuo que conforma la poblacin. A estas FDUDFWHUtVWLFDV que pueden variar de un individuo a otro las denominamos YDULDEOHV En la tabla siguiente se presentan algunas variables y categoras o valores que ellas pueden tomar.3 6H[R 9DULDEOHV IHPHQLQR PDVFXOLQR &DWHJRUtDV R YDORUHV
&RQIRUPLGDG FRQ ORV FRQWHQLGRV GLVFRQIRUPH SRFR FRQIRUPH FRQ DSUHQGLGRV HQ OD HVFXHOD IRUPH PX\ FRQIRUPH 0DWHULD GH SUHIHUHQFLD PDWHPiWLFD OHQJXD ItVLFD 'HVHPSHxR HVFRODU (GDG HQ DxRV &DQWLGDG GH KHUPDQRV
$SUR[LPDGD D YDORU HQWHUR
3URPHGLR GH ODV FDOLILFDFLRQHV RE WHQLGDV 6XHOGR PHQVXDO
(Q
De la observacin de las variables con las que se est trabajando se puede deducir que stas conforman dos grupos: las numricas y las no numricas.4
3 4
Tabla adaptada de ESTADSTICA DESCRIPTIVA. Aplicacin a un caso concreto. Cuando hablamos de las variables numricas o no numricas nos referimos a los verdaderos valores que ellas pueden tomar independientemente de la codificacin que se realice a posteriori de los mismos. 2
A las variables numricas las denominamos &8$17,7$7,9$6 A las variables que no son numricas las denominamos5 &8$/,7$7,9$6 (MHUFLFLR Cules de todas las variables citadas anteriormente son cualitativas y cules son cuantitativas? Entre las YDULDEOHV FXDOLWDWLYDV, algunas admiten orden. (MHUFLFLR Cules de las variables cualitativas ya mencionadas son las que admiten un cierto orden? Las YDULDEOHV FXDQWLWDWLYDV pueden ser:
(MHUFLFLR Cules de las variables anteriores son cuantitativas discretas y cules continuas?
En general y para un mejor procesamiento de los datos, a los valores de las variables cualitativas se los suele codificar con nmeros, a pesar de que la codificacin sea cuantitativa, la variable sigue siendo cualitativa. 3
- Las columnas con N indican el nmero de alumno interrogado, en total se interrogaron 50. - Las columnas con Act. indican la actividad elegida por cada alumno donde: T es teatro, M es msica e I ingls.
La variable $FWLYLGDG H[WUDSURJUDPiWLFD que tiene por categoras M, T o I es FXDOL WDWLYD \ QR DGPLWH RUGHQ Organizamos los datos obtenidos en una tabla, donde en la primera columna colocamos las categoras que toma la variable y en la segunda la cantidad de veces que aparece cada una de esas categoras. $FWLYLGDG &DQWLGDG ; I Msica 17 Teatro 11 Ingls 22 WRWDO Q I se denomina IUHFXHQFLD DEVROXWD e indica la cantidad de veces que aparece cada valor o categora de la variable. La suma de todos los valores de I da como resultado el total de las observaciones. A este valor se lo denomina Q
Primer ejemplo.
La tabla anterior recibe el nombre de: 7DEOD GH GLVWULEXFLyQ GH IUHFXHQFLDV Uno de los grficos que corresponden a la distribucin de este tipo de variables es el siguiente GLDJUDPD GH EDUUDV
'LDJUDPD GH %DUUDV
0
)UHFXHQFLDV DEVROXWDV
La flecha indica la categora de la variable con mayor frecuencia, (Ingls) es decir, la eleccin que predomina.
7
$FWLYLGDG
6H GHQRPLQD 02'2 R 02'$ \ VH VLPEROL]D 0R DO YDORU R FDWHJRUtD GH OD YDULDEOH TXH SRVHH PD\RU IUHFXHQFLD.6
En este caso, 0R
Este valor calculado nos permite extraer la siguiente conclusin: (Q HO JUXSR GH DOXPQRV HQWUHYLVWDGRV SUHGRPLQDQ DTXHOORV TXH SUHILHUHQ LQJOpV FRPR DFWLYLGDG H[WUDSURJUDPiWLFD El Modo es una 0HGLGD GH SRVLFLyQ y para este tipo de variables es la ~QLFD PHGL GD SRVLEOH GH FDOFXODU Es decir que, si la variable con la que trabajamos es cualitativa y no admite orden, la nica medida de posicin que podemos calcular es el modo. Adems de la frecuencia absoluta, para cada valor de la variable puede interesarnos calcular:
6
Si una distribucin presenta dos valores predominantes, dos Mo, se dice que es bimodal.
Primer ejemplo.
/D IUHFXHQFLD UHODWLYD proporcin entre la cantidad de veces que aparece un valor de la variable y el total de las observaciones. /D IUHFXHQFLD SRUFHQWXDO porcentaje.
IQ
I
U
)UHF DEV I
Sobre el total de alumnos interrogados, la proporcin de alumnos que elige Msica es 0,34; la proporcin de alumnos que elige Teatro es 0,22 y la proporcin de alumnos que elige Ingls es 0,44.
'LDJUDPD &LUFXODU
0~VLFD 7H DWUR
Sobre el total de alumnos interrogados, el 44% elige Ingls; el 34% elige Msica y el 22% elige Teatro.
2EVHUYDFLRQHV El Diagrama de Barras podra haberse realizado con cualquiera de las tres frecuencias. Para calcular porcentajes es conveniente que las frecuencias absolutas no sean muy pequeas. Para comparar distintas distribuciones de una misma variable, cuando el n es distinto en cada caso, debe utilizarse la fr o la f%.
Segundo ejemplo.
6(*81'2 (-(03/2 Antes de implementar alguna actividad extraprogramtica, las autoridades del colegio desean conocer la opinin de los padres de los alumnos, por tal motivo se entrevist a un grupo de 105 padres. En la entrevista se les pregunt si la implementacin de tal actividad les resultaba una idea mala, regular, buena, muy buena o excelente. Las respuestas obtenidas se encuentran volcadas en la siguiente tabla:
2SLQLyQ 0DOD 5HJXODU %XHQD 0X\ %XHQD ([FHOHQWH 7RWDO
I
IU
)UHF DEV )UHF UHO )UHF SRUF DFXPXODGDV DFXPXODGDV DFXPXODGDV ) ) )
La variable RSLQLyQ cuyas categoras son mala, regular, buena, muy buena o excelente; HV XQD YDULDEOH FXDOLWDWLYD TXH DGPLWH RUGHQ El hecho de que la variable pueda ordenarse, nos permite acumular frecuencias, es decir, calcular las )UHFXHQFLDV $FXPXODGDV Cada Frecuencia Acumulada se obtiene sumando las frecuencias anteriores a la de la categora que se est considerando. Por ese motivo, la primera de las acumuladas no vara y la ltima coincide con el total de las observaciones. El clculo de las frecuencias acumuladas puede realizarse tanto sobre las frecuencias absolutas, como sobre las relativas o las porcentuales. La frecuencia porcentual acumulada (F%) que muestra la tabla nos permite realizar la siguiente observacin: HO GH ORV SDGUHV HQWUHYLVWDGRV RSLQDQ TXH OD LGHD GH LPSOHPHQWDU XQD DFWLYLGDG H[WUDSURJUDPiWLFD HV PDOD R UHJXODU
Segundo ejemplo.
Representaremos grficamente la frecuencia porcentual (f%) y la frecuencia porcentual acumulada (F%) en los correspondientes diagramas de barras.
I
)
2SLQLyQ
0 %
2SLQLyQ
0%
Transcribimos nuevamente la tabla de distribucin de frecuencias y observamos que la categora que predomina es %XHQD, con lo cual: 0R % 2SLQLyQ 0DOD 5HJXODU %XHQD 0X\ %XHQD ([FHOHQWH 7RWDO )UHF DEV I 20 25 15 5
Como la variable admite un orden, otra de las medidas de posicin que puede calcularse es la 0HGLDQD la cual se simboliza 0H
/D 0HGLDQD HV HO YDORU R FDWHJRUtD GH OD YDULDEOH REVHUYDGR R QR TXH VXSHUD \ HV VXSH UDGR D OR VXPR SRU HO GH ODV REVHUYDFLRQHV.
0H
Segundo ejemplo.
Luego contamos los datos desde el mayor valor de la variable, el cual es la categora ( en donde hay 5; le sumamos los 15 siguientes que corresponden a 0% y ya obtenemos 20; a stos no podemos sumarles los de % porque tendramos 60, que es mayor que 52; por lo tanto los nicos datos que se encuentran por encima de la 0H son los 20 de las dos ltimas categoras. De ambas sumas de datos se deduce que la 0H es la categora %.
(Q HO JUXSR GH SDGUHV FRQVXOWDGRV SUHGRPLQD ORV TXH RSLQDQ TXH OD FUHDFLyQ GH XQD DFWLYLGDG H[WUDSURJUDPiWLFD HV EXHQD LGHD (O GH ORV SDGUHV FRQVXOWDGRV RSLQD TXH OD LPSOHPHQWDFLyQ GH GLFKD DFWLYLGDG HV XQD PDOD UHJXODU R EXHQD LGHD
2EVHUYDFLRQHV
El clculo de la Mediana requiere que la variable se pueda ordenar. En algunos casos, a pesar de que la variable cualitativa admite orden, puede ocurrir que la 0H no exista. Por ejemplo, si se tiene la siguiente tabla de distribucin de frecuencias para la variable (VFRODULGDG puede observarse que:
(VFRODULGDG 3ULPDULD 6HFXQGDULD 7HUFLDULD 8QLYHUVLWDULD 7RWDO I En este caso no es posible encontrar un valor para la mediana, porque: la cantidad de observaciones es 70, el 50% es 35, la categora 3 ya tiene las 35 y la suma de las frecuencias de 67 8 tambin es 35.
La mediana debera ubicarse entre 3 y 6 y como entre ellos no existe categora alguna, OD PHGLDQD QR H[LVWH FRPR YDORU A pesar de ello, su posible ubicacin nos orienta con respecto a la distribucin.
(MHUFLFLR 1- Completar la siguiente tabla de distribucin de frecuencias de una variable cualitativa y graficar en un diagrama de barras utilizando f%.
I 10 ? ? 25 ? ? ? 200
IU ? 0,15 ? ? ? 0,12 ?
I ? ? 25 ? 10 ? ?
2- Cul es el modo de la distribucin y qu indica ese valor? 3- Puede calcularse la mediana de la distribucin?. En caso afirmativo, calcularla e interpretar su resultado.
Tercer ejemplo.
7(5&(5 (-(03/2 Los datos que se presentan en la siguiente matriz corresponden a una encuesta sobre el hbito de fumar, realizada a los 45 alumnos del ltimo ao de un determinado establecimiento escolar. En ella se les pregunt si fumaban y el conocimiento sobre los efectos perjudiciales que el cigarrillo puede ocasionar en la salud.
(QF +iE HQ &LJDUU (QF +iE HQ &LJDUU (QF +iE HQ &LJDUU 1 DOXPQR 3HUMXG 1 DOXPQR 3HUMXG 1 DOXPQR 3HUMXG 1 1 6 6 1 6 1 1 1 1 1 1 1 6 1 1 1 6 6 1 6 6 1 1 1 6 1 6 6 1 1 1 1 6 6 6 6 1 6 6 6 1 1 1 1
Para la variable KiELWR GH IXPDU HQ HO DOXPQR se tomaron las categoras: fuma y no fuma. Esta variable es cualitativa, no admite orden y su codificacin fue: 6- fuma. 1- no fuma. Para la variable FRQRFLPLHQWR VREUH ORV HIHFWRV SHUMXGLFLDOHV TXH RFDVLRQD HO FL JDUULOOR HQ OD VDOXG se consideraron las categoras: desconocimiento, escaso conocimiento y amplio conocimiento. La variable es cualitativa, admite orden y se la codific de la siguiente manera:7
- desconocimiento. - escaso conocimiento. - amplio conocimiento.
En este caso hemos utilizado una codificacin numrica, a pesar de ello la variable sigue siendo cualitativa. 10
Tercer ejemplo.
Para una mejor observacin de los datos volcados en la matriz, los organizamos en la siguiente tabla.
+iELWR HQ HO DOXPQR 6 1 7RWDO
7RWDO
En cada casilla de la zona sombreada aparece la frecuencia absoluta correspondiente a la interseccin entre las categoras de las dos variables consideradas. Podemos observar, por ejemplo, que 6 alumnos fuman y a su vez desconocen los perjuicios de dicho hbito, de los alumnos que no fuman 12 poseen escasos conocimientos sobre el perjuicio del cigarrillo, etc. Algunas frecuencias consignadas en la tabla nos brindan informacin sobre el total de alumnos consultados que puede resultarnos til:
1R KD\ DOXPQRV TXH QR IXPHQ \ GHVFRQR]FDQ ORV HIHFWRV SHUMXGLFLDOHV GHO FL JDUULOOR
'H ORV DOXPQRV TXH IXPDQ VyOR FRQRFHQ EDVWDQWH ORV HIHFWRV SHUMXGLFLDOHV GHO FLJDUULOOR
Observamos que el modo se localiza en la interseccin entre las categoras no fuma y posee amplios conocimientos sobre los efectos perjudiciales del cigarrillo. Esto indica que: 3UHGRPLQDQ ORV DOXPQRV TXH QR IXPDQ \ SRVHHQ DPSOLRV FRQRFLPLHQWRV VREUH ORV HIHFWRV SHUMXGLFLDOHV GH GLFKR KiELWR
Las frecuencias que aparecen en la columna y fila de totales se denominan IUHFXHQ FLDV PDUJLQDOHV, stas son, para cada variable, las frecuencias absolutas de cada una de sus categora.
11
Tercer ejemplo.
De las frecuencias marginales podemos extraer que del total de alumnos encuestados: 3UHGRPLQDQ ORV DOXPQRV TXH QR IXPDQ GH ORV 6RQ PX\ SRFRV ORV TXH GHVFRQRFHQ ORV HIHFWRV SHUMXGLFLDOHV GHO FLJDUULOOR VyOR GH ORV
Los datos que proporciona la tabla de distribucin conjunta pueden graficarse en el siguiente diagrama:
)XPD 1R)XPD
(MHUFLFLR En el club A debe reorganizarse la actividad deportiva destinada a chicos de 12 a 15 aos. La direccin de la institucin decide realizar un relevamiento, para lo cual consulta a un grupo de socios de esa edad y anota en una tabla el sexo y el deporte preferido por cada uno de ellos. La tabla confeccionada es la siguiente:
6H[R 'HS 6H[R 'HS 6H[R 'HS 6H[R 'HS 6H[R 'HS 3UHI 3UHI 3UHI 3UHI 3UHI 3 ) 7 ) 9 ) 7 ) 7 ) ) 7 0 3 0 3 0 7 ) 7 7 0 7 0 3 0 9 ) 3 0 ) 9 ) 7 0 7 ) 9 0 3 3 ) 7 ) 7 ) 9 0 3 0 ) 9 ) 3 0 3 ) 9 0 7 ) 7 0 3 9 ) 7 0 9 ) 0 7 0 3 ) 9 0 3 ) 9 Para sexo: F-femenino. M-masculino Para deporte preferido: V-voley. T-tenis. P-paddle
1- Presentar en una misma tabla la informacin relevada por los directivos del club. 2- Graficar en un diagrama de barras los resultados de la tabla anterior.
12
La variable de este ejemplo (x) FDQWLGDG GH KHUPDQRV es FXDQWLWDWLYD GLVFUHWD y sus valores son: 0,1, 2, 3, 4 y 5 En las variables cuantitativas, tanto discretas como continuas, el clculo de las distintas frecuencias (f, fr, f%, F, Fr y F%) se efecta de la misma manera que para las cualitativas. De la observacin de la tabla obtenemos, por ejemplo, que el 70% de los alumnos consultados tienen a lo sumo 2 hermanos. Cuando la variable es cuantitativa discreta, la obtencin de las medidas de posicin definidas (modo y mediana) tambin se realiza de la misma forma que para las variables cualitativas. En este caso observamos que el 0R
y la 0H
.
Estos resultados nos permiten extraer las siguientes conclusiones: 3UHGRPLQDQ ORV QLxRV TXH WLHQHQ VyOR XQ KHUPDQR (O
Para representar grficamente la distribucin de una variable discreta utilizamos el GLDJUDPD GH EDVWRQHV o el GLDJUDPD GH SXQWRV
13
Primer ejemplo.
'LDJUDPD GH 3XQWRV
I
;
Al ser la variable del ejemplo cuantitativa, adems del 0R y la 0H podemos calcular otra medida de posicin, OD 0HGLD $ULWPpWLFD o 3URPHGLR, que se simboliza X /D 0HGLD $ULWPpWLFD HV OD VXPD GH WRGRV ORV GDWRV REVHUYDGRV (o todos los valores de X con sus repeticiones) GLYLGLGD SRU OD FDQWLGDG WRWDO GH HOORV. En este caso8,
;= + + + + +
En ambos grficos puede observarse que la distribucin no es simtrica, presenta DVLPHWUtD D GHUHFKD
El valor obtenido nos indica que para el grupo de nios consultado HO SURPHGLR GH KHUPDQRV HV La 0HGLD $ULWPpWLFD puede definirse de acuerdo con la siguiente expresin:
Cantidad total de datos observados.
;=
[ I + [ I + + [ P I P
n
;=
; f
P L L
Cantidad de valores distintos de x. Siempre es menor o igual que el total de datos observados.
Primer ejemplo.
(MHUFLFLR Para cada una de las variables de la tabla de la pgina 2, decir cul o cules de las tres medidas de posicin, 0R 0H \ ; puede calcularse y explicar por qu. (MHUFLFLR El dueo de una cadena de libreras quiere abrir una nueva en un cierto barrio, pero antes de tomar la decisin, resuelve preguntarle a cada familia del vecindario cuntos hijos en edad escolar tiene y con las respuestas elabor la siguiente tabla:
+LMRV HQ HGDG HVFRODU &DQWLGDG GH IDPLOLDV
1- A cuntas familias consult? 2- Cul es la variable en estudio? 3- Graficar la distribucin. 4- En ese vecindario, las familias con cuntos nios en edad escolar, son las que predominan?, cul es el nmero promedio de nios en edad escolar por familia?, el 50% de las familias a lo sumo cuntos hijos en edad escolar tienen? 3DUD WHQHU HQ FXHQWD
Muchas veces cuando se trabaja con variables cuantitativas discretas, suele aparecer el siguiente grfico.
'LDJUDPD GH OtQHDV
I
Este diagrama slo sirve para observar mejor la forma de la distribucin. No es el grfico correcto ya que al ser x una variable discreta, entre los puntos del plano (0,5) - (1,14) - ...el espacio est vaco.
15
Segundo ejemplo.
6(*81'2 (-(03/2 En cada uno de los casos siguientes se indica la cantidad de hijos que poseen 8 familias que habitan en un edificio de departamentos. &DVR La cantidad de hijos para cada una de las 8 familias es: 1-1-2-2-2-2-3-3 /D PHGLD DULWPpWLFD HV
El correspondiente Diagrama de puntos.
;
Media Aritmtica
&DVR La cantidad de hijos para cada una de las 8 familias es: 0-0-1-1-2-2-4-6 /D PHGLD DULWPpWLFD HV
Media Aritmtica
Puede observarse que en el caso 1. la media aritmtica es ms representativa del total de datos que en el caso 2. Esto se debe a que en 1. los datos se encuentran menos dispersos, en este caso la variabilidad o dispersin de las observaciones con respecto a la media aritmtica result menor. &XDQWR PiV SHTXHxD HV OD GLVSHUVLyQ GH ORV GDWRV FRQ UHVSHFWR D OD PHGLD DULWPpWL FD PiV UHSUHVHQWDWLYD GHO FRQMXQWR GH GDWRV VHUi HVWD PHGLGD.
16
Segundo ejemplo.
Vamos a definir y calcular algunas de las 0HGLGDV GH 'LVSHUVLyQ ms utilizadas: (O 5DQJR HV OD PHGLGD GH GLVSHUVLyQ TXH QRV LQGLFD OD ORQJLWXG R H[WHQVLyQ WRWDO GH OD GLVWULEXFLyQ. Esta medida se calcula restndole al valor mximo de X (Xmx) el valor mnimo que toma X (Xmn). 5DQJR Con respecto a los datos del problema: El rango para la situacin 1. es: R=3-1=2 El rango para la situacin 2. es: R=6-0=6 ;
Pi[
5DQJR R $PSOLWXG
-;
PtQ
Como esperbamos result menor el rango de 1., pues la variabilidad de las observaciones es menor Esta medida no nos orienta sobre la distribucin de todos los datos, pues slo utiliza los valores extremos.9 9DULDQ]D /D 9DULDQ]D 9; HV XQD PHGLGD GH GLVSHUVLyQ TXH QRV LQGLFD HO FRPSRUWD PLHQWR GH WRGDV ODV REVHUYDFLRQHV FRQ UHVSHFWR GH OD PHGLD DULWPpWLFD. Cuanto mayor es la variacin de las observaciones respecto de la media aritmtica, mayor ser el valor de la varianza. Para calcular la varianza, promediamos todas las ; ; . Es decir, promediamos las diferencias al cuadrado entre todos los datos observados y la media aritmtica.10
L
Puede ocurrir que se obtenga un rango muy grande a pesar de que los datos no estn demasiado dispersos entre s salvo los extremos, esto podra haber ocurrido si en el caso 1. la cantidad de hijos fuera: 1, 1, 2, 2, 2, 2, 3 y 8. 10 La varianza, al ser calculada por medio de la suma de los desvos al cuadrado, respecto de la media, queda expresada en la magnitud de la variable al cuadrado. En nuestro ejemplo, la magnitud de la variable es hijos entonces la varianza queda expresada en hijos al cuadrado y esto carece de sentido. 17
Segundo ejemplo.
Como en los casos del problema los valores que toma la variable no son todos distintos, para calcular la varianza, a cada diferencia al cuadrado la multiplicamos por la frecuencia correspondiente. Obtenemos. Para el caso 1.
V(X)=
V(X) = V(X) =
Obtenemos 9;
As como ocurri con el rango, la varianza tambin result menor para el primer caso. Definimos la 9DULDQ]D con la siguiente expresin: 9;
(X
L
X fi n
18
Segundo ejemplo.
'HVYtR 6WDQGDUG (O GHVYtR VWDQGDUG '6 HV XQD PHGLGD SRU PHGLR GH OD FXDO VH REWLHQH OD GLVSHU VLyQ GH ORV GDWRV FRQ UHVSHFWR D OD PHGLD DULWPpWLFD HQ OD PLVPD PDJQLWXG GH OD YDULDEOH La definicin del desvo es la siguiente:
'6
V(X)
Si calculamos los desvos para nuestro ejemplo, obtenemos: Para el caso 1. = '6 Para el caso 2. '6 =
Como era de esperar, el desvo standard tambin result menor para el caso 1.
Con el clculo de las medidas de dispersin para los datos del ejemplo, hemos confirmado lo observado en los grficos, es decir, que a pesar de que en los dos casos la cantidad promedio de hijos es la misma, la distribucin de los hijos para el primer caso es menos variable, ms homognea, que para el segundo 2EVHUYDFLRQHV Cuando se trabaja con datos de toda la poblacin, a la varianza se la suele llamar V al desvo standard V y a la media aritmtica P. En el caso de trabajar con una muestra 6 6 y ; respectivamente.
En este texto se estn utilizando las notaciones 9; '6 \ ; para ambos casos.
(MHUFLFLR Calcular todas las medidas de dispersin dadas para la distribucin de los datos del ejercicio 7.
19
Tercer ejemplo.
7(5&(5 (-(03/2 Para seleccionar a los nuevos ingresantes a primer ao, un colegio decide tomar una prueba de nivel a los 50 postulantes y las calificaciones obtenidas, entre 0 y 100, fueron las siguientes:
La variable FDOLILFDFLyQ es FXDQWLWDWLYD FRQWLQXD puede tomar cualquier valor real comprendido entre 0 y 100. En este caso, los datos observados nos indican que el menor valor de la variable es 39 y el mayor 100. Cuando la variable es cuantitativa continua, es comn tener muchos datos distintos entre s, por ese motivo, una tabla de distribucin de frecuencias en la que figure el listado de todos los valores de la variable, como las que se confeccionaron hasta el momento, podra ser muy extensa y de poca utilidad.11 En estos casos, se consideran intervalos para ubicar todos los valores observados de la variable que denominamos ,QWHUYDORV R &ODVHV
Para la construccin de los intervalos, debemos tener en cuenta que FDGD GDWR RE VHUYDGR GHEH SHUWHQHFHU D XQ ~QLFR LQWHUYDOR. Lo que es equivalente a decir que las clases deben ser excluyentes y exhaustivas.
En este ejemplo agruparemos todos los datos en 7 intervalos de igual amplitud y para determinar dicha amplitud calculamos el UDQJR de la distribucin de calificaciones12
11
Esta situacin puede presentarse tambin en casos donde la variable de estudio sea cuantitativa discreta, presente un amplio rango y la cantidad de observaciones sea grande. El procedimiento siguiente no es adecuado para distribuciones que poseen un rango muy grande debido a valores extremos muy alejados, en estos casos, los intervalos a tomar son en general de distinta amplitud. 20
12
Tercer ejemplo.
5DQJR
Pi[
;
PtQ
Luego dividimos el rango entre la cantidad de intervalos elegida Finalmente usamos como amplitud de cada intervalo un valor levemente mayor al obtenido en la cuenta. Esto garantiza que todos los datos puedan incluirse en algn intervalo. Consideramos entonces LQWHUYDORV GH DPSOLWXG FDGD XQR Estos intervalos son los nmeros comprendidos entre: 39 y 48 - 48 y 57 - 57 y 66 - 66 y 75 - 75 y 84 - 84 y 93 - 93 y 102 El primer valor de cada intervalo se llama lmite inferior (L1) y el ltimo lmite superior (L2). Cada calificacin observada pertenece a uno slo de los intervalos considerados, excepto aquellas que coinciden con alguno de los lmites, en estos casos debemos decidir en cul de los intervalos incluirlas, ya que deben pertenecer slo a uno. En general, se consideran intervalos que contienen al lmite inferior pero no al superior. Usando ese criterio la calificacin 39 la ubicamos en el intervalo que va de 39 a 48, la calificacin 48 en el de 48 a 57, la calificacin 57 en el de 57 a 66, y as sucesivamente. En consecuencia, FXDQGR XQD REVHUYDFLyQ FRLQFLGH FRQ HO H[WUHPR R OtPLWH LQIHULRU GH XQ LQWHUYDOR OD LQFOXtPRV HQ pO 6L FRLQFLGH FRQ HO OtPLWH VXSHULRU OD LQFOXtPRV HQ HO LQWHUYDOR VLJXLHQWH Para cada intervalo o clase elegimos un representante y como tal utilizamos al punto medio de dicho intervalo13 que se denomina 0DUFD GH &ODVH y se denota por ;
13
Este valor se calcula dividiendo por dos la suma de los lmites del intervalo / / sumndole al
Tercer ejemplo.
Una vez escogidos los intervalos para agrupar los datos, organizamos la informacin en la siguiente tabla de distribucin de frecuencias. ,QWHUYDORV GH 0DUFD ; I &DOLILFDFLRQHV 7RWDO I I
U
)
Intervalo modal
Intervalo mediano
El polgono superpuesto al histograma se construy tomando las coordenadas de los puntos medios de cada intervalo (marca de clase) y el grfico formado se llama 3ROtJRQR GH IUHFXHQFLDV
22
Tercer ejemplo.
Observando el grfico notamos que HO 3ROtJRQR GH IUHFXHQFLDV HQFLHUUD XQ iUHD LJXDO D OD GHO +LVWRJUDPD. Para calcular el rea encerrada por el Histograma tomamos como unidad de medida la amplitud de los intervalos. Observamos que la base de cada rectngulo mide 1 unidad y que la altura, mide el valor de la frecuencia asociada al intervalo. De esta manera, HO iUHD GHO KLVWRJUDPD HV VL VH WUDEDMD FRQ ODV IUHFXHQ FLDV UHODWLYDV VL VH FRQVLGHUDQ ODV IUHFXHQFLDV GH SRUFHQWDMHV \ HO WRWDO HQ HO FDVR GH XWLOL]DU ODV DEVROXWDV
Por ese motivo, si los intervalos son de distinta amplitud, la altura de los rectngulos no coincidir con el valor de la frecuencia con la cual se trabaja. Esta altura debe calcularse en forma proporcional al ancho del intervalo y manteniendo el rea correspondiente. Notemos que cuanto ms pequeos son los intervalos, ms suave es el grfico del polgono de frecuencias. Esto significa que a medida que la amplitud de los intervalos se acerca a 0 el polgono se aproxima al grfico de una funcin matemtica que servir de modelo terico para la distribucin.
Otro grfico de gran utilidad para este tipo de distribuciones es el de las frecuencias acumuladas, para el que puede considerarse tanto F, como Fr F%. El grfico no vara segn la frecuencia acumulada elegida. Para su construccin se consideran los puntos determinados por los pares lmite superior y frecuencia acumulada de cada intervalo. En el caso de utilizar la frecuencia acumulada porcentual, los puntos sern: (39,0), (48,8), (57,20), (66,46),..., (93,90) y (102,100)14 . La poligonal que queda determinada por dichos puntos recibe el nombre de 2MLYD
14
Notemos que todos los puntos de abscisa mayor o igual a 102 tienen como ordenada 100, como as tambin todos los de abscisa menor o igual a 39 tienen como ordenada 0. 23
Tercer ejemplo.
2MLYD )
Para esta distribucin de calificaciones FDOFXODUHPRV ODV PHGLGDV GH SRVLFLyQ \ GH GLVSHUVLyQ \D GHILQLGDV. L 5DQJR
El rango ya fue calculado para establecer la amplitud de los intervalos de la distribucin 5DQJR
LL 0HGLD $ULWPpWLFD Para el clculo de la media aritmtica se procede de la misma forma que con las variables discretas, considerando como X a la marca de clase. X=
X .f
i
L
n 43,5.4 + 52,5.6 + 61,5.13 + 70,5.9 + 79,5.7 + 88,5.6 + 97,5.5 X= 50 3498 X= = 69,96 50 ; =
24
Tercer ejemplo.
Este valor indica que OD FDOLILFDFLyQ SURPHGLR REWHQLGD SRU ORV SRVWX ODQWHV HQ OD SUXHED GH QLYHO HV GH SXQWRV.
LLL 9DULDQ]D Tambin para el clculo de esta medida se considera como X a la marca del intervalo.
(X V(X) =
L
X .fi n
= =
9; =
LY 'HVYtR 6WDQGDUG
DS = 15,53
Y 0RGR En este caso, si observamos la tabla, no podemos obtener a simple vista el valor del modo pero s el intervalo que posee mayor frecuencia 57-66, por ese motivo el intervalo recibe el nombre de LQWHUYDOR PRGDO El modo es un valor que pertenece a dicho intervalo. Muchas veces se suele tomar como valor del modo al punto medio del intervalo modal (en este caso 61,5), el cual no siempre coincide con el verdadero valor. Antes de calcular el valor del modo, lo localizaremos grficamente, para lo cual confeccionamos el histograma de frecuencias absolutas.
25
Tercer ejemplo.
Punto interseccin
0R
Intervalo modal
(O 0R HV OD DEVFLVD GHO SXQWR GH LQWHUVHFFLyQ GH ODV GRV UHFWDV PDUFDGDV HQ HO JUi ILFR. Se lo puede obtener hallando las ecuaciones de esas rectas y luego calculando la abscisa del punto interseccin. Si el clculo de las rectas y de la interseccin se efecta para puntos genricos, se obtiene la siguiente expresin para calcular el modo:
Mo = / +
Diferencia entre la frecuencia del intervalo modal y la frecuencia del intervalo anterior
d1 a d1 + d2
Diferencia entre la frecuencia del intervalo modal y la frecuencia del intervalo posterior
26
Tercer ejemplo.
7 .9 = 7+4 7 = 57 + .9 11
0R
Este valor indica que OD FDOLILFDFLyQ TXH SUHGRPLQD HV GH SXQWRV. Observamos que el resultado obtenido no coincide con el punto medio del intervalo modal (61,5). (MHUFLFLR En qu casos el modo coincidir con el punto medio del intervalo modal? YL 0HGLDQD El valor de la mediana, como ocurre con el modo, no se obtiene directamente de la observacin de la tabla, lo que s se obtiene es el intervalo mediano 66-75 y la mediana es un valor que pertenece a dicho intervalo .15 La mediana se localiza grficamente en la Ojiva, que es donde se representan las frecuencias acumuladas.
15
Para localizar el intervalo mediano, notamos que la cantidad de observaciones es 50, los tres primeros intervalos suman 23, no puedo agregar las 9 del cuarto intervalo porque superara 25, y lo mismo ocurre con los tres ltimos que suman 18. 27
Tercer ejemplo.
0H
Si se calcula la ecuacin de la recta en forma genrica, luego se reemplaza por el punto (Me, n/2) y se despeja Me, se obtiene la siguiente expresin para el clculo de la mediana:
Frecuencia acumulada del intervalo anterior al intervalo mediano
25 23 .9 = 9 2 = 66 + .9 9 Me = 68 Me = 66 +
28
Tercer ejemplo.
Este resultado indica que HO GH ORV DVSLUDQWHV REWXYLHURQ XQD FDOLILFDFLyQ LQIHULRU R LJXDO D SXQWRV \ HO UHVWDQWH XQD FDOLILFDFLyQ VXSHULRU D SXQ WRV 2EVHUYDFLRQHV Cuando la variable es cuantitativa, las medidas de posicin no necesariamente dan por resultado un valor observado. En el caso de variables cuantitativas continuas, la mediana supera y es superada exactamente por el 50% de las observaciones. Si el modo, la mediana y la media coinciden, la distribucin es simtrica.
(MHUFLFLR
La siguiente distribucin de frecuencias corresponde a las horas semanales de trabajo de un grupo de docentes de enseanza media.
+RUDV GH WUDEDMR 10-15 15-20 20-25 25-30 30-35 35-40 40-45 45-50 50-55 &DQWLGDG GH GRFHQWHV 5 7 25 15 45 18 13 6 3
1. Graficar el histograma, el polgono de frecuencias y la ojiva. 2. Calcular todas las medidas posibles y ubicarlas en los grficos correspondientes, 3. Extraer conclusiones.
29
&XUVRV $
%
Al observar los datos de la tabla, se puede afirmar que los puntajes de todos los alumnos de 1 B en relacin a los del grupo de 1 A, variaron menos respecto al puntaje promedio, es decir que estn ms concentrados alrededor de dicho promedio. Esto significa que los alumnos de 1 B obtuvieron puntajes ms KRPRJpQHRV que los de 1 A. El grupo 1 B es PHQRV YDULDEOH con respecto a los puntajes que el otro grupo.16 Para extraer la conclusin anterior bast con observar los desvos de los puntajes, dado que los promedios coinciden para ambos grupos.
En general, cuando se comparan dos o ms grupos con respecto a una misma variable, es difcil que se presente la situacin anterior donde los promedios coinciden. Pero, a pesar de ello, es factible analizar la variabilidad de los grupos entre s.
16
Un tipo de comparacin.
Segundo ejemplo.
6(*81'2 (-(03/2 Tomaremos el mismo problema que en el primer ejemplo pero con la siguiente tabla de resultados:
0HGLGDV
X '6
&XUVRV $
%
Con los resultados obtenidos en este caso no podemos decidir cul de los dos cursos presenta mayor KRPRJHQHLGDG en los puntajes. Para este tipo de problemas necesitamos de otra medida de dispersin denominada &RHILFLHQWH GH 9DULDFLyQ (O FRHILFLHQWH GH YDULDFLyQ &9 H[SUHVD DO GHVYtR VWDQGDUG FRPR XQ SRUFHQWDMH GH OD PHGLD DULWPpWLFD y se define con la siguiente expresin:
CV =
DS 100 X
Al comparar dos o ms grupos respecto a una misma variable y calcular para cada uno de ellos el CV, este valor nos permitir decidir sobre la homogeneidad de los mismos pues: HO JUXSR PiV KRPRJpQHR UHVXOWDUi VHU DTXHO TXH SRVHD HO PHQRU FRHILFLHQWH GH YDULDFLyQ . Al calcular los CV para los dos cursos de nuestro ejemplo obtenemos: Para 1 A Para 1 B
2,7 .100 6 CV = 45 CV =
2,4 .100 5 CV = 48 CV =
31
Un tipo de comparacin.
Segundo ejemplo.
Como para 1 A el coeficiente de variacin result menor que para 1 B, puede afirmarse que ORV SXQWDMHV GH $ IXHURQ PiV KRPRJpQHRV TXH ORV GH % (MHUFLFLR Se tom una prueba de nivel con un puntaje mximo de 20 a dos comisiones de estudiantes (C1 y C2) y los resultados obtenidos fueron los siguientes:
1. Para cul de los dos grupos el promedio de los puntajes result mayor? 2. Para cul de los dos grupos el puntaje result ms homogneo?
32
81 352%/(0$ ',67,172 Ante un hecho real, las variables a analizar no siempre se presentan en forma tan clara, como en los ejemplos tratados. Muchas veces, ciertas variables, pueden cumplir el rol de las frecuencias absolutas y la dificultad surge al calcular las medidas que permitan extraer conclusiones. Por ese motivo es muy importante poder identificar y clasificar la variable de inters en un estudio. (-(03/2 En la Direccin de Turismo de una determinada Ciudad, se buscaron los datos referidos a la entrada de turistas durante los ltimos tres aos, seleccionando slo los meses de temporada alta. La finalidad de dicha bsqueda, es la de realizar una sntesis de la informacin que permita analizar posibles cambios con respecto a las medidas implementadas hasta el momento y de esta manera incrementar la afluencia turstica en la ciudad. En la siguiente tabla se presenta la informacin obtenida. 0HV 3ULPHU DxR 6HJXQGR DxR 7HUFHU DxR 'LFLHPEUH (QHUR )HEUHUR 0DU]R 7RWDO &DQWLGDG GH WXULVWDV HQ PLOHV SRU PHV \ DxR FRQVLGHUDGR 7RWDO
Observamos que las variables DxR y PHV GH WHPSRUDGD DOWD son ambas cualitativas. Graficamos toda la informacin de la tabla en el siguiente diagrama de barras adyacentes:
33
Un problema distinto.
R x D R G Q X J H 6
R x D U H P L U 3
De la observacin tanto de la tabla como del grfico extraemos entre otras las siguientes conclusiones: 'H ORV FXDWUR PHVHV FRQVLGHUDGRV SUHGRPLQD OD HQWUDGD GH WXULVWDV HQ HO PHV GH HQHUR (VWH KHFKR VH GD HQ ORV WUHV DxRV HVSHFLDOPHQWH HQ HO SULPHUR
Pero si consideramos OD FDQWLGDG GH WXULVWDV TXH LQJUHVDURQ VHJ~Q PHV \ DxR como una tercera variable de estudio, podemos realizar un anlisis ms completo de la informacin dada. Esta nueva variable es cuantitativa discreta por tal motivo podemos calcularle todas las medidas antes definidas, sus valores son las frecuencias que aparecen en la tabla antes confeccionada. Notamos que todos los valores tienen frecuencia 1, por tal motivo carece de sentido graficar la informacin.
34
Un problema distinto.
Las siguientes son algunas de las conclusiones que podemos extraer: 1. /D HQWUDGD GH WXULVWDV D OD &LXGDG HQ ORV ~OWLPRV WUHV DxRV IXH HQ SURPHGLR GH WXULVWDV DQXDOHV Pues
331 + 393 + 369 3 = 364,33
2. 'XUDQWH ORV WUHV ~OWLPRV DxRV HO SURPHGLR PHQVXDO GH WXULVWDV TXH LQJUHVDURQ D OD &LXGDG IXH GH Pues
216 + 350 + 295 + 232 4 = 273,25
As como obtuvimos las conclusiones anteriores, podemos adems calcular el promedio mensual de turistas que ingresaron en cada uno de los tres aos, el promedio anual de turistas para cada mes de la temporada considerado el promedio mensual de turistas que ingresaron a la Ciudad.
Puede resultarnos tambin de inters averiguar en qu mes de la temporada alta el ingreso de turistas a la Ciudad result ms homogneo. Para esto necesitamos comparar los coeficientes de variacin de los cuatro meses considerados. Calculamos entonces para cada uno de los meses el promedio de ingreso de turistas, el desvo estndar y el coeficiente de variacin correspondiente, obteniendo los siguientes resultados, para: Diciembre:
X= 50 + 76 + 90 = 72 3
(50 72) 2 + (76 72) 2 + (90 72) 2 = 16,57 3 S 16,57 CV = 100 = 100 = 23 72 X DS =
35
Un problema distinto.
Enero:
X= 125 + 120 + 105 = 116,67 DS = 8,50 3 S 8,50 CV = 100 = 100 = 7,28 116 ,67 X
Febrero:
X= 89 + 110 + 96 = 98,33 DS = 8,73 3 S 8,73 CV = 100 = 100 = 8,88 98,33 X
Marzo:
X=
En los clculos realizados observamos que el coeficiente de variacin menor se obtuvo en el mes de Enero esto indica que: 3DUD OD WHPSRUDGD DOWD VH REWXYR TXH HO LQJUHVR GH WXULVWDV D OD &LXGDG UHVXOWy PiV KRPRJpQHR HQ HO PHV GH (QHUR
36
(-(5&,&,2 ,17(*5$'25 Las autoridades educativas de cierta comunidad decidieron describir el perfil de los docentes que se desempean en ella. Por tal motivo se seleccion una muestra de 32 docentes y los datos relevados se volcaron en una matriz.
1 GH HQ 6H[R (VWDGR (GDG 6XHOGR &DQW OXJD WUHYLVWDGR FLYLO HQ DxRV HQ UHV GRQGH WUDEDMD
) ) 0 0 0 ) 0 0 ) ) ) ) ) 0 0 ) ) ) ) 0 ) ) ) 0 0 ) ) ) ) 0 ) )
6 & 6 ' 6 6 & & & ' ' & & & 6 & & & & ' & & 6 6 & & & 6 6 6 6 6
Con los datos proporcionados por la matriz: 1. Determinar de qu tipo es cada una de las variables que intervienen en el estudio. 2. Confeccionar las tablas y grficos que crea ms conveniente para cada una de ellas. 3. Calcular todas las medidas posibles e interpretar sus resultados. 4. Establecer las comparaciones posibles.
En Sexo: F para femenino y M para masculino. En Estado Civil: S para soltero, C para casado y D para divorciado o separado
37
352%$%,/,'$'
,1752'8&&,1
Al realizar un anlisis estadstico de un conjunto de datos provenientes de una determinada poblacin que se desea estudiar, puede ocurrir que dichos datos hayan sido relevados de la poblacin en su totalidad o de una muestra representativa de dicha poblacin.1 Si los datos fueron obtenidos de toda la poblacin, al organizarlos, presentarlos y resumirlos por medio de la estadstica descriptiva, se extraern conclusiones referidas a dicha poblacin. Pero si los datos fueron obtenidos de una muestra, al realizar un anlisis descriptivo de los mismos slo se sacarn conclusiones referidas a esa muestra. En este caso, las conclusiones acerca de la poblacin se debern inferir a travs de los resultados muestrales. En consecuencia, slo al realizar un anlisis descriptivo de toda una poblacin, las conclusiones extradas sern acerca de dicha poblacin. En otra situacin, los resultados de la estadstica descriptiva no alcanzan, se deber transferir esos resultados para obtener conclusiones sobre la poblacin. Los mtodos y procedimientos que permiten inferir los resultados muestrales a la poblacin en su totalidad corresponden a la denominada HVWDGtVWLFD LQIHUHQFLDO y pVWD VH IXQGDPHQWD WHyULFDPHQWH HQ OD WHRUtD GH OD 3UREDELOLGDG $ WUDYpV GH OD 3UREDELOLGDG VH HODERUDQ ORV PRGHORV WHyULFRV HQ ORV TXH VH EDVD OD (VWDGtVWLFD SDUD OD WRPD GH GHFLVLRQHV DQWH OD LQFHUWLGXPEUH /D SUREDELOLGDG HV D OD YH] HO OHQJXDMH \ OD PHGLGD GH LQFHUWLGXPEUH \ ORV ULHVJRV DVRFLDGRV FRQ HOOD2
Esto depender del tamao de la poblacin y de la posibilidad de recoleccin de los datos. Chou Ya Lun en Anlisis Estadstico. 39
(;3(5,0(1726
Podemos realizar, entre otros, los siguientes experimentos: 1. Observar la cantidad de alumnos ausentes en el colegio en el da D. 2. Sortear una bicicleta entre los 35 alumnos de 2 ao. 3. Organizar un campeonato de ftbol entre los colegios A, B, C y D y premiar al ganador. 4. Calcular los promedios generales de todos los alumnos de 5 ao y anotar el mejor. Observamos que en estos experimentos no se puede predecir el resultado a obtener. 1R H[LVWH IyUPXOD DOJXQD TXH SXHGD GHWHUPLQDU OD FDQWLGDG GH DOXPQRV TXH IDOWD UiQ DO FROHJLR TXLpQ JDQDUi OD ELFLFOHWD FXiO VHUi HO FROHJLR SUHPLDGR QL FXiO VHUi HO PHMRU SURPHGLR. Para los juegos de azar ocurre exactamente lo mismo; no se puede predecir el resultado a obtener al lanzar una moneda, ni al lanzar un dado, ni al hacer girar la ruleta, etc. Todos estos experimentos tienen ms de un resultado posible y estos resultados son inciertos. En otras palabras, no puede determinarse un resultado a priori. Por ese motivo se los llama: (V VyOR HQ HVWH WLSR GH H[SHULPHQWRV GRQGH VH SXHGH KDEODU GH SUREDELOLGDG En consecuencia, para la probabilidad se necesita que los experimentos a realizar sean aleatorios. (MHUFLFLR Decidir cules de los siguientes experimentos son aleatorios y explicar porqu.
1- Calcular la superficie de un terreno rectangular de 10m de ancho por 25m de largo. 2- Jugar un torneo de tenis. 3- Tirar una tiza desde el fondo del aula y medir la distancia de donde cae al pizarrn. 4- Medir la altura de una planta al ao de ser plantada. 5- Determinar el desplazamiento de un mvil que se mueve durante 3h a velocidad constante de 80 km/h. 6- Depositar $100 en una entidad bancaria y calcular el monto total a retirar luego de 2 meses, en un perodo de estabilidad econmica. 7- Depositar $100 en una entidad bancaria y calcular el monto total a retirar luego de 2 meses, en un perodo de inflacin econmica.
40
8Q HVSDFLR PXHVWUDO HV XQ FRQMXQWR IRUPDGR SRU WRGRV ORV UHVXOWDGRV SRVLEOHV GH XQ H[SHULPHQWR DOHDWRULR
En la siguiente tabla figuran distintos experimentos y un espacio muestral correspondiente a cada uno de ellos. ([SHULPHQWR (VSDFLR PXHVWUDO Observar la cantidad de alumnos que faltan E = {0,1,2,...20,........n} al colegio en el da D. n depende de la cantidad total de alumnos. Lanzar dos monedas. E = {CC, SS, SC, CS}
Considerar el mejor promedio general entre E = {xR/ 0 x 10} los alumnos de 5 ao. Registrar el nmero de veces que se debe E = {1,2,3,4,.....} lanzar un dado hasta que aparezca el 1. Contar la cantidad de alumnos de un curso E = {0,1,2,.......,40} de 40, que cumplen aos en un mismo mes. Los espacios muestrales son conjuntos que pueden tener una cantidad finita o infinita de elementos3. (MHUFLFLR Cules de los espacios muestrales asociados a los experimentos aleatorios anteriores son conjuntos de finitos elementos?
3
Segundo ejemplo.
6(*81'2 (-(03/2 Consideremos la siguiente situacin: Se realiza un sorteo entre 40 nmeros, del 1 al 40, cul de los nmeros ser el ganador?. En este caso el espacio muestral es: ( ^`
Ahora bien, si yo tengo todos los nmeros que terminan con 7 voy a ganar si en el sorteo sale alguno de los resultados del siguiente conjunto $ ^`
Los conjuntos A, B, C y D son subconjuntos del espacio muestral E y reciben el nombre de VXFHVRV
8Q VXFHVR RFXUUH FXDQGR HO UHVXOWDGR TXH VH REWLHQH HQ HO H[SHULPHQWR HV XQ HOHPHQWR GH GLFKR VXFHVR.
En particular: 6L XQ VXFHVR WLHQH XQ VyOR HOHPHQWR VH GLFH TXH HV XQ VXFHVR HOHPHQWDO (B). 6L XQ VXFHVR FRLQFLGH FRQ HO HVSDFLR PXHVWUDO RFXUUH VLHPSUH SRU OR TXH VH GHQRPLQD VXFHVR FLHUWR (C). 6L XQ VXFHVR QR WLHQH HOHPHQWRV FRLQFLGH FRQ HO FRQMXQWR OXHJR QR SXHGH RFXUULU QXQFD HV GHFLU HV HO VXFHVR LPSRVLEOH (D). Como todo conjunto es subconjunto de s mismo, y adems, el conjunto vaco es un subconjunto de cualquier conjunto, tanto el suceso cierto como el suceso imposible estn asociados a cualquier experimento aleatorio.
42
Tercer ejemplo.
7(5&(5 (-(03/2 Para un torneo de ajedrez se inscribieron 6 nios de 10 aos: Mara (M), Cristina (C), Vernica (V), Luis (L), Alejandro (A) y Gerardo (G). Se deben sortear dos nios para realizar el partido de iniciacin. Los resultados posibles del sorteo son todos los elementos del siguiente conjunto:
( ^0& 09 0/ 0$ 0* &9 &/ &$ &* 9/ 9$ 9* /$ /* $*`
$: Los dos nios son del mismo sexo. %: Los dos nios son de distinto sexo.
% &
&: Al menos uno de los nios es varn. ': Uno de los nios debe ser Vernica.
'
^0/ 0$ 0* &/ &$ &* 9/ 9$ 9*` ^0/ 0$ 0* &/ &$ &* 9/ 9$ 9* /$ /* $*` ^09 &9 9/ 9$ 9*`
Entre los sucesos podemos realizar las siguientes RSHUDFLRQHV4 ,QWHUVHFFLyQ C D = {VG, VA, VL} El suceso C D ocurre cuando ocurren C y D simultneamente.
& 0/ 0$ 0* &/ 9* &$ &* /$ 9$ /* 9/ $*
09 &9
&XDQGR OD LQWHUVHFFLyQ HQWUH GRV VXFHVRV HV HO FRQMXQWR YD FtR VH GLFH TXH ORV VXFHVRV VRQ PXWXDPHQWH H[FOX\HQWHV.
4
Como los sucesos son conjuntos, las operaciones que se pueden realizar son las mismas que las operaciones entre conjuntos. 43
Tercer ejemplo.
Es decir que dos sucesos son mutuamente excluyentes cuando no pueden ocurrir simultneamente. En el ejemplo, A y B son dos sucesos excluyentes. 8QLyQ
$
0& /$ /* $*
El suceso AD ocurre cuando ocurre por lo menos uno de ellos. ( En la unin estn todos los elementos de A y todos los de D.
'LIHUHQFLD
%
MV CV
MC LG LA AG
La diferencia entre los sucesos B y D (B-D), es el suceso cuyos elementos son los de B que no pertenecen a D. ( El suceso B-D ocurre cuando ocurre B y no ocurre D
&RPSOHPHQWR
El suceso B es el complemento del suceso A (B = Ac), pues VXV HOHPHQWRV VRQ WRGRV ORV GHO HVSDFLR PXHVWUDO TXH QR SHUWHQHFHQ D $ y ocurre cuando no ocurre A. $ ($ A y Ac son sucesos mutuamente excluyentes.
F
2EVHUYDFLyQ Tanto la unin como la interseccin pueden obtenerse para ms de dos sucesos. (MHUFLFLR Dados los sucesos A y B asociados a un experimento aleatorio, representarlos en diagramas y sombrear las regiones correspondientes a: AB, AB, Ac, Bc, A-B y B-A
44
Si queremos asignarle una probabilidad al suceso A de nuestro ejemplo ser 3$ Luego, la probabilidad de ganar es 0,1. Si tengo slo el nmero 30 voy a ganar si ocurre el suceso: B = {30} y en este caso 3% Con lo cual, la probabilidad de ganar es 0,025. Si tengo todos los nmeros voy a ganar siempre 3( dad de ganar es 1. Es decir, la probabili-
Si no tengo ningn nmero no ganar nunca 3 Luego, la probabilidad de ganar, en este caso, ser 0.
45
Definicin de probabilidad.
Qu probabilidad tendr de ganar si adems de poseer los nmeros que terminan con 7, tengo el nmero 30? En este caso voy a ganar si ocurre el suceso S = {7,17,27,37,30} = A B En este FDVR 36 3$ 3% Podemos decir entonces, que la probabilidad de ganar es 0,125. En los puntos 1.,2.,3.,4. y 5. hemos observado que la probabilidad es un nmero real que vara entre 0 y 1. Adems, en el punto 5. se observa que la probabilidad de la unin de dos sucesos excluyentes es la suma de sus respectivas probabilidades. Conclumos en la GHILQLFLyQ D[LRPiWLFD GH SUREDELOLGDG: /D SUREDELOLGDG HV XQD IXQFLyQ TXH D FDGD VXFHVR $ GH XQ HVSD FLR PXHVWUDO ( DVRFLDGR D XQ H[SHULPHQWR DOHDWRULR OH DVLJQD XQ Q~PHUR (VH Q~PHUR PLGH OD SRVLELOLGDG GH RFXUUHQFLD GHO VXFHVR \ FXPSOH FRQ ORV VLJXLHQWHV D[LRPDV d 3$d 3( 3$ % 3$ 3% VL $ %
El tercer axioma de probabilidad puede extenderse a un nmero finito o infinito numerable de sucesos mutuamente excluyentes.
46
^9 0`
(
Los dos espacios muestrales estn asociados al mismo experimento, pero en el segundo estamos distinguiendo a los alumnos postulados. La diferencia entre ambos espacios muestrales es que en el primero, los resultados (V o M) no tienen la misma posibilidad de ocurrir dado que hay ms varones que mujeres. En cambio en el segundo, FDGD UHVXOWDGR R VXFHVR HOHPHQWDO WLHQH OD PLVPD SRVLELOLGDG GH RFXUULU por ese motivo decimos que: ( HV XQ HVSDFLR PXHVWUDO HTXLSUREDEOH
Por lo tanto: 8Q HVSDFLR PXHVWUDO DVRFLDGR D XQ H[SHULPHQWR HV HTXLSUREDEOH VL WRGRV VXV UHVXOWDGRV WLHQHQ OD PLVPD SUREDELOLGDG GH RFXUULU Para este ejemplo es lgico pensar que la probabilidad de que en el sorteo salga seleccionada una mujer sea 2/5 y no 1/2.
47
Primer ejemplo.
/$ 7(25$ &/6,&$ '( /$ 352%$%,/,'$' Define a la probabilidad del suceso A asociado a un experimento, como el cociente entre la cantidad de casos favorables a A y la cantidad de casos igualmente posibles para el experimento. Es decir que 3$ = 3$ &DQWLGDG GH FDVRV IDYRUDEOHV D $ &DQWLGDG GH FDVRV SRVLEOHV HQ HO H[SHULPHQWR &DQWLGDG GH HOHPHQWRV GH $ &DQWLGDG GH HOHPHQWRV GH (
Esta definicin de probabilidad, aplicable slo a espacios muestrales finitos y equiprobables, es conocida como la GHILQLFLyQ GH SUREDELOLGDG GH /DSODFH. Aplicando esta definicin al ejemplo considerado, el espacio muestral debe ser: E = {V1, V2, V3, M1, M2} El suceso, sea seleccionada una mujer es: A = {M1, M2} Con lo cual, si queremos calcular la probabilidad de que sea seleccionada una mujer, esta probabilidad ser: P(A) = 2/5. Este resultado coincide con el pensado anteriormente.
(MHUFLFLR Para el ejemplo, calcular la probabilidad de que el alumno seleccionado sea: a) varn, b) de cualquier sexo, c) ni mujer ni varn, d) M1 y e) V1 V2. Para cada caso escribir el suceso correspondiente y relacionar los resultados obtenidos con lo expuesto hasta el momento.
48
Segundo ejemplo.
6(*81'2 (-(03/2 Un vendedor de videogames, posee en stock 3 marcas distintas y del mismo precio (A, B y C). Debe reponer su mercadera, pero puede hacerlo slo de una de dichas marcas, por lo que decide seleccionar aquella que tenga menor probabilidad de reclamo por garanta de parte del cliente. El vendedor tiene el problema de no saber cul es la probabilidad de reclamo para cada marca. Lo que s puede saber, a travs de las facturas entregadas a los clientes, es la cantidad de reclamos para cada una de ellas en los ltimos 6 meses. Con los datos confecciona la siguiente tabla:
0DUFD GHO &DQW GH UHFODPRV YLGHRJDPH I )UHF UHODWLYD IU
Recordamos que: Cada frecuencia relativa vara entre 0 y 1. La suma de todas las frecuencias relativas es 1.
$ % & 7RWDO
Considerando la informacin de la tabla y, pensando que lo ocurrido durante esos meses puede seguir ocurriendo, el vendedor cree que la marca ms conveniente es la C. Si bien los datos no nos proporcionan las probabilidades de reclamo para cada marca de videogame, observando las frecuencias relativas podemos suponer que la marca C tendr la menor probabilidad de reclamo. /$ 7(25$ )5(&8(1&,$/ '( /$ 352%$%,/,'$' Define a la probabilidad en trminos de la frecuencia relativa. Es decir, que si un experimento aleatorio se repite un nmero grande de veces, entonces, la probabilidad de un suceso en particular puede asimilarse a la frecuencia relativa. En realidad, con la frecuencia relativa estamos tomando una aproximacin estimada de la probabilidad y esa aproximacin es la que denominamos probabilidad.
49
Segundo ejemplo.
Por lo tanto
Cantidad de veces que ocurri el suceso A se acerca a P(A) Cantidad de repeticiones del experimento f(A) se acerca a P(A) a medida que n crece n
(MHUFLFLR En la siguiente tabla se presenta la cantidad de hermanos y el sexo para los 45 alumnos de un curso determinado.
&DQW KHUPDQRV 9DURQHV 0XMHUHV
Si se selecciona un alumno al azar cul es la probabilidad de que: a) sea varn?, b) sea mujer?, c) tenga un slo hermano?, d) no tenga hermanos? y e) sea varn y tenga 3 hermanos?
50
Los sucesos S: comprar un sandwich y G: comprar golosinas no son sucesos mutuamente excluyentes, dado que hay alumnos que compran ambas cosas.
Si se selecciona al azar un alumno del colegio, cul es la probabilidad de que ese alumno compre: 1. solamente un sandwich? P(slo S) = 0,15 2. solamente una golosina? P(slo G) = 0,30 3. un sandwich? P(S) = 0,25 4. una golosina? P(G) = 0,40 5. un sandwich y una golosina? P(S G) = 0,10 6. un sandwich o una golosina? P(S G) = 0,15+ 0,10+ 0,30 = 0,55 Observemos que P(S G) = 0,55. sin embargo P(S) + P(G) = 0,25 + 0,40 = 0,65 (Q HVWH FDVR 36 * QR FRLQFLGH FRQ 36 3* SXHV 6 * z Al realizar P(S) + P(G) estamos sumando dos veces P(S G). Entonces, podramos calcular P(S G) recurriendo a la siguiente expresin: P(S G) = P(S) + P(G) - P(S G) P(S G) = 0,25 + 0,40 - 0,10 = 0,65 - 0,10 = 0,55 Este valor coincide con el calculado anteriormente.
51
Ejemplo.
Por lo tanto
(MHUFLFLR Para los datos del ejercicio 6, si se selecciona un alumno al azar, cul es la probabilidad de que: 1. sea varn o tenga dos hermanos? 2. sea mujer o no tenga hermanos? 3. sea mujer o tenga ms de dos hermanos? (MHUFLFLR Para un grupo de 35 alumnos de un curso se obtuvieron los siguientes datos referidos a si es socio de algn club y cuntos deportes practica: Si se selecciona un alumno al azar, &DQW GH GHS 6RFLR GH DOJ~Q FOXE calcular la probabilidad de que: TXH SUDFWLFD 6L 1R 1. no practique deportes. 2. sea socio de algn club. 3. practique como mnimo un deporte. 4. no sea socio de algn club o no practique deportes. 5. sea socio de algn club o practique como mnimo un deporte. (MHUFLFLR La probabilidad de que un vendedor de computadoras personales le venda a un cliente una computadora sin impresora es de 0,15; una impresora solamente es 0,05 y una computadora con la impresora es 0,25. Si un cliente concurre al negocio, cul es la probabilidad de que le venda una impresora, una computadora, una computadora o una impresora?.
52
Si se selecciona al azar un alumno. 1. La probabilidad de que sea mujer, es: P(M)= 25/45 2. La probabilidad de que tenga 3 hermanos y sea mujer, es: P(3H M)= 2/45 3. Sabiendo que es mujer, la probabilidad de que tenga 3 hermanos. En este caso estamos condicionando el suceso: tener tres hermanos, al suceso: es mujer. Esta SUREDELOLGDG FRQGLFLRQDO se denota: 3+0
Para calcularla, como sabemos que el alumno es mujer el total de casos posibles se reduce de 45 a 25, por lo que estamos ubicados en la segunda columna de la tabla y la cantidad de casos favorables es 2. Es decir, que dentro del conjunto de las mujeres seleccionamos a las que tienen 3 hermanos. Luego P(3H/M)= 2/25 De la observacin de 1.,2. y 3. conclumos que: 3+ 0 3+ 0 = = 30 3+ 0 /XHJR 3+ 0 30
53
Primer ejemplo.
4. La probabilidad de que tenga 3 hermanos, es: P(3H)= 3/45 5. La probabilidad de que sea mujer y tenga tres hermanos, es: P(M 3H)= 2/45 6. La probabilidad de que sea mujer sabiendo que tiene tres hermanos, en este caso la probabilidad condicional es: P(M/3H). Como sabemos que el alumno tiene tres hermanos, los casos posibles se reducen de 45 a 3, nos ubicamos en la tercera fila y en ella los casos favorables son 2. Luego: P(M/3H)= 2/3 Al observar 4.,5. y 6. conclumos que:
30 + 30 +
30 + = = 3+ 30 + 3+
En consecuencia, dados dos sucesos A y B, definimos la probabilidad condicional como: /D SUREDELOLGDG FRQGLFLRQDO GH $ GDGR % (si P(B)0) es: 3$ % 3$ % 3% 3% $ 3$
3$ % 3$ %3% R 3% $ 3% $3$
Segundo ejemplo.
6(*81'2 (-(03/2 Retomaremos el ejemplo de los 5 alumnos que se postularon para ser delegados de curso; V1, V2, V3, M1 y M2. Pero en este caso vamos a seleccionar 2 delegados y calcular la probabilidad de que: a) los dos alumnos seleccionados sean mujer y b) slo un alumno seleccionado sea varn. Para calcular las probabilidades pedidas necesitamos saber cules son todas las posibilidades que existen de elegir los dos delegados, es decir, los elementos del espacio muestral E. Un manera de obtener los elementos de E es por medio del denominado GLDJUDPD GH iUERO el cual puede realizarse de dos formas distintas.
En la primera columna del diagrama escribimos las posibilidades que tenemos de seleccionar el primer delegado y en la segunda, las posibilidades de seleccionar el segundo delegado para cada caso. Cada rama del rbol indica un resultado posible para la seleccin de los dos delegados, es decir que del diagrama de rbol completo obtenemos el conjunto de todos los resultados posibles para esta situacin.. 'LDJUDPD GH iUERO
9
9 9 0
0
9 9 0 0 9 9 0 0 9 9 0 0 9 9 9 0 9 9 9 0
5HVXOWDGRV SRVLEOHV (
99 99 90 90 99 99 90 90 99 99 90 90 09 09 09 00 09 09 09 00
55
Segundo ejemplo.
En total tenemos 5 x 4 = 20 resultados posibles. Calculamos finalmente las probabilidades de que: a) los dos alumnos seleccionados sean mujer. Luego: 30 0 = 2/20 =
La otra forma de construir el diagrama del rbol es sin discriminar a los varones y a las mujeres entre s, sta determina un espacio muestral que no es equiprobable. Para evitar tal dificultad colocamos en cada una de sus ramas la probabilidad correspondiente, de la siguiente manera: 'LDJUDPD GH iUERO 9
De los 5 alumnos hay 3 varones, luego P(V)=3/5 De los 5 alumnos hay 2 mujeres, luego P(M)=2/5
9 0 9 0
Como se seleccion un alumno quedan 4 y de ellos 2 varones por ser el primero varn, luego P(V/V)=2/4 Entre los 4 alumnos restantes hay 2 mujeres, luego P(M/V)=2/4
Calculamos las probabilidades de que: a) los dos alumnos seleccionados sean mujer: b) slo un alumno sea varn: P[(V M) (M V)] al ser sucesos excluyentes: 39 0 30 9 = P(V). P(M/V) + P(M). P(V/M) = 3/5. 2/4 + 2/5. 3/4 = 6/20 + 6/20 = 12/20 = Como era de esperar, los resultados no cambiaron.
56
Tercer ejemplo.
(MHUFLFLR Para el ejemplo anterior, calcular la probabilidad de que: a) los dos alumnos seleccionados sean varn, b) al menos uno de los alumnos seleccionados sea mujer y c) a lo sumo uno de los alumnos seleccionados sea varn. 7(5&(5 (-(03/2 En una juguetera hay 8 casettes de videogames de 20 juegos cada uno. El dueo de la juguetera sabe que 2 de ellos, en realidad, no tienen 20 juegos distintos, sino, varias repeticiones de un mismo juego. Es decir, que vinieron fallados. Como especula con venderlos igual, tiene todos los casettes mezclados. Si entran dos clientes a la juguetera a comprar casettes, cul es la probabilidad de que a ambos les halla tocado los fallados? El siguiente diagrama de rbol, en donde F indica que el casette est fallado y S sano, nos puede guiar para el clculo de la probabilidad.
6 )
) 6
En este caso, la probabilidad pedida es: P(F F) = P(FF) = P(F/F). P(F) = 1/7. 2/8 = 1/28 Luego, la probabilidad de que los dos clientes compren casettes fallados es 1/28.
) 6
Esta situacin es del mimo tipo que las anteriores, pero, en qu hubiera cambiado esta probabilidad si: . El primer cliente compra un casette y antes de que el segundo entre a comprar, lo devuelve? En este caso, la segunda venta se realiza sobre un total de 8 como la primera y el diagrama correspondiente es el siguiente:
6 )
) 6 ) 6
57
Observamos que P(S/F) = P(S), P(F/S) = P(F) ......, la segunda venta no depende de la primera. Luego: P(S F) = P(S). P(F) P(S S) = P(S). P(S) P(F F) = P(F). P(F) P(F S) = P(F). P(S)
Definimos entonces sucesos independientes como: 'RV VXFHVRV $ \ % VRQ LQGHSHQGLHQWHV VL \ VyOR VL 3$ %
3$ 3%
(Q ORV VXFHVRV LQGHSHQGLHQWHV OD RFXUUHQFLD GH XQR GH HOORV QR LQFLGH HQ OD RFX UUHQFLD GHO RWUR 2EVHUYDFLyQ La definicin de independencia puede extenderse a ms de dos sucesos. Es muy importante tener en cuenta que el concepto de independencia entre sucesos es distinto al de exclusin. (MHUFLFLR En una caja hay 5 pilas comunes y 4 pilas de larga duracin. 1. Si se extraen dos al azar y simultneamente, cul es la probabilidad de que: a- ambas sean pilas comunes? b- slo una sea una pila comn? c- ninguna sea una pila comn? 2. Si se extraen dos pilas al azar, pero reponiendo la primera extrada, cul es la probabilidad de que: a- ambas sean comunes? b- slo una sea comn? c- ninguna sea comn? (MHUFLFLR Cul es la diferencia entre sucesos mutuamente excluyentes y sucesos independientes?
58
$3/,&$1'2 /2 $17(5,25
35,0(5 (-(03/2 Debe seleccionarse un alumno cualquiera de 5to ao para representar al colegio en un acto. En el colegio hay cuatro quintos, A con 30 alumnos, B con 25, C con 35 y D con 27 alumnos. A la vez, en A hay 10 varones, en B hay 11 varones, en C hay 20 y en D hay 12 varones. Cul es la probabilidad de que el alumno seleccionado sea varn? Como el alumno puede pertenecer a cualquiera de los cuatro quintos, la probabilidad de que sea varn P(V), es:
3 >9 \ SHUWHQHFH D $R 9 \ SHUWHQHFH D % R 9 \ SHUWHQHFH D & R 9 \ SHUWHQHFH D '@
Es decir:
39
/RV VXFHVRV VRQ H[FOX\HQWHV SXHVWR TXH XQ DOXPQR QR SXHGH HVWDU HQ $ \ % DO PLV PR WLHPSR, entonces: P(V) = P(V A) + P(V B) + P(V C) + P(V D) &RPR OD SUREDELOLGDG GH 9 YD D GHSHQGHU GHO FXUVR DO TXH SHUWHQHFH HO DOXPQR, aplicando a la probabilidad de la interseccin la definicin correspondiente, tendremos: P(V) = P(V/A) . P(A) + P(V/B) . P(B) + P(V/C) . P(C) + P(V/D) . P(D) Con los datos del problema construmos la siguiente tabla:
6H[R 9 0 7RWDO $ &XUVR % & '
Y de la observacin de la misma se deduce que: P(A) = 30/117 P(V/A) = 10/30 7RWDO P(B) = 25/117 P(V/B) = 11/25 P(C) = 35/117 P(V/C) = 20/35 P(D) = 27/117 P(V/D) = 12/27
Reemplazando en P(V) cada uno de los valores nos queda: P(V) = 10/30 . 30/117 + 11/25 . 25/117 + 20/35 . 35/117 + 12/27 . 27/117 P(V) = 10/117 + 11/117 + 20/117 + 12/117 39
59
Aplicando lo anterior.
Segundo ejemplo.
Notemos que en la tabla aparece directamente cada una de las intersecciones y el ejercicio se podra haber resuelto de la siguiente manera:
P(V) = P(V A) + P(V B) + P(V C) + P(V D) = 10/117 + 11/117 + 20/117 + 12/117 =
(MHUFLFLR Para este ejemplo calcular: a) La probabilidad de que el alumno seleccionado sea mujer. b) Si el alumno seleccionado result ser varn, cul es la probabilidad de que est en 5to A?. c) Si el alumno seleccionado result ser mujer, cul es la probabilidad de que est en 5to D?
6(*81'2 (-(03/2 Un vendedor de computadoras personales, compra chips de memoria de tres fabricantes distintos;(A, B y C) en la misma proporcin. La probabilidad de que los chips tengan alguna falla es de 0,1; 0,09 y 0,11 para cada uno de ellos respectivamente. Si al armar una PC selecciona al azar uno de los chips y resulta con falla (F), cul es la probabilidad de que el chip provenga de B? Llamaremos A al suceso el chip proviene del fabricante A, B al suceso el chip proviene del fabricante B y C al suceso el chip proviene del fabricante C En este caso se est pidiendo: P(B/F) y las probabilidades conocidas son: P(A) = 1/3 P(B) = 1/3 P(C) = 1/3 Pues los tres proveen en la misma proporcin. P(F/A) = 0,1 P(F/B) = 0,09 P(F/C) = 0,11
60
Aplicando lo anterior.
Segundo ejemplo.
3% ) 3% )
3% ) 3) % 3% = 3) 3)
3) % 3% 3) $3$ 3) %3% 3) &3& 0,09. 0,33 0,0297 P(B / F) = = 0,1. 0,33 + 0,09. 0,33 + 0,11. 0,33 0,033 + 0,0297 + 0,0363
0,0297 0,099
Luego 3% )
/D SUREDELOLGDG GH TXH HO FKLS SURYHQJD GHO IDEULFDQWH % VDELHQGR TXH HVWi IDOOD GR HV (MHUFLFLR Para este ejemplo. Si al armar una PC el chip seleccionado resulta sin fallas (S). 1. Cul es la probabilidad de que provenga de C? 2. Cul es la probabilidad de que provenga de A?
61
F S
S F S F S F S
S
Los resultados posibles (ventas) no son valores numricos, pero si elegimos la variable ; FDQWLGDG GH FDVHWWHV IDOODGRV TXH VH YHQGLHURQ a cada resultado le va a corresponder un nmero y de esta manera queda determinada la siguiente asignacin: ))6 )6) 6)) )66 6)6 66) 666
Los nmeros 0, 1 y 2 son los valores que puede tomar la variable X. A esta aplicacin, que a cada resultado posible de un experimento aleatorio le asigna un valor numrico la denominamos 9DULDEOH DOHDWRULD
62
Primer ejemplo.
8QD YDULDEOH DOHDWRULD HV XQD IXQFLyQ TXH D FDGD UHVXOWD GR GH XQ H[SHULPHQWR DOHDWRULR OH DVLJQD XQ Q~PHUR UHDO Al conjunto de todos los valores que asume una variable aleatoria lo llamamos UH FRUULGR &XDQGR HO UHFRUULGR GH XQD YDULDEOH DOHDWRULD ; HV XQ FRQMXQWR ILQLWR R LQILQLWR QXPHUDEOH VH OD GHQRPLQD YDULDEOH DOHDWRULD GLVFUHWD &XDQGR HO UHFRUULGR GH XQD YDULDEOH DOHDWRULD ; HV XQ FRQMXQWR LQILQLWR QR QXPHUDEOH VH OD GHQRPLQD YDULDEOH DOHDWRULD FRQWLQXD
La variable aleatoria cantidad de casettes fallados que se vendieron es discreta pues tiene como recorrido al conjunto 5 ^0,1,2` que es un conjunto finito.
[
A cada valor de una variable aleatoria discreta le podemos calcular la probabilidad y con ello nos queda determinada la IXQFLyQ GH SUREDELOLGDG Si calculamos la probabilidad de cada valor del recorrido de la variable X considerada en este ejemplo, tenemos: P(x = 0) = P(SSS) =
=
Estas probabilidades determinan la funcin de probabilidad de X que presentamos en la siguiente tabla: 7DEOD GH GLVWULEXFLyQ GH SUREDELOLGDG
9DORUHV GH ;
7RWDO
63
Primer ejemplo.
Observamos que cada valor de la segunda columna vara entre 0 y 1 por ser una probabilidad y la suma total de ellos es 1, pues coincide con la probabilidad del espacio muestral. /D IXQFLyQ GH SUREDELOLGDG GH XQD YDULDEOH DOHDWRULD GLVFUHWD FXPSOH FRQ ODV VL JXLHQWHV SURSLHGDGHV
FDGD YDORU GH OD IXQFLyQ FRPR HV XQD SUREDELOL GDG HV XQ Q~PHUR HQWUH \ OD VXPD GH WRGRV ORV YDORUHV GH OD IXQFLyQ HV
La grfica de la funcin de probabilidad de una variable aleatoria discreta es el diagrama de bastones o el de puntos.
'LDJUDPD GH SXQWRV
Para toda variable aleatoria se puede calcular un nmero que indica el valor que de ella se espera obtener, no necesariamente ese valor pertenece al recorrido de la variable. En el caso que estamos tratando nos puede interesar calcular cuntos casettes fallados se espera vender en el negocio si concurren 3 clientes. El valor que se espera de una variable aleatoria se denomina YDORU HVSHUDGR R HVSH UDQ]D VH denota (; y si la variable en cuestin es discreta, se define como:
(;=
[ 5[
[S[
64
Segundo ejemplo.
Puede verificarse que si X es una variable aleatoria discreta, el clculo de E(X) coincide con el de la media aritmtica. Volviendo al ejemplo, VL DO QHJRFLR FRQFXUUHQ FOLHQWHV SDUD FRPSUDU FDVHWWHV VH HVSHUD YHQGHU QLQJXQR R XQR GH ORV TXH HVWiQ IDOODGRV pues: E(X)= 0.5/4 + 1.15/28 + 2.3/28 = 0,75
6(*81'2 (-(03/2 Si compramos un cuaderno Arte 21x27 y medimos el ancho de una hoja cualquiera de dicho cuaderno con distintas reglas, es difcil que con todas obtengamos exactamente 21 cm; pero s obtendremos aproximadamente 21 cm. Cuanto ms precisa sea la regla ms nos acercaremos a la verdadera medida. Lo mismo va a ocurrir si queremos medir el ancho de todas las hojas del cuaderno. Es difcil que todas midan exactamente lo mismo. No podemos afirmar que el ancho de una hoja del cuaderno mide exactamente 21 cm pero podemos decir que mide alrededor de 21 cm. En otras palabras, podemos afirmar que el ancho de la hoja del cuaderno mide, por ejemplo, entre 20,5 cm y 21,5 cm. Si consideramos a la variable aleatoria ;: PHGLGD GHO DQFKR GH XQD KRMD GHO FXD GHUQR esta variable tendr un recorrido que puede ser cualquier nmero real comprendido, por ejemplo, entre 20,5 y 21,5. Se observa que la variable aleatoria X tiene como recorrido un conjunto infinito no numerable, entonces decimos que ; HV XQD YDULDEOH DOHDWRULD FRQWLQXD Cuando una variable aleatoria es continua no se pueden listar todos los valores que toma, pero s considerar intervalos de valores de su recorrido6; por tal motivo, en este caso slo es posible calcular probabilidades para intervalos. Las probabilidades puntuales son cero.
6
Esto coincide con lo observado en los ejemplos de estadstica referidos a variables continuas. 65
Segundo ejemplo.
La funcin de probabilidad de una variable aleatoria continua I[ permite calcular las probabilidades para cualquier intervalo del recorrido de dicha variable, esta funcin se denomina IXQFLyQ GH GHQVLGDG GH SUREDELOLGDG y su grfica puede tener distintas formas.
Los siguientes son posibles grficos para una funcin de densidad de probabilidad.
I[
I[
0 I[
0 I[
3D[E 0 [ 0 a b [
Estas funciones son algunos ejemplos de modelos a los cuales se puede aproximar el grfico del polgono de frecuencias relativas correspondiente a una variable continua, cuando la base de los rectngulos del histograma respectivo tiende a 0. Recordando que los polgonos de frecuencias relativas, de las distribuciones de frecuencias de variables continuas, encierran un rea igual a 1, tenemos que el rea total que la funcin de densidad de probabilidad encierra respecto al eje de las abscisas es 1.
66
Segundo ejemplo.
8QD IXQFLyQ I[ HV GH GHQVLGDG GH SUREDELOLGDG GH XQD YDULDEOH DOHDWRULD FRQ WLQXD VL FXPSOH FRQ ODV VLJXLHQWHV SURSLHGDGHV
HV PD\RU R LJXDO TXH SDUD WRGRV ORV YDORUHV UHDOHV GRQGH HVWi GHILQLGD OD IXQFLyQ HO iUHD HQFHUUDGD HQWUH OD IXQFLyQ \ HO HMH GH ODV DEVFLVDV HV
OD IXQFLyQ GH GHQVLGDG QR HV XQD SUREDELOLGDG SHUR D WUDYpV GH HOOD SRGH PRV FDOFXODU OD SUREDELOLGDG GH TXH OD YDULDEOH DOHDWRULD VH HQFXHQWUH HQWUH GRV YDORUHV D \ E (VWD SUREDELOLGDG HV LJXDO DO iUHD HQFHUUDGD SRU OD IXQFLyQ HO HMH GH ODV DEVFLVDV OD UHFWD [ D \ OD UHFWD [ E
(MHUFLFLR Por qu hemos afirmado anteriormente que si una variable aleatoria es continua, las probabilidades puntuales son cero? (Si x es una variable aleatoria continua entonces P(x = a) = 0) (MHUFLFLR Qu tipo de curva puede aproximar mejor el grfico de la funcin de densidad de probabilidad, correspondiente a cada una de las siguientes variables aleatorias? 1. X: medida del ancho de una hoja del cuaderno del ejemplo. 2. X: estatura de un nio de 5 aos. 3. X: tiempo que tarda en quemarse una lamparita encendida
67
02'(/26
El objetivo de un modelo es describir y explicar determinados fenmenos o situaciones del mundo real, bajo condiciones especficas. En este punto introduciremos dos de los modelos probabilsticos ms usados: SDUD YDULDEOHV DOHDWRULDV GLVFUHWDV HO 0RGHOR %LQRPLDO \ SDUD YDULDEOHV DOHDWRULDV FRQ WLQXDV HO 0RGHOR 1RUPDO 35,0(5 (-(03/2 En una esquina transitada hay un cartel de propaganda y la experiencia previa indica que de cada 20 personas que pasan por dicha esquina a cualquier hora del da, 8 leen el cartel. Es decir, la probabilidad de que una persona que pase por esa esquina lea el cartel es 8/20 (0,4). Supongamos que por esa esquina, en un momento determinado pasan 3 personas, que pueden leer (L) o no leer (N) el cartel. Los resultados posibles son: / 1 / 1
0,4 0,6 0,4 0,6
0,4
0,4 0,6
/ 1 / 1 / 1 / 1
0,6
0,4 0,6
La variable aleatoria discreta X: cantidad de personas que leen el cartel. Tiene un recorrido Rx = {0,1,2,3} En este ejemplo, a diferencia del anterior, las probabilidades no cambian, P(L) = 0,4 y P(N) = 0,6
68
Modelos.
Primer ejemplo.
WRWDO
() = () () = () () = () =
Si para esta distribucin de probabilidad queremos calcular el valor esperado: E(X)= 0.0,216+ 1.0,432+ 2.0,288+ 3.0,064 (; (VWH UHVXOWDGR LQGLFD TXH GH ODV SHUVRQDV TXH SDVDQ FDPLQDQGR SRU HVD HVTXLQD VH HVSHUD TXH OHD HO FDUWHO. 3DUWLFXODULGDGHV GHO HMHPSOR
D 1. Se repite 3 veces la situacin de que una persona pase por esa esquina (n = 3) y esas UHSHWLFLRQHV VRQ LQGHSHQGLHQWHV. 2. Cada persona que pasa por la esquina, puede leer o no leer el cartel. Existen nicamente dos resultados posibles: e[LWR R )UDFDVR. 3. La probabilidad de xito es la misma para cada persona, S La probabilidad de fracaso es la misma para cada persona, S
Cantidad de xitos
3;
N Q N N = () () N
Probabilidad de xito
Probabilidad de fracaso
F El valor esperado de la variable X es el producto entre el nmero de repeticiones (n = 3) y la probabilidad de xito (p = 0,4). (;
69
Modelos.
Primer ejemplo.
/D YDULDEOH DOHDWRULD ; GHO HMHPSOR WLHQH 'LVWULEXFLyQ %LQRPLDO VH OD VXHOH GHQR PLQDU YDULDEOH DOHDWRULD %LQRPLDO 02'(/2 %,120,$/ 8Q H[SHULPHQWR DOHDWRULR VH SXHGH HVWXGLDU EDMR XQ PRGHOR %LQRPLDO \ VH GHQRPLQD H[SHULPHQWR %LQRPLDO VL
&RQVLVWH HQ Q UHSHWLFLRQHV LQGHSHQGLHQWHV GH XQ PLVPR HQVD\R R H[SHULPHQWR (Q FDGD HQVD\R H[LVWHQ VyOR GRV UHVXOWDGRV SRVLEOHV p[LWR IUDFDVR /D SUREDELOLGDG S GH p[LWR HV FRQVWDQWH HQ FDGD HQVD\R
La variable aleatoria discreta X: cantidad de xitos en las n repeticiones de un experimento binomial cuyo recorrido es Rx ={0,1,2,3,4,....} Se denomina YDULDEOH DOHDWRULD ELQRPLDO de parmetros Q y S si:
3; N Q N Q N (S) ( S) N
QS
(MHUFLFLR Con respecto al ejemplo. Cul es la probabilidad de que 10 de las 15 personas que pasan por esa esquina, en un momento determinado, lean el cartel? (MHUFLFLR Decidir cules de los siguientes experimentos responden al modelo binomial: 1. Lanzar una moneda 4 veces. 2. Extraer simultneamente y al azar 6 chicles de menta de una bolsa que contiene 10 chicles de menta y 8 de fruta. 3. Una caja de 20 lamparitas tiene 4 quemadas. Extraer de a una y con reposicin 3 lamparitas de dicha caja.
70
Modelos.
Segundo ejemplo.
6(*81'2 (-(03/2 Una empresa embotelladora de gaseosas compra una mquina para llenar botellas de 1 litro. Puede pensarse que la mquina no llenar todas las botellas con un litro exacto de gaseosa sino que el promedio de llenado ser de un litro. Habr un desvo propio al proceso de llenado, y ste depender de la precisin de la mquina; cuanto ms precisa, menor ser el desvo.7 Podemos suponer que: - la probabilidad de que una botella tenga una capacidad inferior al promedio (1 litro) es la misma que la probabilidad de que tenga una capacidad superior al promedio. - la mayora de las botellas tendrn una capacidad de aproximadamente un litro. - es muy poco probable que la capacidad de una botella se aleje demasiado del litro. Que tenga, por ejemplo, una capacidad inferior a 0,9 litros o superior a 1,1 litros. La variable aleatoria X: capacidad de una botella de gaseosa, es una variable aleatoria continua. Una funcin de densidad de probabilidad posible para esta variable tendr un grfico semejante al siguiente:
I[ El rea de esta regin es P(a < X < b)
Si observamos varias botellas de igual capacidad, de una misma gaseosa, en el estante de una supermercado, podemos notar a simple vista que no todas tienen igual cantidad de lquido. 71
Modelos.
Segundo ejemplo.
&RQVLGHUDFLRQHV A la media aritmtica la denominamos P y al desvo V Si la media aritmtica cambia (considerar por ejemplo, como promedio de llenado un litro o un litro y medio) pero el desvo se mantiene, la grfica de la funcin se traslada sobre el eje de las abscisas. Grficamente obtenemos la siguiente situacin:
V V
V P P
Si por el contrario, para la misma media el desvo es el que cambia, a medida que el desvo crece la grfica de la funcin tiende a achatarse. En este caso obtenemos:
V
V
V V
72
Modelos.
Segundo ejemplo.
02'(/2 1250$/ El modelo normal es un modelo de distribucin de probabilidad de una variable aleatoria continua. El mismo se ha convertido en el modelo de probabilidad ms importante para el anlisis estadstico. La distribucin normal fue descubierta en 1733 por De Moivre como la forma lmite del modelo binomial, pero se le atribuy a Gauss debido a que fue el primero que hizo referencia a ella en 1809. 8QD YDULDEOH DOHDWRULD ; WLHQH GLVWULEXFLyQ QRUPDO VL
(V FRQWLQXD
([LVWHQ ORV SDUiPHWURV P OD PHGLD \ V HO GHVYtR 6LHQGR P FXDOTXLHU Q~PHUR UHDO \ V XQ Q~PHUR UHDO SRVLWLYR
I[ = H V S
[ P
V
La grfica de la funcin normal es: Esta funcin en forma de campana se conoce como Campana de Gaus y tiene, entre otras, las siguientes caractersticas: - es simtrica respecto de . - depende de y de .
P ;
73
Modelos.
Segundo ejemplo.
Cuando = 0 y = 1 el modelo se denomina 1RUPDO 6WDQGDUG y la variable se denota por = *UiILFR GH OD IXQFLyQ QRUPDO VWDQGDUG
I]
Indica el rea dentro de 1, 2 y 3 desvos. Entre z = -1 y z = 1 el rea es el 68,27% Entre z = -2 y z = 2 es el 95,45% Entre z = -3 y z = 3 es el 99,73%
Cualquier variable aleatoria X con distribucin normal de parmetros y , puede standarizarse, es decir, transformarse en una variable normal satandard, basta con considerar:
;P V
La importancia de poder standarizar una variable aleatoria normal radica en el hecho de que las probabilidades de una variable normal standard estn tabuladas.
74
Modelos.
Segundo ejemplo.
(-(03/2 '( $3/,&$&,1 Las estaturas de 300 estudiantes estn distribudas normalmente con media 1,70m y desvo 10 cm. Si se elige un estudiante al azar cul es la probabilidad de que mida menos de 1,60m? La probabilidad pedida es P(x 1,60), si estandarizamos la variable X tenemos: P(x 1,60) = P(z
1,60 1,70 ) = P(z -1) = 0,1587 0,10
En la tabla que se adjunta obtenemos el rea para z 1, pero como la funcin es simtrica, coincide con el rea para z -1
Luego, OD SUREDELOLGDG GH TXH XQ HVWXGLDQWH HOHJLGR DO D]DU PLGD PHQRV GH P HV Con este resultado, tambin podemos afirmar que: HO GH GLFKRV HVWXGLDQWHV PLGHQ PHQRV GH P DSUR[LPDGDPHQWH GH ORV HVWXGLDQWHV PLGHQ PHQRV GH P (MHUFLFLR Con respecto a los datos del ejemplo anterior calcular: 1. La probabilidad de que un estudiante elegido al azar mida entre 1,65m y 1,75m. 2. Cuntos estudiantes miden menos de 1,50m? 3. Qu porcentaje de estudiantes mide entre 1,62m y 1,72m?
; =
(MHUFLFLR En una prueba de nivel tomada a 500 estudiantes, se obtuvo un puntaje promedio de 57,50 puntos y un desvo de 12 puntos. Suponiendo que la distribucin de los puntajes es aproximadamente normal: 1. Qu porcentaje de estudiantes tuvieron un puntaje superior a 60 puntos? 2. Qu porcentaje de estudiantes tuvieron un puntaje entre 40 puntos y 60 puntos?
75
Cuantitativas Cantidad de hermanos. Edad en aos. Promedio de las calificaciones obtenidas. Sueldo mensual. Cantidad de hijos. Altura en metros.
Cuantitativas continuas Edad en aos. Promedio de las calificaciones obtenidas. Sueldo mensual. Altura en metros.
Observacin: al tomar la aproximacin a valores enteros en una variable continua se la est discretizando pero la variable sigue siendo continua. (MHUFLFLR 1. La tabla completa es: ; $ % & ' ( ) * 7RW I 10 30 50 25 20 24 41 200 IU 0,05 0,15 0,25 0,125 0,10 0,12 0,205 1 I 5 15 25 12,5 10 12 20,5 100 y el grfico: I
$ % & ' ( ) *
76
3. Solamente si las categoras A, B, C, D, E, F Y G responden a una variable que admite orden puede calcularse la mediana (en otro caso no). Sera Me = D, lo cual indica que el 50% de las observaciones son inferiores o iguales a D. (MHUFLFLR 1.
'HSRUWH 6H[R ) 0 7RW
2.
7 3 9 7RW
)0)0)0
(MHUFLFLR
9DULDEOH Sexo. Materia preferida. Conformidad con los contenidos... Desempeo escolar. Cantidad de hermanos. Edad en aos. Promedio de las calificaciones... Sueldo mensual. Cantidad de hijos. Altura en metros.
0HGLGDV Mo Mo, Me
Mo, Me y X
(MHUFLFLR 3.
I
1. 154 2. Cantidad de hijos en edad escolar por familia. 4. Predominan las familias que tienen 2 hijos en edad escolar. El promedio es 1,44. Es decir 1 hijo por flia. El 50% de las familias a lo sumo tienen 1 hijo en edad escolar
(MHUFLFLR
V(X)= 1,117
DS = 1,057
R= 4
77
(MHUFLFLR
Cuando el intervalo anterior al intervalo modal tiene la misma frecuencia que el intervalo posterior al intervalo modal. En ese caso d1 = d2 Reemplazando en la frmula queda: l + a (d1 / 2d1 ) = l + a (1 / 2) = l + a / 2. (MHUFLFLR
2. X = 31,33
3. El promedio de horas de trabajo semanales es de 31,33 horas; (para Mo (30,35) Mo = 30 + .5 Mo = 32,63 este grupo de docentes). 30 + 27 Predominan los que trabajan 32,63 68,5 52 Me (30,35) Me = 30 + .5 Me = 31,83 horas por semana. 45 El 50% de los docentes conV(X) = 77,10 sultados trabajan a lo sumo 31,83 horas por semana. DS = 77,10 DS = 8,78
30
X=
1200
DS = CV =
352%$%,/,'$'
(MHUFLFLR
El primero, el segundo y el quinto. (MHUFLFLR Como AAc = E y adems A y Ac son sucesos mutuamente excluyentes, tenemos que: P(AAc) = P(E) P(A) + P(Ac) = 1 P(Ac) = 1- P(A)
78
(MHUFLFLR
D B = {V1, V2, V3}, P(B)= 3/5 Como el suceso B es el complemento del suceso A del ejemplo, podramos haber calculado P(B) como 1-P(A), es decir, P(B) = 1- 2/5 = 3/5 E C = {V1, V2, V3, M1, M2}, C = E, entonces P(C) = 1 F D = { }, P(D) = 0 G F = {M1}, P(F) = 1/5 H G = {V1, V2}, P(G) = 2/5 D P(V) = 20/45 G P(0H) = 9/45 E P(M) = 25/45 H P(V3H) = 1/45 F P(1H) = 22/45
(MHUFLFLR
(MHUFLFLR
. P(V2H) = P(V) + P(2H) - P(V2H) = 20/45 + 11/45 - 5/45 = 26/45 P(V2H)= 0,578 . P(M0H) = P(M) + P(0H) - P(M0H) = 25/45 + 9/45 - 5/45 = 29/45 P(M0H) = 0,644 . P(M3H) = P(M) + P(3H) - P(M3H) = 25/45 + 3/45 - 2/45 = 26/45 P(M3H)= 0,578 . 15/36 . 20/36 . 16/36 + 15/36 - 10/36 = 21/36 . 0,05 + 0,25 = 0,30 . 18/36 + 3/36 = 21/36 . 20/36 + 21/36 - 15/36 = 26/36 . 0,15 + 0,05 + 0,25 = 0,45
(MHUFLFLR
(MHUFLFLR
(MHUFLFLR
D P(VV) = 3/5.2/4 = 6/20 = 3/10 E P(VM) + P(MV) + P(MM) = 3/5.2/4 + 2/5.3/4 + 2/5.1/4 = 7/10 F P(MM) + P(VM) + P(MV) = 7/10, o sino como 1- P(VV) = 1-3/10 = 7/10 . a- P(CC) = 5/9.4/8 = 20/72 = 5/18 b- P(CL) + P(LC) = 5/9.4/8 + 4/9.5/8 = 5/9 c- P(LL) = 4/9.3/8 = 1/6 . a- P(CC) = 5/9.5/9 = 25/81
79
(MHUFLFLR
En los sucesos mutuamente excluyentes la probabilidad de la interseccin es 0. En los sucesos independientes la probabilidad de la interseccin es el producto de las probabilidades. Salvo en algunos casos raros, cuando dos sucesos son excluyentes no pueden ser independientes. (MHUFLFLR
(MHUFLFLR
E P(5A/V) = 10/53
P(S / C). P(C) 0,901 P(S / A). P(A) 0,901
F P(5D/M) = 15/64
= =
= =
= 0.326 = 0,329
. P(A/S) = (MHUFLFLR
P(x = a) es el rea encerrada por la funcin, el eje de las abscisas y la recta x = a, y este rea es 0. (MHUFLFLR Para las variables del primero y segundo ejemplo:
(MHUFLFLR
E: una persona lea el cartel. X: cantidad de personas que leen el cartel. Datos: n = 15 P(E) = 0,4 = p 1-p = 0,6 k = 10
80
P(x=10)=
La probabilidad de que 10 de las 15 personas que pasan por esa esquina lean el cartel es 0,0245 (MHUFLFLR
) = P(0,5 z 0,5) 0,10 0,10 P(1,65 x 1,75) = 2.0,1915 = 0,383 P(x 1,50)= P(z -2)= 0,0228 De los 300 estudiantes el 2,28%, aproximadamente 7, miden menos de 1,50m. . P(1,62 x 1,72)= P(-0,8 z 0,2)= 0,2881+ 0,0793= 0,3674 El 36,74% de esos estudiantes mide entre 1,62m y 1,72m.
. P(1,65 x 1,75) = P(
1,65 1,70
1,75 1,70
(MHUFLFLR
. P(x > 60) = P(z > 0,21) = 0,4168 El 41,68% de los estudiantes tuvieron un puntaje superior a 60 puntos. . P(40 x 60) = P(-1,46 z 0,21) = 0,4279 + 0,0832 = 0,5111 El 51,11% de los estudiantes tuvo un puntaje entre 40 y 60.
81
%,%/,2*5$)$
- Chou Ya Lun. Anlisis Estadstico. Ed. Interamericana. Mxico. 1988
- Elizondo S., ngel M. E. Estadstica descriptiva. (Aplicacin a un caso concreto). Ed. Rocamora. Argentina. 1996 - Galibert M. S., Elizondo S., Angel M. E. Apuntes de Probabilidad y Estadstica. Ed. Rocamora. Argentina. 1996 - Levin Richard I. Anlisis Estadstico. Ed. Prentice Hall. Mxico. 1993 - Meyer. Probabilidad y aplicaciones estadsticas. Ed. Addison-Wesley-Iberoamericana. Mxico. 1986
82