Vous êtes sur la page 1sur 42

NDICE GENERAL

INTRODUCCIN ................................................................................................. 3 1. PROBABILIDAD Y FRECUENCIA RELATIVA ................................................ 5 1.1. DEFINICIN ................................................................................................. 5 1.2. ESPACIO MUESTRAL FINITO ......................................................................... 6 1.3. PROBABILIDAD CONDICIONAL ....................................................................... 7 1.4. ESPACIO MUESTRAL PARTICIONADO ............................................................. 8 1.5. PROBABILIDAD DE CAUSAS. BAYES ............................................................... 9 1.6. FRECUENCIA RELATIVA .............................................................................. 10 2. DISTRIBUCIONES ESPECIALES ................................................................. 11 2.1. DISTRIBUCIN CONTINUA UNIFORME ........................................................... 11 2.2. DISTRIBUCIN GAMMA ............................................................................... 11 2.3. DISTRIBUCIN EXPONENCIAL ...................................................................... 12 2.4. DISTRIBUCIN JI-CUADRADA ...................................................................... 12 2.5. DISTRIBUCIN ERLANG .............................................................................. 12 2.6. DISTRIBUCIN BETA .................................................................................. 13 2.7. DISTRIBUCIN DE W EIBULL ........................................................................ 13 2.7.1. RAZN DE FALLA .................................................................................... 14 2.8. DISTRIBUCIN LOGNORMAL ....................................................................... 14 2.9. DISTRIBUCIN NORMAL ............................................................................. 14 2.10. DISTRIBUCIN NORMAL ESTNDAR .......................................................... 15 2.11. DISTRIBUCIN DISCRETE UNIFORME ......................................................... 15 2.12. DISTRIBUCIN DE BERNOULLI . BER(P) ..................................................... 15 2.13. DISTRIBUCIN BINOMIAL B(N, P) ............................................................... 16 2.13.1. Caractersticas de un experiment Binomial ..................................... 16 2.13.2. Parmetros ..................................................................................... 17 2.14. DISTRIBUCIN BINOMIAL NEGATIVA BN(K, P) ............................................ 17 2.15. DISTRIBUCIN DE PROBABILIDAD GEOMTRICA GE(P) ................................ 18 2.16. DISTRIBUCIN HIPERGEOMTRICA H(N, K, N) ........................................... 19

2.17. APROXIMACIN DE LA DISTRIBUCIN HIPERGEOMTRICA CON LA DISTRIBUCIN BINOMIAL ....................................................................................... 20 2.18. DISTRIBUCIN DE POISSON P() .............................................................. 20 2.19. APROXIMACIN DE LA DISTRIBUCIN BINOMIAL MEDIANTE LA DISTRIBUCIN
DE POISSON ......................................................................................................... 21

2.20. DISTRIBUCIN MULTINOMIAL .................................................................... 22 3. INTRODUCCIN A LAS PROBABILIDADES ............................................... 23 3.1. CONCEPTO DE PROBABILIDAD .................................................................... 23 3.2. LEYES DE LA PROBABILIDAD ....................................................................... 24 4. MUESTREO ................................................................................................... 27 5. TIPOS DE MUESTREO ................................................................................. 27 5.1. NO PROBABILSTICAS O FINALISTAS. ........................................................... 28 5.1.1. Casual. ............................................................................................. 28 5.1.2. Intencional. ....................................................................................... 28 5.1.3. Por cuotas. ....................................................................................... 28 5.2. PROBABILSTICAS. ..................................................................................... 28 5.2.1. Simple al azar. .................................................................................. 29 5.2.2. Sistemtica. ...................................................................................... 29 5.2.3. Estratificada. ..................................................................................... 29 5.3. POR CONGLOMERADOS.............................................................................. 30 6. DISTRIBUCIN MUESTRAL ......................................................................... 30 7. VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD ..... 35 7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD .......................................... 36 7.2. DISTRIBUCIN CONTINUA DE PROBABILIDAD ................................................ 39 BIBLIOGRAFA ................................................................................................. 42

INTRODUCCIN

La Estadstica es la ciencia cuyo objetivo es reunir una informacin cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al anlisis de estos datos unos significados precisos o unas previsiones para el futuro. La estadstica, en general, es la ciencia que trata de la recopilacin, organizacin presentacin, anlisis e interpretacin de datos numricos con e fin de realizar una toma de decisin ms efectiva. Otros autores tienen definiciones de la Estadstica semejantes a las anteriores, y algunos otros no tan semejantes. Para Chacn esta se define como la ciencia que tiene por objeto el estudio cuantitativo de los colectivos; otros la definen como la expresin cuantitativa del conocimiento dispuesta en forma adecuada para el escrutinio y anlisis. La ms aceptada, sin embargo, es la de Minguez, que define la Estadstica como La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su intensidad, deducir las leyes que los rigen y hacer su prediccin prxima. Los estudiantes confunden comnmente los dems trminos asociados con las Estadsticas, una confusin que es conveniente aclarar debido a que esta palabra tiene tres significados: la palabra estadstica, en primer trmino se usa para referirse a la informacin estadstica; tambin se utiliza para referirse al conjunto de tcnicas y mtodos que se utilizan para analizar la informacin estadstica; y el trmino estadstico, en singular y en masculino, se refiere a una medida derivada de una muestra. Los mtodos estadsticos tradicionalmente se utilizan para propsitos descriptivos, para organizar y resumir datos numricos. La estadstica descriptiva, por ejemplo trata de la tabulacin de datos, su presentacin en forma grfica o ilustrativa y el clculo de medidas descriptivas.

Ahora bien, las tcnicas estadsticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de consumidores; anlisis de resultados en deportes;

administradores de instituciones; en la educacin; organismos polticos; mdicos; y por otras personas que intervienen en la toma de decisiones.

1. Probabilidad y frecuencia relativa Si se quiere estudiar una caracterstica X de una poblacin, X recibe el nombre de variable aleatoria y todos los posibles valores que ella puede tomar se llama espacio muestral M. Un subconjunto de M recibe el nombre de suceso. Ejemplo: Se lanza un dado X = nmero que resulta del dado. M = {1, 2, 3, 4, 5, 6} Un suceso S podra ser ser par o sea S = {2, 4, 6} Nos interesa definir la probabilidad que un suceso dado S suceda, o sea definir a cada suceso un nmero que est dado en porcentaje, es decir, entre 0 y 1, lo haremos de la siguiente manera:

1.1. Definicin La probabilidad p, ser una funcin p: {sucesos} R tales que: 1) 0 p (s) 1

2) p (m) = 1 3) Si A B = , entonces p (A B) = p(A) + p (B) Consecuencias: a) p () = 0 b) p (Ac) = 1 p(A) Donde Ac es el complemento de A c) P (AB) = p (A) + p (B) p (AB) Esta definicin tendr distintas formas en su aplicacin dependiendo de cmo es el espacio muestral M que tiene la variable aleatoria.

1.2. Espacio Muestral Finito

Supongamos de M = {x1, x2 ..., xn} donde los xi son los valores que puede tomar x, entonces se tiene que: p (x1) + p(x2) + ... + p(xn) = p(M) = 1 Si todos ellos tienen igual probabilidad p, entonces p + p + p -+ p = np = 1, lo que da Ejemplo: Cul es la probabilidad de obtener un as con un dado? .

Si se toma un suceso S = {x1 , x2 , ... xk}, entonces p (s) = p (x1) + p(x2) + ... * p(xk) = p + p ... + lo que nos lleva a la siguiente definicin

Ejemplo 2: Sacar suma 7 con dos dados: Cada dado puede caer de 6 maneras, por lo tanto los dos dados pueden caer de 36 maneras, mientras que 7 se puede obtener como: 16, 25, 34, 43, 52, 61, o sea

Ejemplo 3: Probabilidad de al sacar 2 cartas sean dos ases.

Nota: Sea A: se extrae un As 6

Ejemplo 4 Si se dispone de mquinas nuevas (N) y usadas (U), elctricas (E) y manuales (M) en una oficina dadas por la tabla:

Mquinas N E 20 M 4 24 Cul es la probabilidad que sea? a) Elctrica: b) Nueva: c) Nueva y elctrica:

U Total 10 30 15 19 25 49

1.3. Probabilidad Condicional Definiremos la probabilidad condicional como la probabilidad de que ocurra un suceso A si se sabe que ha ocurrido un suceso B.

Definicin:

Ejemplo En el caso de las mquinas del ejemplo 4. Calcule Cul es la probabilidad que sea nueva una mquina si se sabe que es elctrica?

Diremos que dos sucesos son independientes En este caso:

1.4. Espacio Muestral Particionado Entenderemos que el espacio muestral est particionado si:

Con Se quiere expresar la probabilidad de un suceso cualquiera A en ese espacio muestral.

Usando la frmula anterior:

Ejemplo Una fbrica tiene tres plantas de produccin, una en Maracaibo que produce el 30% de la produccin y muestra un 5% de productos defectuosos. Caracas que produce el 50% con 3% de defectuosos y Valencia con el resto y un 2% de defectuosos. Si se toma un artculo producido al azar Cul es la probabilidad que sea defectuoso?

1.5. Probabilidad de Causas. Bayes La pregunta es ahora al revs, si se sabe que algo pas Cul es la probabilidad de alguna causa? O sea: Ejemplo En el ejemplo inmediato anterior, si un artculo fue defectuoso Cul es la probabilidad de que haya sido producido en Maracaibo?

1.6. Frecuencia relativa La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. La frecuencia relativa se puede expresar en tantos por ciento y se representa por ni.

Ejemplo Durante el mes de julio, en la ciudad de Cabimas se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. Determinar la frecuencia relativa.

xi 27 28 29 30 31 32 33 34

fi 1 2 6 7 8 3 3 1 31

ni 0,032 0,065 0,194 0,226 0,258 0,097 0,097 0,092 1

10

2. Distribuciones especiales

2.1. Distribucin continua uniforme Este modelo corresponde a una variable aleatoria continua cuyos valores tienen igual valor de probabilidad en un intervalo especificado para la variable. X: Variable aleatoria continua con distribucin Uniforme. los valores que puede tomar, con igual probabilidad. La Densidad de Probabilidad de X es:

2.2. Distribucin Gamma Es un modelo bsico en la teora estadstica y corresponde a la siguiente definicin: X: Variable aleatoria continua con distribucin Gamma. La Densidad de Probabilidad de X es:

11

2.3. Distribucin exponencial Es un caso particular de la distribucin Gamma cuando =1y tiene aplicaciones de inters prctico. X: Variable aleatoria continua con distribucin Exponencial. La Densidad de Probabilidad de X es:

2.4. Distribucin Ji-Cuadrada Es un caso particular de de la distribucin Gamma cuando tiene aplicaciones de inters prctico. X: Variable aleatoria continua con distribucin Ji Cuadrada. La Densidad de Probabilidad de X es:

Esta distribucin tiene un parmetro: grados de libertad.

y se denomina nmero de

2.5. Distribucin Erlang Es un caso particular de la distribucin Gamma cuando es un entero positivo. , donde n

12

X: Variable aleatoria continua con distribucin Erlang. La Densidad de Probabilidad de X es:

2.6. Distribucin Beta X: Variable aleatoria continua con distribucin Beta. La Funcin Beta es:

La Densidad de Probabilidad de X es:

Donde: funcin Gamma.

son los parmetros de este modelo.

es la

2.7. Distribucin de Weibull Este modelo se usa en problemas relacionados con falla de materiales y estudios de confiabilidad. X: Variable aleatoria continua con distribucin Weibull. La Densidad de Probabilidad de X es:

13

2.7.1. Razn de falla Si la variable aleatoria es el tiempo t en que falla un equipo, el ndice o razn de falla en el instante t es la funcin de densidad de falla al tiempo t. dado que la falla no ocurre antes de t. Sean, t: Variable aleatoria continua (tiempo), f(t): Funcin de densidad de probabilidad, F(t): Funcin de distribucin (funcin de probabilidad acumulada), entonces:

2.8. Distribucin LogNormal La Distribucin Lognormal que se la define como: , donde

. Esta variable es de alta aplicacin en Economa como en Medicina. X: Variable aleatoria continua con distribucin Weibull. La Densidad de Probabilidad de X es:

2.9. Distribucin Normal X: Variable aleatoria continua con distribucin Normal. La Densidad de Probabilidad de X es:

14

2.10. Distribucin Normal Estndar X: Variable aleatoria continua con distribucin Normal Estndar La Densidad de Probabilidad de X es:

2.11. Distribucin discrete uniforme Una variable aleatoria tiene distribucin discreta uniforme si su espacio muestral tiene n resultados y cada uno con igual probabilidad. X: Variable aleatoria discreta los valores que puede tomar, con igual probabilidad. La Distribucin de Probabilidad de X es:

2.12. Distribucin de Bernoulli . Ber(p) Es aquel donde existen solamente dos resultados: xito o fracaso.X: Variable aleatoria cuyos valores pueden ser 1: xito, 0: fracaso. p: Valor de probabilidad de xito. 1-p=q: Valor de probabilidad de fracaso.

15

La Distribucin de Probabilidad de X es:

x P(X = x) 1 p 0 1-p

2.13. Distribucin Binomial B(n, p) Tiene las mismas caractersticas de un experimento Bernoulli, cuando ste se repite n veces de tal forma que las repeticiones sean independientes entre si y es de inters la variable aleatoria relacionada con la cantidad de xitos que se obtienen del experimento, entonces tenemos una distribucin binomial.

2.13.1. Caractersticas de un experiment Binomial 1. La cantidad de ensayos que se realizan es finita. Sea esta cantidad n. 2. Cada ensayo o prueba tiene nicamente 2 resultados posibles: xito o fracaso. 3. Todos los ensayos realizados son independientes. 4. La probabilidad de xito en cada ensayo permanece constante. Sea este valor p.

X: Variable aleatoria discreta con distribucin binomial. (Nmero de xitos obtenidos en una serie de n ensayos realizados).

16

p: Valor de probabilidad de xito.

La Distribucin de Probabilidad de X es:

2.13.2. Parmetros Son valores que pertenecen a un problema particular. Por ejemplo, para la distribucin binomial sus parmetros son n y p. Para distinguir entre variables y parmetros, se puede usar la siguiente notacin:

2.14. Distribucin Binomial Negativa BN(k, p) Los experimentos estadsticos con este modelo de probabilidad tienen caractersticas similares a los experimentos binomiales. La diferencia es que en este nuevo modelo la variable de inters se refiere a la cantidad de ensayos que se realizan hasta obtener una cantidad requerida de xitos: k

X: Variable aleatoria con distribucin binomial negativa. (Cantidad de ensayos realizados hasta obtener k xitos) p: Valor de probabilidad de xito.

17

x= k, k+1, k+2, ( valores que puede tomar la variable X)

La Distribucin de Probabilidad de X es:

2.15. Distribucin de probabilidad Geomtrica Ge(p) Es un caso especial de la distribucin Binomial Negativa, cuando k=1. Es decir, interesa conocer la probabilidad respecto a la cantidad de ensayos que se realizan hasta obtener el primer xito.

X: Variable aleatoria discreta con distribucin geomtrica. (Cantidad de ensayos realizados hasta obtener el primer xito.). p: Valor de probabilidad de xito. x= 1, 2, 3, (Valores que puede tomar la variable X)

La Distribucin de Probabilidad de X es:

18

2.16. Distribucin Hipergeomtrica H(N, K, n) Esta distribucin se refiere a los experimentos estadsticos que consisten en tomar una muestra sin reemplazo, de un conjunto finito el cual contiene algunos elementos considerados xitos y los restantes son considerados fracasos. Tomar una muestra sin reemplazo significa que los elementos son tomados uno a uno, sin devolverlos. Podemos concluir entonces que los ensayos ya no pueden ser considerados independientes porque la probabilidad de xito al tomar cada elemento es afectada por el resultado de los ensayos anteriores debido a que la cantidad de elementos de la poblacin est cambiando.

X: Variable aleatoria discreta con distribucin hipergeomtrica (Cantidad de resultados considerados xitos que se obtienen en la muestra) N: Cantidad de elementos del conjunto del que se toma la muestra K: Cantidad de elementos existentes que se consideran xitos n: Tamao de la muestra x = 0,1,2,3,,n (valores que puede tomar X)

La Distribucin de probabilidad de X es:

19

2.17. Aproximacin de la Distribucin Hipergeomtrica con la Distribucin Binomial Si el tamao de la muestra n es muy pequeo con respecto a N, entonces podemos considerar que los ensayos son aproximadamente independientes. Ejemplo: Si N=1000 y n=10 y hay 200 elementos considerados xitos, entonces la probabilidad de xito del primer ensayo ser 200/10000 = 0.2, la probabilidad de xito del segundo ensayo ser 199/999 = 0.1992 o 200/999 = 0.2002 dependiendo si el primer resultado fue o no un xito. Ambos valores son muy parecidos. En esta situacin se puede considerar que el modelo hipergeomtrico es aproximadamente Binomial y se puede usar la frmula de la distribucin con .

Por algunos estudios con respecto a este tema, se establece que esta aproximacin es aceptable si n < 5% de N.

Sea H: Distribucin Hipergeomtrica B: distribucin binomial Si n < 5%N, entonces H(x; N, K, n) = B(x; n, K/N)

2.18. Distribucin de Poisson P() La distribucin de Poisson es un modelo que puede usarse para calcular la probabilidad correspondiente al nmero xitos que ocurren en una regin o en intervalo de tiempo especificados, si se conoce el nmero promedio de xitos que ocurren. Este modelo requiere que se cumplan las siguientes suposiciones: a) El nmero de xitos que ocurren en la regin o intervalo es independiente de lo que ocurre en otra regin o intervalo. 20

b) La probabilidad de que un resultado ocurra en una regin o intervalo muy pequeo, es igual para todos los intervalos o regiones de igual tamao y es proporcional al tamao de la regin o intervalo. c) La probabilidad de que ms de un resultado ocurra en una regin o intervalo muy pequeo no es significativa.

X: Variable aleatoria discreta con distribucin de Poisson (Cantidad de xitos en una regin o intervalo especificados) x= 0, 1, 2, (Valores posibles para la variable X) : Cantidad promedio de xitos en la regin o intervalo especificados.

La Distribucin de probabilidad de X es:

2.19. Aproximacin de la Distribucin Binomial mediante la Distribucin de Poisson En la distribucin binomial cuando n es grande, no es prctico usar su frmula. Ejemplo: Suponga que m=200, p=0.05 y se quiere calcular la probabilidad que la variable aleatoria X tome el valor 5:

21

El clculo aritmtico puede presentar alguna dificultad. En esta situacin se puede calcular la probabilidad mediante un modelo aproximado que se obtiene del lmite al que tiende la distribucin binomial:

Este modelo corresponde a la distribucin de Poisson con =np. Algunos estudios con respecto a este tema indican que esta aproximacin es aceptable para la distribucin binomial n 20 y p 0.05. Otro criterio establece que la aproximacin es muy buena si n 100 y np 10.

2.20. Distribucin Multinomial En esta distribucin cada ensayo puede tener ms de dos resultados posibles. Consideramos el caso en el que hay n ensayos independientes, cada uno de los cuales permite k resultados mutuamente excluyentes, cuyas respectivas probabilidades son

X: Variable aleatoria discreta con distribucin multinomial. n: Cantidad de ensayos x = 1, 2, 3, ( valores que puede tomar la variable X) La Distribucin de Probabilidad de X es:

22

3. Introduccin a las Probabilidades 3.1. Concepto de probabilidad Definicin a "priori". La probabilidad de un suceso es el nmero de casos favorables sobre el nmero de casos totales. Ejemplo: La probabilidad de caer cara en una moneda es 1/2 pues es uno de los dos posibles resultados. Definicin a "posteriori". La probabilidad de un suceso es el lmite (si existe) de la frecuencia relativa cuando el tamao de muestra tiende a infinito. Ejemplo: La probabilidad de germinar de semillas de una determinada poblacin es 80%. Esto se sabe porque en una serie de pruebas se obtuvo ese porcentaje de germinacin. La idea bsica es que el investigador llega a la conclusin de que haciendo pruebas con cantidades cada vez ms grandes el porcentaje de germinacin que se obtendr ser de 80%. Enfoque axiomtico. Algunos autores objetan que ambas definiciones son criticables. La definicin clsica define probabilidad en trmino de casos equiprobables, es decir de igual probabilidad. O sea que para decir lo que es probabilidad necesitamos ya saber de antemano lo que significa

probabilidad. La segunda es en realidad una forma de decir (como veremos mas adelante) que la probabilidad es un parmetro y su estimador (la frecuencia relativa) tiende a l. Una alternativa ms rigurosa es encarar el concepto de probabilidad con un enfoque axiomtico: es un nmero entre 0 y 1 que cumple con determinadas propiedades, llamadas leyes de la probabilidad. Ejemplo: Cul es la probabilidad de nacimiento de un varn al nacer un nio? Si razonamos que hay dos sexos posibles se puede decir que la probabilidad es 1/2. No obstante hay ciertos estudios que indican que es ms probable que nazca un varn que una nia, algunos autores dicen que la probabilidad de nacer varn es de 0,51, otros incluso ms alta. Esos estudios se basan en anlisis de frecuencias y encontraron que era ms frecuente el

23

nacimiento de varones. En este caso el razonamiento inicial fall debido a que los dos sexos no son "equiprobables".

3.2. Leyes de la Probabilidad Dos sucesos son excluyentes si la ocurrencia de uno impide la ocurrencia del otro, es decir la probabilidad de que ambos ocurran al mismo tiempo (probabilidad de la interseccin) es cero. Ley de suma de probabilidades. La probabilidad de uno u otro de dos sucesos (probabilidad de la unin de ambos) es la suma de las probabilidades individuales menos la probabilidad de la interseccin:

Dos sucesos son independientes si la ocurrencia de uno no afecta para nada la ocurrencia del otro. Es decir que la probabilidad de A dado B (probabilidad condicional de A dado B), P[A|B], es igual a la probabilidad sin condicin de B : P[A|B] = P[B].

Ley del producto de probabilidades. La ley del producto de probabilidades dice que la probabilidad de A y B simultneamente es el producto de la probabilidad de uno de ellos por la probabilidad condicional del otro: P (A B) = P(A) * P (B|A) = P (B) * P(A|B) Ejemplo: Se sortear un estudiante como delegado de la Regional Norte a Montevideo. En la clase son 4 hombres de los cuales 3 trabajan, y 16

24

mujeres de las cuales 7 trabajan. Cul es la probabilidad de que por azar le toque ir a un hombre? 4 en 16. Cul es la probabilidad de que le toque ir a alguien que trabaja? 0,50 ya que son 10 los que trabajan en un total de 20. Cul es la probabilidad de que sea un hombre que trabaja? Es 3 en 20 lo que no es igual que el producto de las probabilidades marginales: (1/2)(1/4). Por lo tanto los sucesos no son independientes. Esto tambin se puede observar si notamos que los hombres que trabajan son 3/4 (es decir 75%) mientras que las mujeres que trabajan son 7/16 (lo que es alrededor de 0,4375. Es decir que es ms probable encontrar una persona que trabaja entre los hombres que en las mujeres, o sea que la caracterstica (el suceso) "trabajar" no es independiente del sexo.

Probabilidad total. Si un suceso ocurre necesariamente asociado con otro, la probabilidad de ocurrencia es la suma de las probabilidades que ocurra con subconjuntos de su condicin. Por ejemplo si un artculo es producido por tres mquinas: M1, M2 y M3. La M1 produce el 20 de los artculos, la M2 el 30% y la M3 el restante 50%. La probabilidad de que la M1 produzca un artculo defectuoso es de 2%, la de M2 es de 1% y la de M3 es de 3%. La probabilidad de obtener un artculo defectuoso en todo el taller es la suma de las probabilidades de obtener artculos defectuosos en cada una de las mquinas:

En el ejemplo: P = (0,20)(0,02) + (0,30)(0,01) + (0,50)(0,03) = 0,004 + 0,003 + 0,015 = 0,022

25

Teorema de Bayes. La probabilidad de que un artculo defectuoso sea de una mquina en particular (la mquina 1 por ejemplo) en el caso anterior es una situacin donde se aplica el teorema de Bayes:

En el ejemplo, P[ M1| D] = 0,004/0,022 = 0,1818

Aplicaciones de las ideas de probabilidad. Las ideas presentadas aqu son de gran aplicacin en el rea de la salud. Un ejemplo es para diagnstico:

Situacin ideal: Negativo Positivo Total Situacin real: Negativo Positivo Total Sanos 720 180 900 Enfermos 10 90 100 Total 730 270 1000 Sanos 100 0 100 Enfermos 0 100 100 Total 100 100 200

Deseamos que el mtodo de diagnstico nos diga positivo siempre que el paciente est enfermo y negativo siempre que est sano (que ningn paciente sano aparezca como enfermo) Sensibilidad del diagnstico P [+|E] = 1 Probabilidad de diagnstico positivo en un paciente enfermo sea igual a 1. Especificidad P [-| S] = 1 Probabilidad de diagnstico negativo en un paciente sano sea igual a 1. 26

En el presente ejemplo la sensibilidad es S = 90 / 100 = 0,9 y la especificidad es E = 720 / 900 = 0,8.

4. Muestreo Muchas veces el universo de estudio en una investigacin consiste en una poblacin demasiado numerosa o no se cuenta con suficientes recursos para estudiarla en su totalidad. En esos casos es muy frecuente que se recurra al muestreo. Universo o poblacin es el conjunto de individuos objeto de estudio, por lo tanto estar en funcin del objetivo de la investigacin. Muestra es un subconjunto de la poblacin que se pretende que represente a esta. En el proceso de sacar conclusiones para una poblacin a partir de una muestra se cometen errores, estos pueden ser de dos tipos: sistemticos y aleatorios. Los primeros, tambin llamados sesgos, se deben minimizar y los segundos se cuantifican. Seran errores evitables e inevitables, con los segundos hay que aprender a convivir. Uno de los objetivos del muestreo estadstico es conocer el grado de incertidumbre que tiene lo que estamos diciendo. Por ejemplo no conocemos el precio que tendr un producto el ao que viene, pero puede ser de utilidad decir: "estar entre 80 y 100 con un 95% de probabilidad". Generalmente no se dir entre 80 y 100 sino 90 10. El valor 10 es lo que se conoce como margen de error. Se intenta que el margen de error sea pequeo. La precisin de la inferencia ser mayor cuanto mas pequeo sea el margen de error. Conviene distinguir entre poblacin muestreada y poblacin objetivo. La inferencia estadstica proporciona herramientas para sacar conclusiones de la muestra hacia la poblacin muestreada, la extrapolacin a la poblacin objetivo (si ambas no coinciden) es exclusiva responsabilidad del investigador.

5. Tipos de muestreo Los distintos tipos de muestras pueden ser descritos como:

27

5.1. No probabilsticas o Finalistas. En las muestras no probabilsticas los elementos de la poblacin tienen una probabilidad desconocida de integrar la muestra. No tienen valor desde el punto de vista estadstico.

5.1.1. Casual. Por ejemplo cuando una periodista entrevista a una de cada 10 personas que pasan por una calle. Aunque no las elija no pasan por una calle todos los integrantes de una poblacin por lo que hay un sesgo desconocido.

5.1.2. Intencional. Son aquellas en las que el investigador interroga solamente a ciertos informantes claves elegidos por el. Parece que tiene utilidad en investigaciones de tipo exploratorio.

5.1.3. Por cuotas. Utilizadas en investigaciones de mercado. A una serie de investigadores le es fijada una cuota de individuos a entrevistar y ellos seleccionan por su cuenta a los entrevistados. Generalmente se les proporciona alguna caracterstica que los entrevistados deben reunir (mayores de edad, casados, etc.)

5.2. Probabilsticas. En las muestras probabilsticas, cada elemento de la poblacin tiene una probabilidad conocida de integrar la muestra. Los distintos tipos de muestras probabilsticas son: simple al azar, sistemtica, estratificada y por conglomerados.

28

5.2.1. Simple al azar. Es la muestra en la que se eligen los integrantes al azar entre el total de la poblacin. Requiere de un listado de los elementos de la poblacin, su numeracin y elegir al azar (por ejemplo usando una tabla de nmeros aleatorios los que integraran la muestra). Sus ventajas son: es una metodologa muy simple desde el punto de vista estadstico, tanto para llevar a cabo como para interpretar y utilizar; es insesgada, especialmente esta libre de los sesgos que introduciran las ponderaciones incorrectas que se puedan utilizar, no supone un conocimiento previo de la poblacin de la cual se va a extraer la muestra; y, como consecuencia de esto, tiende a reflejar todas las caractersticas del universo. No obstante la simplicidad conceptual, puede ser muy difcil de llevar a la prctica a veces y entonces aparecen las otras.

5.2.2. Sistemtica. Es el que se sigue cuando se elige segn un orden determinado, por ejemplo cada 10, se elige el primero el 11, el 21, etc. Se menciona la ventaja en la seleccin de la muestra y la desventaja es que si hay un gradiente ("trend") en el orden esta sesgando los resultados.

5.2.3. Estratificada. Es cuando la poblacin se divide en estratos y se hace un muestreo aleatorio simple dentro de cada estrato. Ventajas: el estrato necesita una muestra ms pequea que el muestreo aleatorio simple. Desventaja: hay que saber hacer bien los estratos. Hay dos variantes ac: proporcional o no. En el primer caso el tamao de la muestra de cada estrato es proporcional al tamao del estrato ("la fraccin de muestreo es igual para cada estrato"), en el segundo no.

29

5.3. Por conglomerados. Utilizado en aquellos casos donde el universo a estudiar esta disperso a lo largo de reas geogrficas extensas o situaciones similares. Luego se elige un conglomerado, es decir uno de los grupos formados. Por ejemplo se elige una manzana de casas y en ella se entrevista a todas las personas que habitan en las casas de la manzana. Enfatizamos la importancia que tiene desde el punto de vista estadstico el uso de muestras probabilsticas. Estas son las nicas en las que se puede aplicar la inferencia estadstica que se ver ms adelante.

6. Distribucin muestral Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propia, impredecibles. No se esperara que dos muestras aleatorias del mismo tamao y tomadas de la misma poblacin tenga la misma media muestral o que sean completamente parecidas; puede esperarse que cualquier estadstico, como la media muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribucin de todos los valores posibles de un estadstico. Tales distribuciones sern muy importantes en el estudio de la estadstica inferencial, porque las inferencias sobre las poblaciones se harn usando estadsticas muestrales. Como el anlisis de las distribuciones asociadas con los estadsticos muestrales, podremos juzgar la confiabilidad de un estadstico muestral como un instrumento para hacer inferencias sobre un parmetro poblacional desconocido. Como los valores de un estadstico, tal como x, varan de una muestra aleatoria a otra, se le puede considerar como una variable aleatoria con su correspondiente distribucin de frecuencias. La distribucin de frecuencia de un estadstico muestral se denomina distribucin muestral. En general, la distribucin muestral de un estadstico

30

es la de todos sus valores posibles calculados a partir de muestras del mismo tamao. Suponga que se han seleccionado muestras aleatorias de tamao 20 en una poblacin grande. Se calcula la madia muestral x para cada muestra; la coleccin de todas estas medias muestrales recibe el nombre de distribucin muestral de medias, lo que se puede ilustrar en la siguiente figura:

Suponga que se eligen muestras aleatorias de tamao 20, de una poblacin grande, y se calcula la deviacin estndar de cada una. La coleccin de todas estas desviaciones estndar muestrales se llama distribucin muestral de la desviacin estndar, y lo podemos ver en la siguiente figura:

31

Ejemplo Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacin de valores 0, 2, 4 y 6. Encuentre: La media poblacional. La desviacin estndar poblacional. La media de la distribucin muestral de medias. La desviacin estndar de la distribucin muestral de medias. Adems, grafique las frecuencias para la poblacin y para la distribucin muestral de medias Solucin: a. La media poblacional es:

b. La desviacin estndar de la poblacin es:

c. A continuacin se listan los elementos de la distribucin muestral de la media y la correspondiente distribucin de frecuencias.

32

La media de la distribucin muestral de medias es:

d. La desviacin estndar de la distribucin muestral de medias es:

33

De lo que podemos deducir que:

Como para cualquier variable aleatoria, la distribucin muestral de medias tiene una media o valor esperado, una varianza y una desviacin estndar, se puede demostrar que la distribucin muestral de medias tiene una media igual a la media poblacional. Esto es:

Despus de haber realizado el ejercicio anterior se puede ver que una distribucin muestral se genera extrayendo todas las posibles muestras del mismo tamao de la poblacin y calculndoles a stas su estadstico. Si la poblacin de la que se extraen las muestras es normal, la distribucin muestral de medias ser normal sin importar el tamao de la muestra.

Si la poblacin de donde se extraen las muestras no es normal, entonces el tamao de la muestra debe ser mayor o igual a 30, para que la distribucin muestral tenga una forma acampanada. Mientras mayor sea el tamao de la muestra, ms cerca estar la distribucin muestral de ser normal. Para muchos propsitos, la aproximacin normal se considera buena si se cumple n=30. La forma de la distribucin muestral de medias sea

34

aproximadamente normal, an en casos donde la poblacin original es bimodal, es realmente notable.

7. Variables Aleatorias y Distribuciones de Probabilidad Una variable aleatoria es una funcin que asocia un nmero real con cada elemento del espacio muestral. Se utiliza una letra mayscula, por ejemplo X, para denotar una variable aleatoria, y su correspondiente minscula, x en este caso, para denotar a cada uno de sus valores. Cada valor de X representa un evento que es un subconjunto del espacio muestral para el experimento dado. Ejemplo: Se sacan dos bolas de manera sucesiva sin reemplazo de una urna que contiene cuatro bolas rojas y tres negras. Los posibles resultados y los valores x de la variable aleatoria X, donde X es el nmero de bolas rojas, son:

35

Si un espacio muestral contiene un nmero finito de posibilidades, o una serie interminable con tantos elementos como nmeros enteros existen, se llama espacio muestral discreto. Una variable aleatoria se llama variable aleatoria discreta si se puede contar su conjunto de resultados posibles. Si un espacio muestral contiene un nmero infinito de posibilidades igual al nmero de puntos en un segmento de lnea, se llama espacio muestral continuo. Una variable aleatoria se llama variable aleatoria continua si puede tomar valores en una escala continua. En la mayor parte de los problemas prcticos, las variables aleatorias continuas representan datos medidos, como todos los posibles pesos, alturas, temperaturas, distancias o periodos de vida. Mientras que las variables aleatorias discretas representan datos contados, como el nmero de artculos defectuosos en una muestra de k artculos o el nmero de accidentes de carretera por ao en un pas.

7.1. Distribuciones Discretas de Probabilidad El conjunto de pares ordenados (x, f(x)) es una distribucin de probabilidad o funcin de masa de probabilidad de la variable aleatoria discreta X si, para cada resultado posible x,

Ejemplo: Hay tres computadoras defectuosas de un conjunto de ocho similares en una tienda. Si una escuela hace una compra al azar de dos de estas computadoras, cul es la distribucin de probabilidad para el nmero de defectuosas?

36

Sea X una variable aleatoria cuyos valores de x son la cantidad posible de computadoras defectuosas que compra la escuela. Entonces x puede ser cualquiera de los nmeros 0, 1 y 2.

Hay muchos problemas en donde se desea calcular la probabilidad de que el valor observado de una variable aleatoria X sea menor o igual que algn nmero real x. La distribucin acumulada o funcin de distribucin F(x) de una variable aleatoria discreta X con distribucin de probabilidad f(x) es:

Como consecuencia;

37

Es til ver de forma grfica una distribucin de probabilidad. Los puntos (x, f(x)) se pueden graficar mediante un grfico de barras. El grfico permite observar de forma fcil qu valores de X tienen ms probabilidad de ocurrencia.

Los puntos (x, f(x)) se pueden graficar mediante un grfico llamado histograma de probabilidad. Este se utiliza para las distribuciones de probabilidad de variables aleatorias continuas, ya que el ancho de los rectngulos representa intervalos y esto reas.

38

Tambin es til ver de forma grfica una distribucin acumulada. Los puntos (x, F(x)) se pueden graficar mediante un diagrama de frecuencias acumuladas.

7.2. Distribucin continua de probabilidad Una variable aleatoria continua tiene una probabilidad cero de tomar exactamente cualquiera de sus valores. Por lo cual, su distribucin de probabilidad no se puede dar en forma tabular, pero se puede establecer como una frmula. En este tipo de variables se trata con un intervalo en lugar de un valor puntual de nuestra variable aleatoria. Se trata el clculo de probabilidades para varios intervalos de variables aleatorias continuas como P(a< X< b), P(X> a), etc. Cuando X es continua, se puede notar que:

No importa si incluimos o no un extremo del intervalo. Esto no es cierto cuando X es discreta. La frmula que se utiliza para una variable aleatoria continua, ser funcin de los valores numricos de la variable X y, como tal, se representar

39

mediante la notacin f(x) y se le llama funcin de densidad de probabilidad, o simplemente funcin de densidad de X. Se utilizan reas para representar probabilidades y son valores numricos positivos, la funcin de densidad debe estar completamente por arriba del eje x.

40

41

BIBLIOGRAFA

Johnson, R. Elementary statistics. 2nd. ed. 1976. Duxbury Press. North Scituate, Massachusetts. 550p Ott, L.; Mendenhall, W. y Larson, R. F. 1978. Statistics: a tool for the social sciences. 2nd. ed. Duxbury Press. North Scituate, Massachusetts. 531p Koopmans, L. H. 1981. An introduction to contemporary statistics. Duxbury Press, Boston, Massachusetts. 599p Tanur, J. M. (Ed) 1972. Statistics: a guide to the unknown. Holden-Day, San Francisco.430p Bancroft, T. A. (Ed) Statistical papers in honor of G. W. Snedecor. Iowa State University Press, Iowa. 328p Federer, W. T. 1973. Statistics and Society. M. Dekker. N. York. 399p Snedecor, G. W & Cochran, W. G. 1956. Statistical methods. 5th ed. Iowa State University Press, Ames, Iowa. 534p Hay ediciones mas nuevas y traduccin al espaol. Steel, R. G. D. & Torrie, J. H. 1980. Principles and procedures of statistics. 2nd. ed. Mc Graw Hill, N. York. 633p. Pardell, H., Cobo, E. & Canela, J. 1986. Manual de bioestadstica. Masson, Barcelona. 263p Ferguson, G. A. 1976. Statistical analysis in Psychology and Education. 4th. ed. 529p

42

Vous aimerez peut-être aussi