Vous êtes sur la page 1sur 64

del aleman Statistik, y este der. del italiano statista 'hombre de Estado'.

“Para actuar acertadamente en el mundo de hoy se requiere, entre otras cosas, estar
educado en cierto “pensar estadístico” que permita no solo tener presente o saber buscar
resultados anteriores (recopilados en registros tabulados o en gráficos); sino también
saberlos interpretar y aplicar adecuadamente en la toma de decisiones” Dr. Luis Santaló

“Llegará el día en el que el pensamiento estadístico será una condición tan necesaria para
la convivencia eficiente como la capacidad de leer y escribir” Herbert George Wells

Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias
sociales, desde las ciencias de la salud hasta el control de calidad.

Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales.

Estadística Descriptiva: ciencia que se encarga de recolectar, describir e interpretar datos

Estadística inferencial: Obtener conclusiones sobre una población a partir de una muestra.

Para un buen análisis estadístico se debe 1) definir cuidadosamente la situación. 2)


Recolectar los datos 3) resumir con precisión los datos 4) derivar y comunicar información
significativa.

Conceptos fundamentales:

-Población: Colección o conjunto de individuos cuyas características se analizaran. Se debe


definir cuidadosamente. Finita e infinita. Ej: (f) alumnos del profesorado en matemática
del isfd Cecilia bravslaski, (I) cantidad de personas que podrían consumir aspirinas.

Cuando el tamaño de la población es muy grande se suele tomar una muestra

-Muestra: Subconjunto de la población… La selección al de 10 alumnos del profesorado en


matemática del isfd CB.

-Variable (o variable de respuesta): Una característica de interés acerca de cada elemento


individual, de una población o muestra. Por ejemplo: Color de cabello de los alumnos del
tercer año del profesorado en matemática del isfd CB

-Valor de datos: El valor de la variable asociada con un elemento de la población o


muestra.

-Experimento: Actividad planificada cuyos resultados producen un conjunto de datos.


-Parametro: Valor numérico que resume los datos de una población.

-Estadistico: Valor numérico que resume los datos de una población.

-Marco muestral: Listado de todos los elementos de la población.

-Tecnicas de muestreo:

- Las muestras puede ser, según sus características, probabilísticas o aleatoreas, o


estocásticas o al azar. no probabilísticas

Probabilisticas:

-Muestreo aleatorio simple: Cada elemento de la población tiene las mismas posibilidades
de ser seleccionadas. Se realiza sin reposición y consiste en seleccionar n elementos de
entre N (n<N), de tal forma que todas las muetras de tamaño n que se puedan formar
tengan la misma posibilidad de ser elegidas.

-Muestreo aleatorio estratificado: Consiste en establecer “estratos”, es decir subconjuntos


que sean lo más homogéneos posibles, parecidos en cuanto a las características mas
importantes para la investigación. Cada estrato es una suerte de subpoblación, dentro de
la cual se obtendrán muestras al azar(una dentro de cada estrato).

-Muestreo por conglomerados: consiste en dividir a la población en subgrupos llamados


conglomerados, como por ejemplo barrios, edificios, municipios, etc. Buscando que cada
uno sea representativo de la población total. En este caso, la variabilidad interna dentro
de cada conglomerado debe ser grande. Luego se selecciona la muestra al azar de
conglomerados, luego una muestra de entre los elementos de cada conglomerado
seleccionado al azar, logrando que la muestra este mas concentrada.

Muestreo sistematico: Si el tamaño de la muestra es n y el de la población N, se


determina un numero k=N/n luego se elige el primer elemento de la muestra al azar
sorteando un numero entre 1 y k, y los restantes se obtienen sumando k a numero
sorteado y asi se continua hasta completar el tamaño muestral.

Clase 2)

Muestras no probabilísticas:

- Muestreo por conveniencia: Se elige una muestra fácilmente accesible.


- -Muestreo intencional: los miembros son elegidos 1 a 1 por considerarlos
representativos.
- Muestreo por cuota: En este tipo de muestreo se fijan unas "cuotas" que consisten
en un número de individuos que reúnen unas determinadas condiciones, por
ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Campo
Grande. Una vez determinada la cuota se eligen los primeros que se encuentren
que cumplan esas características. Este método se utiliza mucho en las encuestas
de opinión.
- Muestreo bola de nieve: Se seleccionan algunos individuos que luego conducen a
otros, y luego estos a otros y así sucesivamente.

Las variables y los tipos

Variables es una característica que deseamos observar (medir)

Ejemplos de variables:

-Cantidad de alumnos en carreras científicas en Argentina.

-Color de cabello de los alumnos de la Esc. 299.

-Presión de aire que soporta un neumático.

-Estado civil del alumnado del ISFD CB.

-Titulo de los docentes de una escuela.

-Temperatura de un pueblo x en el sur de Argentina a las 10 de la mañana.

-Libros leídos por los alumnos del 3er año del prof. En matemática del isfd CB

-Cantidad de mascotas por familias en A. del Valle.

-Color de remera preferida por los adolescentes de A. del Valle.

-Nivel de organización de la esc. Nº 128.

Las variables, las podemos clasificar dependiendo de ciertos criterios.

Primero, dependiendo de los valores que puede tomar.

A partir de esto, vemos que las variables pueden ser de dos tipos.

-Cualitativas: hacen referencia a una cualidad, a una característica no numérica.

-Cuantitativa: Son las que se pueden representar por un valor numérico. Estas, además
pueden ser Discretas o continuas, dependiendo de los valores que pueden tomar.
A partir de esto, escriban 3 ejemplos de cada tipo de variable siguiendo lo que entienden
de cada una.

Estas variables, además están asociadas a ciertos niveles de medición.

Que es medir: Asignar un número a un objeto o evento dependiendo de ciertas reglas


predeterminadas.

-Nivel nominal: Las variables están representadas por palabras o números que no reflejan
una cantidad sino un nombre.

Por ejemplo, sexo, estado civil, numero de documento.

-Nivel ordinal: Los valores de la variable sirven para establecer un orden o categoría, se las
puede ordenar de mayor a menor, se puede dar la posición relativa de un dato con
respecto a otro, pero sin cuantificar. Por ejemplo: Grado de acuerdo, categoría dentro de
un escalafón.

-Nivel intervalar: Permite integrar el concepto de intervalo, es decir hablar de la distancia


entre valores. El cero no es un valor absoluto, es decir que no indica la ausencia de la
propiedad, es una referencia arbitraria. Por ejemplo: temperatura en grados celcius, CI

-Nivel de razón: El cero es absoluto, es decir que el cero indica la ausencia de la


propiedad. Por ejemplo: peso, altura, distancia.

Podemos además clasificarlas por su función en el estudio:

Independiente y dependiente.

Una vez seleccionada la variable y haber hecho la medición, tenemos los datos obtenidos.
Ahora necesitamos estudiarlos.

Distribuciones de frecuencias, muestra la variación de la variables con sus respectivos


valores.
Datos sin agrupar o datos en bruto
Los datos en bruto son los datos recolectados que aún no se han organizado.

Por ejemplo en un estudio, se encuesto a 10 alumnos de una escuela, preguntándoles por


la cantidad de personas que vivían en sus casas. Los resultados obtenidos fueron:

1;5;2;8;4;3;2;6;2;4.
Tabla de frecuencias:

Es una tabla usada para variables cualitativas, o para variables discretas con poca
variabilidad en sus datos.

Ejemplo: En una escuela, se consultó por el color de buzo de preferencia a 20 alumnos.

Los datos obtenidos fueron:

Blanco=5, verde=8, azul=6, rojo=1.

Color Fi Fi Fi%
Blanco 5 Xi/n Xi/n*100
Verde 8
Azul 6
Rojo 1
Totales 20
Fi: Frecuencia acumulada: Número de veces que se repite un valor de la variable

Fi: Razón entre las frecuencias y el total. Indica la proporción que representa cada valor de
la variable en el total.

Fi%: Frecuencia relativa porcentual: Indica el porcentaje de cada valor en relación a la


totalidad de los datos.

Si la variable es ordinal, o de un nivel de medición mayor además se pueden calcular la


columna de frecuencias acumuladas.

Veamos un ejemplo donde podemos realizar este cálculo.

Se realizó un estudio de opinión en CABA, donde a 40 personas se le consulto por como


viajaba en tren, que luego de volcar a una tabla de frecuencias se obtuvo lo siguiente.

Opinión Fi Fri fri% fa


Muy mal 10 10
Mal 5 15
Neutro 13 28
Bien 7 35
Muy bien 5 40
Totales 40
Construcción de tabla en intervalos de clases

Esta tabla, no será útil en el caso de variables discretas con grandes cantidades de valores,
o para variables continuas.

Por ejemplo:

Se midieron las estaturas (en metros) de los familiares concurrentes a un acto de la


escuela y se obtienen los siguientes valores

1,15 1,53 1,21 1,48 1,16 1,59


1,49 1,40 1,86 1,50 1,81 1,52
1,51 1,98 1,48 1,52 1,20 1,37
1,53 1,42 1,16 1,45 1,53 1,73
1,55 1,20 1,62 1,49 1,98 1,01

Los repartiremos en 10 intervalos con una amplitud de 10 cm cada uno, obteniendo

Estatura Fi Fri Fri% fa


[1,00-1,10) 1 1
[1,10-1,20) 3 4
[1,20-1,30) 3 7
[1,30-1,40) 2 9
[1,40-1,50) 6 15
[1,50-1,60) 4 19
[1,60-1,70) 3 22
[1,70-1,80) 3 25
[1,80-1,90) 2 27
[1,90-2,00) 3 30
30
-Fronteras de clase: extremos de cada intervalo, superior (Ls) e inferior (Li).

-Tamaño o amplitud de a clase: diferencia entre las fronteras de clase en un mismo


intervalo de clase… Ls-Li=a

-Marca de clase: Punto medio del intervalo de clase. (Ls+Li)/2=xi


Clase 4: PARA OBTENER UNA DISTRIBUCIÓN EN INTERVALOS DE CLASE “PERFECTA” SE
SUELE UTILIZAR LOS SIGUIENTES PASOS.

1_ Calcular el Rango.

RANGO=VALmax-VALmin

Rango en nuestro ejemplo: 97-53=44

2_ Determinar el número de clases o intervalos de clases. Regla de Sturges

NºI=1+3,322*logn; Siendo n el tamaño de la muestra

NºI=1+3,322*log80=1+6,32=7,32= NI=7

3_ Amplitud de los intervalos (a) v

A=R/NI=44/7=6,28=> a=7

a.Ni=NR=> 7.7=49

Esos 5 valores que sobran es necesario distribuirlos. Podriamos dar iniciar 3 valores antes
del Valinicial y 2 Valores posteriores al inicial. Quedando los siguientes intervalos de la
siguiente forma.

MEDIDAS DE TENDENCIA CENTRAL


Son valores típicos o representativos de un conjunto de datos. Como estos valores típicos
tienden a encontrarse en el centro de los conjuntos de datos, ordenados de acuerdo con
su magnitud, se les conoce como medidas de tendencia central. Se pueden definir varios
tipos de medidas; los más usados son la media aritmética, la mediana, la moda, la media
geométrica y la media armónica. Cada una de ellas tiene ventajas y desventajas de
acuerdo con el tipo de datos y el propósito de su uso.
LA MEDIA ARITMETICA O PROMEDIO
X=sumatoria de i=1 hasta n de os n valores de x.
Ver en datos brutos, en datos agrupados en tabla de frecuencias y en tabla de intervalos
de clase.
En datos brutos:
Si sobre una vara numerada sin peso, se colocan pesos idénticos sobre el valor de cada
dato, la vara queda en equilibrio cuando se la apoya en el punto correspondiente a la
media.

La media aritmética para tablas de frecuencia.

La media aritmética para intervalos de clase.

-La media aritmética es susceptible a valores extremos.

Por ejemplo.

En una empresa, los sueldos de sus empleados eran

1000, 1200 , 1250, 1300, 8000

-No necesariamente es un valor que tenga “sentido” en nuestra distribución.

Por ejemplo, cantidad de hijos.

0,0,4,3,1,4,2,1,2

1,88

-Utiliza todo el conjunto de datos.

-En un conjunto de números, la suma algebraica de las desviaciones de estos números


respecto a su media aritmética es cero.

-----Calcular la media de las distribuciones realizadas en la hoja de trabajo 1.

LA MEDIANA

Es el punto central de los datos, deja la misma cantidad de datos a un lado como al otro
de la misma. El 50% de los datos es menor a la mediana, y el 50% de los datos es superior
a la mediana.

-No esta influida por la presencia de valores extremos.


Calculo de la mediana para datos en bruto.

Primero se debe ordenar la distribución de menor a mayor o de mayor a menor.

Calcuamos el ORDEN de la mediana, con n+1/2

En el caso, que la cantidad de datos sea impar, la mediana es el valor que se encuentra en
la posición obtenida. Si la cantidad de datos es par, entonces la mediana es la media
aritmética de los dos valores centrales.

Pir ejemplo:

Teniendo el conjunto de datos.

2,6,9,3,5,8,7.

2,3,5,6,7,8,9… Orden de la mediana=7+1/2=4= Me=6

2,3,5,6,7,8…. Orden de la mediana=6+1/2=3.5 6+7/2=6,5 Me=6,5

En el caso que la distribuión este en un tabla de frecuencias.

Se busca el valor obtenido en el cálculo del orden de la mediana, en la columna de


frecuencias acumuladas. (Ver en tabla de cómo se viaja en tren)

En el caso de que la distribución este presentada en intervalos de clase, se utiliza a


siguiente formula.

Me=Li+((n/2-fa(i-1)/fi).a

Donde

-Li: limite inferior de la clase que contiene a la mediana.

-fai-1: Frecuencia acumulada hasta el intervalo anterior al que contiene a la mediana.

-fi: frecuencia absoluta del intervalo que contiene a la mediana.

-a: amplitud del intervalo.

N: tamaño de la muestra.
LA MODA:

La moda o modo es el valor de la variable que más se repite.

La distribución puede no tener moda, puede ser unimodal, bimodal o multimodal (Esto
puede respresenta grupos diversos en la población)

Por ejemplo (Ver el de los buzos)

el caso de tablas de frecuencias es el valor de la variable que tiene mayor frecuencia


absoluta.

Y para tabla de intervalos de clase:

Mo=Li+(D1/D1+D2)*a

Li: limite inferior del intervalo modal.

D1: Exceso en la frecuencia modal con respecto al intervalo anterior al intervalo modal: fi-
fi-1

D2: Exceso en la frecuencia modal con respecto al intervalo superior al intervalo modal: fi-
fi+1

A=amplitud

La tabla muestra la distribución de


edades de un grupo de personas.

Hallar la media, la mediana y la moda.


MEDIA ARITMÉTICA PONDERADA
Algunas veces, a los números X1, X2, . . . , Xn se les asignan ciertos factores de ponderación (o
pesos) w1, w2, . . . , wn,
que dependen del significado o importancia que se les asigne a estos números. En este caso, a
𝑛
𝑤1 𝑥1 + ⋯ + 𝑤𝑛 𝑥𝑛 𝑤𝑖 𝑥𝑖
𝜇= =∑
𝑤1 + ⋯ + 𝑤𝑛 𝑤𝑖
𝑖=1

Ejemplo:

MEDIA GEOMETRICA G

La media geométrica de un conjunto de datos es la raíz n-esima de los productos de todos los
valores.

G=Raiz enésima de X1.X2….Xn

Por ejemplo, dado el conjunto de datos 2, 4 6 8 9.

MEDIA armónica h

La media armónica H de un conjunto de datos es el inverso de la media aritmética de los inversos


de los datos:

Es decir que H=n/Z 1/x

2,5, 6, 7, 9
Relación entre media aritmética, armonica y geométrica

H<=G<=X

MEDIDAS DE POSICIÓN

Cuartiles:

Son 3 valores que dividen al conjunto de datos, una vez ordenado de manera creciente o
decreciente, en 4 partes iguales, donde cada una concentra el 25% de los datos.

Q1 (cuartil 1): Es el valor que deja a su izquierda el 25% de la distribución.

Q2 (cuartil 2): Es el valor que deja a su izquierda el 50% de la distribución.

Q3 (Cuartil 3): Es el valor que deja a su izquierda al 75% de la distribución.

Para calcular los cuartiles

En dator en bruto, o datos en frecuencia ver el orden: kn/4

Qk=Li+(nk/4+fai-1)/fixa

Deciles. El orden es nk/10 con k desde 1 hasta 9

Para los centiles, el orden es nk/100 cn k desde 1 hasta n


Medidas de dispersión

Aclaración, los estadísticos y los parámetros se identifican mediante símbolos distintos,


generalmente los parámetros son indicados con letras griegas.

La media aritmética x, es designada por u.

Se tomaron las longitudes de dos conjuntos diferentes de bloques A y B. Las longitudes de los
bloques en el conjunto A fueron 10, 20, 30, 40, 50 y 60 cm. y las longitudes de los bloques en el
conjunto B fueron 10, 10, 10, 60, 60 y 60 cm.

Una MTC es más representativa si va acompañada de una medida de dispersión

Las más utilizadas son.

Rango: distancia entre el menor y el mayor valor que toma la variable.

Rango= Vmax-Vmin

Desvio con respecto a la media: es la distancia de un valor de la variable a la media aritméticas:


DX=xi-X. Indica cuan alejado se encuentra un valor de la media de la distribución

Varianza: Es el promedio de los desvíos con respecto a la media elevados al cuadrado.

(𝑋𝑖 − 𝜇)2
𝜎2 = ∑
𝑁

En el caso que estemos trabajando con una muestra, se utiliza S en vez de sigma, y se multiplica a
la expresión por el estimador insesgado (Corrección de Bessel)

Como la varianza se calcula al cuadrado, el resultado obtenido carece de sentido, entonces


calculamos el desvió estándar. Que es la raíz cuadrada de la varianza.

O=raíz o^2
Calcular o de las distribuciones de bloques

La distribución con mayor desvío estándar es la que tiene valores más dispersos, más para
memorizar una lista de seis pares de palabras. Los resultados fueron: 5 8 3 9 6 7 10 6 7 4 6 9 5 6 7
94687

En datos muestrales, la varianza, y el desvio estándar o típico se representa mediante la letra S.

Hallar El desvío estándar en las siguientes distribuciones.

Coeficiente de variación

El coeficiente de variación es un indicador de la dispersión de los datos respecto a su promedio.


Generalmente se expresa en porcentaje y no tiene unidad de medida. Cuanto menor sea el
coeficiente de variación, menor será la diferencia entre los datos observados y mejor
representados estarán por su promedio

𝑆
𝐶𝑉 = 100
𝑋̅
CV=o.100/u

puede comparar una distribución de alturas de los alumnos con la distribución de sus pesos y
hablar, entonces, de cual de las dos tiene mayor variabilidad.

Gráficos estadísticos

Una gráfica es un dibujo complementario a una tabla o cuadro, que permite observar las
tendencias de un fenómeno en estudio.

De acuerdo a ciertas características de la distribución se usan unos u otros tipos de gráficos.


Veremos a continuación los más utilizados.
GRAFICO DE BARRAS O COLUMNAS:

Constituido por columnas verticales u horizontales rectangulares de igual ancho y del mismo color
o trazado, que:

 conservan igual distancia de separación entre sí, y


 la altura de las barras es proporcional a las frecuencias.

Grafico circular o grafico de torta:

Se usa para representar variables en porcentajes, o cifras absolutas cuando el número de variables
no es demasiado grande. Para realizar el gráfico “a mano” es necesario sacar el ángulo que
corresponde a cada variable.

Continuemos con el ejemplo de la variable “color de buzo de preferencia “A los buzos blancos les
corresponde el 25%. Entonces decimos: como a 100% corresponde un ángulo de 360 grados,
entonces a 25% corresponde un ángulo de (25 % x 360)/100%

Acá hacer la regla de 3 simple para encontrar lo anterior.


Gráfico a bastones En el caso de variable Discreta el gráfico es “a bastones”, como se pretende
ilustrar a continuación. En lugar de barras, aparecen líneas que representan a las frecuencias.

Pictograma El número de frecuencias se representa a través de dibujos o unidades pictóricas,


todas ellas de igual tamaño. Son diagramas poco precisos y, por tanto, escasamente utilizados por
los expertos, pero de muy sencilla interpretación para los menos entendidos.
Gráfico de linea

Generalmente se utiliza para representar la evolución de la variable a través del tiempo (años,
meses, horas, etc.).

Sobre el eje horizontal figuran los períodos de tiempo.

Grafico polar o radial de telraña

Suele utilizarse para ver la evolución de una variable en el tiempo.

Se divide 360 por la cantidad de valores que toma la variable, determinando sectores circulares
iguales. Luego se trazan circunferencias concéntricas con valores de la variable.

Exportaciones de maíz en millones de toneladas.


enero
80

60
julio febrero
Meses Fi
40
Enero 50
20 Febrero 60
Marzo 50
0 Abril 55
junio marzo mayo 70
Junio 75
julio 80

mayo abril

Histograma

En el caso de variable Continua se utilizan intervalos cuya amplitud debe ser igual en todos los
casos, siempre que esto sea posible. Se construye dibujando barras contiguas que tienen: como
base la amplitud del intervalo y como alturas las frecuencias respectivas

Puntajes de alumnos en cierto juego de preguntas y respuestas.


Polígonos de frecuencias:

Es similar a un gráfico de líneas, pero en este caso se consideran los puntos medios de las bases
superiores de los rectángulos del histograma correspondiente a la distribución. El área encerrada
bajo el polígono de frecuencias es igual o proporcional al tamaño de la muestra o población.

Curva de densidad.

También llamado

Si hacemos tender a infinito la cantidad de intervalos, es decir que a tienda a cero, el polígono de
frecuencias determinado tiene a convertirse en una curva, en la cual podemos analizar ciertas
cuestiones.

El área encerrada bajo la curva es proporcional a la frecuencia de la distribución. Esta curva suele
llamarse polígono de frecuencias suavizado, curva de frecuencias o curva de densidad.

Momentos de una distribución.

Los momentos de una variable X son los valores esperados de ciertas distribuciones de X.
éstos forman una colección de medidas descriptivas que pueden emplearse para caracterizar
la distirbución y especificarlas si todos los momentos de X son conocidos.

Tomaremos los momentos alrededor de la media, que dan ciertas características.

El primer momento coincide con la media aritmética.

El segundo momento coincide con la varianza y nos da la dispersión de los datos.

El tercer momento, es el que determina la simetría o sesgo de la distribución.


Medidas de asimetría:

Sesgo estándar:

Indica el grado de asimetría de la curva, es decir cuanto se aparta de la simetría. Permite analizar
en que rama de del recorrido de la variable hay mayor acumulación de datos sin necesidad de
realizar el grafico.

∑(𝑥𝑖 − 𝑋)3 . 𝑓𝑖
𝑎3 =
𝑛. 𝑆 3

a3 =0 Curva simétrica. X=Me=Mo

a3<0---- Sesgo negativo, o sesgada a la izquierda O ASIMETRICA NEGATIVA.

---Concentración de valores altos de la variable.

---La X está afectada por valores muy bajos de la variable.

X<Me<Mo

a3>0----- Sesgo positivo o sesgada a la derecha, asimétrica a positiva.

Con cola a la derecha. Concentración de valores bajos de la variable.

El cuarto momento de la distribución es el que determina que tan alta es la curva de densidad.

Medidas de apuntalamiento:

Curtosis: Indica cuan puntiaguda es la curva de frecuencias de una distribución con respecto a la
normal.

∑(𝑥𝑖−𝑋)4 .𝑓𝑖
𝑎4 = 𝑛.𝑆 4
-3

a4=0---- Mesocurtica igual a la normal.

a4<0 Platicurtica------ Los datos están dispersos, es una distribución heterogénea.


a4>0 Leptocurtica---- Gran concentración de los valores alrededor de la X. Distribución
homogénea.9

Covariación:

Tratamos ahora de dos variables obtenidas en una misma prueba. Por ejemplo: En un equipo de
futbol, interesan tomar las alturas y los pesos de cada jugador. Se obtienen asi dos datos de un
mismo sujeto.

El término de covariación expresa e incluye las siguientes situaciones:

 Dependencia causal unilateral: Se da cuando una variable influye a la otra. Por ejemplo, si
relacionamos cantidad de lluvia caída y la asistencia a clases. La cantidad de lluvia influe
sobre la asistencia. Pero la asistencia no influye en la cantidad de lluvia.
 Interdependencia: La influencia de las os variables es recíproca. Un ejemplo clásico es el
que vincula los precios con las cantidades demandadas/ ofrecidas de un bien.
 Dependencia indirecta: Cuando dos variables pueden registrar una covariación que no es
real y que se da porque ambas dependen de una tercera que ejerce su influencia entre
ellas. Por ejemplo: En este decenio se registra una mayor afluencia al comedor escolar que
en el decenio pasado, y en ese mismo período ha aumentado la repitencia escolar. Esto no
quiere decir que la afluencia al comedor escolar haga que mas alumnos repitan el año.
 Concordancia: Existen casos en los que sabemos que dos variables son independientes,
pero queremos saber si hay cierta concordancia entre sus valores. Por ejemplo las notas
de concepto de los profesores de un curso.
 Covariación casual: Existen situaciones en las que se observa una variación sincronizada
entre dos variables, cuya observación llevaría a concluir que existe una asociación o
dependencia entre las mismas. No obstante, tal covariación puede ser totalmente casual o
accidental.
Gráfico de dispersión:

Consiste en un grafico que representa la relación entre 2 variables.

Podemos, a partir del grafico sacar algunas conclusiones sobre la relación entre las variables.

En el grafico podemos observar una clara relación entre las dos variables.

Podemos obtener distintos tipos de gráficos que representan diferentes situaciones:

A) Una relación lineal positiva.

B) una relación lineal perfecta.

C) Que no haya relación.

D) Relación no lineal, también llamada curvilinea.

E) relación lineal negativa.

F) Relación lineal negativa perfecta. ?


Graficar cada una de las situaciones.
Covarianza muestral

covarianza es un valor que indica el grado de variación conjunta de dos variables aleatorias
respecto a sus medias. Es el dato básico para determinar si existe una dependencia entre ambas
variables y además es el dato necesario para estimar otros parámetros básicos, como el
coeficiente de correlación lineal o la recta de regresión. Sxy

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)


𝑆𝑥𝑦 =
𝑛−1

Tener en cuenta como sería para el caso de las poblaciones (es el que vamos a usar)

Coeficiente de correlación lineal.

A través del coeficiente de correlación. obtenemos un valor numérico adimensionado que expresa
el grado de correlación entre las variables.

Medida de Pearson:
𝑆𝑥𝑦
r=
𝑆𝑥.𝑆𝑦

Demostrar

r es un valor entre 1 y -1.

si /r/=1 la correlación es perfecta.

Si r=0 no hay correlación, o la correlación no es lineal.

El coeficiente de determinación se obtiene elevando r al cuadrado. Nos brinda el porcentaje de


variación de la variable y, que esta siendo explicada por la variable x.

Hacer el ejemplo de las gaseosas.

En en el análisis de correlación encontramos un valor que nos indica que tan fuerte es la relación
entre las variables. Con el análisis de regresión, se busca una line que explique de la mejor manera
posible a esa relación

¿Se podría decir que la producción de trigo


depende de la cantidad de fertilizantes que
se utilicen en su producción?
Análisis de regresión.

Método de los mínimos cuadrados para hallar la recta de mejor ajuste.

tiene que quedar.

Zy=n.b+a.Zx

Zxy=bZx+aZx2

^y=a+bx

b:coeficiente de regresión.
UNIDAD Nº 3 PROBABILIDAD

Tipos de experimentos:

-Experimento determinista: aquel que realizado en las mismas condiciones siempre nos da el
mismo resultado. De estos experimentos se ocupa la física clásica.

-Experimento aleatorio: es aquel susceptible a dar varios resultados. Sin poder predecir de
antemano cuál de ellos va a producirse en una experiencia concreta. Por ejemplo.

-Lanzar un dado o una moneda al aire.

-El tiempo de espera del colectivo.

- El número de hijos que tendrá un matrimonio.

Sucesos elementales:

*Un suceso elemental es un resultado en un experimento aleatorio. Por ejemplo

en el experimento: lanzar un dado.

S1: sacar un 1 S2: sacar un 2….

*Espacio probabilístico o espacio muestral: el conjunto de todos los sucesos elementales, es decir
todos los posibles resultados de un experimento.

Se simboliza con E

Por ejemplo, en el experimento: Lanzar una moneda

E= {C;X}

+Evento o suceso: un sub-conjunto del espacio muestral

sea el experimento: lanzar 1 dado.

A=Obtener un Nº par

A={2,4,6}

Podemos tener 4 tipos de sucesos:

Suceso simple Cumple solo una condicion por ejemplo: sacar un 7 de una
baraja española
suceso compuesto cumple mas de una condición sacar un 7 de copas de una
baraja española
suceso imposible ningún suceso del espacio Sacar un 7 de corazones de
A=O muestral cumple con las una baraja española
condiciones
Suceso cierto Todos los sucesos del espacio Sacar una carta de una baraja
A=E muestral cumple las española
condiciones

Tenga en cuenta que los sucesos son conjuntos, por lo tanto valen las operaciones entre ellos.

Union, intersección, complemento, diferencia.

experimento: lanzar un dado.

A=numero par

B=mayor a 3

AUB es el conjunto de todos los sucesos elementales que pertenecen a A o a B.

AUB=numeo par o mayor a 3={2,4,5,6}

AinterB es el suceso formado por los sucesos de A y B

AinterB={4,6}

Diferencia:

A-B=es el conjunto formado por los elementos que pertenecen a A pero no a B.

A-B={2}

Complemento:

𝐴̅=S-A

A’=sacar un numero impar.


Teoría clásica de la probabilidad

P(x)=Número de casos favorables/número de casos posibles=k/n

A esta definición de probabilidad se la conoce como probabilidad clásica o de Laplace.

LA probabilidad de que ocurra un evento o suceso se la suele indicar con p que es la probabilidad
de éxito de que ocurra dicho evento.

Su complemento “q” se le llama la probabilidad de fracaso.

q=P(p’)=n-k/n=1-k/n=1-p

Esta definición de probabilidad es aplicable únicamente cando los sucesos elementales son
equiprobables.

En casos donde esto no ocurre se utiliza la definición frecuencial de probabilidad, donde:


Supongamos que se repite n veces el experimento E y sean A y B dos sucesos asociados con E.

Llamamos na y nb al respectivo número de veces que ocurrieron los sucesos A y B en las n


repeticiones entonces

fra=na/n es la frecuencia relativa del evento A en las n repeticiones de E.

fra tiene la siguientes propiedades.

i) 0≤fra≤1

ii) fra=1 si A ocurre cada vez en la n repeticiones.

iii) fra=0 si A nunca ocurre en las n repeticiones.

iiii) si A y B son dos sucesos que se excluyen mutuamente y sea fAUB la frecuencia asociada al
suceso AUB entonces fAUB=fA+fB

En estadística, dada una tabla de frecuencias, la frecuencia relativa es el cociente entre las
apariciones de un suceso A, es decir la frecuencia absoluta y el tamaño muestral n
𝑎𝑝𝑎𝑟𝑖𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒𝑙 𝑠𝑢𝑐𝑒𝑠𝑜 𝐴
FrA=
𝑡𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙

Si se repiten el experimento infinitas veces, es decir que hacemos ninfinito, entonces FrA=P(A).

Es decir, que en sentido funcional Fa converge a P(A)

A esta definición se la llama definición frecuencial de la probabilidad.

¿Qué diferencia a la probabilidad de Laplace a esta?

Lancemos una moneda y veamos la frecuencia de que salga cara.

Definir sucesos simultaneos y sucesos mutuamente excluyentes.

Forma axiomática de la probabilidad


Tenemos dos tipos de sucesos

* Mutuamente excluyente: es decir que son sucesos que no pueden ocurrir al mismo tiempo.

Por ejemplo si tomamos dos eventos: casado y soltero. No se puede ser ambos.

 Sucesos simultaneeos: son aquellos que pueden ocurrir al mismo tiempo. Por ejemplo si
tomamos los sucesos: mujeres, casadas.

Dados un experimento aleatorio y su correspondiente espacio muestral S

Se llama probabilidad de ocurrencia de un suceso aleatorio A a un número real que cumple los
siguientes axiomas.

i) la probabilidad de A es un nº R en el intervalo cerrado 0 1, es decir

0≤P(A)≤1

ii) Si el suceso aleatorio A es el espacio muestral S entonces la probabilidad de ocurrencia es 1

A=SP(A)=P(S)=1

iii) Sean A1, A2,…An sucesos mutuamente excluyentes de a pares y pertenecientes al mismo
espacio muestral S. La probabilidad de que ocurra alguno de ellos es igual a la suma de las
probabilidades de los Ai. Es decir

Sean Ai y AkCS/ Ai∩Ak=0 i≠k

P(A1oA2oA3o…oAk)=P(A1UA2U…UAk)=P(A1)+P(A2)+P(A3)+…+P(Ak)

Que se conoce como la regla aditiva especial.

Veamos en un ejemplo.

Sea E el espacio muestral formado por 15 bolitas de colores, de las cuales son: 6 negras, 5 rayadas
y 4 blancas.

Sea A: Sacar una bolita blanca

E: es el espacio muestral

Para obtener la probabilidad de A, se debe realizar el cociente entre la cantidad de elementos de A


dividido entre l cantidad de elementos de E
#𝐴 4
𝑃(𝐴) = =
#𝐸 15

Observe que #A<#E y P(A)<1 y además #A>0 0<P(A)<1

Supongamos ahora el suceso B: sacar una bolita roja.

#𝐵 0
𝑃(𝐵) = = =0
#𝐸 15

Ademas. Seas S el suceso sacar una bolita

#𝑠 15
𝑃(𝑆) = = =1
#𝐸 15

Por lo tanto.

Sea X un suceso incluido en E.

0≤P(X)≤1

#X=0 P(X)=0 y es un imposible.

#A=#EP(X)=1 y es una certeza.

Tenga en cuenta que esto no es aplicable a la definición frecuencial de la probabilidad.

Probabilidad de dos sucesos

hacer la demostración para la unión que se llama propiedad aditiva general.

ahora ver el ejemplo de las bolitas.


¿Cuál es la probabiliad de extraer una bolita negra que tenga la letra M?

¿Cuál es la probabilidad de sacar una bolita negra o que tenga la letra M?

en el libo de estadística para ingenieros. hacer los ejercicios de la pag 47 y 48.: 1; 5; 10; 15
Probabilidad condicional

Hacer el de las bolitas en el pdf unidad 3.

Tenemos 100 bolitas en una urna: 10 bolitas negras y 90 blancas

A: Sacar una bolita negra

B: Sacar una bolita blanca.

¿Qué ocurre si la selección se realiza sin reposición?

En el primer intento:

P(A)=10/100

P(B)=90/100

Que ocurre si en la primera extracción saco una bolita negra y quiero volver a sacar.

P(A)=9/99

P(B)=90/99

Y que ocurre si en la primer extracción se obtiene una bolita blanca. ¿Cuál es la probabilidad de
que en una segunda extracción la bolita sea negra?

P(A/B)=10/89

P(A│B) Probabilidad de que ocurra A, sabiendo que ha ocurrido B, o probabilidad de A, dado B.


Que es una probabilidad condicional.

Tomemos un ejemplo

Supongamos que el espacio muestral S es la población de adultos en una pequeña ciudad que
cumplen con los requisitos para obtener un grado en la facultad. Debemos clasificarlos según se
sexo y situación laboral.

Empleado Desempleado Totales


Hombre 460 40 500
Mujer 140 260 400
Totales 600 300 900
Uno de estos individuos se seleccionará al azar para que realice un viaje a través del país para
promover las ventajas de establecer industrias nuevas en la ciudad.

Nos interesan que se cumplan los siguientes eventos.

H: el elegido sea hombre.


E: el elegido tenga empleo.

P(H/E)=460/600

Sea nX el número de elemento en cualquier conjunto A, podemos escribir:

𝑛(𝐻 ∩ 𝐸)
𝑛(𝐻 ∩ 𝐸) 𝑛(𝑆) 𝑃(𝐻 ∩ 𝐸)
P(H│E) = = =
𝑛(𝐸) 𝑛(𝐸) 𝑃(𝐸)
𝑛(𝑆)

𝑃(𝐻 ∩ 𝐸)
P(H│E) =
𝑃(𝐸)

P(H│E). 𝑃(𝐸) = 𝑃(𝐻 ∩ 𝐸) Que se conoce como regla multiplicativa

Introducción al teorema de Bayes.

Particiones:

Dado un espacio muestral S, se pueden realizar particiones Bi en el mismo. Estas deben cumplir
que:

i) B1UB2U…UBk=S

ii)Bi∩Bj=0 para todo i≠J

iii) P(Bi)>0

Consideremos una partición del espacio muestra en k partes. Entonces, para cualquier suceso A
incluido en S. 𝑃(𝐴) = ∑ 𝑃(𝐵𝑖 ∩ 𝐴) = ∑ 𝑃(𝐴|𝐵𝑖 ). 𝑃(𝐵𝑖 ). tenga en cuenta que los eventos son
mutuamente exluyentes.

Demostración

en el diagrama de Veen podemos observar que

A=(𝐵1 ∩ 𝐴)𝑈(𝑏2 ∩ 𝐴)𝑈(𝐵3 ∩ 𝐴)𝑈(𝐵4 ∩ 𝐴)𝑈(𝐵5 ∩ 𝐴)

y si queremos calcular

P(A)=𝑃((𝐵1 ∩ 𝐴)𝑈(𝑏2 ∩ 𝐴)𝑈(𝐵3 ∩ 𝐴)𝑈(𝐵4 ∩


𝐴)𝑈(𝐵5 ∩ 𝐴)).

Utilizando la ley aditiva, teniendo en cuenta que son


elementos mutuamente excluyentes nos queda

𝑃(𝐴) = 𝑃(𝐵1 ∩ 𝐴) + 𝑃(𝑏2 ∩ 𝐴) + 𝑃(𝐵3 ∩ 𝐴) + 𝑃(𝐵4 ∩ 𝐴)𝑃(𝐵5 ∩ 𝐴).


Y utilizando la ley multiplicativa tenemos.

𝑃(𝐴) = 𝑃(𝐵1│𝐴). 𝑃(𝐵1) + 𝑃(𝑏2│𝐴). 𝑃(𝐵2) + 𝑃(𝐵3│𝐴). 𝑃(𝐵3) + 𝑃(𝐵4│𝐴). 𝑃(𝐵4)


+ 𝑃(𝐵5│𝐴). 𝑃(𝐵5)

A esto le la llama teorema de probabilidad total o ley de eliminación.

Veamoslo en un ejemplo:

En cierta planta de montaje, tres maquinas B1, B2 y B3 montan respectivamente 30%, $45 y 25%
de los productos. A su vez, se sabe que respectivamente que el 2% el 3% y el 2% de los productos
ensamblados por las maquinas son defencuosos. Ahora, suponga que se selecciona al azar un
producto ¿Cuál es la probabilidad de que sea defectuoso?

Tenemos:

A: el producto es defectuoso.

B1: el producto fue ensamblado por la maquina 1.

B2: el producto fue ensamblado por la maquina 2.

B3: el producto fue ensamblado por la maquina 3.

Utilizando el teorema de probabilidad total tenemos.

P(A)=P(A│B1).P(B1)+P(A│B2).P(B2)+P(A│B3).P(B3)=(0,02.0.3)+0,03.0,45+0.02.0.25=0,006+0,0135+
0,005=0,0245

Es decir que la probabilidad de que el producto sea defectuoso es de 2,45%.

Ahora, si en vez de preguntar por A, se quiere saber la probabilidad condicional P(B3│A). Es


decir, que se seleccionó un producto de manera aleatoria y este resulto defectuoso ¿Cuál es la
probabilidad de que haya sido producido por la maquina B3? Preguntas de este tipo se pueden
responder utilizando el teorema de Bayes.

Si los eventos B1, B2, …,Bk constituyen una partición del espacio muestral S, donde P(Bk)≠0 para
2i=1,2,3,…,k Entonces.

𝑷(𝑨|𝐁𝐢). 𝐏(𝐁𝐢)
𝑷(𝑩𝒊|𝐀) =
∑𝒌𝒊=𝟏 ∑ 𝑷(𝐀│𝑩𝒊). 𝑷(𝑩𝒊)

En nuestro ejemplo, por ejemplo para saber la probabilidad de que el producto haya sido
producido por la maquina 3, siendo que es defectuoso.
𝑃(𝐴│𝐵3). P(B3) 0,02.0,25
𝑃(𝐵3|A) = =
𝑃(A|𝐵1). P(B1) + 𝑃(A|𝐵2). P(B2) + 𝑃(A|𝐵3). P(B3) 0,006 + 0,0135 + 0,005
0,005
= =
0,0245

Demostración del teorema:

𝑃(𝐵𝑟∩𝐴)
𝑃(𝐵𝑟|𝐴) = Por definición de probabilidad condicional.
𝑃(𝐴)

Utilizando la ley multiplicativa en el numerador y el teorema de la probabilidad total en el


denominador

𝑃(𝐴|Br). P(Br)
𝑃(𝐵𝑟|𝐴) =
∑ 𝑃(𝐵𝑖 |𝐴). 𝑃(𝐵𝑖 )

1) La prevalencia de infarto cardíaco para hipertensos es del 0,3% y para no hipertensos del 0,1%.
Si la prevalencia de hipertensión en una cierta población es del 25% ¿Cuál es la prevalencia del
infarto en esa población?

2) El 20 % d e l o s em pl ead o s d e u n a e mp r e sa s on i n g en i e r os y ot r o 20 %
s on e c on omi s ta s. El 75 % d e l o s i n g en i e r o s o cu p an u n pu e st o di r e cti v o y
el 50 % d e l o s e c on o mi sta s t am bi én , mi e n tr as qu e d e l o s n o i n gen i e r os y
l os n o e c on omi st as s ol am en t e el 20 % o cu pa u n pu e st o di r e cti v o. ¿Cu ál
e s l a p r oba bi l i dad d e qu e u n e mpl e ad o di re cti v o el egi do al az a r s e a
i n gen i e r o?

3) En l a sal a d e p ed i atrí a d e u n h os pi tal , el 6 0 % d e l o s pa ci en t e s s on


n i ñ as. D e l o s n i ñ os el 35 % s on m en o r es d e 24 m e s e s. El 20 % d e l as
n i ñ as ti e n en m en os de 2 4 m es e s . Un p e di atra qu e i n gr e sa a l a sal a
s el e cci on a u n i n f an t e al az a r.

a. D et e r mi n e el val o r d e l a p r oba bi li dad de qu e s ea m en o r d e 24 m e s e s.

b. Si el i n fan t e r esu l ta s e r m en o r d e 24 m e s es . D et e r mi n e l a
pr ob abi l i dad qu e s e a u n a n i ñ a .
Distribuciones de probabilidad

Introducción.

Variable aleatoria:

Analicemos los siguientes experimentos:

E1: Se tira un dado y se observa el número que queda en la cara superior.

E2: Se arroja una moneda 3 veces y se cuenta el número de caras obtenidas.

E3: Se fabrican artículos en una línea de producción y se cuentan aquellos que resultan
defectuosos.

E4: Se prueba la duración de una lamparita, anotando el tiempo hasta que se quema.

La pregunta principal sería ¿Qué tienen en común todos estos experimentos?

“Es posible repetir cada experimento indefinidamente sin cambiar esencialmente las condiciones.
Aunque no podemos indicar cuál será un resultado particular, podemos describir el conjunto de
todos los resultados posibles del experimento. A medida que el experimento se repite, los
resultados individuales parecen ocurrir de forma “caprichosa”. Sin embargo, cuando se repite un
gran número de veces, aparece un modelo definido de regularidad. Esta regularidad hace posible
la construcción de un modelo matemático preciso con el cual analizar el experimento.” (Meyer, P.:
1986, p. 8)

Los experimentos que cumplen con las características enunciadas, se llaman experimentos
aleatorios.

Tomaremos el siguiente experimento

Dado un lote de artículos electrónicos se prueban 3 artículos, donde surge el siguiente espacio
muestral

S={NNN;NND;NDN;NDD;DNN;DND;DDN;DDD} donde N: no defectuoso y D es defectuoso.

De esta forma se le asiganaran valores a cada uno de los elementos del espacio muestral 0, 1, 2 o 3
Estos valores, son cantidades aleatorias determinadas por el resultado del experimento aleatorio.

Se pueden ver como valores que toma la variable aleatoria X, el número de artículos defectuosos
cuando se prueban 3 artículos electrónicos.

A partir del ejemplo definiremos a la variable aleatoria como:


Es una “cantidad” obtenida como resultado de un experimento aleatorio que, debido al azar,
puede tomar distintos valores.

Está definición es válida, pero necesitamos exponerla de una manera más refinada. Para ello
utilizaremos los diagramas de ven correspondientes al ejemplo para lograr una definición más
adecuada. Trabajamos desde el concepto de función

S(Espacio muestral) R (Recorrido de la [0;1]


variable)

X f(x)=P(X=xi)
NNN
0
NND
1/8
NDN
1
DNN
3/8
NDD 2
DND
DDN 3
DDD

Definimos entonces a la variable aleatoria x, como la función que asigna un valor a cada uno de los
elementos del espacio muestral. X:S R

Donde: Dominio X=S, mientras que la imX={0,1,2,3}=R

Encontraos dos posibilidades para las variables aleatorias.

Cuando R es un conjunto numerable (infinito o no) se dice que X es una variable aleatoria discreta.

Cuando R es un conjunto no numerable, se dice que X es una variable aleatoria Continua.

La segunda función f(x)=P(X=xi) es la que asocia cada valor de la variable aleatoria X, su respectiva
probabilidad. f:imX R
Distribuciones de probabilidad discreta

El conjunto de pares ordenados (x;f(x)) es una función de probabilidad, función de masa de


probabilidad o distribución de probabilidad de la variable aleatoria discreta x, si se cumple que:

i) f(x)≥0

ii)∑ 𝑓(𝑥) = 1

ii) P(X=xi)=f(x)

Una distribución de probabilidad discreta suele representarse mediante un diagrama a bastones.

Siguiendo el ejemplo enunciado, pero pensando en que son 4 los artículos seleccionados

De una línea de producción de cierto dispositivo electrónico, se seleccionan 4 al azar, para su


control. Indicaremos con “N” el dispositivo que funciona y con “D” el defectuoso.

tendríamos.

Articulos defectuosos probabilidad


0 1/16
1 4/16
2 6/16
3 4/16
4 1/16

1 2 3 4 5

Distribuciones continuas de probabilidad.

Una VAC tiene una probabilidad 0 de tomar exactamente uno de sus valores, en consecuencia, su
distribución no puede ser dada de forma tabular. No podemos trabajar con un valor, sino con un
intervalo de valores de nuestra variable aleatoria.

Por ejemplo: P(a<x<b); P(x>a), etc.

Notese que: P(a<x≤b)= P(a<x<b)+P(x=b)= P(a<x<b)


Esto significa que en una distribución continua de probabilidades no importa si se consideran o no
los extremos del intervalo, cosa que no ocurre cuando la variable es discreta.

A pesar de que la probabilidad no podrá ser expresada de manera tabular, es posible darla a través
de una formula, y dicha fórmula necesariamente será función de la variable aleatoria X. La función
f(x) para las variables continuas suele llamarse función de densidad de probabilidad, o
simplemente función de densidad de X. Como X, se define sobre un espacio muestral continuo, es
posible que f(x) presente un numero finito de discontinuidades aunque no suele ser el caso de las
funciones con aplicaciones estadísticas.

La función de densidad, siempre será positiva, es decir que se desarrolla siempre sobre el eje x.

La función de densidad de probabilidad se construye de tal forma, que el área bajo la curva
limitada por el eje x sea 1 cuando se calcula en el rango de X para el cual está definida f(x). Si este
rango es limitado, siempre es posible extenderlo para comprender a todos los números reales,
haciendo que f(x)=0 en el intervalo extendido.

El el siguiente gráfico, la probabilidad de que a<x<b es el área bajo la curva, entre a y b, limitada
por el eje x.

Podemos obtener entonces que

Podemos obtener entonces que


𝑏
𝑃(𝑎 < 𝑥 < 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥
𝑎

La fnción f(x) es una función de densidad de probabilidad de la variable aleatoria continua X,


definida en el conjunto de los números R si:

i) f(x)≥0 para todo x, perteneciente a R


+∞
ii)∫−∞ 𝑓(𝑥)𝑑𝑥 = 1
iii)
𝑏
𝑃(𝑎 < 𝑥 < 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥
𝑎

Tengamos en cuenta que f(x) no es una probabilidad, y puede tomar valores mayores a 1, es
simplemente el valor de una función en un punto.

Ejemplo:

Suponga que el error en la temperatura de reacción en ºC, para un experimento de laboratorio


controlado es una VAC con función de densidad dada por

La distribución Acumulada de una variable aleatoria continua X está dada por.


𝑥
𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∫ 𝑓(𝑡)𝑑𝑡
−∞

En el ejemplo:

Ejercicio:
Esperanza matemática o valor medio de la variable aleatoria.

Supongamos el siguiente caso:

En un juego de azar, una persona ganará $5 si, cuando lance tres monedas, ocurren tres caras o
tres cruces, o perderá $3 si ocurren una o dos caras. ¿Cuál es el promedio de ganancia que el
jugador espera obtener por tirada?

Es el valor promedio, a largo plazo de la variable aleatoria.

Def: Sea X una variable aleatoria con distribución de probabilidad f(x). La media o valor esperado
esta dada por:

Si es discreta 𝜇 = 𝐸(𝑋) = ∑𝑛𝑖=1 𝑥𝑖 . 𝑓(𝑥𝑖 )


+∞
Si es continua 𝜇 = 𝐸(𝑋) = ∫−∞ 𝑥. 𝑓(𝑥)𝑑𝑥
Varianza y desvío estándar

Sea X una variable aleatoria con distribución de probabilidad f(x) y media u. La varianza de la
variable aleatoria x o la varianza de la distribución de probabilidad de X es:
+∞
si escontinua: 𝜎 2 = 𝐸[(𝑋 − 𝜇)2 ] = ∫−∞ (𝑥 − 𝜇)2 . 𝑓(𝑥)𝑑𝑥

si es disceta: 𝜎 2 = 𝐸[(𝑋 − 𝜇)2 ] = ∑𝑛𝑖=1(𝑥 − 𝜇)2 . 𝑓(𝑥𝑖 )

En tanto que la raíz cuadrada de la varianza es el desvío estándar.

Probar si es una DP. Calcular la probabilidad: P(X<150), P(P>90), P(70<x<120)

Hallar la esperanza y el desvio estándar.

Teorema de Chebyshev: La probabilidad de que cualquier variable aleatoria X tome un valor


dentro de k desviaciones estándar de la media es al menos 1-1/k^2

Ejercicio
Algunas distribuciones de probabilidad discreta:

Distribución uniforme discreta:

Si la variable aleatoria X, toma los valores x1, x2,…,xk con idéntica probabilidad entonces la
distribución uniforme discreta está dada por:

f(x;k)=1/K con x=1, 2, 3 ,… xk

La distribución depende del parámetro k.

Por ejemplo la variable obtenida al ver la cara superior de un dado.

f(x;k)=1/6

Teorema:

La media y la varianza de una distribución uniforme discreta están dadas por:

1) Un jugador lanza un dado corriente. Si sale 1 o número primo, gana tantos cientos de
euros como marca el dado, pero si no sale número primo, pierde tantos cientos de euros
como marca el dado. Determinar la función de probabilidad y la esperanza matemática del
juego
2) Si una persona compra una papeleta en una rifa, en la que puede ganar de 5.000 € ó un
segundo premio de 2000 € con probabilidades de: 0.001 y 0.003. ¿Cuál sería el precio justo
a pagar por la papeleta?
3) Se lanza un par de dados. Se define la variable aleatoria X como la suma de las
puntuaciones obtenidas. Hallar la función de probabilidad, la esperanza matemática y la
varianza
4) Representar gráficamente cada una de las situaciones.

Distribución binomial

Procesos de Bernoulli:

Si se realiza un experimento, el cual consiste en pruebas repetidas con dos resultados posibles,
catalogados como éxitos o fracaso este proceso se llama proceso de Bernoulli y cada ensayo un
experimento de Bernoulli.

Analicen los siguientes experimentos, y determinen que tienen en común:

-Se lanza una moneda y se espera obtener una cara.

-Se lanza un dado esperando obtener un 5.

-De un lote de objetos se selecciona uno y se ve si es defectuoso.

-Se selecciona una carta de una baraja española y se espera obtener una espada.

Debe cumplir ciertos requisitos:

1) El experimento consiste en n pruebas que se repiten.

2) Cada prueba produce un resultado que se puede clasificar como éxito o fracaso.

3) La probabilidad de un éxito, que se denota p, permanece constante en cada prueba.

4) Las pruebas que se repiten son independientes.

Si se cumple esto, estamos ante una distribución binomial

Def:

Un experimento de Bernoulli puede tener como resultado un éxito con probabilidad p o un fracaso
con probabilidad q=1-p. Entonces la distribución de probabilidad de la variable aleatoria binomial
X, el número de éxitos en n pruebas independientes es:

b(x;n;p)=𝐶𝑛𝑥 . 𝑝 𝑥 . 𝑞 𝑛−𝑥 Donde x pertenece a Z/0≤x≤n también aparece n/x


Esta distribución recibe su nombre, ya que su función de probabilidad es obtenida a partir del
desarrollo del binomio de newton de la forma:r

(𝑝 + 𝑞)𝑛 = 𝐶𝑛0 . 𝑝0 . 𝑞 𝑛−0 + 𝐶𝑛1 . 𝑝1 . 𝑞 𝑛−1 + ⋯ + 𝐶𝑛𝑛 . 𝑝𝑛 . 𝑞 0

Como p+q=1

Vemos que 1 = (𝑝 + 𝑞)𝑛 = ∑𝑛𝑥=0 𝐶𝑛𝑥 . 𝑝 𝑥 . 𝑞 𝑛−𝑥 = b(x; n; p)

ver los ejemplos del libro de estadística para ingenieros. pag 132 del pdf.

Teorema:

La media y la Varianza de una distribución binomial b(x;n;p) están dadas por.

𝜇 = 𝑛. 𝑝 𝜎 2 = 𝑛. 𝑝. 𝑞

Distribución binomial negativa o de Pascal.

En relación a los ensayos de Bernoulli, algunas veces nos interesa el número de ensayos en el que
ocurre el k-esimo acierto. Por ejemplo, podemos estar interesados en la probabilidad de que el
cuarto niño expuesto a una enfermedad sea el segundo en contraerla, o bien que el quinto
examen que presente un alumno sea el segundo que repruebe, etc. Existe una distribución de
probabilidad relacionada con la binomial que se aplica en este tipo de situaciones y que recibe el
nombre de Distribución Binomial negativa o distribución de Pascal.
Una variable aleatoria X, tiene una distribución binomial negativa o de Pascal, si y solo si su
distribución de probabilidad está dada por.
𝑘−1 𝑘 𝑥−𝑘
𝑏 ∗ (𝑥; 𝑘; 𝑝) = 𝐶𝑥−1 .𝑝 𝑞 𝑃𝑎𝑟𝑎 𝑥 = 𝑘, 𝑘 + 1, 𝑘 + 2, …

Estos términos surgen de la expansión binomial de 𝑝𝑘 . (1 − 𝑞)−𝑘

Por ejemplo:

Si la probabilidad de que un automovilista de cierta ciudad se pase la luz roja en el momento en


que se acaba de poner es de 0,4 ¿Cuál es la probabilidad de que el décimo conductor que llega a
una esquina en el instante en que se acaba de poner la luz roja sea el tercero en pasarse el alto?

Tenemos. x=10…k=3….p=0,4

𝑏 ∗ (10; 3; 0,4) = 0,645

Teorema:

La media y la varianza de una distribución binomial negativa están dadas por:

𝑘 𝑘𝑞
𝜇= 𝜎2 =
𝑝 𝑝2

Si consideramos el caso especial de la distribución binomial negativa donde k=1, tenemos la


distribución de probabilidades para el número de veces que se debe realizar el experimento para
obtener 1 solo éxito. Nos quedaría:

𝑏 ∗ (𝑥; 1; 𝑝) = 𝑝𝑞 𝑥−1

A esta distribución especial, se la llama distribución geométrico porque los términos sucesivos
forman una progresión geométrica de razón q

.definición:

Una variable aleatoria X, obtenida a partir de un proceso de Bernoulli, tiene una distribución
geométrica en la que aparece el primer éxito y su forma es:

𝑔(𝑥; 𝑝) = 𝑝𝑞 𝑥−1

Ejemplo:

Se sabe que en cierto proceso de fabricación, 1 de cada 100 artículos es defectuoso. ¿Cuál es la
probabilidad de que el quinto artículo que se inspecciona sea el primer defectuoso que se
encuentra?

p=0,01 x=5
Teorema:

La media y la varianza de una distribución geométrica son:

1 𝑞
𝜇= 𝜎2 =
𝑝 𝑝2

Distribución Hipergeométrica

La diferencia entre una distribución binomial y la hipergeométrica es que la probabilidad no


permanece constante pues el muestreo se realiza sin reposición.

1: Se selecciona sin reemplazo una muestra n de una población finita N.

2: k de los N artículos se pueden clasificar como éxito y N-k como fracasos.

Ejemplo: Se selecciona al azar un comité de entre 3 químicos y 5 físicos. ¿Cuál es la probabilidad


de que el comité este integrado por 2 químicos?

el ejemplo esta en la pag. 140 pdf ingenieros.

Definición:

La distribución de probabilidad de la variable aleatoria Hipergeometrica X, el número de éxitos en


una muestra aleatoria de tamaño n que se selecciona de N artículos de los que k se denominan
éxitos y N-k fracasos, es:

𝑁−𝑘
𝐶𝑥𝑘 𝐶𝑁−𝑥
ℎ(𝑥; 𝑁; 𝑛; 𝑘) = Con x=0,1,2,….,n
𝐶𝑛𝑁

Teorema:

La media y la varianza de un distribución hipergeométrica h(x;N;n;k) están dadas por:


𝑛𝑘 𝑁−𝑛 𝑘 𝑘
𝜇= 𝑁
𝜎2 = 𝑁−1
. 𝑛. 𝑁 . (1 − 𝑁)

Demostración: realizar la demostración para la media.

hacer algunos ejercicios.

1) En un estante de un supermercado un cliente observa que sólo quedan diez focos de una oferta,
selecciona cuatro para llevarlo a su casa, pero del lote de diez tres no funcionan. ¿Cuál es la
probabilidad de que, a) todos los seleccionados funcionen, b) por lo menos dos no funcionen?

2) Un lote contiene 100 piezas de un proveedor de tubería local y 200 unidades de un proveedor
de tubería del estado vecino. Si se seleccionan cuatro piezas al azar y sin reemplazo,

(a) ¿cuál es la probabilidad de que todas sean del proveedor local?

(b) ¿Cuál es la probabilidad de que dos o más piezas de la muestra sean del proveedor local?

(c) ¿Cuál es la probabilidad de que al menos una pieza de la muestra sea del proveedor local?

Relación entre la distribución binomial y la distribución hipergeométrica.

Para el caso en que n sea pequeño comparado con N, la naturaleza de los N articulas varia muy
poco. Por lo que el cociente K/N=p

aquí podemos ver que

𝑛𝑘 𝑁−𝑛 𝑘 𝑘
𝜇= = 𝑛. 𝑝 𝜎 2 = 𝑛. 𝑝. 𝑞 → . 𝑛. . (1 − )
𝑁 𝑁−1 𝑁 𝑁

La media es la misma, mientras que la varianza difiere en el factor N-n/N-1 que para valores altos
de N y pequeños de n tiende a 1.

No es necesario que N sea muy grande para cumplirse esta relación, algunos autores se refieren a
que se puede aproximar la distribución hipergeométrica por la binomial cuando N>50 y n es
menor al 5% del tamaño de N

Ejemplo:

Se estima que 4000 de 10000 votantes de una ciudad están en contra de un nuevo impuesto a las
ventas. Si se selecciona al azar 15 votantes y se les pide la opinión. ¿Cuál es la probabilidad de que
7 de ellos estén en contra del impuesto?

Distribución de Poisson y proceso de Poisson


Los experimentos que dan valores numéricos a una variable aleatoria X, el número de resultados
que ocurren durante un intervalo de tiempo determinado o una región especifica se llaman
experimentos de Poison.

Por ejemplo, la variable aleatoria X podría ser: número de llamadas telefónicas que recibe una
oficina durante una semana, el número de juegos suspendidos durante una temporada en un
deporte, la cantidad de ratas por hectárea en un campo, el número de bacterias en un cultivo, etc.

Un Experimento de Poisson se deriva de un proceso de Poisson y tiene las siguientes


características:

-el numero de resultados que ocurren en un intervalo o región especifica son independientes del
numero que ocurren en cualquier otro intervalo o región del espacio disjunto. De esta forma
vemos que el proceso de Poisson no tiene memoria

-La probabilidad de que ocurra un solo resultado durante un intervalo de tiempo o región muy
pequeñas es proporcional al intervalo o región y no depende del número de resultados que
ocurren fuera de este intervalo.

-La probabilidad de que ocurra más de un resultado en tal intervalo o región muy pequeña es
insignificante.

Definición:

La distribución de probabilidad de la variable aleatoria de Poisson X, que representa el numero de


resultados que ocurren en un intervalo dado o región especifica que se denota con t, esta dado
po:

𝑒 −ƛ𝑡 (ƛ𝑡)𝑥
𝑝(𝑥; ƛ𝑡) = 𝑥
𝑥!
= 1,2,3 … . ƛ 𝑒𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑝𝑜𝑟 𝑢𝑛𝑖𝑑𝑎𝑑 𝑑𝑒 𝑡𝑖𝑒𝑚𝑝𝑜 𝑜 𝑟𝑒𝑔𝑖𝑜𝑛

lamda es igual a n.p, tamaño de la muestra por la probabilidad.

Ejemplo:

Durante un experimento de laboratorio, el número promedio de partículas radiactivas que pasan a


través de un contador en un milisegundo es cuatro. ¿Cuál es la probabilidad de que pasen 6
particulas en un milisegundo dado?

x=6. lamdat: 4

Demostracion de que es una distribución de probabilidad


𝑒 −ƛ ƛ𝑡 𝑥 ƛ𝑡 𝑥
∑ 𝑝(𝑥, ƛ𝑡) = ∑ = 𝑒 −ƛ𝑡 ∑ = 𝑒 −ƛ𝑡 𝑒 ƛ𝑡 = 𝑒 0 = 1
𝑥! 𝑥!

Teorema: Lamedia y la varianza de una distribución de Poisson p(x; ƛ t) es igual a ƛ𝑡

Demostración: hacemos ƛ𝑡 = 𝑢

LA distribución de Poisson como forma limitante de la binomial.


Distribuciones continuas de probabilidad.

Distribución uniforme continua

La función de densidad de la variable aleatoria uniforme continua X en el intervalo [A;B] esta dada
por:

1
𝑓(𝑥; 𝐴; 𝐵) = 𝐴≤𝑥≤𝐵 0 𝑒𝑛 𝑡𝑜𝑑𝑜 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
𝐵−𝐴

Probar que la integral da 1.

es un rectángulo de base B-A y altura, 1/B-A

Demostrar cada una.

Distribución Normal.

Entre las distribuciones continuas, la normal es la más utilizada.

También recibe el nombre de distribución de Gauss. Y su grafica recibe el nombre de curva


normal, campana de gauss o simplemente curva de gauss.
La función de densidad de la variable aleatoria Normal X con media u y varianza sigma cuadrado,
esta dada por

1 1 𝑥−𝜇 2
𝑛(𝑥; 𝜇; 𝜎) = . 𝑒 −2(𝜎
)
, 𝑐𝑜𝑛 𝑥𝜖𝑅
√2𝜋𝜎

Las propiedades que cumple la distribución normal son:

1) La Moda y la mediana ocurren en el punto máximo de la función, que se obtiene en x=u

2) La curva es simétrica respecto a la recta que pasa por u.

3) La curva normal se acerca de manera asintótica respecto al eje x conforme los valores d x se
alejan de la media en ambas direcciones.

4) La curva tiene sus puntos de inflexión en x=u+-o. Es cóncava hacia abajo u-o<x<u+o. Y convaca
hacia arriba en todo otro punto.

5) El área total bajo la curva y sobre el eje x es igual a 1.

Basandonos en la función de densidad de una variable aleatoria normal, nos encontramos con que
existen infinitas distribuciones, dependiendo de los valores de la media y la varianza. Para
simplificar el trabajo, es útil unificar estas distribuciones, de manera que podamos trabjar a todas
las distribuciones normales de una sola manera.

Surge así la idea de la Distribución Normal Estandar, con media 0 y desvio estándar 1.
𝑥−𝜇
𝑍=
𝜎

A la distribución normal con media igual a 0 y desvío igual a 1, se la llama distribución normal
estándar.

Es necesario el uso de tablas para calcular el área bajo la curva. tabla pag 36.

Ejemplo:
Aproximación normal de la binomial.

Con la aproximación de Poisson vimos que es posible la aproximación cuando n es relativamente


grande y p muy pequeño, la ventaja de la aproximación binomial es que no necesitamos que n sea
muy grande o que p sea muy pequeño, puede ser cercano a ½ inclusive.

Decimos entonces:

Si X es una variable aleatoria binomial nos u=n.p y o^2=n.p.q entonces la forma limitante de

𝑋 − 𝑛𝑝
𝑍=
√𝑛𝑝𝑞

Conforme n tiende a infinito es la distribución normal estándar n(z,0,1)

Veamoslo en un ejemplo. Sea una distribución binomial b(x,15,0,4)


Queremos calcular P(X=4) y P(6<x<9)

Para la aproximación tendremos que tener el cuenta el área del rectángulo con centro en x. es
decir que tiene un área que va de 3,5 a 4,5. y estos valores son los que vamos a estandarizar. La
suma y resta de 0,5 comunmente se le llama factor de corrección de continuidad.

La aproximación será casi perfecta cuando n es grande o cuando p es muy cercano a ½

otro ejemplo

Distribuciones muestrales.

Supóngase que de una población finita de tamaño N > n se extraen, todas las muestras posibles de
tamaño n. Si se denota con 𝜇𝑥̅ 𝑦 𝜎𝑥̅ respectivamente, a la media y a la desviación estándar de una
distribución muestral de las medias, y con μ y σ, respectivamente, a la media y la desviación
estándar poblacionales, entonces
𝜎
𝜇𝑥̅ = 𝜇 𝜎𝑥 2 =
𝑛2
Distribución muestral de la diferencia entre 2 medias.

Suponga que tenemos 2 poblaciones, la primera con media u1 y varianza sigma sub 2 cuadra, y la
segunda con media u2 y varianza sigma sub 2 cuadrado, representamos con el estadístico X1 raya

de las cuales se extraen muestras de tamaño n1 y n2. Entonces la distribución muestral de la


diferencia de medias X1-X2 raya, está distribuida aproximadamente de forma normal con media y
varianza dadas por.

𝜎12 𝜎12
𝜇̅̅̅̅̅̅
𝑋1 −̅̅̅̅
𝑋2 =𝜇1 −𝜇2 𝜎̅𝑥2̅̅̅−𝑋
1 ̅̅̅̅
= + 𝐷𝑒 𝑎𝑞𝑢𝑖 𝑞𝑢𝑒
2 𝑛1 𝑛2

̅̅̅1 − ̅̅̅
(𝑋 𝑋2 ) − (𝜇1 − 𝜇2 )
𝑍=
𝜎2 𝜎2
√ 1 + 1
𝑛1 𝑛2

Es aproximadamente una variable normal estándar.


Distribución t.

En la plicación del teorema del limite central del comportamiento de la distribución de medias en
forma normal, se supone que se conoce a varianza poblacional. Ahora, en el caso en que este valor
se desconosca, se utiliza la distribución T, que se define como

Los grados de libertad son el número de variables aleatorias independientes de la muestra.

Estimaciones puntuales y por intervalos.


Una estimación es un procedimiento que nos permite a través de las medidas obtenidas de una
muestra, calculas los valores poblacionales.

Las medidas que se calculan con los datos extraidos de una muestra se llaman “Estimadores o
estadisticos”y los correspondientes a la población se llaman parámetros.

hacer cuadrito de estimación

proporción es: el número de individuos que cumple con una determinada condición sobre el total
de la población.

Es decir: Con los estimadores muestrales inferimos los parámetros poblacionales.

Una estimación puede hacerse de manera puntual y por intervalos.

Estimación puntual.

Realizar una estimación puntual es dar un único valor como posible parámetro poblacional.

Es decir, se toma una muestra de la población y aplicando cierta fórmula, se obtiene una
estimación puntual del parámetro. Podemos decir, entonces, que el estimador es una función de
las observaciones de la muestra.

Estimación por intervalos.

Esta estimación, a diferencia de la anterior, consiste en obtener un intervalo, que tiene una cierta
probabilidad de contener al verdadero valor del parámetro. Este intervalo puede construirse para
diferentes parámetros: la media poblacional u, el desvío estándar poblacional sigma, la proporción
poblacional P.

Siendo un intervalo, la estimación no se limita a un solo valor numérico, sino que se estima
mediante un rango de valores con cierta confianza
La estimación por intervalo de confianza se realiza mediante un intervalo aleatorio, determinado
por un límite inferior y un límite superior. Estos límites son variables que dependen de elementos
tales como, el tamaño de la muestra (n) y el nivel de confianza que se simboliza con 1- alfa.

Dado un parámetro poblacional 𝜃 decimos que

P(a< 𝜃 <b)=(1- 𝛼).100%

Cabe señalar que:


Para un mismo tamaño de muestra n, si deseamos aumentar el nivel de confianza,
aumentará la amplitud del intervalo, es decir, que la precisión disminuye.
Para una misma confianza 1- , si aumentamos el tamaño de la muestra n, disminuirá la
amplitud del intervalo; o sea, que aumenta la precisión (observe que .n. se encuentra en los
denominadores dentro del intervalo de confianza).
Para tener una confianza del 100%, hay dos alternativas: trabajar con toda la población, no
con una muestra; o bien, trabajar con el intervalo (- ; + ), lo cual no tendría ninguna
utilidad.

Una sola muestra: Estimación de la media.

La media muestral se utiliza como una estimación de de la media poblacional. Si la muestra se


selecciona de una población normal, o ante la falta de esto con n suficientemente grande
podemos establecer un intervalo de confianza para mu considerando la distribución muestral de
medias x raya. Que de acuerdo al teorema del límite central nos dice que se distribuye
normalmente con media u sub aquis raya igua a mu, y sigma sub equis igual a sigma sobre raíz de
n.

Partimos de 𝑃 (−𝑧𝛼 ≤ 𝑍 ≤ 𝑧𝛼 ) = 1 − 𝛼
2 2
De aquí que si deseamos buscar cual es el tamaño de una muestra para tener un error menor que
𝑧𝛼/2 2
un valor e tenemos que 𝑛 = ( )
𝑒

En el caso en que no se conozca la desviación estándar de la muestra, podemos utilizar el desvio


estándar de una muestra, y utilizando T estimar igualmente la media de la población.

Sabemos que la variable aleatoria T tiene una distribución t con v=n-1 grado de libertad.

Podemos entonces construir un intervalo de confianza para mu.


El proceso de construcción es el mismo, solo que sigma se reemplaza por S, y la distribución
normal estándar por t.

𝑃 (−𝑡𝛼 ≤ 𝑇 ≤ 𝑡𝛼 ) = 1 − 𝛼
2 2

de donde

𝑆 𝑆
𝑃 (𝑋̅ − 𝑡𝛼 ≤ 𝜇 ≤ 𝑋̅ + 𝑡𝛼 ) = 1 − 𝛼
√𝑛 2 √𝑛 2

Tengamos en cuenta, que la distribución t se supone extraída de una población normal, en el caso
en que la población no fuera normal, la muestra debería ser mayor a 30, para lograr una buena
aproximación.

Para encontras t sub alfa sobre 2 se hace 1 menos alfa sobre dos. y se busca en la tabla el valor
correspondiente.
Dos muestras: estimación de la diferencia de medias.

Podemos encontrar 2 casos, cuando se conoce y cuando se desconoce el desvio estándar


poblacional.

Si se conoce, se estima el intervalo utilizando una distribución normal para encontrar el intervalo
de confianza.

Vous aimerez peut-être aussi