Académique Documents
Professionnel Documents
Culture Documents
Definición de Estadística.
- Descriptiva: todo cúmulo de datos cuantitatvios sobre un conj. de individuos que tienen un
atributo en común.
- Cálculo de Probabilidad: métodos adecuados para dar significado a un conjunto de datos,
afectados por el azar, usando instrumentos de la matemática.
- Inferencial: recopilación, presentación, análisis e interpretación de daros numéricos extraídos
de un conj de individuo, que permiten formular conclusiones válidas y efectuar decisiones
basadas en dicho análisis y extender los resultados desde un grupo pequeño a uno mas grande.
Estadística descriptiva e inferencial.
- Descriptiva: se refiere en un sentido técnico a la rama de la matemática aplicada que se ocupa
de interpretar pos resultados numéricos, elaborar tablas y gráficos explicativos para después
inferir parámetros etadisticos que caracterizan al conj total de datos.
- Inferencial: ciencia que estudia a los fenómenos regidos por el azar, midiendo los riesgos y
llevando a valores numérico los resultados de hechos aleatorios, observando el comportamiento
de una muestra y generalizando conclusiones a toda una población. Trata de la generalización
hacia la población de resultados obtenidos en las muestras y de las condiciones bajo las cuales
estas conclusiones son válidas.
El lenguaje de la estadística.
Teoría de las muestras: establece resultados calidos para una población númerosa partiendo de
la observación del comportamiento de una parte de la misma, la muestra, que bajo ciertas
condiciones, resulta representativa de las características de la población.
- Poblacion: conjunto de todos los elementos que cumplen una determinada característica, que
deseamos medir o estudiar.
- Muestra: cualquier subconjunto de la población.
- Unidad estadística: cada individuo de una población.
- Carácter estadístico: propiedad del atributo que estamos aislando para estudiarla.
Estos a su vez se clasifican en:
1) Carácter estadístico cualitativo o atributo: no es medible, contable, no es cuantitativo. Las
distintas modalidades de un carácter deben cubrir todas las posibilidades y deben ser
exhaustivas y no se puede presentar más de una de ellas pero si una.
Para medir esta variables se usan las siguientes escalas:
- Escalas Nominales: las categorías no mantienen un orden entre sí
- Escalas Ordinales: existe un cierto orden o jerarquía entre las categorías.
2) Carácter estadístico cuantitativo: lo podemos clasificar numéricamente.
- Carácter estadístico discreto: entre 2 elementos consecutivos no existe un valor intermedio.
(Conteo)
- Carácter estadístico continuo: entre 2 elementos consecutivos puede existir uno intermedio.
(Mediciones)
∑(xi−X)2 .𝑓𝑖
- Varianza: Var(x)= 𝑛
Medidas de Concentración
𝑖.𝑛
( −∑𝑓 𝑎𝑛𝑡).𝑐
- Cuartiles: Qi= LRI+ 4
𝑓𝑄𝑖
𝑖.𝑛
( −∑𝑓 𝑎𝑛𝑡).𝑐
- Deciles: Di= LRI+ 10
𝑓𝐷𝑖
𝑖.𝑛
( −∑𝑓 𝑎𝑛𝑡).𝑐
- Percentiles: Pi= LRI+ 100
𝑓𝑃𝑖
(𝑋𝑖−𝑋)3 .𝑓𝑖
∑
Coeficiente de Asimetría de Fisher: As= 𝑛
𝑠3
Modulo N°2: Regresión y Correlación
Diagrama de Dispersión
Es una gráfica que se representa en un sistema de ejes cartesianios, en la cual se marcan los
pares ordenados (x;y) correspondientes a los datos apareados que resultan de las mediciones
experimentales de las dos variables X e Y.
Los puntos pueden mostrar una tendencia curva o lineal, lo cual representa la relación entre las
variables.
Cuando no hay una curva que de ajuste que se adapte a al comportamiento entre las variables
se dice que son independientes.
Además de ser curva o lineal, la relación puede ser positiva o negativa, perfecta o imperfecta.
Teorema de la multiplicación
Si A y B son dos sucesos dependientes tales que P (A) y P (B/A) son conocidas, la ocurrencia
simultánea de estos eventos P (A∩B), es igual al producto de la probabilidad de uno de ellos por
la probabilidad condicional del otro, calculada suponiendo que el primer suceso ya ha ocurrido.
(evtos dependientes)
P (A∩B)= P (B/A). P (A)
Eventos independientes
Los eventos A y B son sucesos independientes si el hecho de que acontezca uno, no tiene
ningún efecto en la probabilidad del otro, es decir, si P (B/A)= P (B), es decir
P (A∩B)= P (A). P (B)
Teorema de Bayes
Diagrama de árbol (probs coondicionadas)
Módulo N°4: Variable aleatoria
Definición de variable aleatoria
Una variable aleatoria X de un esp muestral E es una función que hace corresponder a cada
elemento de E un nro real. Convierte a las muestras en nro reales, sean o no elementos
cuantitativos.
EL conj de valores que pude tomar la variable aleatoria X se lo llama recorrido de la variable
aleatoria.
Clasificación de variables aleatorias
1) Variables discretas (VAD): entre 2 valores consecutivos de la misma variable no existe un
valor intermedio. Tiene un esp muestral finito o infinito numerable.
2) Variables continuas (VAC): entre 2 valores cualesquiera de misma variable siempre existen
valores intermedios. Tiene un espacio muestral infinito no numerable.
Variable aleatoria discreta
Función de probabilidad
Es la función que hace corresponder a cada elemento del espacio muestral el valor de su
probabilidad
Propiedades de la fc de probabilidad
1) La prob de cualquier valor de la variable si es positiva y entre 0 y 1
2) La suma de las prob de todos los valores que puede tomar la variable e igual a 1, es decir al
100%
3) La prob del evto imposible es nula
Esperanza de una variable aleatoria discreta
Desigualdad de Chebyshev
Para un conjunto cualquiera de observaciones (muestra o población),la proporción mínima de los
valores que se encuentran dentro de k desviaciones estándares a partir de la media es mayor o
1
igual que 1- 𝑘 2 , donde k es una constante mayor que 1
En símbolos:
1
P[│x- E(x)│< 𝑘 𝜎𝑥] > 1 − donde E(x)= µ
𝑘2
O sino:
1
P[│x- E(x)│≥ 𝑘 𝜎𝑥] ≤ donde E(x)= µ
𝑘2
𝜎= √𝑝. 𝑞
Distribución Binomial
- Solo se realiza si es proceso es con reposición
- p y q salen de analizar cada uno como un Bernoulli y son las mismas en toda la experiencia,
son constantes
- nro finito de pruebas
𝑛
Modelo binomial: b(k;n;p)= ( ). 𝑝𝑘 . 𝑞 𝑛−𝑘
𝑘
Donde: n: nro de veces; k: nro de éxitos
E (x)= n.p
Var (x)= n.p.q
Número más probable de repeticiones de un suceso
p.n-q≤ 𝑥0 ≤p.n+p
Distribución Multinomial
- Se esperan más de 2 tipos de resultados
- Las probs asociadas a cada uno de los resultados son constantes
- Cada una de las repeticiones del experimento son independientes
- El nro de repeticiones de experimento es constante
Distribución Hipergeométrica
- Se toma una muestra de tamaño n, sin reemplazo de un conj finito de N objetos
- k de los N objetos se puede clasificar como éxitos y N-K fracasos.
- No hay reposición
Distribución de Poisson
Se usa mucho en procesos donde existe una obervación por unidad de tiempo o espacio
- Debe existir un nro fijo y finito de pruebas
- Cada una de las pruebas tiene solo 2 resultados o q
- La prob del éxito es la misma es cada prueba
- Las pruebas son estadísticamente independientes
- El tamaño de la muestra debe ser grande
- La probabilidad de éxito es pequeña
ℯ −𝜆 .𝜆𝑘
P (X=k)=
𝑘!
3) Todas las curvas son simétricas respecto a la vertical que pasa por el pto max
4) Todas las curvas normales tienen forma de campana, cerca de su pto max son convexas,
tienen 2 ptos de inflexión x=𝜇 − 𝜎 y x= 𝜇 + 𝜎 donde se vuelven cóncavas.
5) El área entre la curva normal y el eje x es = a 1
6) Media, mediana y moda coinciden y corresponden al pto máximo de la curva
La distribución normal queda definida por 2 parámetros, su media y su desviación estándar y la
representamos así N(𝜇𝑥; 𝜎𝑥)
El área del intervalo (a;b), debajo de la curva y encima del eje x, es la prob P(𝑎 ≤ 𝑥 ≤ 𝑏).
Los valores µ y 𝜎 determinan la forma y situación de la curva normal.
- La distribución de una variable aleatoria normal con media 0 y desviación estándar 1 se llama
distribución normal estándar.
1 2
1
Su función de densidad es f (z)= . 𝑒 −2(𝑧)
√2𝜋
Propiedades de toda curva normal estándar
1) Caracteriza a las VAC
2) Tiene forma de campana, simétrica resecto al eje y
3) E (x)=0 y 𝜎= 1
4) Media= Mediana= Mo da= 0
5) Puntos de inflexión en z=±1=±𝜎
6) Máximo en z=0
7) El área entre la curva normal estándar y el eje z es= a 1
8) Es asintótica respecto al eje z
Grados de libertas
Es el nro de valores que podemos elegir libremente.
Distribución Chi-Cuadrado
𝑁−𝑛
Cpf: √𝑁−1
𝜎𝑥 𝑁−𝑛
Entonces sería: 𝜎𝑥 = . √𝑁−1
√𝑛