Académique Documents
Professionnel Documents
Culture Documents
Misantla, Ver
Introduccin
02 de septiembre de 2015
Desarrollo
1. Qu es la probabilidad y la estadstica.
La estadstica es una ciencia que proporciona un conjunto de procedimientos o pasos para poder
recopilar, ordenar, presentar y analizar los datos para posteriormente describirlos o inferencias.
El estudio de fenmenos aleatorios, en donde el aspecto ms importante es la obtencin de conclusiones
basadas en los datos experimentales (Canavos, 1988). Evidentemente se puede observar que la
estadstica va de la mano con la probabilidad como ciencia de apoyo sobre todo en la estadstica
inferencial.
La probabilidad Es un mecanismo por medio del cual pueden estudiarse sucesos aleatorios, cuando stos
se comparan con los fenmenos determinsticos (Canavos, 1988) se puede argumentar que la probabilidad
es una ciencia que proporciona una medida de confiabilidad para hacer generalizaciones o inferencias para
un determinado evento aleatorio.
La esencia de tomar una decisin en la estadstica, es decidir a partir de una evidencia experimental
obtenida de una muestra aleatoria, si los datos obtenidos de la muestra aleatoria apoyan estadsticamente
a la decisin (realizada en base a la probabilidad) se considera pertinente aprobar dicha decisin y en caso
de que la probabilidad de un valor mnimo o pequeo, se rechaza.
Para ello es importante conocer la manera de calcular las medidas de tendencia central como es la media,
mediana y moda, as como las medidas de dispersin, debido a que a partir de ellas se puede describir el
comportamiento de los datos para posteriormente tomar una decisin con el apoyo de la probabilidad.
Supongamos que una empresa decide realizar mantenimiento preventivo a una determinada lnea de
produccin en la cual una de las actividades consiste en el cambio de banda en un sistema de transmisin
de velocidad, para poder determinar la frecuencia del tiempo en que se debe cambiar la banda, se basar
en el comportamiento anterior de dicho elemento, es decir los antecedentes histricos de su vida til y es
ah donde entra la probabilidad y estadstica, a partir de la recoleccin de informacin, el anlisis y la
interpretacin de los resultados obtenidos, as como de la probabilidad de que dicha banda falle con la
frecuencia en las que ha fallado anteriormente. Y es as como considero la importancia en la toma de
decisiones con un ejemplo fcil de entender.
medidas de tendencia central nos proporcionan informacin sobre el comportamiento de la poblacin pero
no son suficientes para poder realizar conclusiones o inferencias al respecto, es por ello que se debe hacer
uso de las medidas de dispersin para poder describir al conjunto de valores de una variable dada y cmo
se comportan respecto a la media.
Las medidas de dispersin de o variabilidad respecto a la media permiten ampliar la descripcin de los
datos e inclusive, hacer comparacin con otras series. Tambin sirven como una medida del grado de
asimetra y finalmente, permiten comparar la curtosis de distribuciones simtricas respecto a la distribucin
mesocrtica o normal.
En la siguiente imagen se puede observar tres tipos de distribuciones simtricas y que a partir de la curtosis
se puede hacer inferencia del comportamiento de los datos.
5. Curtosis y asimetra.
La curtosis es la propiedad de una distribucin de frecuencias por la cual se compara la dispersin de los
datos observados cercanos al valor central con la dispersin de los datos cercanos a ambos extremos de la
distribucin. La curtosis se mide en comparacin a la curva simtrica normal o mesocrtica. (Crdova,
1995)
En la figura 1 se observa que existen tres tipos de curvas simtricas y que su curtosis es diferente en cada
uno de los casos, para la curva leptocrtica se puede observar que su curtosis es mayor que la normal y
que la platicrtica tiene menor curtosis, es decir la curtosis se entiende tambin como que tan puntiaguda
esta la curva respecto a la normal y a partir de esto se puede afirmar tambin que la curva leptocrtica es la
de mayor curtosis pero tambin es vlido decir que en ella los datos se encuentran ms uniformes respecto
al centro, en otras palabras, que su desviacin estndar es menor.
Existe una frmula para calcular la curtosis basada en percentiles, es poco usada por su inestabilidad, pero
sirve para describir el concepto anteriormente mencionado.
K=
P75P25
0.5
P90P10
Si el valor de K=0 es una distribucin de tipo normal. Si K tiende a 0.5 es de tipo leptocrtica y si K tiende a
-0.5 hablamos de una distribucin platicrtica.
Para comenzar a hablar sobre la asimetra es necesario entender el concepto de simetra, Crdova (1995)
usa la siguiente definicin: se dice que una distribucin de frecuencias es simtrica, si los intervalos
equidistantes del intervalo central tienen iguales frecuencias. Tambin se dice que una distribucin es
simtrica si su curva de frecuencias es simtrica con respecto al centro de los datos.
En el caso de una curva simtrica, los valores de la media, mediana y moda coinciden, caso contrario, si
estos valores no coinciden, entonces se concluye que la distribucin es asimtrica.
Para determinar la asimetra de una distribucin se usan diversos mtodos, uno de ellos es el ndice de
asimetra de Pearson.
As=
3 ( x Me )
s
Si As (ndice de asimetra de Pearson) es igual a cero, es una distribucin simtrica y los valores de la
media, mediana y moda coinciden (=Me=Mo) pero si As es diferente a cero sin duda se habla de una
distribucin asimtrica, donde si As>0 es asimtrica positiva o de cola derecha y si As<0 es asimtrica
negativa o sesgada a la izquierda.
7. Poblacin y muestra
En el lenguaje de la estadstica, uno de los conceptos ms elementales es el muestreo. En casi todos los
problemas de estadstica, un nmero especificado de mediciones o datos, es decir, una muestra, se toma
de un cuerpo de mediciones ms grande llamado poblacin. Mendenhall et al. (2010).
A partir de la definicin anterior se entiende que la poblacin es un conjunto de elementos que poseen
caractersticas medibles ya sean de tipo cualitativo o cuantitativo, mientras que la muestra es una parte
representativa de la poblacin, la cual debe ser tomada al azar y que proporciona informacin de la
poblacin de la que proviene.
Un aspecto que es importante mencionar que para llevar a cabo la investigacin cientfica se debe decidir si
se trabajar con la poblacin o con la muestra, que en s los procedimientos y frmulas para describirlas
son las mismas y lo nico que cambia es la nomenclatura utilizada.
8. Desviacin cuartil.
La desviacin cuartil es una medida de dispersin o de variabilidad que mide que tan separados se
encuentran los datos respecto a la media. Otro nombre que se le da comnmente a la desviacin cuartil es
rango semiintercuartil y no es ms que el rango intercuartil dividido entre dos.
El rango intercuartil RI, es la diferencia entre sus cuartiles tercero y primero. (Crdova, 1995) Esto es:
RI =Q3Q1
Se puede observar que al trabajar con el tercer y primer cuartil se excluyen al 25% de los valores ms
bajos y ms altos; por lo tanto, si la desviacin cuartil es la mitad de rango intercuartil, entonces el valor se
asocia con la mediana.
x = x i / n
i=1
Ejemplo1. Las calificaciones obtenidas por un alumno de ingeniera industrial de segundo semestre en el
ITSM son: 78, 82, 95, 83, 100, 72. Cul es el promedio que obtuvo en el semestre? En este caso se tiene
n= 6 que es el nmero de datos, a continuacin se realiza la suma de cada uno de los datos dando un total
de 510 y finalmente se divide entre el total de los datos, obteniendo as la media o el promedio de las
calificaciones la cual es 85.
El propsito de la mediana de la muestra es reflejar la tendencia central de la muestra de manera que no
sea influida por los valores extremos (Walpole, Myers, Myers, & Keying, 2012).
Para calcular la media Me, solo basta con ordenar los datos en orden creciente o decreciente y el valor que
divida en dos a los datos, es el valor de Me. En caso de que n sea par, se debe realizar la semisuma de los
dos valores centrales.
Ejemplo 2. Retomando el ejemplo anterior, se ordena en orden creciente las calificaciones del alumno
72, 78, 82, 83, 95, 100 se observa que n es par, por lo tanto se toman los dos valores centrales que dividen
exactamente a la mitad a la serie de datos y se realiza la semisuma en este caso Me=(82+83)/2=82.5
La moda de un conjunto de observaciones es el valor de la observacin que ocurre con mayor frecuencia
en el conjunto. (Canavos, 1988).
Ejemplo 3. Continuando con los datos del ejemplo 1 en la serie 72, 78, 82, 83, 95, 100 se observa que
ningn dato se repite, por lo que se argumenta que no existe la moda o bien, que todos los datos son
moda.
R= X max X min
La varianza se define como la media aritmtica de los cuadrados de las diferencias de los datos con
respecto a su media aritmtica. (Crdova, 1995). La varianza tambin es una medida de dispersin que
permite saber que tan alejados se encuentran los datos respecto a la media, si los valores se concentran
cerca de la media, se argumenta que la varianza es pequea en caso contrario, cuando la varianza es
grande es porque los datos se encuentran distribuidos lejos de la media, la forma en que se denota la
varianza es s2 si se trabaja con la muestra y 2 si se refiere a la poblacin.
La desviacin estndar es la raz cuadrada de la varianza y se denota con s si se refiere a muestra y
Las frmulas para calcular la varianza tambin dependen si los datos estn agrupados o no, a continuacin
se muestran las frmulas para calcularla en los diversos casos.
S=
( )
2
i
x /n x
i=1
S=
(
i=1
2
i
f i x / n x
S=
(
i=1
f i m 2i / n x 2
intervalos.
El coeficiente de variacin, C. V. es una medida de dispersin relativa (libre de unidades de medidas), que
se define como la desviacin estndar dividido por la media aritmtica. (Crdova, 1995). Esto es:
C . V .=s / x
El C.V. se utiliza para poder realizar comparaciones de la variabilidad entre dos o ms series de datos, por
ejemplo, considere las calificaciones en estadstica de dos grupos (A y B) ambos poseen una desviacin
estndar de s=1.2 el promedio del grupo A es de 9.3, mientras que del grupo B es de 8.7, el CV para el
grupo A es de s=1.2/9.3 = 0.129 = 12.9% y para el grupo B el CV= 1.2/8.7 = 0.137 = 13.7% por lo que se
puede concluir que las calificaciones del grupo A son ms homogneas que las del grupo B debido a que el
C.V. es menor.
11. Histograma.
Al graficarse las frecuencias relativas de las clases contra sus respectivos intervalos en forma de
rectngulos, se produce lo que comnmente se conoce como histograma de frecuencia relativa o
distribucin de frecuencia relativa. Esta ltima es la que puede hacer evidentes los patrones existentes en
un conjunto de datos. (Canavos, 1988)
En acuerdo a la definicin anterior, un histograma es un grfico de barras verticales juntas en el que el
ancho de la barra es la amplitud del intervalo y la altura corresponde no precisamente a la frecuencia
relativa, puede ser incluso a la frecuencia absoluta o a la frecuencia porcentajes.
A continuacin se muestra un ejemplo de histograma obtenido a partir de una distribucin de frecuencias
del nmero de unidades vendidas de cierto producto.
Conclusin
Con la elaboracin de este trabajo se pudieron resolver algunas dudas que tena respecto a las frmulas
para clculo de las medidas de tendencia central y para las medidas de dispersin. Tambin se logr
comprender con mayor claridad la diferencia entre la estadstica descriptiva y la estadstica inferencial, as
como el papel importante que representan en la toma de decisiones y que a su vez estas van muy ligadas a
la probabilidad la cual proporciona herramientas para eliminar la incertidumbre total en un evento de tipo
aleatorio.
Otros de los temas que me resultaron muy interesantes fue la forma en la que se pueden ordenar los datos
a travs de los cuadros numricos o comnmente conocidos como distribucin de frecuencias debido a que
estos deben tener un nombre acorde a la variable que se est estudiando y no solo eso, tambin se debe
tomar en cuenta el tipo de variable hblese de una variable cualitativa y cuantitativas, pues si no se realiza
una buena distribucin de frecuencias, esto resultar en inconvenientes al momento de representar dicha
tabla por medio de grficos y el estudio de la poblacin sera errneo.
Finalmente concluyo que la elaboracin de este trabajo de investigacin de los once temas presentados,
son de vital importancia debido a que me permitieron recordar y aprender nuevos conceptos que servirn
como base para temas ms complejos que abarca el estudio de la probabilidad y estadstica y que sin ellos
resultara ms complejo entenderlos.
Referencias
Canavos, G. C. (1988). Probabilidad y estadstica aplicaciones y mtodos. Mxico: McGraw-Hill.
Crdova, M. (1995). Estadstica descriptiva e inferencial aplicaciones. Lima, Per: MOSHERA S.R.L.
Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2010). Introduccin a la probabilidad y estadstica. Mxico,
D.F.: Cengage Learning Editores S.A de C.V.
Walpole, R. E., Myers, R. H., Myers, S. L., & Keying, Y. (2012). Probabilidad y estadstica para ingeniera y
ciencias novena edicin. Estado de Mxico: Pearson Educacin de Mxico S.A. de C.V.