Vous êtes sur la page 1sur 13

Instituto Tecnolgico Superior de Misantla

Maestra en Ingeniera Industrial


Estadstica.
Actividad:
Importancia de la probabilidad y estadstica y su relacin en
la toma de decisiones.
Presenta:
Jos de Jess Mendoza Osorio.
Matricula:
MII-0101
Asesor:
M.I.A. Luis Enrique Garca Santamara.

Misantla, Ver

Introduccin

02 de septiembre de 2015

El trabajo que a continuacin se presenta, tiene la finalidad de demostrar la importancia de la probabilidad y


estadstica y su relacin en la toma de decisiones, es por ello que se abordan once temas de vital
importancia en los cuales se comienza definiendo lo que es la probabilidad y la estadstica y la relacin que
guardan entre s dichas ciencias.
Posteriormente se abordan temas de mayor complejidad permitiendo al lector comenzar a entender los
temas generales como son definiciones, clasificacin y la importancia de la probabilidad y estadstica en la
toma de decisiones, hasta temas de mayor complejidad como son las medidas de tendencia central y las
medidas de dispersin.
Para facilitar la comprensin de los temas con mayor grado de complejidad que aqu se presentan, se
muestran imgenes, tablas, formulas y algunos ejemplos sencillos que permitirn al lector familiarizarse con
los temas bsicos de la probabilidad y estadstica.
Finalmente, se proporciona una conclusin en la que se mencionan los resultados obtenidos con la
elaboracin de este trabajo.

Desarrollo

1. Qu es la probabilidad y la estadstica.
La estadstica es una ciencia que proporciona un conjunto de procedimientos o pasos para poder
recopilar, ordenar, presentar y analizar los datos para posteriormente describirlos o inferencias.
El estudio de fenmenos aleatorios, en donde el aspecto ms importante es la obtencin de conclusiones
basadas en los datos experimentales (Canavos, 1988). Evidentemente se puede observar que la
estadstica va de la mano con la probabilidad como ciencia de apoyo sobre todo en la estadstica
inferencial.
La probabilidad Es un mecanismo por medio del cual pueden estudiarse sucesos aleatorios, cuando stos
se comparan con los fenmenos determinsticos (Canavos, 1988) se puede argumentar que la probabilidad
es una ciencia que proporciona una medida de confiabilidad para hacer generalizaciones o inferencias para
un determinado evento aleatorio.

2. Clasificacin general de la estadstica.


La estadstica se clasifica en dos ramas: La estadstica descriptiva y la estadstica inferencial.
La estadstica descriptiva est formada por procedimientos empleados para resumir y describir las
caractersticas importantes de un conjunto de mediciones. (Mendenhall, Beaver, & Beaver, 2010). La
estadstica descriptiva se relaciona con la descripcin e interpretacin de datos a partir de la presentacin
en tablas y grficas y en dichos datos no existe incertidumbre, mientras que la estadstica inferencial es un
conjunto de mtodos en el que a partir de una muestra se hacen generalizaciones o inferencias de la
poblacin, en este caso existe incertidumbre por lo que la estadstica inferencial hace uso de la
probabilidad como medida de confiabilidad.
Es importante mencionar que la estadstica inferencial y la descriptiva no son ramas que se excluyen
mutuamente, debido a que se requiere conocer los mtodos utilizados en la estadstica descriptiva para
poder utilizar los mtodos de la inferencia estadstica.

3. Probabilidad y estadstica en la toma de decisiones.

La esencia de tomar una decisin en la estadstica, es decidir a partir de una evidencia experimental
obtenida de una muestra aleatoria, si los datos obtenidos de la muestra aleatoria apoyan estadsticamente
a la decisin (realizada en base a la probabilidad) se considera pertinente aprobar dicha decisin y en caso
de que la probabilidad de un valor mnimo o pequeo, se rechaza.
Para ello es importante conocer la manera de calcular las medidas de tendencia central como es la media,
mediana y moda, as como las medidas de dispersin, debido a que a partir de ellas se puede describir el
comportamiento de los datos para posteriormente tomar una decisin con el apoyo de la probabilidad.
Supongamos que una empresa decide realizar mantenimiento preventivo a una determinada lnea de
produccin en la cual una de las actividades consiste en el cambio de banda en un sistema de transmisin
de velocidad, para poder determinar la frecuencia del tiempo en que se debe cambiar la banda, se basar
en el comportamiento anterior de dicho elemento, es decir los antecedentes histricos de su vida til y es
ah donde entra la probabilidad y estadstica, a partir de la recoleccin de informacin, el anlisis y la
interpretacin de los resultados obtenidos, as como de la probabilidad de que dicha banda falle con la
frecuencia en las que ha fallado anteriormente. Y es as como considero la importancia en la toma de
decisiones con un ejemplo fcil de entender.

4. Caractersticas de una distribucin de frecuencias (tendencia central,


dispersin y sesgo)
Despus de la recopilacin de los datos, es necesario resumirlos y presentarlos en forma tal, que faciliten
su comprensin y su posterior anlisis y utilizacin. Para ello, se ordenan en cuadros numricos y luego se
representan en grficos. (Crdova, 1995)
Se denomina distribucin de frecuencias a los cuadros numricos de una sola variable y estos se pueden
realizar dependiendo de su tipo, debido a que hay distribucin de frecuencias de variables cualitativas y
cuantitativas.
Estas a su vez se pueden ordenar en los cuadros numricos por medio de los valores que tome la variable
o por intervalos, esto prcticamente va a depender del tamao de la muestra que se tome.
Una vez obtenida la distribucin de frecuencias, posteriormente se representan de manera grfica por
medio de histogramas, polgonos de frecuencia, curvas de frecuencia, grafico circular, etc. Una de las
representaciones grficas ms importantes son los histogramas y la curva de frecuencia, en esta ltima se
pueden observar aspectos fundamentales como simetra, asimetra, dispersin a partir de la curtosis, etc.
Las medidas de tendencia central, denominados tambin promedios, ubican el centro de los datos como la
media aritmtica, la media geomtrica, la media armnica y la mediana (Crdova, 1995) en este caso estas

medidas de tendencia central nos proporcionan informacin sobre el comportamiento de la poblacin pero
no son suficientes para poder realizar conclusiones o inferencias al respecto, es por ello que se debe hacer
uso de las medidas de dispersin para poder describir al conjunto de valores de una variable dada y cmo
se comportan respecto a la media.
Las medidas de dispersin de o variabilidad respecto a la media permiten ampliar la descripcin de los
datos e inclusive, hacer comparacin con otras series. Tambin sirven como una medida del grado de
asimetra y finalmente, permiten comparar la curtosis de distribuciones simtricas respecto a la distribucin
mesocrtica o normal.
En la siguiente imagen se puede observar tres tipos de distribuciones simtricas y que a partir de la curtosis
se puede hacer inferencia del comportamiento de los datos.

Fig. 1 Curvas simtricas a) normal, b) platicrtica, c) leptocrtica. (Crdova, 1995)


Por ltimo es importante mencionar que existen distribuciones que no son simtricas y tienen sesgo, es
decir, es la inclinacin que tiene el grfico de una distribucin de frecuencias y esta puede estar inclinada a
la derecha, a la izquierda o al centro (cuando es al centro es insesgada o simtrica)

Fig. 2 Curvas asimtricas. (Crdova, 1995)

5. Curtosis y asimetra.

La curtosis es la propiedad de una distribucin de frecuencias por la cual se compara la dispersin de los
datos observados cercanos al valor central con la dispersin de los datos cercanos a ambos extremos de la
distribucin. La curtosis se mide en comparacin a la curva simtrica normal o mesocrtica. (Crdova,
1995)
En la figura 1 se observa que existen tres tipos de curvas simtricas y que su curtosis es diferente en cada
uno de los casos, para la curva leptocrtica se puede observar que su curtosis es mayor que la normal y
que la platicrtica tiene menor curtosis, es decir la curtosis se entiende tambin como que tan puntiaguda
esta la curva respecto a la normal y a partir de esto se puede afirmar tambin que la curva leptocrtica es la
de mayor curtosis pero tambin es vlido decir que en ella los datos se encuentran ms uniformes respecto
al centro, en otras palabras, que su desviacin estndar es menor.
Existe una frmula para calcular la curtosis basada en percentiles, es poco usada por su inestabilidad, pero
sirve para describir el concepto anteriormente mencionado.

K=

P75P25
0.5
P90P10

Si el valor de K=0 es una distribucin de tipo normal. Si K tiende a 0.5 es de tipo leptocrtica y si K tiende a
-0.5 hablamos de una distribucin platicrtica.
Para comenzar a hablar sobre la asimetra es necesario entender el concepto de simetra, Crdova (1995)
usa la siguiente definicin: se dice que una distribucin de frecuencias es simtrica, si los intervalos
equidistantes del intervalo central tienen iguales frecuencias. Tambin se dice que una distribucin es
simtrica si su curva de frecuencias es simtrica con respecto al centro de los datos.
En el caso de una curva simtrica, los valores de la media, mediana y moda coinciden, caso contrario, si
estos valores no coinciden, entonces se concluye que la distribucin es asimtrica.
Para determinar la asimetra de una distribucin se usan diversos mtodos, uno de ellos es el ndice de
asimetra de Pearson.

As=

3 ( x Me )
s

Si As (ndice de asimetra de Pearson) es igual a cero, es una distribucin simtrica y los valores de la
media, mediana y moda coinciden (=Me=Mo) pero si As es diferente a cero sin duda se habla de una

distribucin asimtrica, donde si As>0 es asimtrica positiva o de cola derecha y si As<0 es asimtrica
negativa o sesgada a la izquierda.

Fig. 3 distribucin simtrica y asimtricas. (Crdova, 1995)

6. Formas de distribucin de frecuencias.


A continuacin se muestran algunos ejemplos de distribucin de frecuencias, en donde se puede observar
que los aspectos fundamentales son: ttulo adecuado, fuente y unidades y como su nombre lo dice
distribucin de frecuencias las que se incluyen usualmente son frecuencia absoluta, frecuencia relativa y
frecuencia porcentajes.

Fig. 4 Distribucin de frecuencias de variable cualitativa. (Crdova, 1995)


En el caso de la distribucin de frecuencias de una variable cuantitativa y de una variable cualitativa, las
frecuencias absolutas, relativas y porcentajes tienen el mismo significado y propiedades, tal y como se
muestra en las siguientes tablas.

Fig. 5 Distribucin de frecuencias de variable discreta. (Crdova, 1995)

Fig. 6 Distribucin de frecuencias por intervalo. (Crdova, 1995)

7. Poblacin y muestra
En el lenguaje de la estadstica, uno de los conceptos ms elementales es el muestreo. En casi todos los
problemas de estadstica, un nmero especificado de mediciones o datos, es decir, una muestra, se toma
de un cuerpo de mediciones ms grande llamado poblacin. Mendenhall et al. (2010).
A partir de la definicin anterior se entiende que la poblacin es un conjunto de elementos que poseen
caractersticas medibles ya sean de tipo cualitativo o cuantitativo, mientras que la muestra es una parte
representativa de la poblacin, la cual debe ser tomada al azar y que proporciona informacin de la
poblacin de la que proviene.
Un aspecto que es importante mencionar que para llevar a cabo la investigacin cientfica se debe decidir si
se trabajar con la poblacin o con la muestra, que en s los procedimientos y frmulas para describirlas
son las mismas y lo nico que cambia es la nomenclatura utilizada.

8. Desviacin cuartil.
La desviacin cuartil es una medida de dispersin o de variabilidad que mide que tan separados se
encuentran los datos respecto a la media. Otro nombre que se le da comnmente a la desviacin cuartil es
rango semiintercuartil y no es ms que el rango intercuartil dividido entre dos.
El rango intercuartil RI, es la diferencia entre sus cuartiles tercero y primero. (Crdova, 1995) Esto es:

RI =Q3Q1
Se puede observar que al trabajar con el tercer y primer cuartil se excluyen al 25% de los valores ms
bajos y ms altos; por lo tanto, si la desviacin cuartil es la mitad de rango intercuartil, entonces el valor se
asocia con la mediana.

9. Medidas de tendencia central.


Las medidas de tendencia central de un conjunto de datos es la disposicin de stos para agruparse ya sea
alrededor del centro o de ciertos valores numricos. (Canavos, 1988). Las medidas de tendencia central
ms comnmente utilizadas son la media, mediana y moda.
La media es el promedio aritmtico de las observaciones y vara la frmula si es que los datos se
encuentran no agrupados o agrupados tomando en cuenta que se tiene mayor precisin si se usa la
frmula de la media para datos no agrupados
Calculo de la media para datos no agrupados:
n

x = x i / n
i=1

Ejemplo1. Las calificaciones obtenidas por un alumno de ingeniera industrial de segundo semestre en el
ITSM son: 78, 82, 95, 83, 100, 72. Cul es el promedio que obtuvo en el semestre? En este caso se tiene
n= 6 que es el nmero de datos, a continuacin se realiza la suma de cada uno de los datos dando un total
de 510 y finalmente se divide entre el total de los datos, obteniendo as la media o el promedio de las
calificaciones la cual es 85.
El propsito de la mediana de la muestra es reflejar la tendencia central de la muestra de manera que no
sea influida por los valores extremos (Walpole, Myers, Myers, & Keying, 2012).
Para calcular la media Me, solo basta con ordenar los datos en orden creciente o decreciente y el valor que
divida en dos a los datos, es el valor de Me. En caso de que n sea par, se debe realizar la semisuma de los
dos valores centrales.
Ejemplo 2. Retomando el ejemplo anterior, se ordena en orden creciente las calificaciones del alumno
72, 78, 82, 83, 95, 100 se observa que n es par, por lo tanto se toman los dos valores centrales que dividen
exactamente a la mitad a la serie de datos y se realiza la semisuma en este caso Me=(82+83)/2=82.5
La moda de un conjunto de observaciones es el valor de la observacin que ocurre con mayor frecuencia
en el conjunto. (Canavos, 1988).
Ejemplo 3. Continuando con los datos del ejemplo 1 en la serie 72, 78, 82, 83, 95, 100 se observa que
ningn dato se repite, por lo que se argumenta que no existe la moda o bien, que todos los datos son
moda.

10. Medidas de dispersin.


Las medidas de dispersin o variabilidad son nmeros que miden el grado de separacin de los datos con
respecto a un valor central, que generalmente es la media aritmtica. (Crdova, 1995).
Existen diversas formas para calcular la dispersin de los datos respecto a la media, las principales son: El
rango, rango intercuartil, la varianza, la desviacin estndar y el coeficiente de variacin. (El rango
intercuartil se explic anteriormente por lo tanto se omitir en este tema).
El rango es la forma ms fcil para calcular la dispersin de los datos, debido a que consiste en restar el
valor mnimo al valor mximo de una serie de datos, pero es poco confiable debido a su inestabilidad
porque depende de los valores extremos.

R= X max X min
La varianza se define como la media aritmtica de los cuadrados de las diferencias de los datos con
respecto a su media aritmtica. (Crdova, 1995). La varianza tambin es una medida de dispersin que
permite saber que tan alejados se encuentran los datos respecto a la media, si los valores se concentran
cerca de la media, se argumenta que la varianza es pequea en caso contrario, cuando la varianza es
grande es porque los datos se encuentran distribuidos lejos de la media, la forma en que se denota la
varianza es s2 si se trabaja con la muestra y 2 si se refiere a la poblacin.
La desviacin estndar es la raz cuadrada de la varianza y se denota con s si se refiere a muestra y
Las frmulas para calcular la varianza tambin dependen si los datos estn agrupados o no, a continuacin
se muestran las frmulas para calcularla en los diversos casos.

S=

( )
2
i

x /n x

i=1

Varianza de datos no tabulados

S=

(
i=1

2
i

f i x / n x

S=

(
i=1

f i m 2i / n x 2

Varianza de datos tabulados de Varianza de datos tabulados por


variable discreta.

intervalos.

El coeficiente de variacin, C. V. es una medida de dispersin relativa (libre de unidades de medidas), que
se define como la desviacin estndar dividido por la media aritmtica. (Crdova, 1995). Esto es:

C . V .=s / x
El C.V. se utiliza para poder realizar comparaciones de la variabilidad entre dos o ms series de datos, por
ejemplo, considere las calificaciones en estadstica de dos grupos (A y B) ambos poseen una desviacin
estndar de s=1.2 el promedio del grupo A es de 9.3, mientras que del grupo B es de 8.7, el CV para el
grupo A es de s=1.2/9.3 = 0.129 = 12.9% y para el grupo B el CV= 1.2/8.7 = 0.137 = 13.7% por lo que se
puede concluir que las calificaciones del grupo A son ms homogneas que las del grupo B debido a que el
C.V. es menor.

11. Histograma.
Al graficarse las frecuencias relativas de las clases contra sus respectivos intervalos en forma de
rectngulos, se produce lo que comnmente se conoce como histograma de frecuencia relativa o
distribucin de frecuencia relativa. Esta ltima es la que puede hacer evidentes los patrones existentes en
un conjunto de datos. (Canavos, 1988)
En acuerdo a la definicin anterior, un histograma es un grfico de barras verticales juntas en el que el
ancho de la barra es la amplitud del intervalo y la altura corresponde no precisamente a la frecuencia
relativa, puede ser incluso a la frecuencia absoluta o a la frecuencia porcentajes.
A continuacin se muestra un ejemplo de histograma obtenido a partir de una distribucin de frecuencias
del nmero de unidades vendidas de cierto producto.

Fig. 7 Histograma nmero de unidades vendidas de cierto producto. (Canavos, 1988)

Conclusin
Con la elaboracin de este trabajo se pudieron resolver algunas dudas que tena respecto a las frmulas
para clculo de las medidas de tendencia central y para las medidas de dispersin. Tambin se logr
comprender con mayor claridad la diferencia entre la estadstica descriptiva y la estadstica inferencial, as
como el papel importante que representan en la toma de decisiones y que a su vez estas van muy ligadas a
la probabilidad la cual proporciona herramientas para eliminar la incertidumbre total en un evento de tipo
aleatorio.
Otros de los temas que me resultaron muy interesantes fue la forma en la que se pueden ordenar los datos
a travs de los cuadros numricos o comnmente conocidos como distribucin de frecuencias debido a que
estos deben tener un nombre acorde a la variable que se est estudiando y no solo eso, tambin se debe
tomar en cuenta el tipo de variable hblese de una variable cualitativa y cuantitativas, pues si no se realiza
una buena distribucin de frecuencias, esto resultar en inconvenientes al momento de representar dicha
tabla por medio de grficos y el estudio de la poblacin sera errneo.
Finalmente concluyo que la elaboracin de este trabajo de investigacin de los once temas presentados,
son de vital importancia debido a que me permitieron recordar y aprender nuevos conceptos que servirn
como base para temas ms complejos que abarca el estudio de la probabilidad y estadstica y que sin ellos
resultara ms complejo entenderlos.

Referencias
Canavos, G. C. (1988). Probabilidad y estadstica aplicaciones y mtodos. Mxico: McGraw-Hill.
Crdova, M. (1995). Estadstica descriptiva e inferencial aplicaciones. Lima, Per: MOSHERA S.R.L.

Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2010). Introduccin a la probabilidad y estadstica. Mxico,
D.F.: Cengage Learning Editores S.A de C.V.

Walpole, R. E., Myers, R. H., Myers, S. L., & Keying, Y. (2012). Probabilidad y estadstica para ingeniera y
ciencias novena edicin. Estado de Mxico: Pearson Educacin de Mxico S.A. de C.V.

Vous aimerez peut-être aussi