Académique Documents
Professionnel Documents
Culture Documents
FUNDAMENTOS DE ESTADÍSTICA
OBJETIVOS
4.1 INTRODUCCIÓN
2.Estadística inductiva, que trata de determinar, partiendo de una cantidad limitada de datos (la
muestra), una conclusión importante acerca de una cantidad mucho mayor de datos (población).
Como esas conclusiones o inferencias no pueden afirmarse con certidumbre absoluta, con
frecuencia se usa el lenguaje de la probabilidad.
Los datos sin agrupar son una lista de los valores observados, mientras que los datos agrupados
representan una aglomeración de datos observados semejantes. Los datos pueden ser discretos,
como lo son en esta sección, o continuos, como lo serán en la siguiente sección.
Las distribuciones de frecuencia se presentan en forma gráfica cuando se desea tener mayor
claridad visual. Hay varias formas diferentes de presentar la distribución de frecuencia.
Datos agrupados
Una distribución de frecuencia basta para muchos problemas de calidad. Sin embargo, en una
amplia clase de problemas, una técnica gráfica es inconveniente, o necesita la información
adicional que proporcionan las técnicas analíticas.
Promedio
Mediana
Otra medida de tendencia central es la mediana, que se define como el valor que divide una serie
de observaciones ordenadas de tal manera que la cantidad de elementos arriba de ella es igual
a la cantidad de elementos abajo de ella.
Moda
La moda (Mo) de un conjunto de números es el valor que se presenta con la máxima frecuencia.
Es posible que no exista moda en una serie de números, o que tenga más de un valor.
Las medidas de dispersión que se describirán en esta sección son el rango, la desviación
estándar y la varianza. Hay otras medidas, como la desviación media y desviación cuartil, que
no se usan en control de calidad.
Hay otras tres medidas que se usan con frecuencia para analizar una colección de datos: el
sesgo o asimetría, la curtosis o apuntamiento, y el coeficiente de variación.
Descripción
Una curva o distribución de población se obtiene con un histograma de frecuencia. A medida que
crece más y más el tamaño muestral de un histograma, el intervalo de clase se vuelve cada vez
más pequeño. Cuando el tamaño de la muestra es bastante grande, y el intervalo de clase es
muy pequeño, el histograma tendrá la apariencia de un polígono uniforme, o curva, que
representa a la población.
Como se aprecia en la fórmula de la curva normal estandarizada, hay una relación definida entre
la media, la desviación estándar y la curva normal.
Por la importancia que tiene la distribución normal, con frecuencia es necesario determinar si los
datos tienen esa distribución. Para usar las técnicas, se advierte al lector que ninguna de ellas
tiene 100% de certeza. También se pueden aplicar las técnicas del histograma, asimetría y
curtosis, gráficas de probabilidad y la prueba chi cuadrada (o ji cuadrada), con ciertas
modificaciones, a otras distribuciones poblacionales.
La forma más sencilla de determinar si existe una relación de causa a efecto entre dos variables
es trazar un diagrama de dispersión, o diagrama de puntos. Un diagrama de dispersión se
elabora con unos pocos pasos simples. Se recolectan los datos en forma de pares ordenados (x,
y). Se controla la velocidad del automóvil (la causa) y se mide el rendimiento de la gasolina (el
efecto). Las escalas horizontal y vertical se trazan con los valores mayores a la derecha del eje
x y arriba del eje y. Después de ponerle título a las escalas, se grafican los datos.
El programa para Excel, en el CD que acompaña a este libro, calcula el histograma con
estadísticos descriptivos, la prueba chi cuadrada y el diagrama de dispersión. Los nombres de
los archivos son histogram chi-squared y scatter diagram. Se debe observar que el histograma
es una adición bajo Análisis de datos, en el menú Herramientas. El coeficiente de correlación
entre dos variables se determina con CORREL, y la pendiente y la ordenada al origen con
LINEST.