Vous êtes sur la page 1sur 2

4.

FUNDAMENTOS DE ESTADÍSTICA

OBJETIVOS

 Conozca la diferencia entre una variable y un atributo.


 Comprenda el concepto de un universo y una muestra.

4.1 INTRODUCCIÓN

1.Estadística descriptiva o deductiva, para describir y analizar un sujeto o un grupo.

2.Estadística inductiva, que trata de determinar, partiendo de una cantidad limitada de datos (la
muestra), una conclusión importante acerca de una cantidad mucho mayor de datos (población).
Como esas conclusiones o inferencias no pueden afirmarse con certidumbre absoluta, con
frecuencia se usa el lenguaje de la probabilidad.

4.2 DISTRIBUCIÓN DE FRECUENCIA

Datos sin agrupar

Los datos sin agrupar son una lista de los valores observados, mientras que los datos agrupados
representan una aglomeración de datos observados semejantes. Los datos pueden ser discretos,
como lo son en esta sección, o continuos, como lo serán en la siguiente sección.

Las distribuciones de frecuencia se presentan en forma gráfica cuando se desea tener mayor
claridad visual. Hay varias formas diferentes de presentar la distribución de frecuencia.

Un histograma consiste en un conjunto de rectángulos que representan la frecuencia en cada


categoría. Gráficamente representa las frecuencias de los valores observados.

Datos agrupados

La construcción de una distribución de frecuencia para datos agrupados es más complicada,


porque usualmente hay una cantidad mayor de categorías. El concepto se ilustrará con un
problema de ejemplo, donde se usa una variable continua.

1. Recolectar datos y formar una hoja de conteo.


2. Determinar el rango.
3. Determinar el intervalo de clase.
4. Determinar los puntos medios de las clases.
5. Determinar los límites de clase.
6. Identificar la frecuencia de clase.

4.3 MEDIDAS DE TENDENCIA CENTRAL

Una distribución de frecuencia basta para muchos problemas de calidad. Sin embargo, en una
amplia clase de problemas, una técnica gráfica es inconveniente, o necesita la información
adicional que proporcionan las técnicas analíticas.

Promedio

El promedio es la suma de las observaciones dividida entre la cantidad de observaciones. Es la


medida más común de la tendencia central. Hay tres técnicas diferentes disponibles para calcular
el promedio: (1) datos no agrupados, (2) datos agrupados y (3) promedio ponderado.

Mediana

Otra medida de tendencia central es la mediana, que se define como el valor que divide una serie
de observaciones ordenadas de tal manera que la cantidad de elementos arriba de ella es igual
a la cantidad de elementos abajo de ella.

Moda
La moda (Mo) de un conjunto de números es el valor que se presenta con la máxima frecuencia.
Es posible que no exista moda en una serie de números, o que tenga más de un valor.

4.5 MEDIDAS DE DISPERSIÓN

Las medidas de dispersión que se describirán en esta sección son el rango, la desviación
estándar y la varianza. Hay otras medidas, como la desviación media y desviación cuartil, que
no se usan en control de calidad.

4.6 OTRAS MEDIDAS

Hay otras tres medidas que se usan con frecuencia para analizar una colección de datos: el
sesgo o asimetría, la curtosis o apuntamiento, y el coeficiente de variación.

4.7 CONCEPTO DE POBLACIÓN Y MUESTRA

La población es la colección completa de mediciones, y en los ejemplos anteriores, las


poblaciones fueron todos los ejes de acero y todos los automóviles particulares. Cuando se
calculan promedios, desviaciones estándar, y otras medidas, a partir de muestras, los resultados
se llaman estadísticos. Como rara vez es posible medir toda la población, se selecciona una
muestra. Es necesario tomar muestras cuando sea imposible medir toda la población.

4.8 LA CURVA NORMAL

Descripción

Una curva o distribución de población se obtiene con un histograma de frecuencia. A medida que
crece más y más el tamaño muestral de un histograma, el intervalo de clase se vuelve cada vez
más pequeño. Cuando el tamaño de la muestra es bastante grande, y el intervalo de clase es
muy pequeño, el histograma tendrá la apariencia de un polígono uniforme, o curva, que
representa a la población.

Relación entre la media y la desviación estándar

Como se aprecia en la fórmula de la curva normal estandarizada, hay una relación definida entre
la media, la desviación estándar y la curva normal.

4.9 PRUEBAS DE NORMALIDAD

Por la importancia que tiene la distribución normal, con frecuencia es necesario determinar si los
datos tienen esa distribución. Para usar las técnicas, se advierte al lector que ninguna de ellas
tiene 100% de certeza. También se pueden aplicar las técnicas del histograma, asimetría y
curtosis, gráficas de probabilidad y la prueba chi cuadrada (o ji cuadrada), con ciertas
modificaciones, a otras distribuciones poblacionales.

4.10 DIAGRAMA DE DISPERSIÓN

La forma más sencilla de determinar si existe una relación de causa a efecto entre dos variables
es trazar un diagrama de dispersión, o diagrama de puntos. Un diagrama de dispersión se
elabora con unos pocos pasos simples. Se recolectan los datos en forma de pares ordenados (x,
y). Se controla la velocidad del automóvil (la causa) y se mide el rendimiento de la gasolina (el
efecto). Las escalas horizontal y vertical se trazan con los valores mayores a la derecha del eje
x y arriba del eje y. Después de ponerle título a las escalas, se grafican los datos.

4.11 PROGRAMA DE CÓMPUTO

El programa para Excel, en el CD que acompaña a este libro, calcula el histograma con
estadísticos descriptivos, la prueba chi cuadrada y el diagrama de dispersión. Los nombres de
los archivos son histogram chi-squared y scatter diagram. Se debe observar que el histograma
es una adición bajo Análisis de datos, en el menú Herramientas. El coeficiente de correlación
entre dos variables se determina con CORREL, y la pendiente y la ordenada al origen con
LINEST.

Vous aimerez peut-être aussi