Vous êtes sur la page 1sur 47

FUNDAMENTOS DE

ESTADSTICA
Grupo 7
-

Karem Baquerizo
Ricardo Lpez Villacs
Julio Naranjo
Luis Paladines

Introduccin
Estadstica.- Es la ciencia que trata de la recoleccin,
tabulacin, anlisis, interpretacin y presentacin de datos
cuantitativos.
Hay dos fases de la estadstica:
Estadstica descriptiva o deductiva.- Para describir y
analizar un sujeto o un grupo.
Estadstica inductiva.- Trata de determinar una conclusin
sobre una poblacin a partir de una muestra.

Recoleccin de datos
Los datos que se recolectan para fines de calidad se
obtienen por observacin directa y se clasifican como:
Variables .-Son caractersticas de la calidad que se

pueden medir y se subdividen en:


- Variables Continuas: Se la puede subdividir hasta
cualquier grado (Ej: 11.698 Kg.)
- Variables Discretas.- Variables que tienen
discontinuidades. (Ej: 10 remaches conformes)
Atributos.- Las caractersticas que se juzgan por

observacin visual. (Ej: el interruptor esta abierto o cerrado)

Diferencia entre exactitud y precisin

Redondeo: Si el ltimo dgito es 5 o ms, el nmero se

redondea hacia arriba. Un nmero redondeado es una


aproximacin al nmero exacto.
Precisin: Es la diferencia entre el mayor valor y el menor

valor.
6.235
El mximo error posible: (m.e.p.) es igual a la mitad de la
precisin.
Error relativo: (e.r.) es igual al m.e.p dividido entre el

nmero.

Cifras significativas.- son los dgitos de un nmero sin

tener en cuenta los ceros anteriores necesarios para ubicar


el punto decimal, mientras que los ceros a la derecha se
cuentan como significativas.

Cuando se hacen las operaciones matemticas de multiplicacin,


divisin y exponenciacin, el resultado tiene la misma cantidad de
cifras significativas que la cantidad con menos cifras
significativas.

Descripcin de datos
Hay dos tcnicas disponibles para hacer este compendio
de datos:

Distribucin de frecuencias
Datos sin agrupar

Al quitar la columna de tabulacin da como resultado la


tabla de distribucin de frecuencia.

Hay varias formas diferentes de presentar la distribucin de


frecuencia.
Un histograma consiste en un conjunto de rectngulos que
representa a frecuencia de cada categora.

Datos Agrupados
La construccin de una distribucin de frecuencia para
datos agrupados es ms complicada, porque usualmente
hay cantidad mayor de categoras
1.- Recolectar datos y formar una hoja de conteo.
2.- Determinar el rango.
3.- Determinar el intervalo de clase.
4.- Determinar los puntos medios de la clase.
5.- Determinar los lmites de clase.
6.- Identificar la frecuencia de clase.

El histograma se usa para:


1. Resolver problemas
2. Determinar la capacidad del proceso
3. Comparar con las especificaciones
4. Sugerir la forma de la poblacin
5. Indicar discrepancias en datos, como por
ejemplo discontinuidades

Otros tipos de grficas de


distribucin de frecuencia
Las grficas de barras es correcta para datos discretos,

pero no se usa con frecuencia.


Polgono de frecuencia: se traza poniendo un punto sobre

cada punto medio de clase, a la altura indicada para cada


frecuencia.
Ojiva:

presenta la frecuencia de todos los valores


menores que el lmite superior de clase, de determinada
clase.

Caractersticas de las grficas de


distribucin de frecuencia
Una curva continua representa una distribucin de
frecuencia poblacin. El histograma representa una
distribucin de frecuencia muestral.
Caractersticas:
Simetra o falta de simetra de los datos
Cantidad de modas o picos en los datos
Aguzado de los picos (curva bastante puntiaguda, se
llama leptocrtica. Curva ms aplanada, se llama
platicrtica.

Las distribuciones de frecuencia pueden dar

informacin suficiente para tomar decisiones, sin


ms anlisis. Tambin se pueden comparar
respecto a:

Una limitacin de las distribuciones de frecuencia es que


no muestran el orden en que se produjeron los datos

MEDIDAS DE TENDENCIA
CENTRAL
Los mtodos analticos principales para describir
un conjunto de datos: medidas de tendencia
central y medidas de dispersin.
Es un valor numrico que describe la posicin
central de los datos o la tendencia de los datos a
acumularse en el centro.
Son: promedio, mediana y moda.

Promedio

Hay 3 tcnicas para calcularlo:


Datos

no agrupados:
organizados.

cuando

los

datos

no

estn

Datos agrupados: cuando se agrupa los datos por clases

(ms de un valor observado por clase) o cuando cada valor


observado tiene su propia frecuencia.

Promedio ponderado: cuando se combinan varios promedios con

diferentes frecuencias.

Mediana

Valor que divide una serie de observaciones ordenadas tal


que la cantidad de elementos arriba de ella es igual a la
cantidad de elementos debajo de ella
Para datos no agrupados:

Cuando la cantidad de nmeros en la serie es impar, la


mediana es el punto medio de los valores. Cuando la
cantidad es par, es el promedio de los dos nmeros a la
mitad.

Para

datos agrupados: Cuando los datos estn


agrupados en una distribucin de frecuencia, la
mediana se obtiene determinando la clase que tenga el
nmero a la mitad, para interpolar dentro de la celda.

Moda

Valor que se presenta con la mxima frecuencia.


Se dice que una serie de nmeros es unimodal si
tiene una moda, bimodal si tiene dos modas y
multimodal si tiene ms de dos modas.

Relaciones entre las medidas de


tendencia central

Promedio: se usa cuando la distribucin es simtrica o


cuando se van a calcular ms estadsticos con base en el
promedio y cuando se necesita tener un valor estable para
estadstica inductiva.

Mediana: es efectiva cuando la distribucin es asimtrica


positiva o negativa. Se usa cuando se desea tener un valor
medio exacto de una distribucin.
Una grfica de control basada en la mediana es excelente
para vigilar la calidad.
Moda: se usa cuando se desea tener una medida rpida y
aproximada de la tendencia central.

Medidas de dispersin
Describen la forma en que los datos se extienden o
dispersan a cada lado del valor central. Para describir un
conjunto de datos se necesitan tanto las medidas de
dispersin como las medidas de tendencia central.

Rango

El rango de una serie de nmeros es la diferencia entre los


valores u observaciones mayor y menor.

Desviacin Estndar

La desviacin estndar es un valor numrico cuyas


unidades son las de los valores observados.
Mide la tendencia de los datos a la dispersin.
Una desviacin estndar grande indica mayor variabilidad
de datos que una pequea.

Tcnica para datos no agrupados

Tcnica para datos agrupados


Cuando los datos se agrupan en una se puede aplicar la

siguiente tcnica. Distribucin de frecuencias.

Relacin entre las medidas de


dispersin
El rango es una medida muy comn de la dispersin.

Otras medidas
Hay otras tres medidas que se usan con frecuencia para
analizar una coleccin de datos:
Sesgo
Asimetra
Curtosis o apuntamiento
Coeficiente de variacin

Asimetra
Es la carencia de simetra de los datos.

La asimetra es un nmero cuya magnitud indica el grado


de desviacin respecto a la simetra.
A3=0 son simtricos
A3>0 son asimtricos
A3<0 son asimtricos hacia la izquierda

Curtosis

Es una medida de lo picuda que es la distribucin de los


datos.

Coeficiente de variacin

Es una medida de cuanta variacin existe en relacin con


la media, la desviacin estandar sola no es muy til sin
tener un contexto.

Concepto de poblacin y muestra


La poblacin es la coleccin completa de mediciones.
La poblacin puede tener una cantidad finita de

elementos.

La curva normal
La curva normal, campana de gauss o distribucin de
gauss, es una distribucin simtrica, unimodal, en forma de
campana, en la que la media, la mediana y la moda tienen
el mismo valor.

Todas las distribuciones normales de variables continuas

se pueden convertir en la distribucin estandarizada


mediante la siguiente frmula:

Curva de distribucin Normal Estndar

Relacin entre la media y la


desviacin estndar.
Si la desviacin estndar es constante y la media vara lo nico que
cambia es la ubicacin.

Relacin entre la media y la


desviacin estndar.
Si la media es constante y la desviacin estndar varia, nos damos cuenta que
cuan mayor sea la desviacin estndar, la curva es mas aplanada.

Pruebas de Normalidad
Por la importancia que tiene la distribucin normal, con

frecuencia es necesario determinar si los datos siguen


esta distribucin.
Se advierte que ninguna de las tcnicas tiene 100% de

certeza.
Se

pueden aplicar las pruebas del Histograma,


Asimetra y Curtosis, Graficas de probabilidad y la
prueba Chi Cuadrada(Ji Cuadrada).

Prueba de Normalidad:
Histograma
Un examen visual de un histograma elaborado

con una gran cantidad de datos puede dar una


idea de que distribucin se trata.
Si el histograma es unimodal, simtrico y baja

gradualmente a los lados existe la posibilidad


definida de que sea normal y que la informacin
sea suficiente para casos prcticos.

Prueba de Normalidad: Asimetra y Curtosis


Es una medida de forma de una distribucin que permite

identificar y describir la manera como los datos tienden a


reunirse de acuerdo con la frecuencia con que se hallen dentro
de la distribucin. Permite identificar las caractersticas de la
distribucin de datos sin necesidad de generar el grfico.
La Curtosis mide el grado de agudeza o achatamiento de una

distribucin con relacin a la distribucin normal, es decir, mide


cun
puntiaguda
es
una
distribucin.

Prueba de Normalidad: Graficas de Probabilidad


El grfico de probabilidad normal es una tcnica grfica, utilizada

para contrastar la normalidad de un conjunto de datos. Permite


comparar la distribucin emprica de una muestra de datos, con la
distribucin normal. Es un caso particular de grfico de
probabilidad.
La idea bsica consiste en representar, en un mismo grfico, los
datos empricos observados, frente a los datos que se obtendran
en una distribucin normal terica. Si la distribucin de la variable
es normal, los puntos quedarn cerca de una lnea recta. Es
frecuente observar una mayor variabilidad (separacin) en los
extremos.

Prueba de Normalidad: Graficas de


Probabilidad
1.
2.
3.

4.
5.
6.
7.

Ordenar datos: se anotan las observaciones de menor a mayor.


Jerarquizar las observaciones: comenzando con 1 la
observacin menor 2 para la siguiente y as sucesivamente.
Calcular la posicin en la grafica:
donde i= rango
n= tamao de la muestra.
PP= posicin en la grafica.
Poner nombre a la escala de datos
Graficar los puntos: se anota la posicin y la observacin en el
papel de probabilidad normal.
Tratar de ajustar al ojo la mejor lnea: al ajustar la lnea se debe
dar mayor peso a los valores centrales que a los extremos.
Determinar la normalidad: esta decisin es a juicio dependiendo
lo cerca que estn los puntos de la recta, los datos siguen una
distribucin normal.

Prueba Chi Cuadrada, de Bondad de Ajuste


Es otra tcnica para determinar si los datos de la muestra siguen una
distribucin normal o alguna otra distribucin.

Vous aimerez peut-être aussi