Académique Documents
Professionnel Documents
Culture Documents
INSTITUTO TECNOLGICO
DE CAMPECHE
CARRERA:
INGENIERA EN ADMINISTRACIN
MATERIA:
ESTADISTICA I
ACREDITADA A LA UNIDAD NMERO: 1
TEMA DE INVESTIGACION:
ESTADSTICA DESCRIPTIVA
ALUMNA:
CAHUICH NOH SHEYLA AURORA
MAESTRO:
RAMON AGUSTIN BOCOS PATRON
GRADO:
3 SEMESTRE
GRUPO:
VD3
FECHA DE ENTREGA:
2 DE SEPTIEMBRE 2015
2
NDICE
que es un ensayo?...................................................................3
qu es la estadstica moderna?.................................................4
por qu estudiar estadstica?....................................................5
partes en que se divide la estadstica moderna para su estudio ...6
el mtodo cientfico en la estadstica..........................................6
mtodos para la obtencin de datos, principio "bebs". ................7
cmo recolectar datos?............................................................7
tipos de datos estadsticos.........................................................8
propiedades que describen una serie numrica de datos .............9
medidas de tendencia central para cantid. pequeas.................11
comparacin entre la media, mediana y moda...........................15
medidas de dispersin para cantidades pequeas de datos ......16
el manejo de grandes cantidades de datos................................19
medidas de tendencia central para datos agrupados.................20
medidas de posicin................................................................24
medidas de dispersin para datos agrupados...........................27
histograma, polgono de frecuencia y ojivas.............................29
importancia de la forma de los datos........................................32
grafica para datos cualitativos o categricos............................34
QU ES UN ENSAYO?
3
El ensayo es un gnero literario que se caracteriza
por permitir desarrollar un tema
determinado de una manera libre y personal. Comnmente, las personas escriben
ensayos para manifestar alguna opinin o idea, y sin tener que preocuparse de
ceirse a una estructura rgida de redaccin o documentarlo exhaustivamente.
DE
UN
ENSAYO
Aunque sea difcil describir todas las caractersticas de un ensayo por ser un
gnero literario esencialmente libre, podemos resumir sus principales caracteres
en la siguiente lista:
- Libertad temtica
- Estilo personal o amistoso en la escritura
- Puede incluir citas o referencias
- Sin una estructura definida, el autor escoge el orden en que desarrolla su
argumento
de
decisiones
en
reas
de negocios o
Los mtodos estadsticos utilizan el mtodo cientfico, que consiste en cinco pasos
bsicos:
1. Definir cuidadosamente el problema. Asegurarse de que est claro el objeto de
un estudio o un anlisis.
2. Formular un plan para recopilar los datos necesarios.
3. Reunir los datos.
4. Analizar e interpretar los mismos.
5. Anotar las conclusiones y otros descubrimientos, de manera que sean
fcilmente comprendidos por los que utilizarn los resultados al tomar decisiones.
Datos Estadsticos Los datos estadsticos se obtienen mediante un proceso que
comprende la observacin o medicin de conceptos como: Ingresos anuales en
una comunidad.
Calificaciones de exmenes.
Cantidad de caf por taza despachada por una mquina vendedora.
Resistencia a la rotura de fibras de plstico.
Porcentaje de azcar en cereales, etc.
Tales conceptos tambin reciben el nombre de variables, ya que producen valores
que tienden a mostrar cierto grado de variabilidad, al efectuarse mediciones
Sucesivas.
MTODOS
PARA
LA
OBTENCIN
DE
DATOS,
PRINCIPIO
"BEBS".
clasifican
en:
datos
de
caractersticas
cualitativas
se
clasifican
en:
9
una muestra, es posible asignar a cada elemento
una categora y contar l nmero
que corresponde a cada elemento. De esta manera estas caractersticas se
convierten
en
numricas.
Tendencia central
2.
Variacin
3.
Forma
10
Cuartiles. Los cuartiles son mediciones descriptivas que dividen los datos
ordenados en cuatro cuartos.
Mediciones
de
la
La variacin es la cantidad de dispersin o propagacin en los datos.
Variacin
Las medidas de tendencia central se utilizan con bastante frecuencia para resumir
un conjunto de cantidades o datos numricos a fin de describir los datos
cuantitativos que los forman.
Ejemplos de ello, pueden ser: la edad promedio o la estatura promedio de los
estudiantes de la universidad o el peso promedio de las bolsas de cereal que son
llenadas por una determinada mquina en un proceso de produccin o las ventas
de un negocio.
Las medidas de tendencia central son tambin frecuentemente usadas para
comparar un grupo de datos con otro, por ejemplo: el promedio de ventas obtenido
por un grupo de vendedores de una zona comparado con el promedio de ventas
otro grupo de vendedores de otra zona, el promedio de reclamos de clientes de
una sucursal, comparado con el promedio de reclamos de otra sucursal.
Otras caractersticas generales de las medidas de tendencia central son las
siguientes:
Permiten apreciar qu tanto se parecen lo grupos entre s.
Son valores que se calculan para un grupo de datos y que se utiliza para
describirlos de alguna manera.
, 13
la media aritmtica se define como:
Se utiliza la letra X con una barra horizontal sobre el smbolo para representar la
media de una muestra ( ), mientras que la letra (mu) se usa para la media
aritmtica de una poblacin, es decir, el valor esperado de una variable.
En otras palabras, es la suma de n valores de la variable y luego dividido por n:
donde n es el nmero de sumandos, o en el caso de estadstica el nmero de
datos se da el resultado.
Media ponderada
Es una medida de tendencia central, que es apropiada cuando en un conjunto de
datos cada uno de ellos tiene una importancia relativa (o peso) respecto de los
dems datos. Se obtiene multiplicando cada uno de los datos por su ponderacin
(peso) para luego sumarlos, obteniendo as una suma ponderada; despus se
divide esta entre la suma de los pesos, dando como resultado la media
ponderada.
Para una serie de datos no vaca:
14
Mediana
. Es decir:
.
,
15
DATOS AGRUPADOS
Donde
,
y
son los extremos, interior y exterior, del intervalo
donde se alcanza la mediana y
es la abscisa a calcular, la
mediana. Se observa que
es la amplitud de los intervalos
seleccionados para el diagrama.
Moda
Es el valor con una mayor frecuencia en una distribucin de datos.
Se hablar de una distribucin bimodal de los datos adquiridos en una columna
cuando encontremos dos modas, es decir, dos datos que tengan la misma
frecuencia absoluta mxima. Una distribucin tri-modal de los datos es en la que
encontramos tres modas. Si todas las variables tienen la misma frecuencia
diremos que no hay moda.
El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos
agrupados antes de definir la moda, se ha de definir el intervalo modal.
La moda, cuando los datos estn agrupados, es un punto que divide al intervalo
modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que
verifiquen que:
16
Dnde:
= -inferior de la clase modal.
= es el delta de frecuencia absoluta modal y la frecuencia absoluta premodal.
= es el delta de frecuencia absoluta modal y la frecuencia absoluta postmodal.
= Amplitud del intervalo modal
COMPARACIN ENTRE LA MEDIA, MEDIANA Y MODA
Si media=moda=mediana, la distribucin es simtrica
Si media > mediana, la distribucin es asimtrica con cola a la derecha
(sesgada a la derecha).
Si media < mediana, la distribucin es asimtrica con cola a la izquierda
(sesgada a la izquierda).
Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una
tiene una media de 7. Sus desviaciones estndar mustrales son 7, 5 y 1,
respectivamente. La tercera muestra tiene una desviacin mucho menor que las
otras dos porque sus valores estn ms cerca de 7.
La desviacin estndar puede ser interpretada como una medida
de incertidumbre. La desviacin estndar de un grupo repetido de medidas nos da
la precisin de stas. Cuando se va a determinar si un grupo de medidas est de
acuerdo con el modelo terico, la desviacin estndar de esas medidas es de vital
importancia: si la media de las medidas est demasiado alejada de
la prediccin (con la distancia medida en desviaciones estndar), entonces
consideramos que las medidas contradicen la teora. Esto es coherente, ya que
las mediciones caen fuera del rango de valores en el cual sera razonable esperar
que ocurrieran si el modelo terico fuera correcto. La desviacin estndar es uno
de tres parmetros de ubicacin central; muestra la agrupacin de los datos
alrededor de un valor central (la media o promedio).
Coeficiente de variacin
En estadstica, cuando se desea hacer referencia a la relacin entre el tamao de
la media y la variabilidad de la variable, se utiliza el coeficiente de variacin.
20
nota
6,0 Primero, se suman las notas:
5,4
6,0+5,4+3,1+7,0+6,1 = 27,6
3,1 Luego el total se divide entre la cantidad de alumnos:
7,0
27,6/5=5,52
6,1
22
MEDIANA
La mediana es un valor de la variable que deja por debajo de s a la mitad de los
datos, una vez que stos estn ordenados de menor a mayor. Por ejemplo, la
mediana del nmero de hijos de un conjunto de trece familias, cuyos respectivos
hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados
los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es 2:
23
Por ejemplo, el nmero de personas en distintos
vehculos en una carretera: 5-7-46-9-5-6-1-5-3-7. El nmero que ms se repite es 5, entonces la moda es 5.
Siendo
la frecuencia absoluta del intervalo modal y
y
las
frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al
intervalo modal.
Las calificaciones en la asignatura de Matemticas de 39 alumnos de una
clase vienen dadas por la siguiente tabla (debajo):
Calificaciones
Nmero de alumnos
Intervalo de clase
60 62
63 65
66 68
69 71
72 74
Frecuencia
5
18
42
27
8
24
Total
100
Conceptos bsicos. Clase. Es el nmero de subconjuntos en que se han agrupado
los datos. Cada clase se puede denominar mediante una letra, un nmero o
alguna caracterstica del subconjunto.
25
Para muestras con 200 o ms datos el nmero
de clases se determina con la raz
cbica del nmero de datos.
Aquel valor de una serie que supera al 25% de los datos y es superado por
el
75%
restante.
Formula de Q1 para series de Datos Agrupados en Clase.
Dnde:
c.
Dnde:
28
29
VARIANZA
DESVIACIN ESTNDAR
30
Tipos de histograma
31
OJIVAS
La representacin grfica de un cuadro de frecuencia acumulada son curvas
llamadas ojivas. En la grfica de ojiva, el ltimo intervalo no se une con el eje
horizontal.
La ojiva apropiada para informacin que presente frecuencias mayores que el dato
que se est comparando tendr una pendiente negativa (hacia abajo y a la
derecha) y en cambio la que se asigna a valores menores, tendr una pendiente
positiva. Una grfica similar al polgono de frecuencias es la ojiva, pero sta se
obtiene de aplicar parcialmente la misma tcnica a una distribucin acumulativa y
de igual manera que stas, existen las ojivas mayores que y las ojivas menores
que.
32
POLGONO DE FRECUENCIA
33
TIPOS DE ASIMETRA
La asimetra presenta las siguientes formas:
Asimetra Negativa o a la Izquierda.- Se da cuando en una distribucin la minora
de los datos est en la parte izquierda de la media. Este tipo de distribucin
presenta un alargamiento o sesgo hacia la izquierda, es decir, la distribucin de los
datos tiene a la izquierda una cola ms larga que a la derecha. Tambin se dice
que una distribucin es simtrica a la izquierda o tiene sesgo negativo cuando
el valor de la media aritmtica es menor que la mediana y ste valor de la mediana
a su vez es menor que la moda, en smbolos
34
MEDIDAS DE ASIMETRA
Dnde:
35
= media aritmtica.
Md = Mediana.
s = desviacin tpica o estndar.
CURTOSIS O APUNTAMIENTO
La curtosis mide el grado de agudeza o achatamiento de una distribucin con
relacin a la distribucin normal, es decir, mide cun puntiaguda es una
distribucin.
TIPOS DE CURTOSIS
La curtosis determina el grado de concentracin que presentan los valores en la
regin central de la distribucin. As puede ser:
Leptocrtica.- Existe una gran concentracin.
Mesocrtica.- Existe una concentracin normal.
Platicrtica.- Existe una baja concentracin.
MEDIDAS DE CURTOSIS
Medida de Fisher
36
Para datos sin agrupar se emplea la siguiente
frmula:
Los datos cualitativos pueden ser difciles de ilustrar. El mejor mtodo para
presentar los datos, cualitativos o cuantitativos, es a travs del uso de grficas.
Muchos mtodos de grficas pueden ilustrar los datos cualitativos y cuantitativos.
Una representacin visual de los datos reunidos te puede ayudar a describir
rpidamente que el dato se est ilustrando sin tener que entrar en una explicacin
profunda, que tal vez no sea fcilmente entendida sin las grficas de todas formas.
Una grfica es una forma rpida y eficiente de captar la atencin y describir
una idea sin utilizar mucho tiempo o muchas palabras.
GRFICAS ESTADSTICAS
Las grficas estadsticas nos permiten familiarizarnos con los datos que se
han recopilado y resumido. Se considera como una tcnica inicial de ANLISIS
EXPLORATORIO DE DATOS que produce una representacin visual. Las
grficas resultantes revelan un patrn de comportamiento de la variable en
estudio. Se ofrecen muchos tipos de grficos para describir el conjunto de datos.
Dependiendo del tipo de datos y lo que se quiera representar, se har uso del
mtodo grfico ms adecuado.
37
GRAFICA DE BARRAS
Asientos
(2004)
EURO 33
EFA
33
33
3
3
ED
D
3
3
3
3
3
3
ELD
R
6
7
6
0
EPP
276
272
UEN
27
36
Otros
66
29
38
GRAFICA DE PASTEL
Una grfica circular, tambin llamada grfico de pastel, grfico de torta o grfica
de
360
grados,
es
un
recurso estadstico que
se
utiliza
para
DIAGRAMA CIRCULAR
40
ENSAYO
rea
aplicacin
de Comentario
Ejemplo
Estudios
variacin
de La
variacin
de
una
caracterstica se produce
cuando su valor cambia de
un sujeto a otro, o de un
momento a otro en el mismo
sujeto
Diagnstico de
enfermedades y
de la salud de la
comunidad
Prediccin
del Es
la
evaluacin
del
resultado
resultado de un programa de
probable de un intervencin
en
una
programa
de comunidad
o
de
una
intervencin
enfermedad
en
los
pacientes, a la luz de los
sntomas,
signos
y
Programa de intervencin
nutricional para determinar el
impacto de la aplicacin de
un suplemento alimenticio
41
circunstancias existentes
Eleccin
Se basa en la experiencia Evaluacin de la eficacia de
apropiada
de anterior con pacientes o un
frmaco
y/u
otros
intervencin en comunidades de anlogas mtodos de tratamiento
paciente
o caractersticas que haban
comunidad
sufrido una intervencin
Realizacin
y Contempla otorgar la validez Probabilidad de cncer de
anlisis en la a investigaciones analticas o prstata en individuos con
investigacin en de encuestas descriptivas.
edad mayor a 60 aos
salud pblica