Vous êtes sur la page 1sur 18

Gua Estadstica

Estadstica: es una ciencia formal y una herramienta que estudia el uso y los
anlisis provenientes de una muestra representativa de datos, busca explicar las
correlaciones y dependencias de un fenmeno fsico o natural, de ocurrencia en
forma aleatoria o condicional.
1) Estadstica descriptiva: Se dedica a la descripcin, visualizacin y resumen
de datos originados a partir de los fenmenos de estudio.
(Media y la desviacin estndar, histograma, pirmide poblacional, grfico
circular, etc.)
2) Estadstica inferencial: Se dedica a la generacin de los modelos,
inferencias y predicciones asociadas a los fenmenos en cuestin teniendo
en cuenta la aleatoriedad de las observaciones.

Mtodos Estadsticos:
1) Recoleccin de Datos ( forma en que vamos a recabar informacin,
2)
3)
4)
5)

analizar, organizar e interpretar)


Encuestas (Senzo)
Observacin
Experimentacin
Consulta

Muestreo: es la tcnica para la seleccin de una muestra a partir de


una poblacin.
Tipos de muestreo:

1) Muestreo aleatorio simple: Forman parte de este tipo de muestreo todos


aquellos mtodos para los que se puede calcular la probabilidad de extraccin
de cualquiera de las muestras posibles. Este conjunto de tcnicas de muestreo
es el ms aconsejable, aunque en ocasiones no es posible optar por l.
2) Muestreo estratificado: Consiste en la divisin previa de la poblacin de
estudio en grupos o clases que se suponen homogneos con respecto a
alguna caracterstica de las que se van a estudiar. A cada uno de estos
estratos se le asignara una cuota que determinara el nmero de miembros del
mismo que compondrn la muestra. Dentro de cada estrato se suele usar la
tcnica de muestreo sistemtico, una de las tcnicas de seleccin ms usadas
en la prctica.

3) Muestreo por conglomerados: Se utiliza cuando la poblacin se encuentra


dividida, de manera natural, en grupos que se supone que contienen toda la
variabilidad de la poblacin, es decir, la representan fielmente respecto a la
caracterstica a elegir, pueden seleccionarse slo algunos de estos grupos
o conglomerados para la realizacin del estudio.
4) Muestreo sistemtico: Se utiliza cuando el universo o poblacin es de gran
tamao, o ha de extenderse en el tiempo. Primero hay que identificar las
unidades y relacionarlas con el calendario.

Distribucin de Frecuencias
Unas vez que los datos han sido recopilados se procede a organizarlos para su
fcil manejo. Se divide en 3 pasos:
1) Correccin
2) Clasificacin
3) Tabulacin

Grafica Estadstica
Clases
60-62
63-65
66-68
69-71
72-74

f
9
29
42
16
4

fa
9
38
80
96
100

*Barras* (Dibujar Ejemplo)

fra
.09
.38
.80
.96
1.0

Marca
58
61
64
67
70
73
76

L.R.C
Inf.
59.5
62.5
65.5
68.5
71.5

Sup.
62.5
65.5
68.5
71.5
74.5

Tamao
de Ancho

3
3
3
3
3

*Polgono de Frecuencias* (Dibujar Ejemplo)


Se usa indistintamente para variables discretas y continuas y se construye con la
frecuencia simple y las marcas de clase.

*Histograma* (Dibujar Ejemplo)


Se usa para representar variables continuas aunque tambin para variables
discretas tabuladas en intervalos, se construye con Lim reales de clase y
frecuencia simple.

*Ojiva* (Dibujar Ejemplo)


Es la que ms nos puede dar informacin ya que nos permite saber el
comportamiento con respecto al total de datos, se construye con los Lim reales de
clase y la frecuencia acumulada.

Mediana
n
f
2
=Li +
C
fmed
Li: lmite real inferior de la clase mediana
n: # total de datos
f: suma de frecuencias antes de la mediana
f med: frecuencia simple de la clase mediana
C: ancho o tamao de clase

Ejemplo:

Clases
60-62
63-65
66-68
69-71
72-74

f
9
29
42
16
4

fa
9
38
80
96
100

n
f
2
=Li +
C
fmed
100
38
2
=65.5+
(3)
42
=65.5+

5038
(3)
42

fra
.09
.38
.80
.96
1.0

Marca
58
61
64
67
70
73
76

L.R.C
Inf.
59.5
62.5
65.5
68.5
71.5

Sup.
62.5
65.5
68.5
71.5
74.5

Tamao
de Ancho

3
3
3
3
3

=65.5+

12
(3)
42

=65.5+ 0.2857(3)

= 66.3571

Moda
Md=Li +

1
C
1+ 2

Li: lmite real inferior de la clase modal


1: diferencia de frecuencia entre la clase modal y la premodal
2: diferencia de frecuencia entre la clase modal y la postmodal
C: tamao de clase

Ejemplo:

Clases
60-62
63-65
66-68
69-71
72-74

Md=Li +

f
9
29
42
16
4

fa
9
38
80
96
100

1
C
1+ 2

Md=65.5+

13
(3)
13+26

fra
.09
.38
.80
.96
1.0

Marca
58
61
64
67
70
73
76

L.R.C
Inf.
59.5
62.5
65.5
68.5
71.5

Sup.
62.5
65.5
68.5
71.5
74.5

Tamao
de Ancho

3
3
3
3
3

Md=65.5+

13
(3)
39

Md=65.5+ 0.3333(3)

Md=65.5+1
Md=66.5

Medidas de Dispersin
Son valores que nos permiten saber que tan lejanos o cercanos estn los datos
con respecto a la media o que tan amplio es el rango de variabilidad de los datos.
Estas medidas son el rango, la desviacin media, la varianza y la desviacin
estndar. Se emplea para medir el promedio de los alejamientos de los datos con
respecto a la media. Se calcula con la siguiente ecuacin.
DM=

|x|
n

X= dato
= media
n= # de datos totales
1) Calcular la desviacin media del siguiente conjunto de datos.
22
23
17
19
18
15
17
131/7= 18.71

DM=

|x|
n

-18.71
-18.71
-18.71
-18.71
-18.71
-18.71
-18.71

=
=
=
=
=
=
=

3.292
4.29 2
-1.712
0.292
-0.712
-3.712
-1.712

3.29
4.29
1.71
0.29
0.71
3.71
1.71
= 15.71

10.82
18.46
2.92
0.084
0.504
13.76
2.92
= 49.46

DM=

|15.71|
7

DM=2.24

Otra forma de evitar el 0 es usando la varianza.

Varianza
S =

(x)
n1

Ejemplo:
22
23
17
19
18
15
17
131/7= 18.71

S =

(x)
n1

S =

49.42
71

S =

49.42
6

S =8.23

-18.71
-18.71
-18.71
-18.71
-18.71
-18.71
-18.71

=
=
=
=
=
=
=

3.292
4.29 2
-1.712
0.292
-0.712
-3.712
-1.712

3.29
4.29
1.71
0.29
0.71
3.71
1.71
= 15.71

10.82
18.46
2.92
0.084
0.504
13.76
2.92
= 49.46

Desviacin Estndar (S)


S= s
Ejemplo:
S =8.23
S= s
S= 8.23
S=2.86

Datos Bivariados
Hasta el da de hoy el anlisis estadstico se ha realizado para una
sola variable, pero Qu pasa cuando tenemos dos?
Cuando se tienen 2 variables a analizar se les denomina datos
Bivariados y las combinaciones que se puede presentar se trabajan
por medio de mtodos tabulares y mtodos grficos.
Los datos Bivariados son los valores de dos variables diferentes que
se obtienen de un mismo elemento poblacional.
Los datos Bivariados se pueden presentar en una tabla de
contingencia y a partir de ella obtener porcentajes de cada una de las
variables y combinacin de ellas como se muestra en el siguiente
ejemplo:
Artes
H
M
Total

5
6
11

Administraci
n
6
4
20

Tecnologa

Total

7
2
9

18
12
30

Tabla de Porcentaje de gran total:

H
M

Artes
0.16
0.20
0.36

Administracin
0.20
0.13
0.33

Tecnologa
0.23
0.06
0.30

Total
0.60
0.40
1.00

Tecnologa
0.77
0.22
0.99

Total
0.60
0.40
1.00

Tecnologa
0.38
0.17
0.30

Total
1.00
1.00
1.00

Porcentajes por Columna:

H
M

Artes
0.45
0.55
1.00

Administracin
0.60
0.40
1.00

Porcentaje por Rengln:

H
M

Artes
0.27
0.50
0.36

Administracin
0.33
0.33
0.33

1) Qu porcentaje de los encuestados estudia tecnologa?


R) 30%
2) Qu porcentaje de los que estudian administracin son mujeres?
R) 40%
3) Qu porcentaje de los hombres estudian artes?
R) 27%

Puntuacin Z
Es otra medida de posicin en el sentido de que describe la localizacin de un
valor en trminos de desviaciones estndar con respecto a la media.

Una puntuacin de Z= 2 indica que el valor est a dos desviaciones estndar por
encima de la media; y un valor de Z= -3 indica que el valor esta a 3 desviaciones
estndar por abajo.
Las puntuaciones Z nos permiten comparar valores de distintos conjuntos de
datos.

Muestra:
Z=

Z: puntuacin estndar
X: dato o valor
: media

: Desviacin estndar

Poblacin:
Z=

Z: puntuacin estndar

X: dato o valor
: media
: desviacin estndar

*Extras*
Muestra: Un subconjunto de la poblacin.
Poblacin: Es el universo que nos interesa estudiar.
Diagrama de Pareto: consiste en un grfico de barras similar al histograma
que se conjuga con una ojiva o curva de tipo creciente y que representa en
forma decreciente el grado de importancia o peso que tienen los diferentes
factores que afectan a un proceso, operacin o resultado.
El diagrama de tallo y hoja: es una herramienta que permite obtener una
representacin visual informativa de un conjunto de datos, para su
elaboracin es necesario separar para cada uno de los datos el ltimo
dgito de la derecha (hoja) del bloque de cifras restantes (tallo).
Variable: es una propiedad que puede fluctuar y cuya variacin es
susceptible de adoptar diferentes valores, los cuales pueden medirse u
observarse.
Variable Discreta: Es la variable lo que presenta separaciones o
interrupciones en la escala de valores que puede tomar. Estas
separaciones o interrupciones indican la ausencia de valores entre los
distintos valores especficos que la variable pueda asumir. Ejemplo: El
nmero de hijos (1, 2, 3, 4, 5).

Variable Continua: Es la variable que puede adquirir cualquier valor dentro


de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg,
2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...), o el salario.
Solamente se est limitado por la precisin del aparato medidor, en teora
permiten que exista un valor entre dos variables.
Variable Independiente: es aquella cuyo valor no depende de otra
variable. La variable independiente se representa en el eje de abscisas.
Variable Dependiente: Una variable dependiente es aquella cuyos valores
dependen de los que tomen otra variable. La variable dependiente en una
funcin se suele representar por y. La variable dependiente se representa
en el eje ordenadas.
Frecuencia Relativa: Razn entre el nmero de veces que se repite cada
dato entre el total de los datos obtenidos.
Categora Ordinal: describen el orden de los mismos con base en una
escala. En la escala, no hay manera de distinguir la diferencia relativa entre
los grupos. Por ejemplo, podemos decir que un auto lleg primero, segundo
o de ltimo, pero no sabemos el tiempo de diferencia entre cada vehculo si
no se nos provee ms informacin.

Categora Nominal: se basan en el etiquetado o codificacin de


informacin en categoras. Generalmente, creas nombres para la
informacin con base en las caractersticas. Por ejemplo, puedes clasificar
los colores de cabello en moreno, rubio, rojo o negro.
Limites Reales: Puntos extremos de un intervalo de clase
Rango: diferencia entre el dato mayor y el menor de un conjunto de datos.
Binominal: esta distribucin agrupa los resultados en dos categoras
mutuamente excluyentes.
Distribucin de Poisson: es una distribucin de probabilidad discreta que
expresa, a partir de una frecuencia de ocurrencia media, la probabilidad de que
ocurra un determinado nmero de eventos durante cierto perodo de tiempo.

Vous aimerez peut-être aussi