Académique Documents
Professionnel Documents
Culture Documents
Internacional
Bienvenido (a):
El siguiente material, es una herramienta que
gua al aprendiz en su proceso formativo y
explica de manera detallada los conceptos
bsicos de la estadstica descriptiva e inferencial.
Contenido
Trminos iniciales.
Medidas de tendencia central y dispersin
con datos no agrupados.
Medidas de tendencia central y dispersin
con datos agrupados.
Probabilidad.
Distribucin normal.
Regresin lineal.
Trminos iniciales
Alemanes consumidores
de caf.
Observaciones:
1. Las herramientas anteriores son denominadas
medidas de tendencia central debido a que buscan
donde se concentran los datos.
Datos ordenados
En los ejemplos anteriores, se realiza fcilmente el
anlisis debido a que la cantidad de datos era pequea,
pero cuando la cuanta de los datos es ms grande, se
debe organizar en una tabla que facilite su tratamiento.
La elaboracin de la tabla vara
dependiendo del tipo de variable
(cualitativa, cuantitativa discreta y
cuantitativa continua).
Indonesia
Indonesia
Colombia
Colombia
Vietnam
Per
Colombia
Indonesia
Brasil
Vietnam
Colombia
Indonesia
Brasil
Colombia
Indonesia
Brasil
Per
Vietnam
Colombia
Brasil
Brasil
Brasil
Colombia
Per
Brasil
Brasil
Brasil
Vietnam
Colombia
Indonesia
Brasil
Vietnam
Colombia
Indonesia
Brasil
Vietnam
Indonesia
Brasil
Vietnam
Indonesia
Vietnam
Colombia
Indonesia
Brasil
Vietnam
Colombia
Brasil
Colombia Indonesia
Per
Vietnam
Datos
Frecuencia
Absoluta (fi)
Frecuencia
Relativa(hi)
Brasil
14
28%
Vietnam
10
20%
Colombia
12
24%
Indonesia
11
22%
6%
50
100%
Per
16
14
12
10
8
6
4
2
0
Brasil
Vietnam
Colombia
Indonesia
Per
Colombi
a
24%
Brasil
28%
Vietnam
20%
21
19
18
20
15
30
21
22
24
19
18
24
20
21
18
21
15
24
19
19
22
18
19
20
21
20
20
19
18
20
15
30
21
22
24
19
18
24
20
21
18
19
20
21
22
24
30
Datos(xi)
15
18
19
20
21
22
24
30
Frecuencia Frecuencia
Frecuencia Frecuencia Absoluta
Relativa
Absoluta (fi) Relativa(hi) Acumulada Acumulada
(Fi)
(Hi)
4
8%
4
8%
8
16%
12
24%
10
20%
22
44%
8
16%
30
60%
8
16%
38
76%
4
8%
42
84%
6
12%
48
96%
2
4%
50
100%
50
100%
15
18
19
20
21
22
24
30
30
4%
15
8%
18
16%
22
8%
21
16%
19
20%
20
16%
4,11
4,8
1,7
2,6
3,4
3,8
2,1
4,3
2,7
3,5
2,8
0,4
4,1
2,9
3,4
2,86
3,1
4,4
1,7
2,4
1,3
2,2
3,6
1,7
2,6
0
3,4
5
2,6
1,9
3,4
2,2
2,6
3,4
2,8
3,5
4,2
2,9
3,02
1,4
6%
6%
0.5
1.01 - 2
16%
11
22%
1.5
2.01 - 3
18
36%
29
58%
2.5
3.01 - 4
13
26%
42
84%
3.5
4.01 - 5
16%
50
100%
4.5
50
100%
20
15
10
5
0
0-1
1.01 - 2
2.01 - 3
3.01 - 4
4.01 - 5
0-1
6%
1.01 - 2
16%
3.01 - 4
26%
2.01 - 3
36%
Mediana
Recordar que es el dato que se encuentra en el centro
de la distribucin.
Para esto, se debe identificar el
intervalo en el que est dicho
dato, dividiendo la cantidad de
datos (n) por 2.
En el ejemplo, el dato debe estar en la posicin 25 y esta
posicin, se encuentra en el tercer intervalo [2.01 - 3].
Luego para escoger la mediana dentro de los datos del
intervalo, se podra escoger el representante llamado
marca de clase, aunque con esta eleccin se estara
suponiendo que la mediana se encuentra exactamente
en la mitad del intervalo.
Moda:
La moda es el dato que ms se repite, debido a que
para su clculo, se observa el intervalo con mayor
frecuencia y se toma el representante llamado marca
de clase.
En el ejemplo la mayor frecuencia, est en el tercer
intervalo [2.01 - 3] y su marca de clase es 2.5, por lo
cual:
Medidas de dispersin
Desviacin estndar:
Recordar que esta medida representa la dispersin de
los datos con respecto a la media.
La frmula para calcularla es idntica a la de los datos
no agrupados, recordar:
Calcular:
Probabilidad
Respuesta pregunta 2:
Si la probabilidad de R es de 41.66% y si se nota como
E, el nmero de encuestas enviadas, se tiene que:
Lgica y probabilidad
La relacin entre la lgica y la probabilidad se ve
claramente expresada en las siguientes tres reglas para
calcular probabilidad.
Regla de la adicin:
Esta regla se utiliza cuando dados 2 eventos se quiera
conocer la probabilidad que ocurra alguno de los dos.
Su frmula es la siguiente:
Ejemplo. Se supone que se quieren conocer las
preferencias de las empresas de cierto pas y para esto
se aplica una encuesta va e-mail y otra va telefnica a
60 compaas. Suponiendo que de las 60 slo 25
respondieron va e-mail, 36 va telefnica y 20
contestaron por ambos medios.
Encontrar la probabilidad de que una empresa responda
una encuesta por cualquier va.
Comprobar que:
Distribucin Normal
Obsrvese
que
la
grfica
toma
una
probabilidad
acumulada desde el
infinito negativo, por
esto, la probabilidad de
Z=0 es de 50%.
Adems:
Consideraciones
Regresin lineal
Ejemplo
Los siguientes son los datos de importaciones
hechas por Alemania de especias y caf durante los
correspondientes aos. El valor est dado en
millones de dlares.
x
2006
2007
2008
2009
2010
2011
4.336
4.749
7.831
6.627
8.149
8.360
8.698.016
9.531.243
15.724.648
13.313.643
16.379.490
16.811.960
x.x
4.024.036
4.028.049
4.032.064
4.036.081
4.040.100
4.044.121
9.000
8.500
8.000
7.500
7.000
6.500
6.000
5.500
5.000
4.500
4.000
2005
y = 831,89x - 1.664.167,12
2006
2007
2008
2009
2010
2011
2012
Si x=2015 entonces
y = 831,89(2015) - 1.664.167,12 = 12.082,59
Es decir que en el 2015 las importaciones alemanas de
caf y especias sern por valor de 12.082,59 millones de
dlares.
Ntese que los valores de los aos se podran tomar del
1 al 6 para facilitar los clculos, y para las dos
proyecciones se utilizarn los valores de 7 y 10.
Analizar ahora los a y b
El valor a=831,89 significa que las importaciones estn
creciendo a una tasa de 831,89 millones de dlares al
ao.
El valor b=-1.664.167,12 es negativo, significa que no se
realizaron importaciones, aunque se muestra que un
anlisis al ao 0 no tiene sentido, por lo cual sera mejor
para el anlisis de la b tomar los aos del 1 al 6.