Vous êtes sur la page 1sur 69

Tecnlogo en Negociacin

Internacional

Bienvenido (a):
El siguiente material, es una herramienta que
gua al aprendiz en su proceso formativo y
explica de manera detallada los conceptos
bsicos de la estadstica descriptiva e inferencial.

Contenido

Trminos iniciales.
Medidas de tendencia central y dispersin
con datos no agrupados.
Medidas de tendencia central y dispersin
con datos agrupados.
Probabilidad.
Distribucin normal.
Regresin lineal.

Trminos iniciales

En este Material de formacin, se introducirn


conceptos bsicos de la estadstica que permitirn
analizar los datos recolectados hasta ahora.

Poblacin: conjunto en el cual sus elementos


poseen caractersticas comunes que sern objeto de
estudio.
Ejemplos:

Alemanes consumidores
de caf.

Pases con tratados


comerciales con Colombia.

Muestra: subconjunto de la poblacin que al ser estudiado,


permite inferir caractersticas de la poblacin. Ejemplo:
Si de la poblacin de consumidores de caf
en Alemania se toma el subconjunto de las
mujeres, es probable que las conclusiones
no se puedan aplicar a toda la poblacin,
quiz porque los hombres consuman mayor
cantidad de caf.
En la segunda poblacin, si el nmero de
pases no es muy grande, no habr
necesidad de muestra. Aunque, si por
alguna razn, como los costos se quisiera
escoger una muestra, se podran tomar
pases representantes de continentes.
Muchas veces se habla de una muestra aleatoria, aunque se
debe tener cuidado en que esta, quede bien distribuida.

Las caractersticas que se le pueden estudiar a una poblacin


se denominan variables y estas las podemos clasificar en dos
grupos:
1. Variable cualitativa: hace referencia a
un atributo o caracterstica de la
poblacin diferente de la cantidad.
-

En el ejemplo de los alemanes, sera


el gnero, el estilo de vida, profesin,
entre otros.

En el ejemplo de los pases, sera los


productos que importan o los
productos que no producen.

2. Variables cuantitativas: se expresan en cantidades.


- En el ejemplo de los alemanes, sera la cantidad de
caf que consumen. (continua).
- En el ejemplo de los pases, sera el tamao de la
poblacin (discreta).
En esta variable, se denomina discreta, si se pueden
colocar la correspondencia con los nmeros enteros (2,-1,0,1,2) y se llama contina, si la variable puede
tomar cualquier valor de los nmeros reales
(decimales).

Medidas de tendencia central y


dispersin con datos no agrupados

Medidas para el anlisis de datos


Calcularemos las medidas con los siguientes datos
recolectados a una muestra de 10 alemanes sobre su
consumo de caf en kg durante el ao 2011.
5, 0.5, 3, 1.6, 3.5, 5, 1, 2, 2.6, 3.8
1. Media: se entiende como el promedio de
los datos.

Lo interpretamos que en promedio los alemanes toman


2.8 kg de caf al ao.
Si llamamos n a la cantidad de datos recolectados y xi
a cada valor, entonces la frmula est dada por:

2. Mediana: se entiende como el valor intermedio de la


poblacin.
Primero, organizar los datos en orden.
Segundo, se calcula la posicin media.
0.5, 1, 1.6, 2, 2.6, 3, 3.5 , 3.8, 5, 5

De esto se deduce que si n es impar el valor no dar un


entero. Adems que la frmula es:
Por ltimo se calcula la mediana, en este caso como el
valor intermedio dio 5.5 la mediana es un promedio entre
el 5 y 6 dato.
Se puede observar que este promedio no es necesario
si no es impar.

3. Moda: es el dato con mayor frecuencia, es decir el que


se repite mayor nmero de veces.
5, 0.5, 3, 1.6, 3.5, 5, 1, 2, 2.6, 3.8
En este caso, la moda es 5, debido a que se repite dos
veces, mientras el resto aparece una vez. Cuando se
tenga dos valores que pueden ser modas, el conjunto de
valores es bimodal.

Observaciones:
1. Las herramientas anteriores son denominadas
medidas de tendencia central debido a que buscan
donde se concentran los datos.

2. Como la mediana seala el centro de la distribucin y la


media su promedio, es interesante notar que:
- Si estas son iguales la distribucin, es simtrica.
- Si la media es menor que la mediana, es asimtrica
negativa
- Si la media es mayor que la mediana, es asimtrica
positiva.

4. Desviacin estndar: se interpreta como la dispersin


de los datos con respecto a la media. Se denota con la letra
griega sigma.
Primero se calcula la desviaciones de cada dato con
respecto a la media y se eleva al cuadrado para que los
negativos no anulen los dems.
5, 0.5, 3, 1.6, 3.5, 5, 1, 2, 2.6, 3.8

Segundo, se realizar la sumatoria de todas las diferencias.

Por ltimo, se divide la sumatoria por el nmero de datos y


se calcula su raz cuadrada.

Se interpreta que los datos estn alejados en promedio


1.47 kg, de la media de consumo de caf.
Con lo anterior, se deduce que la frmula para la
desviacin estndar es:

5. Coeficiente de variacin: al igual que la desviacin


estndar, se conocer el grado de dispersin de los datos
con respecto a la media, pero en este caso, se aslan las
unidades del anlisis. Es especialmente til para
comparar la variacin de diferentes muestras.

Para calcular el coeficiente de variacin, se necesitan los


datos de la media y la desviacin estndar.

Se interpreta que la muestra tiene una dispersin del


53%.
La frmula general est dada por:

Medidas de tendencia central y


dispersin con datos agrupados

Datos ordenados
En los ejemplos anteriores, se realiza fcilmente el
anlisis debido a que la cantidad de datos era pequea,
pero cuando la cuanta de los datos es ms grande, se
debe organizar en una tabla que facilite su tratamiento.
La elaboracin de la tabla vara
dependiendo del tipo de variable
(cualitativa, cuantitativa discreta y
cuantitativa continua).

Adems, se mostrarn dos tipos


de grficos que brindan una
herramienta visual para la
interpretacin.

Tabla de frecuencias variable cualitativa


Los siguientes datos fueron recolectados a una muestra
de 50 alemanes consumidores de caf sobre la
procedencia del caf que toman.
Brasil
Vietnam
Colombia
Indonesia

Indonesia
Indonesia
Colombia
Colombia

Vietnam
Per
Colombia
Indonesia

Brasil
Vietnam
Colombia
Indonesia

Brasil
Colombia
Indonesia
Brasil

Per
Vietnam
Colombia
Brasil
Brasil
Brasil

Colombia
Per
Brasil
Brasil
Brasil
Vietnam

Colombia
Indonesia
Brasil
Vietnam
Colombia
Indonesia

Brasil
Vietnam
Indonesia
Brasil
Vietnam
Indonesia

Vietnam
Colombia
Indonesia
Brasil
Vietnam
Colombia

Lo primero que se debe hacer, es realizar un listado de


los datos sin repeticiones.

Brasil

Colombia Indonesia

Per

Vietnam

Luego, se crea una tabla donde la primera columna se


llame datos y se rellena con el listado anterior.
Crear una columna llamada frecuencia absoluta y se
colocan las repeticiones de cada dato.
Crear una columna llamada frecuencia relativa, en
donde se inserta el peso porcentual de la frecuencia de
cada dato con respecto al total de la muestra.

Por ejemplo, Brasil aparece 14 veces (frecuencia


absoluta) y su peso porcentual (frecuencia relativa) es:

Datos

Frecuencia
Absoluta (fi)

Frecuencia
Relativa(hi)

Brasil

14

28%

Vietnam

10

20%

Colombia

12

24%

Indonesia

11

22%

6%

50

100%

Per

Grficos tabla de frecuencias


La primera grfica que se puede deducir, se llama
histograma de frecuencias en la que en el eje x, se
colocan los datos y en el eje y, la frecuencia absoluta de
cada dato.

16
14
12
10
8
6
4
2
0

Histograma de frecuencias sobre la


procedencia del caf de Alemania

Brasil

Vietnam

Colombia

Indonesia

Per

Nota: en cualquiera de los paquetes bsicos de


office, se puede encontrar en insertar -grfico columna.

Otro grfico til, es el diagrama circular en el cual se


grafica la frecuencia relativa, este coloca en proporcin los
ngulos del crculo con los pesos porcentuales de los
datos. La frmula para esto es multiplicar la frecuencia
relativa por 360.
Per
6%
Indonesi
a
22%

Colombi
a
24%

Brasil
28%

Vietnam
20%

Nota: en cualquiera de los paquetes bsicos de


office lo podemos encontrar en insertar -grfico circular.

Tabla de frecuencias variable cuantitativa discreta


Los siguientes datos fueron recolectados a una muestra
de 50 alemanes consumidores de caf sobre la edad (en
aos) en que iniciaron el consumo de caf.
18
21
15
24
19
19
22
18
19
20

21
19
18
20
15
30
21
22
24
19

18
24
20
21
18
21
15
24
19
19

22
18
19
20
21
20
20
19
18
20

15
30
21
22
24
19
18
24
20
21

Lo primero que se debe hacer, es realizar un listado


ordenado de los datos sin repeticiones.
15

18

19

20

21

22

24

30

Al igual que con la variable cualitativa, se crean las


columnas
datos, frecuencia absoluta y frecuencia
relativa.
Luego, se crea una columna llamada frecuencia
absoluta acumulada, en donde se escribe la suma de la
frecuencia absoluta de ese dato y los menores.
Por ltimo, aadir una columna que se denomina
frecuencia relativa acumulada y en ella se consigna la
suma de la frecuencia relativa de ese dato y los
menores.

Por ejemplo, la frecuencia absoluta acumulada de


19 aos es 22=4+8+10 y la frecuencia relativa
acumulada es 44%=8%+16%+20%.

Datos(xi)
15
18
19
20
21
22
24
30

Frecuencia Frecuencia
Frecuencia Frecuencia Absoluta
Relativa
Absoluta (fi) Relativa(hi) Acumulada Acumulada
(Fi)
(Hi)
4
8%
4
8%
8
16%
12
24%
10
20%
22
44%
8
16%
30
60%
8
16%
38
76%
4
8%
42
84%
6
12%
48
96%
2
4%
50
100%
50
100%

Grficos tabla de frecuencias


La primera grfica que se puede deducir, se llama
histograma de frecuencias en la que en el eje x, se
colocan los datos y en el eje y, la frecuencia
absoluta de cada dato.
Histograma de frecuencias sobre la
edad inicial para el consumo de caf
12
10
8
6
4
2
0

15

18

19

20

21

22

24

30

Nota: en cualquiera de los paquetes bsicos de


office, se puede encontrar en insertar -grfico columna.

Otro grfico til es el diagrama circular en el cual se


grafica la frecuencia relativa, este coloca en proporcin
los ngulos del crculo con los pesos porcentuales de los
datos. La frmula para esto es multiplicar la frecuencia
relativa por 360.
24
12%

30
4%

15
8%
18
16%

22
8%

21
16%

19
20%
20
16%

Nota: en cualquiera de los paquetes bsicos de office, se


puede encontrar en insertar -grfico -circular.

Tabla de frecuencias variable cuantitativa


continua
Los siguientes datos fueron recolectados a una
muestra de 50 alemanes consumidores de caf sobre
la cantidad de caf (en kg) que toman durante un ao.
3,6
2,5
4
0,2
3
2,2
5
1,6
1,9
2,8

4,11
4,8
1,7
2,6
3,4
3,8
2,1
4,3
2,7
3,5

2,8
0,4
4,1
2,9
3,4
2,86
3,1
4,4
1,7
2,4

1,3
2,2
3,6
1,7
2,6
0
3,4
5
2,6
1,9

3,4
2,2
2,6
3,4
2,8
3,5
4,2
2,9
3,02
1,4

En este caso, se puede observar que realizar un


listado de datos independiente no es eficiente, porque
pueden salir un listado con una cantidad muy similar a
la de n.
Por lo anterior, lo ms aconsejable es colocar los
datos en intervalos (cajones) para que el listado que
se coloque en la tabla, sea tan resumido como se
pretende.
En este caso, parece conveniente utilizar 5
intervalos. Esta decisin depende del criterio del
analista y lo resumido que se necesite los datos.
Para calcular la amplitud (tamao) de los intervalos,
calcular el rango de la muestra y dividir por la
cantidad de intervalos definidos.

En esta tabla, se adiciona una columna denominada,


marca de clase, que es el valor medio del intervalo.
Frecuenci Frecuenci
Frecuenci Frecuenci
Marca de
a Absoluta a Relativa
Intervalos a Absoluta a Relativa
clase
Acumulad Acumulad
(fi)
(hi)
(yi)
a (Fi)
a (Hi)
0-1

6%

6%

0.5

1.01 - 2

16%

11

22%

1.5

2.01 - 3

18

36%

29

58%

2.5

3.01 - 4

13

26%

42

84%

3.5

4.01 - 5

16%

50

100%

4.5

50

100%

En el intervalo del [1.01-2], se encuentran los valores


de 1.3, 1.4, 1.6, 1.7, 1.7, 1.7, 1.9, 1.9.

Grficos tabla de frecuencias


La primera grfica que se puede deducir, se llama
histograma de frecuencias en la que en el eje x, se
colocan los datos y en el eje y, la frecuencia absoluta
de cada dato.

20

Histograma de frecuencias sobre la


cantidad de caf que se consume al ao.

15
10
5
0
0-1

1.01 - 2

2.01 - 3

3.01 - 4

4.01 - 5

Nota: en cualquiera de los paquetes bsicos de


office, se puede encontrar en insertar -grfico columna.

Otro grfico til es el diagrama circular en el cual se


grafica la frecuencia relativa, este se coloca en
proporcin los ngulo del crculo con los pesos
porcentuales de los datos. La frmula para esto es
multiplicar la frecuencia relativa por 360.
4.01 - 5
16%

0-1
6%
1.01 - 2
16%

3.01 - 4
26%
2.01 - 3
36%

Nota: en cualquiera de los paquetes bsicos de


office, se puede encontrar en insertar -grfico circular.

Medidas de tendencia central datos agrupados


Para calcular las medidas de tendencia central para los
datos agrupados, se tomar el ejemplo de la variable
cuantitativa continua, debido a que es el ms completo.
Media:
Recordar que es la suma de todos los datos dividido por
n.
Para calcular la suma de todos los datos en la tabla, se
debe naturalmente sumar las multiplicaciones de cada
dato por su frecuencia.
Como en la tabla de frecuencias de la variable continua,
no existen los datos de manera individual sino intervalos.
Se toma un representante de cada uno, el cual se
estableci en la marca de clase.

Se interpreta que en promedio los alemanes


consumen 2.8 kg de caf al ao.
Con lo anterior, se puede plantea
la frmula como sigue:

Es importante notar que si la variable fuera


cuantitativa discreta, se reemplaza el yi con xi.
Tambin debemos ver que esta medida no es
aplicable a variables cualitativas.

Mediana
Recordar que es el dato que se encuentra en el centro
de la distribucin.
Para esto, se debe identificar el
intervalo en el que est dicho
dato, dividiendo la cantidad de
datos (n) por 2.
En el ejemplo, el dato debe estar en la posicin 25 y esta
posicin, se encuentra en el tercer intervalo [2.01 - 3].
Luego para escoger la mediana dentro de los datos del
intervalo, se podra escoger el representante llamado
marca de clase, aunque con esta eleccin se estara
suponiendo que la mediana se encuentra exactamente
en la mitad del intervalo.

Cuando el intervalo tiene abundantes datos, se debe


tener cuidado con hacer la suposicin anterior y se
debe refinar la bsqueda de la mediana, identificando
hacia qu parte del intervalo se encuentra. Para esto,
se utiliza el siguiente factor:

La diferencia entre la posicin media y la frecuencia


absoluta acumulada del intervalo anterior, indica la
cantidad de datos que hay desde que empieza el
intervalo hasta la mediana. Y la divisin con la
frecuencia del intervalo, da una proporcin en donde
se encuentra.
Este factor se puede escribir
en general como:

Luego de tener la posicin de la mediana dentro del


intervalo en forma de factor necesitamos conocerla en
kg y para esto resta multiplicarla por la amplitud del
intervalo.

0.77 kg es lo que recorre la mediana desde que


comienza el intervalo, por lo cual, para establecer el
valor de la mediana se debe sumar el lmite inferior del
intervalo que se nota: Li (inf).

Con lo anterior se puede escribir una expresin general


para la mediana como sigue:

Moda:
La moda es el dato que ms se repite, debido a que
para su clculo, se observa el intervalo con mayor
frecuencia y se toma el representante llamado marca
de clase.
En el ejemplo la mayor frecuencia, est en el tercer
intervalo [2.01 - 3] y su marca de clase es 2.5, por lo
cual:

Medidas de dispersin
Desviacin estndar:
Recordar que esta medida representa la dispersin de
los datos con respecto a la media.
La frmula para calcularla es idntica a la de los datos
no agrupados, recordar:

Aunque como en este caso, las Di, no se realizan por


elemento, se debe escoger el representante y
multiplicarlo por la frecuencia.
Cuando la tabla de frecuencias pertenezca a una
variable cuantitativa continua, el representante es la
marca de clase.

Calcular:

Se interpreta como la dispersin promedio del


consumo de caf anual con respecto a 2.8kg es de
1.1 kg.

Probabilidad

Se va a introducir la probabilidad con un ejemplo para


luego definirla formalmente.
Ejemplo. Se supone que se quiere conocer las
preferencias de las empresas de cierto pas y para esto se
aplica una encuesta va e-mail a 60 compaas.
Suponiendo que de las 60 slo 25 respondieron. Entonces
Cul es la probabilidad de que una empresa responda
una encuesta?, s se necesita tener 60 encuestas para
realizar el anlisis Cuntas encuestas debera enviar?
Respuesta pregunta 1:
Si llamamos R al evento que una empresa responda una
encuesta va e-mail, entonces:
Se interpreta como la probabilidad de que una empresa
responda una encuesta va e-mail es de 41.66%.

Respuesta pregunta 2:
Si la probabilidad de R es de 41.66% y si se nota como
E, el nmero de encuestas enviadas, se tiene que:

Por lo cual, para que se reciban 60 encuestas se


deben enviar 144. Luego del ejemplo, conceptualizar.
La probabilidad de un experimento o suceso donde se
conocen todos los posibles resultados es un valor entre
0 y 1. Este nmero mide la frecuencia de obtener un
resultado, luego de realizar el experimento cierto nmero
de veces. Su frmula es:

Ntese que si P(A)=0 implica que ese evento nunca


ocurre, y si P(A)=1 indica que ese evento siempre
sucede.

Lgica y probabilidad
La relacin entre la lgica y la probabilidad se ve
claramente expresada en las siguientes tres reglas para
calcular probabilidad.
Regla de la adicin:
Esta regla se utiliza cuando dados 2 eventos se quiera
conocer la probabilidad que ocurra alguno de los dos.
Su frmula es la siguiente:
Ejemplo. Se supone que se quieren conocer las
preferencias de las empresas de cierto pas y para esto
se aplica una encuesta va e-mail y otra va telefnica a
60 compaas. Suponiendo que de las 60 slo 25
respondieron va e-mail, 36 va telefnica y 20
contestaron por ambos medios.
Encontrar la probabilidad de que una empresa responda
una encuesta por cualquier va.

Utilizar la siguiente notacin:


R: evento de que una empresa responda una encuesta
va e-mail.
K: evento de que una empresa responda una encuesta
va telefnica.

La probabilidad de que una empresa responda una


encuesta por cualquier va e-mail o telefnica es de
68,32%.
Ntese que si los eventos son mutuamente
excluyentes, la probabilidad de la interseccin es
igual a 0.

Regla de la probabilidad condicional


Esta regla se utiliza cuando se quiere conocer la
probabilidad de un evento A dado un evento B. Se nota
como P(A/B). La frmula est dada por:

Vase el ejemplo con los datos anteriores. Se quiere


conocer la probabilidad de que una empresa responda
una encuesta va telefnica, luego de haber respondido
una encuesta va e-mail. Es decir P(K/R).

Comprobar que:

Regla de la probabilidad conjunta


Se utiliza cuando se quiere que ocurran dos eventos a la
vez.
Cuando los eventos estn relacionados y se conoce la
probabilidad condicional, la frmula est dada por:

Ntese que si A y B son independientes P(A/B)=P(A), por


lo cual, la frmula se reduce a:
Vase esta regla en el ejemplo, como K y R estn
relacionados, se debe utilizar la primera:

La probabilidad de que una empresa responda una


encuesta va telefnica y e-mail es de 33,33%.

Distribucin Normal

Al realizar un anlisis estadstico de los datos obtenidos


por una variable cuantitativa continua, es til asociar un
tipo de distribucin.
En lo sucesivo, se presentar la distribucin normal y se
ver su utilidad en el anlisis de datos.
Se dice que una cantidad de datos sigue una
distribucin normal si cumple las siguientes
caractersticas:
1. Tiene una nica moda, que coincide con su media
y su mediana.
2. La curva normal es asinttica al eje x, es decir, la
curva no toca el eje x pero se acerca mucho a este. Por
ello, cualquier valor del eje x es tericamente posible. El
rea total bajo la curva es, por tanto, igual a 1.
3. Es simtrica con respecto a su media. Segn esto,
para este tipo de variables existe una probabilidad de
un 50% de observar un dato mayor que la media, y un
50% de observar un dato menor.

Se dice que una cantidad de datos sigue una


distribucin normal si cumple las siguientes
caractersticas.
4.

El rea bajo la curva comprendido entre los


valores situados aproximadamente a dos
desviaciones estndar de la media, es igual a
0.95. En concreto, existe un 95% de
posibilidades de observar un valor comprendido
en el intervalo.

El grfico de la distribucin normal terica, es la


llamada campana de Gauss.

Para identificar si nuestros datos corresponden a


una distribucin normal, se puede analizar
visualmente el histograma de frecuencias. Por
ejemplo:
Poseen distribucin normal:

No poseen distribucin normal:

Para el ejemplo de variable continua que hay, se observa


que la distribucin se puede asociar a una normal.

Cuando se tiene asociada la distribucin normal a


unos datos, se pueden resolver preguntas de
probabilidad acerca del comportamiento de variables.
Por ejemplo, la probabilidad de encontrar alemanes
que consuman menos de 3kg de caf al ao.

Para obtener informacin como la del ejemplo anterior,


se debe asociar nuestros datos a una distribucin
normal con media cero y varianza 1, debido a que para
este tipo de distribucin existen tablas con la
probabilidad ya calculada.
Dicha asociacin se debe hacer con la siguiente
transformacin:

Realizar el ejemplo propuesto sobre la probabilidad de


encontrar alemanes que consuman menos de 3kg de
caf al ao.
Buscar la probabilidad en la tabla para un valor menor
o igual que 0.18, es decir:

Obsrvese
que
la
grfica
toma
una
probabilidad
acumulada desde el
infinito negativo, por
esto, la probabilidad de
Z=0 es de 50%.

Segn la tabla la probabilidad de encontrar un alemn


que consuma menos de 3kg de caf al ao es de
57.14%.
Ejemplo 2. Cul es la probabilidad de encontrar un
alemn que consuma entre 3.5kg y 4kg de caf
anualmente?
Primero, hay que realizar la respectiva transformacin:

Como se busca en la tabla el rea (probabilidad) entre


dos valores y la tabla, da el rea acumulada, se debe
realizar la resta entre las dos reas, es decir:

Se interpreta como la probabilidad de que un


alemn consuma entre 3.5kg y 4kg al ao es de
12.64%.

Ejemplo 3. Cul es la probabilidad de encontrar un


alemn que consuma menos de 1kg al ao?

Para revisar un resultado negativo, se debe recordar


que la media de la distribucin Z es cero y como esta es
simtrica el cero, est en la mitad de la distribucin.
Recordado lo anterior, es fcil ver en la grfica que el
rea entre -1.63 y cero es igual al rea entre 0 y 1.63, es
decir:

Como en la tabla no aparecen los negativos para


calcular el rea menor que -1.63 debo al rea menor
que cero restarle el rea entre 0 y -1.63 que es lo
mismo por la igualdad anterior que el rea entre 0 y
1.63 , es decir:

Adems:

Lo que se interpreta como la probabilidad de


encontrar un alemn que consuma menos de 1kg
de caf es de 5.16% .

Consideraciones

Aplicar al ejemplo, la caracterstica de la distribucin


normal del intervalo de confianza que se present
anteriormente. Recordar que en esta deca que haba
una probabilidad del 95% que los datos estuvieran en
el siguiente intervalo:
Entonces existe una probabilidad de un 95% de que
se encuentre un alemn que consuma entre 0.644kg
y 4.956kg de caf al ao.

Hasta ahora se ha realizado el trabajo de anlisis con


la distribucin normal, acerca de la poblacin de
consumidores de caf alemanes sobre una muestra
de 50 de estos, deduccin a partir de las
caractersticas de la poblacin de muestra.

Realizar este tipo de anlisis es lo que se denomina


inferencia y hace parte de la estadstica inferencial.
Para que en los ejemplos anteriores sea vlido realizar
la inferencia, se
debe suponer que la media y
desviacin estndar de la muestra es igual a la de la
poblacin.
Si esto no ocurre, se escogi en la muestra
aleatoriamente, un teorema de la estadstica, que indica
que la desviacin estndar de la muestra dividida por la
raz cuadrada de n, es igual a la de la poblacin y que
las medias son iguales. Por lo cual, la funcin de
transformacin Z. queda expresada como sigue:

Otras distribuciones de probabilidad


La distribucin normal que se acab de estudiar, es
ampliamente utilizada, pero no por ello se puede pensar
que es la nica, existen otras que se describen, otros
tipo de distribuciones, vanse los siguientes ejemplos:

De las grficas se puede observar que tienen diferencias


con la distribucin normal. Por ejemplo, la simetra y
donde se concentran los datos.
Profundizar sobre estos tipos de distribuciones esta
fuera del alcance de los objetivos de esta gua, aunque
su manejo es similar al que se realiza con la distribucin
normal.

Regresin lineal

En ocasiones, cuando se est analizando datos, el


inters de conocer cmo se relacionan con otra
variable y as predecir cambios en los datos a partir de
modificaciones de la variable. Por ejemplo, si se tiene
el valor de las importaciones de cierto pas en una
cantidad de aos y se quiere conocer qu va a pasar
en los aos venideros.
Esto se realiza, aproximando los datos a una funcin
conocida. Por ejemplo, la funcin lineal grficamente
sera:

Aqu los puntos representa los datos, la lnea y la


funcin conocida.

En el clculo de la regresin, se calculan dos valores


notados; a y b. El valor a, representa la tasa de variacin
de la variable y con respecto a la variable x, en el
ejemplo de las importaciones, si este valor diera positivo,
implica que las importaciones estn creciendo y si fuera
negativo muestra un decrecimiento. La frmula para este
clculo es:

El valor b, se interpreta como el valor de la variable y


cuando la variable tenga un valor nulo, su frmula es:

Vase con un ejemplo la aplicacin.

Ejemplo
Los siguientes son los datos de importaciones
hechas por Alemania de especias y caf durante los
correspondientes aos. El valor est dado en
millones de dlares.
x

2006

2007

2008

2009

2010

2011

4.336

4.749

7.831

6.627

8.149

8.360

Ntese que para aplicar las frmulas, se deben


aadir las siguientes columnas.
xy

8.698.016

9.531.243

15.724.648

13.313.643

16.379.490

16.811.960

x.x

4.024.036

4.028.049

4.032.064

4.036.081

4.040.100

4.044.121

Ahora, se mostrarn los clculos que se necesitan


para las frmulas.

9.000
8.500
8.000
7.500
7.000
6.500
6.000
5.500
5.000
4.500
4.000
2005

y = 831,89x - 1.664.167,12

2006

2007

2008

2009

2010

2011

2012

Con esta frmula, ahora calcular un valor futuro. Por


ejemplo, las importaciones alemanas de caf y
especias para el ao 2012 y 2015.
y = 831,89x - 1.664.167,12
Si x=2012 entonces
y = 831,89(2012) - 1.664.167,12 = 9.586,93
Es decir, que en el 2012 las importaciones alemanas
de caf y especias sern por valor de 9.586,93
millones de dlares.

Si x=2015 entonces
y = 831,89(2015) - 1.664.167,12 = 12.082,59
Es decir que en el 2015 las importaciones alemanas de
caf y especias sern por valor de 12.082,59 millones de
dlares.
Ntese que los valores de los aos se podran tomar del
1 al 6 para facilitar los clculos, y para las dos
proyecciones se utilizarn los valores de 7 y 10.
Analizar ahora los a y b
El valor a=831,89 significa que las importaciones estn
creciendo a una tasa de 831,89 millones de dlares al
ao.
El valor b=-1.664.167,12 es negativo, significa que no se
realizaron importaciones, aunque se muestra que un
anlisis al ao 0 no tiene sentido, por lo cual sera mejor
para el anlisis de la b tomar los aos del 1 al 6.

Vous aimerez peut-être aussi