Conceptos Basicos de - Estadistica Descriptiva e Inferencial PDF

Tecnlogo en Negociacin
Internacional
Bienvenido (a):
El siguiente material, es una herramienta que
gua al aprendiz en su proceso formativo y
explica de manera detallada los conceptos
bsicos de la estadstica descriptiva e inferencial.
Contenido
Trminos iniciales.
Medidas de tendencia central y dispersin
con datos no agrupados.
Medidas de tendencia central y dispersin
con datos agrupados.
Probabilidad.
Distribucin normal.
Regresin lineal.
Trminos iniciales
En este Material de formacin, se introducirn

conceptos bsicos de la estadstica que permitirn
analizar los datos recolectados hasta ahora.
Poblacin: conjunto en el cual sus elementos

poseen caractersticas comunes que sern objeto de
estudio.
Ejemplos:
Alemanes consumidores
de caf.
Pases con tratados

comerciales con Colombia.
Muestra: subconjunto de la poblacin que al ser estudiado,

permite inferir caractersticas de la poblacin. Ejemplo:
Si de la poblacin de consumidores de caf
en Alemania se toma el subconjunto de las
mujeres, es probable que las conclusiones
no se puedan aplicar a toda la poblacin,
quiz porque los hombres consuman mayor
cantidad de caf.
En la segunda poblacin, si el nmero de
pases no es muy grande, no habr
necesidad de muestra. Aunque, si por
alguna razn, como los costos se quisiera
escoger una muestra, se podran tomar
pases representantes de continentes.
Muchas veces se habla de una muestra aleatoria, aunque se
debe tener cuidado en que esta, quede bien distribuida.
Las caractersticas que se le pueden estudiar a una poblacin

se denominan variables y estas las podemos clasificar en dos
grupos:
1. Variable cualitativa: hace referencia a
un atributo o caracterstica de la
poblacin diferente de la cantidad.
-
En el ejemplo de los alemanes, sera

el gnero, el estilo de vida, profesin,
entre otros.
En el ejemplo de los pases, sera los

productos que importan o los
productos que no producen.
2. Variables cuantitativas: se expresan en cantidades.

- En el ejemplo de los alemanes, sera la cantidad de
caf que consumen. (continua).
- En el ejemplo de los pases, sera el tamao de la
poblacin (discreta).
En esta variable, se denomina discreta, si se pueden
colocar la correspondencia con los nmeros enteros (2,-1,0,1,2) y se llama contina, si la variable puede
tomar cualquier valor de los nmeros reales
(decimales).
Medidas de tendencia central y

dispersin con datos no agrupados
Medidas para el anlisis de datos

Calcularemos las medidas con los siguientes datos
recolectados a una muestra de 10 alemanes sobre su
consumo de caf en kg durante el ao 2011.
5, 0.5, 3, 1.6, 3.5, 5, 1, 2, 2.6, 3.8
1. Media: se entiende como el promedio de
los datos.
Lo interpretamos que en promedio los alemanes toman

2.8 kg de caf al ao.
Si llamamos n a la cantidad de datos recolectados y xi
a cada valor, entonces la frmula est dada por:
2. Mediana: se entiende como el valor intermedio de la

poblacin.
Primero, organizar los datos en orden.
Segundo, se calcula la posicin media.
0.5, 1, 1.6, 2, 2.6, 3, 3.5 , 3.8, 5, 5
De esto se deduce que si n es impar el valor no dar un

entero. Adems que la frmula es:
Por ltimo se calcula la mediana, en este caso como el
valor intermedio dio 5.5 la mediana es un promedio entre
el 5 y 6 dato.
Se puede observar que este promedio no es necesario
si no es impar.
3. Moda: es el dato con mayor frecuencia, es decir el que

se repite mayor nmero de veces.
5, 0.5, 3, 1.6, 3.5, 5, 1, 2, 2.6, 3.8
En este caso, la moda es 5, debido a que se repite dos
veces, mientras el resto aparece una vez. Cuando se
tenga dos valores que pueden ser modas, el conjunto de
valores es bimodal.
Observaciones:
1. Las herramientas anteriores son denominadas
medidas de tendencia central debido a que buscan
donde se concentran los datos.
2. Como la mediana seala el centro de la distribucin y la

media su promedio, es interesante notar que:
- Si estas son iguales la distribucin, es simtrica.
- Si la media es menor que la mediana, es asimtrica
negativa
- Si la media es mayor que la mediana, es asimtrica
positiva.
4. Desviacin estndar: se interpreta como la dispersin

de los datos con respecto a la media. Se denota con la letra
griega sigma.
Primero se calcula la desviaciones de cada dato con
respecto a la media y se eleva al cuadrado para que los
negativos no anulen los dems.
5, 0.5, 3, 1.6, 3.5, 5, 1, 2, 2.6, 3.8
Segundo, se realizar la sumatoria de todas las diferencias.
Por ltimo, se divide la sumatoria por el nmero de datos y

se calcula su raz cuadrada.
Se interpreta que los datos estn alejados en promedio

1.47 kg, de la media de consumo de caf.
Con lo anterior, se deduce que la frmula para la
desviacin estndar es:
5. Coeficiente de variacin: al igual que la desviacin

estndar, se conocer el grado de dispersin de los datos
con respecto a la media, pero en este caso, se aslan las
unidades del anlisis. Es especialmente til para
comparar la variacin de diferentes muestras.
Para calcular el coeficiente de variacin, se necesitan los

datos de la media y la desviacin estndar.
Se interpreta que la muestra tiene una dispersin del

53%.
La frmula general est dada por:
Medidas de tendencia central y

dispersin con datos agrupados
Datos ordenados
En los ejemplos anteriores, se realiza fcilmente el
anlisis debido a que la cantidad de datos era pequea,
pero cuando la cuanta de los datos es ms grande, se
debe organizar en una tabla que facilite su tratamiento.
La elaboracin de la tabla vara
dependiendo del tipo de variable
(cualitativa, cuantitativa discreta y
cuantitativa continua).
Adems, se mostrarn dos tipos

de grficos que brindan una
herramienta visual para la
interpretacin.
Tabla de frecuencias variable cualitativa

Los siguientes datos fueron recolectados a una muestra
de 50 alemanes consumidores de caf sobre la
procedencia del caf que toman.
Brasil
Vietnam
Colombia
Indonesia
Indonesia
Indonesia
Colombia
Colombia
Vietnam
Per
Colombia
Indonesia
Brasil
Vietnam
Colombia
Indonesia
Brasil
Colombia
Indonesia
Brasil
Per
Vietnam
Colombia
Brasil
Brasil
Brasil
Colombia
Per
Brasil
Brasil
Brasil
Vietnam
Colombia
Indonesia
Brasil
Vietnam
Colombia
Indonesia
Brasil
Vietnam
Indonesia
Brasil
Vietnam
Indonesia
Vietnam
Colombia
Indonesia
Brasil
Vietnam
Colombia
Lo primero que se debe hacer, es realizar un listado de

los datos sin repeticiones.
Brasil
Colombia Indonesia
Per
Vietnam
Luego, se crea una tabla donde la primera columna se

llame datos y se rellena con el listado anterior.
Crear una columna llamada frecuencia absoluta y se
colocan las repeticiones de cada dato.
Crear una columna llamada frecuencia relativa, en
donde se inserta el peso porcentual de la frecuencia de
cada dato con respecto al total de la muestra.
Por ejemplo, Brasil aparece 14 veces (frecuencia

absoluta) y su peso porcentual (frecuencia relativa) es:
Datos
Frecuencia
Absoluta (fi)
Frecuencia
Relativa(hi)
Brasil
14
28%
Vietnam
10
20%
Colombia
12
24%
Indonesia
11
22%
6%
50
100%
Per
Grficos tabla de frecuencias

La primera grfica que se puede deducir, se llama
histograma de frecuencias en la que en el eje x, se
colocan los datos y en el eje y, la frecuencia absoluta de
cada dato.
16
14
12
10
8
6
4
2
0
Histograma de frecuencias sobre la

procedencia del caf de Alemania
Brasil
Vietnam
Colombia
Indonesia
Per
Nota: en cualquiera de los paquetes bsicos de

office, se puede encontrar en insertar -grfico columna.
Otro grfico til, es el diagrama circular en el cual se

grafica la frecuencia relativa, este coloca en proporcin los
ngulos del crculo con los pesos porcentuales de los
datos. La frmula para esto es multiplicar la frecuencia
relativa por 360.
Per
6%
Indonesi
a
22%
Colombi
a
24%
Brasil
28%
Vietnam
20%

office lo podemos encontrar en insertar -grfico circular.
Tabla de frecuencias variable cuantitativa discreta

Los siguientes datos fueron recolectados a una muestra
de 50 alemanes consumidores de caf sobre la edad (en
aos) en que iniciaron el consumo de caf.
18
21
15
24
19
19
22
18
19
20
21
19
18
20
15
30
21
22
24
19
18
24
20
21
18
21
15
24
19
19
22
18
19
20
21
20
20
19
18
20
15
30
21
22
24
19
18
24
20
21
Lo primero que se debe hacer, es realizar un listado

ordenado de los datos sin repeticiones.
15
18
19
20
21
22
24
30
Al igual que con la variable cualitativa, se crean las

columnas
datos, frecuencia absoluta y frecuencia
relativa.
Luego, se crea una columna llamada frecuencia
absoluta acumulada, en donde se escribe la suma de la
frecuencia absoluta de ese dato y los menores.
Por ltimo, aadir una columna que se denomina
frecuencia relativa acumulada y en ella se consigna la
suma de la frecuencia relativa de ese dato y los
menores.
Por ejemplo, la frecuencia absoluta acumulada de

19 aos es 22=4+8+10 y la frecuencia relativa
acumulada es 44%=8%+16%+20%.
Datos(xi)
15
18
19
20
21
22
24
30
Frecuencia Frecuencia
Frecuencia Frecuencia Absoluta
Relativa
Absoluta (fi) Relativa(hi) Acumulada Acumulada
(Fi)
(Hi)
4
8%
4
8%
8
16%
12
24%
10
20%
22
44%
8
16%
30
60%
8
16%
38
76%
4
8%
42
84%
6
12%
48
96%
2
4%
50
100%
50
100%

colocan los datos y en el eje y, la frecuencia
absoluta de cada dato.
edad inicial para el consumo de caf
12
10
8
6
4
2
0
15
18
19
20
21
22
24
30

Otro grfico til es el diagrama circular en el cual se

grafica la frecuencia relativa, este coloca en proporcin
los ngulos del crculo con los pesos porcentuales de los
datos. La frmula para esto es multiplicar la frecuencia
relativa por 360.
24
12%
30
4%
15
8%
18
16%
22
8%
21
16%
19
20%
20
16%
Nota: en cualquiera de los paquetes bsicos de office, se

puede encontrar en insertar -grfico -circular.
Tabla de frecuencias variable cuantitativa

continua
Los siguientes datos fueron recolectados a una
muestra de 50 alemanes consumidores de caf sobre
la cantidad de caf (en kg) que toman durante un ao.
3,6
2,5
4
0,2
3
2,2
5
1,6
1,9
2,8
4,11
4,8
1,7
2,6
3,4
3,8
2,1
4,3
2,7
3,5
2,8
0,4
4,1
2,9
3,4
2,86
3,1
4,4
1,7
2,4
1,3
2,2
3,6
1,7
2,6
0
3,4
5
2,6
1,9
3,4
2,2
2,6
3,4
2,8
3,5
4,2
2,9
3,02
1,4
En este caso, se puede observar que realizar un

listado de datos independiente no es eficiente, porque
pueden salir un listado con una cantidad muy similar a
la de n.
Por lo anterior, lo ms aconsejable es colocar los
datos en intervalos (cajones) para que el listado que
se coloque en la tabla, sea tan resumido como se
pretende.
En este caso, parece conveniente utilizar 5
intervalos. Esta decisin depende del criterio del
analista y lo resumido que se necesite los datos.
Para calcular la amplitud (tamao) de los intervalos,
calcular el rango de la muestra y dividir por la
cantidad de intervalos definidos.
En esta tabla, se adiciona una columna denominada,

marca de clase, que es el valor medio del intervalo.
Frecuenci Frecuenci
Frecuenci Frecuenci
Marca de
a Absoluta a Relativa
Intervalos a Absoluta a Relativa
clase
Acumulad Acumulad
(fi)
(hi)
(yi)
a (Fi)
a (Hi)
0-1
6%
6%
0.5
1.01 - 2
16%
11
22%
1.5
2.01 - 3
18
36%
29
58%
2.5
3.01 - 4
13
26%
42
84%
3.5
4.01 - 5
16%
50
100%
4.5
50
100%
En el intervalo del [1.01-2], se encuentran los valores

de 1.3, 1.4, 1.6, 1.7, 1.7, 1.7, 1.9, 1.9.

colocan los datos y en el eje y, la frecuencia absoluta
de cada dato.
20

cantidad de caf que se consume al ao.
15
10
5
0
0-1
1.01 - 2
2.01 - 3
3.01 - 4
4.01 - 5

Otro grfico til es el diagrama circular en el cual se

grafica la frecuencia relativa, este se coloca en
proporcin los ngulo del crculo con los pesos
porcentuales de los datos. La frmula para esto es
multiplicar la frecuencia relativa por 360.
4.01 - 5
16%
0-1
6%
1.01 - 2
16%
3.01 - 4
26%
2.01 - 3
36%

office, se puede encontrar en insertar -grfico circular.
Medidas de tendencia central datos agrupados

Para calcular las medidas de tendencia central para los
datos agrupados, se tomar el ejemplo de la variable
cuantitativa continua, debido a que es el ms completo.
Media:
Recordar que es la suma de todos los datos dividido por
n.
Para calcular la suma de todos los datos en la tabla, se
debe naturalmente sumar las multiplicaciones de cada
dato por su frecuencia.
Como en la tabla de frecuencias de la variable continua,
no existen los datos de manera individual sino intervalos.
Se toma un representante de cada uno, el cual se
estableci en la marca de clase.
Se interpreta que en promedio los alemanes

consumen 2.8 kg de caf al ao.
Con lo anterior, se puede plantea
la frmula como sigue:
Es importante notar que si la variable fuera

cuantitativa discreta, se reemplaza el yi con xi.
Tambin debemos ver que esta medida no es
aplicable a variables cualitativas.
Mediana
Recordar que es el dato que se encuentra en el centro
de la distribucin.
Para esto, se debe identificar el
intervalo en el que est dicho
dato, dividiendo la cantidad de
datos (n) por 2.
En el ejemplo, el dato debe estar en la posicin 25 y esta
posicin, se encuentra en el tercer intervalo [2.01 - 3].
Luego para escoger la mediana dentro de los datos del
intervalo, se podra escoger el representante llamado
marca de clase, aunque con esta eleccin se estara
suponiendo que la mediana se encuentra exactamente
en la mitad del intervalo.
Cuando el intervalo tiene abundantes datos, se debe

tener cuidado con hacer la suposicin anterior y se
debe refinar la bsqueda de la mediana, identificando
hacia qu parte del intervalo se encuentra. Para esto,
se utiliza el siguiente factor:
La diferencia entre la posicin media y la frecuencia

absoluta acumulada del intervalo anterior, indica la
cantidad de datos que hay desde que empieza el
intervalo hasta la mediana. Y la divisin con la
frecuencia del intervalo, da una proporcin en donde
se encuentra.
Este factor se puede escribir
en general como:
Luego de tener la posicin de la mediana dentro del

intervalo en forma de factor necesitamos conocerla en
kg y para esto resta multiplicarla por la amplitud del
intervalo.
0.77 kg es lo que recorre la mediana desde que

comienza el intervalo, por lo cual, para establecer el
valor de la mediana se debe sumar el lmite inferior del
intervalo que se nota: Li (inf).
Con lo anterior se puede escribir una expresin general

para la mediana como sigue:
Moda:
La moda es el dato que ms se repite, debido a que
para su clculo, se observa el intervalo con mayor
frecuencia y se toma el representante llamado marca
de clase.
En el ejemplo la mayor frecuencia, est en el tercer
intervalo [2.01 - 3] y su marca de clase es 2.5, por lo
cual:
Medidas de dispersin
Desviacin estndar:
Recordar que esta medida representa la dispersin de
los datos con respecto a la media.
La frmula para calcularla es idntica a la de los datos
no agrupados, recordar:
Aunque como en este caso, las Di, no se realizan por

elemento, se debe escoger el representante y
multiplicarlo por la frecuencia.
Cuando la tabla de frecuencias pertenezca a una
variable cuantitativa continua, el representante es la
marca de clase.
Calcular:
Se interpreta como la dispersin promedio del

consumo de caf anual con respecto a 2.8kg es de
1.1 kg.
Probabilidad
Se va a introducir la probabilidad con un ejemplo para

luego definirla formalmente.
Ejemplo. Se supone que se quiere conocer las
preferencias de las empresas de cierto pas y para esto se
aplica una encuesta va e-mail a 60 compaas.
Suponiendo que de las 60 slo 25 respondieron. Entonces
Cul es la probabilidad de que una empresa responda
una encuesta?, s se necesita tener 60 encuestas para
realizar el anlisis Cuntas encuestas debera enviar?
Respuesta pregunta 1:
Si llamamos R al evento que una empresa responda una
encuesta va e-mail, entonces:
Se interpreta como la probabilidad de que una empresa
responda una encuesta va e-mail es de 41.66%.
Respuesta pregunta 2:
Si la probabilidad de R es de 41.66% y si se nota como
E, el nmero de encuestas enviadas, se tiene que:
Por lo cual, para que se reciban 60 encuestas se

deben enviar 144. Luego del ejemplo, conceptualizar.
La probabilidad de un experimento o suceso donde se
conocen todos los posibles resultados es un valor entre
0 y 1. Este nmero mide la frecuencia de obtener un
resultado, luego de realizar el experimento cierto nmero
de veces. Su frmula es:
Ntese que si P(A)=0 implica que ese evento nunca

ocurre, y si P(A)=1 indica que ese evento siempre
sucede.
Lgica y probabilidad
La relacin entre la lgica y la probabilidad se ve
claramente expresada en las siguientes tres reglas para
calcular probabilidad.
Regla de la adicin:
Esta regla se utiliza cuando dados 2 eventos se quiera
conocer la probabilidad que ocurra alguno de los dos.
Su frmula es la siguiente:
Ejemplo. Se supone que se quieren conocer las
preferencias de las empresas de cierto pas y para esto
se aplica una encuesta va e-mail y otra va telefnica a
60 compaas. Suponiendo que de las 60 slo 25
respondieron va e-mail, 36 va telefnica y 20
contestaron por ambos medios.
Encontrar la probabilidad de que una empresa responda
una encuesta por cualquier va.
Utilizar la siguiente notacin:

R: evento de que una empresa responda una encuesta
va e-mail.
K: evento de que una empresa responda una encuesta
va telefnica.
La probabilidad de que una empresa responda una

encuesta por cualquier va e-mail o telefnica es de
68,32%.
Ntese que si los eventos son mutuamente
excluyentes, la probabilidad de la interseccin es
igual a 0.
Regla de la probabilidad condicional

Esta regla se utiliza cuando se quiere conocer la
probabilidad de un evento A dado un evento B. Se nota
como P(A/B). La frmula est dada por:
Vase el ejemplo con los datos anteriores. Se quiere

conocer la probabilidad de que una empresa responda
una encuesta va telefnica, luego de haber respondido
una encuesta va e-mail. Es decir P(K/R).
Comprobar que:
Regla de la probabilidad conjunta

Se utiliza cuando se quiere que ocurran dos eventos a la
vez.
Cuando los eventos estn relacionados y se conoce la
probabilidad condicional, la frmula est dada por:
Ntese que si A y B son independientes P(A/B)=P(A), por

lo cual, la frmula se reduce a:
Vase esta regla en el ejemplo, como K y R estn
relacionados, se debe utilizar la primera:
La probabilidad de que una empresa responda una

encuesta va telefnica y e-mail es de 33,33%.
Distribucin Normal
Al realizar un anlisis estadstico de los datos obtenidos

por una variable cuantitativa continua, es til asociar un
tipo de distribucin.
En lo sucesivo, se presentar la distribucin normal y se
ver su utilidad en el anlisis de datos.
Se dice que una cantidad de datos sigue una
distribucin normal si cumple las siguientes
caractersticas:
1. Tiene una nica moda, que coincide con su media
y su mediana.
2. La curva normal es asinttica al eje x, es decir, la
curva no toca el eje x pero se acerca mucho a este. Por
ello, cualquier valor del eje x es tericamente posible. El
rea total bajo la curva es, por tanto, igual a 1.
3. Es simtrica con respecto a su media. Segn esto,
para este tipo de variables existe una probabilidad de
un 50% de observar un dato mayor que la media, y un
50% de observar un dato menor.
Se dice que una cantidad de datos sigue una

distribucin normal si cumple las siguientes
caractersticas.
4.
El rea bajo la curva comprendido entre los

valores situados aproximadamente a dos
desviaciones estndar de la media, es igual a
0.95. En concreto, existe un 95% de
posibilidades de observar un valor comprendido
en el intervalo.
El grfico de la distribucin normal terica, es la

llamada campana de Gauss.
Para identificar si nuestros datos corresponden a

una distribucin normal, se puede analizar
visualmente el histograma de frecuencias. Por
ejemplo:
Poseen distribucin normal:
No poseen distribucin normal:
Para el ejemplo de variable continua que hay, se observa

que la distribucin se puede asociar a una normal.
Cuando se tiene asociada la distribucin normal a

unos datos, se pueden resolver preguntas de
probabilidad acerca del comportamiento de variables.
Por ejemplo, la probabilidad de encontrar alemanes
que consuman menos de 3kg de caf al ao.
Para obtener informacin como la del ejemplo anterior,

se debe asociar nuestros datos a una distribucin
normal con media cero y varianza 1, debido a que para
este tipo de distribucin existen tablas con la
probabilidad ya calculada.
Dicha asociacin se debe hacer con la siguiente
transformacin:
Realizar el ejemplo propuesto sobre la probabilidad de

encontrar alemanes que consuman menos de 3kg de
caf al ao.
Buscar la probabilidad en la tabla para un valor menor
o igual que 0.18, es decir:
Obsrvese
que
la
grfica
toma
una
probabilidad
acumulada desde el
infinito negativo, por
esto, la probabilidad de
Z=0 es de 50%.
Segn la tabla la probabilidad de encontrar un alemn

que consuma menos de 3kg de caf al ao es de
57.14%.
Ejemplo 2. Cul es la probabilidad de encontrar un
alemn que consuma entre 3.5kg y 4kg de caf
anualmente?
Primero, hay que realizar la respectiva transformacin:
Como se busca en la tabla el rea (probabilidad) entre

dos valores y la tabla, da el rea acumulada, se debe
realizar la resta entre las dos reas, es decir:
Se interpreta como la probabilidad de que un

alemn consuma entre 3.5kg y 4kg al ao es de
12.64%.
Ejemplo 3. Cul es la probabilidad de encontrar un

alemn que consuma menos de 1kg al ao?
Para revisar un resultado negativo, se debe recordar

que la media de la distribucin Z es cero y como esta es
simtrica el cero, est en la mitad de la distribucin.
Recordado lo anterior, es fcil ver en la grfica que el
rea entre -1.63 y cero es igual al rea entre 0 y 1.63, es
decir:
Como en la tabla no aparecen los negativos para

calcular el rea menor que -1.63 debo al rea menor
que cero restarle el rea entre 0 y -1.63 que es lo
mismo por la igualdad anterior que el rea entre 0 y
1.63 , es decir:
Adems:
Lo que se interpreta como la probabilidad de

encontrar un alemn que consuma menos de 1kg
de caf es de 5.16% .
Consideraciones
Aplicar al ejemplo, la caracterstica de la distribucin

normal del intervalo de confianza que se present
anteriormente. Recordar que en esta deca que haba
una probabilidad del 95% que los datos estuvieran en
el siguiente intervalo:
Entonces existe una probabilidad de un 95% de que
se encuentre un alemn que consuma entre 0.644kg
y 4.956kg de caf al ao.
Hasta ahora se ha realizado el trabajo de anlisis con

la distribucin normal, acerca de la poblacin de
consumidores de caf alemanes sobre una muestra
de 50 de estos, deduccin a partir de las
caractersticas de la poblacin de muestra.
Realizar este tipo de anlisis es lo que se denomina

inferencia y hace parte de la estadstica inferencial.
Para que en los ejemplos anteriores sea vlido realizar
la inferencia, se
debe suponer que la media y
desviacin estndar de la muestra es igual a la de la
poblacin.
Si esto no ocurre, se escogi en la muestra
aleatoriamente, un teorema de la estadstica, que indica
que la desviacin estndar de la muestra dividida por la
raz cuadrada de n, es igual a la de la poblacin y que
las medias son iguales. Por lo cual, la funcin de
transformacin Z. queda expresada como sigue:
Otras distribuciones de probabilidad

La distribucin normal que se acab de estudiar, es
ampliamente utilizada, pero no por ello se puede pensar
que es la nica, existen otras que se describen, otros
tipo de distribuciones, vanse los siguientes ejemplos:
De las grficas se puede observar que tienen diferencias

con la distribucin normal. Por ejemplo, la simetra y
donde se concentran los datos.
Profundizar sobre estos tipos de distribuciones esta
fuera del alcance de los objetivos de esta gua, aunque
su manejo es similar al que se realiza con la distribucin
normal.
Regresin lineal
En ocasiones, cuando se est analizando datos, el

inters de conocer cmo se relacionan con otra
variable y as predecir cambios en los datos a partir de
modificaciones de la variable. Por ejemplo, si se tiene
el valor de las importaciones de cierto pas en una
cantidad de aos y se quiere conocer qu va a pasar
en los aos venideros.
Esto se realiza, aproximando los datos a una funcin
conocida. Por ejemplo, la funcin lineal grficamente
sera:
Aqu los puntos representa los datos, la lnea y la

funcin conocida.
En el clculo de la regresin, se calculan dos valores

notados; a y b. El valor a, representa la tasa de variacin
de la variable y con respecto a la variable x, en el
ejemplo de las importaciones, si este valor diera positivo,
implica que las importaciones estn creciendo y si fuera
negativo muestra un decrecimiento. La frmula para este
clculo es:
El valor b, se interpreta como el valor de la variable y

cuando la variable tenga un valor nulo, su frmula es:
Vase con un ejemplo la aplicacin.
Ejemplo
Los siguientes son los datos de importaciones
hechas por Alemania de especias y caf durante los
correspondientes aos. El valor est dado en
millones de dlares.
x
2006
2007
2008
2009
2010
2011
4.336
4.749
7.831
6.627
8.149
8.360
Ntese que para aplicar las frmulas, se deben

aadir las siguientes columnas.
xy
8.698.016
9.531.243
15.724.648
13.313.643
16.379.490
16.811.960
x.x
4.024.036
4.028.049
4.032.064
4.036.081
4.040.100
4.044.121
Ahora, se mostrarn los clculos que se necesitan

para las frmulas.
9.000
8.500
8.000
7.500
7.000
6.500
6.000
5.500
5.000
4.500
4.000
2005
y = 831,89x - 1.664.167,12
2006
2007
2008
2009
2010
2011
2012
Con esta frmula, ahora calcular un valor futuro. Por

ejemplo, las importaciones alemanas de caf y
especias para el ao 2012 y 2015.
y = 831,89x - 1.664.167,12
Si x=2012 entonces
y = 831,89(2012) - 1.664.167,12 = 9.586,93
Es decir, que en el 2012 las importaciones alemanas
de caf y especias sern por valor de 9.586,93
millones de dlares.
Si x=2015 entonces
y = 831,89(2015) - 1.664.167,12 = 12.082,59
Es decir que en el 2015 las importaciones alemanas de
caf y especias sern por valor de 12.082,59 millones de
dlares.
Ntese que los valores de los aos se podran tomar del
1 al 6 para facilitar los clculos, y para las dos
proyecciones se utilizarn los valores de 7 y 10.
Analizar ahora los a y b
El valor a=831,89 significa que las importaciones estn
creciendo a una tasa de 831,89 millones de dlares al
ao.
El valor b=-1.664.167,12 es negativo, significa que no se
realizaron importaciones, aunque se muestra que un
anlisis al ao 0 no tiene sentido, por lo cual sera mejor
para el anlisis de la b tomar los aos del 1 al 6.

Conceptos Basicos de - Estadistica Descriptiva e Inferencial PDF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Conceptos Basicos de - Estadistica Descriptiva e Inferencial PDF

Transféré par

Droits d'auteur :

Formats disponibles

Tecnlogo en Negociacin

En este Material de formacin, se introducirn

Poblacin: conjunto en el cual sus elementos

Pases con tratados

Muestra: subconjunto de la poblacin que al ser estudiado,

Las caractersticas que se le pueden estudiar a una poblacin

En el ejemplo de los alemanes, sera

En el ejemplo de los pases, sera los

2. Variables cuantitativas: se expresan en cantidades.

Medidas de tendencia central y

Medidas para el anlisis de datos

Lo interpretamos que en promedio los alemanes toman

2. Mediana: se entiende como el valor intermedio de la

De esto se deduce que si n es impar el valor no dar un

3. Moda: es el dato con mayor frecuencia, es decir el que

2. Como la mediana seala el centro de la distribucin y la

4. Desviacin estndar: se interpreta como la dispersin

Segundo, se realizar la sumatoria de todas las diferencias.

Por ltimo, se divide la sumatoria por el nmero de datos y

Se interpreta que los datos estn alejados en promedio

5. Coeficiente de variacin: al igual que la desviacin

Para calcular el coeficiente de variacin, se necesitan los

Se interpreta que la muestra tiene una dispersin del

Medidas de tendencia central y

Adems, se mostrarn dos tipos

Tabla de frecuencias variable cualitativa

Lo primero que se debe hacer, es realizar un listado de

Luego, se crea una tabla donde la primera columna se

Por ejemplo, Brasil aparece 14 veces (frecuencia

Grficos tabla de frecuencias

Histograma de frecuencias sobre la

Nota: en cualquiera de los paquetes bsicos de

Otro grfico til, es el diagrama circular en el cual se

Nota: en cualquiera de los paquetes bsicos de

Tabla de frecuencias variable cuantitativa discreta

Lo primero que se debe hacer, es realizar un listado

Al igual que con la variable cualitativa, se crean las

Por ejemplo, la frecuencia absoluta acumulada de

Grficos tabla de frecuencias

Nota: en cualquiera de los paquetes bsicos de

Otro grfico til es el diagrama circular en el cual se

Nota: en cualquiera de los paquetes bsicos de office, se

Tabla de frecuencias variable cuantitativa

En este caso, se puede observar que realizar un

En esta tabla, se adiciona una columna denominada,

En el intervalo del [1.01-2], se encuentran los valores

Grficos tabla de frecuencias

Histograma de frecuencias sobre la

Nota: en cualquiera de los paquetes bsicos de

Otro grfico til es el diagrama circular en el cual se

Nota: en cualquiera de los paquetes bsicos de

Medidas de tendencia central datos agrupados

Se interpreta que en promedio los alemanes

Es importante notar que si la variable fuera

Cuando el intervalo tiene abundantes datos, se debe

La diferencia entre la posicin media y la frecuencia

Luego de tener la posicin de la mediana dentro del

0.77 kg es lo que recorre la mediana desde que

Con lo anterior se puede escribir una expresin general

Aunque como en este caso, las Di, no se realizan por

Se interpreta como la dispersin promedio del

Se va a introducir la probabilidad con un ejemplo para

Por lo cual, para que se reciban 60 encuestas se