Vous êtes sur la page 1sur 133

ESTADISTICA

PARA
ADMINISTRACIN
Y ECONOMA.
CURSO PROPEDUTICO

DESCRIPCIN DE LOS DATOS.


Distribuciones de Frecuencias y
Representaciones Grficas.

Introduccin:
Necesitamos organizar datos de varias
maneras e indicar los sitios donde los
valores de datos tienden a acumularse,
y ayudar a distinguir los valores
mayores y menores.
Los mtodos que se utilizar para
describir un conjunto de datos son:

a.-) Distribucin de Frecuencias:


Agrupamiento
de
datos
en
categoras
mutuamente
excluyentes,
que
indican
el
nmero de observaciones en cada
categora.

Para elaborarla el primer paso es


anotar los datos en una tabla que
muestre las clases (categoras) y
el nmero de observaciones en
cada categora.
Ejemplo: Lectura 1

De acuerdo a la lectura Rob Whitner, esta


interesado en reunir informacin sobre los
precios de venta de los vehculos que vende
en su agencia.
Cul es el precio de venta tpico?, Cul es
el precio de venta ms alto? Cul es el ms
bajo? Alrededor de qu valor tienden a
acumularse los precios de venta?
La tabla siguiente muestra los precios que
pagaron los clientes por cada vehculo.
Ver : Tabla 1

La tabla anterior muestra los


datos
de
una
manera
desorganizada y es difcil sacar
los datos para contestar las
preguntas.
Por
lo
tanto
aplicaremos una distribucin de
frecuencias paso a paso.

La tabla anterior muestra los


datos
de
una
manera
desorganizada y es difcil sacar
los datos para contestar las
preguntas.
Por
lo
tanto
aplicaremos una distribucin de
frecuencias paso a paso.

Paso 1
Determinar el Nmero de Clases:
El objetivo es usar suficientes
grupos o clases. Demasiadas
clases o muy pocas no darn
informacin.

Para determinar el nmero


usaremos la siguiente frmula:

de

k = 1 + 3.322*log(n)

clases

En el ejemplo n = el nmero de observaciones


son 80.
Logaritmo de 80 = 1.903089987
Mult. 3.322*1.903089987 = 6.322064937
Completando la ecuacin
K = 1 + 6.322064937

por lo tanto se recomienda utilizar


7 clases.

Paso 2
Determinar el Intervalo o Amplitud:
El intervalo o amplitud de las clases debe de
ser el mismo. Todas las clases deben de
cubrir la distancia que hay desde el menor
hasta el mayor valor de los datos sin
procesar. Usaremos la siguiente frmula:

i >= H-L

Donde:
i= Intervalo de la clase.
H= Mayor valor observado.
L= Menor valor observado.
K= Numero de clases.

Para el ejemplo:
L=12,546 USD
H=32,925 USD
K=7
Entonces:

(32,925-12,546)= 2,911 USD


7

Redondeando hacia arriba nos queda


de 3,000 USD.

Paso 3
Establecer los Lmites de cada Clase:
Cada observacin debe pertenecer a
una sola clase.
Para el ejemplo: 7 clases con una
amplitud de 3,000 USD nos da un total
de 21,000 USD.

Las clases que


ejemplo seran:
$12,000
$15,000
$18,000
$21,000
$24,000
$27,000
$30,000

hasta
hasta
hasta
hasta
hasta
hasta
hasta

usaramos

15,000
18,000
21,000
24,000
27,000
30,000
33,000

para

el

Paso 4
Distribuir los Precios de Venta de los
Vehculos en las Distintas Clases:
CLASE
$12,000 hasta 15,000
$15,000 hasta 18,000
$18,000 hasta 21,000
$21,000 hasta 24,000
$24,000 hasta 27,000
$27,000 hasta 30,000
$27,000 hasta 33,000

PRECIOS EN ESTA
CLASE
IIII III
ETC, ETC.

Paso 5
Contar el Numero de Elementos en Cada Clase:Al
numero de observaciones en cada clase se le llama
frecuencia.
Precios de venta
(Miles de Dlares)
$12 hasta 15
$15 hasta 18
$18 hasta 21
$21 hasta 24
$24 hasta 27
$27 hasta 30
$30 hasta 33

Frecuencia

8
23
17
18
8
4
2
80

Distribucin de Frecuencias Relativas.


Es el porcentaje del nmero total de
observaciones en cada clase.
Precios de venta
(Miles de Dlares)
$12 hasta 15
$15 hasta 18
$18 hasta 21
$21 hasta 24
$24 hasta 27
$27 hasta 30
$27 hasta 33
TOTAL

Frecuencia

Frecuencia Relativa

8
23
17
18
8
4
2

0.1000
0.2875
0.2125
0.2250
0.1000
0.0500
0.0250

80

1.000

Ya organizados los datos en una distribucin de


frecuencias podemos rendir un informe.
1.- Los precios de venta van desde los 12,000 hasta los
33,000 USD.
2.- Los precios de venta se concentran entre 15,000 y
24,000 USD (72.5% se localizan en ste intervalo).
3.- La mayor concentracin est en la clase de 15,000
a 18,000 USD. El valor central de la clase es 16,500
USD (ste es le precio tpico de venta)
15,000+18,000 = 16,500 USD.
2

Con sta informacin el seor


Whitner tendr una imagen clara
de la distribucin de los precios
de venta del mes anterior.

PRACTICA
Autoexamen 2.1, 2.2, y 2.3
Ejercicios 1 a 8

Representaciones Graficas de una


Distribucin de Frecuencias.
Nos proporcionan una buena imagen,
visualizacin rpida, manejo de varios
datos, percepcin rpida. Etc.
Los mas utilizados son el histograma,
el polgono de frecuencias y el polgono
de frecuencias acumuladas.

HISTOGRAMA:
Es una grfica en la que las clases se
marcan en el eje horizontal y las
frecuencias de clase en el eje vertical.
Las
frecuencias
de
clase
estn
representadas por las alturas de las
barras, y stas se colocan juntas una
con otra.

POLGONO DE FRECUENCIAS:
Esta formado por segmentos de recta
que unen a los puntos medios de cada
clase (valor tpico) y las frecuencias de
clase.

Polgono de Frecuencias en un
comparativo:

Podemos representar grficamente los


datos usando tanto los histogramas
como los polgonos:

Polgono de Frecuencias Acumuladas:


Precios de venta
(Miles de
Dlares)

$12 hasta 15
$15 hasta 18
$18 hasta 21
$21 hasta 24
$24 hasta 27
$27 hasta 30

Frecuencia

8
23
17
18
8
4
2

$27 hasta 33

TOTAL

80

Frecuenci De donde
a
sali?
acumulad
a
8
31
48
66
74
78
80

8+23
8+23+17
8+23+17+18
8+23+17+18+8
8+23+17+18+8+
4
8+23+17+18+8+
4+2

Si en este caso se calcula la frecuencia


acumulada y se grafica ; la figura recibe el
nombre de curva ojiva o simplemente ojiva.
Para anlisis estadsticos mas avanzados se
suele tomar el polgono de frecuencias; en este
caso solamente la curva; Lo que recibe el
nombre de curva normal o campana de gauss.

Otras Representaciones Grficas.

Las grficas de barras son tiles para mostrar


cualquiera de los niveles de medicin: nominal,
ordinal de intervalo o de razn.
En los histogramas los datos pertenecen a una
escala de intervalo o de razn.
Las grficas circulares son tiles para mostrar
los datos de nivel nominal.
Las graficas de lneas para mostrar tendencias
con series de tiempo
Las graficas de correlacin o x,y son tiles para
graficar funciones lineales, cuadrticas y en
general polinomiales

ejercicios

Elabora las siguientes graficas


tomando como base los ejercicios 7 y
8 del tema de distribucin de
frecuencias.
Histograma
Polgono de frecuencias
Polgono de frecuencias acumuladas
( La ojiva)

DESCRIPCIN DE LOS
DATOS.

En este captulo se continuar con el


desarrollo de mtodos para describir un
conjunto de datos, mediante un nico
valor:
Medida de tendencia central.
Es un valor nico que resume un conjunto
de datos. Seala el centro de los valores.

Ejemplo:
Durante el cuatrimestre enero-abril
las calificaciones promedio en
Matemticas III fue de 8.7
El rendimiento promedio de un
automvil de 4 cilindros es de 14.6
km/lt.

En estadstica existen varias medidas


de tendencia central.
Trabajaremos con las ms utilizadas.

Media Poblacional:
Se utilizan todos los valores de una
poblacin.
Ejemplo:
El
promedio
de
calificaciones del EGETSU en todas
las Universidades Tecnolgicas de la
Repblica fue de 9.2

Ejemplo 2:
Las comisiones obtenidas de todas las
tiendas Suburbia en el ao 2006
fueron de $ 1,875 por empleado.

En resmen:
La media poblacional se calcula con la siguiente frmula:

=x/N
Donde:

= Media de la poblacin.
x= Suma de todos los valores.
N= Nmero total de elementos en la poblacin.

Media Muestral.
Solo seleccionamos una muestra de la
poblacin.
Ejemplo: El departamento de calidad
necesita tener la seguridad de que la
longitud de sus lminas es aceptable.
Selecciona 5 lminas y las mide y saca la
longitud promedio, y con ello estima la
longitud de las lminas que se producen.

Para datos no agrupados usaremos la siguiente


frmula:
_
x = x/n
Donde:
_
x = Media muestral
x= Suma de todos los valores de la muestra.
n= Nmero total de valores en la muestra.

La media de una muestra, o cualquier


otra medida basada en datos
mustrales se denomina dato
estadstico
La caracterstica de una poblacin tal
como la media aritmtica se
denomina parmetro poblacional

Ejercicio:
Cierta empresa se especializa en los
intereses a largo plazo que ofrecen
los bancos de diferentes pases.
Una muestra aleatoria de 6 bancos
revel lo siguiente:

PASES
Banco de
Australia
Banco de
Blgica
Banco de
Canad
Banco de
Francia
Banco de
Italia

TASA DE
INTERS
9.50 %
7.25 %
6.50 %
4.75 %
12.0 %
8.30 %

Cul es la media de las tasas de


inters en sta muestra de intereses a
largo plazo?

Propiedades de la Media
Aritmtica.
Propiedades:
1.- Todo conjunto de datos de nivel de
intervalo tiene un valor medio.
2.- Para evaluar la media se consideran
todos los valores.

3.- Un conjunto de datos solo tiene una media.


4.- La media es til para comparar dos o mas
poblaciones.
5.- La media aritmtica es la nica medida de
tendencia central, donde la suma de las
desviaciones de cada valor, respecto de la
media, siempre es igual a cero:
_
(X-X)=0

Ejemplo:
La media de 3,8,4 es 5
Entonces:
_
(X-X)= (3-5)+(8-5)+(4-5)=0
= -2+3-1=0
= 0=0

DESVENTAJAS DE LA MEDIA:
Si valores de una poblacin son muy
grandes o muy pequeos, al sacar la
media podra no ser un promedio
adecuado para representar datos.

Ejemplo:
Los ingresos mensuales de los 5
profesores de Matemticas de la
carrera de comercializacin de la
UTSJR son:
$5,000- $4550- $3920- $ 5125 y
$12,569.

El
sueldo
de
$
12,569
indebidamente a la media.

afecta

Otra desventaja es que si hay clases con


extremos abiertos, como salarios de $
6,000 ms, y existan 11 profesores en
esta clase no sabes si se acerca a los
$6,000, a los $7,000 etc.
Por lo tanto no es posible determinar la
media aritmtica para intervalos abiertos.

PRCTICA:
1.- AUTOEXMEN 3.1
2.- EJERCICIOS 1-10

MEDIA PONDERADA.
Se
utiliza
cuando
hay
varias
observaciones con un mismo valor.
Ejemplo:
Un restaurante vende refrescos chicos,
medianos y grandes; y sus precios son de
$2, $3, $4 respectivamente. Los ltimos
10 refrescos que se vendieron 1 chicos, 4
medianos, y 5 grandes.

Para calcular el precio promedio de


los ltimos 10 refrescos vendidos
podemos usar:
_
x = x/n
(Media Muestral)

Lo ms correcto es usar la frmula de la


Media Ponderada:
_
Xw= w1X1+w2x2+w3x3++wnxn
w1+w2+w3++wn
_
Donde: X = Media Ponderada.
W= Cantidad de cada muestra.
x= Ponderaciones (precios).

Sustituyendo datos:
_
X= 1($2)+4($3)+5($4) =34 = $ 3.4
1+4+5
10
ste es el precio de venta medio de los
ltimos 10 refrescos vendidos.
Cada observacin se multiplica por el
nmero de veces que se presenta.

Ejercicio:
Cierta constructora paga a sus empleados
$120, $ 140, $ 160 pesos a sus
empleados. En al empresa hay 26
empleados contratados por hora.
14 reciben la primer tarifa, 10 reciben la
segunda y 2 reciben la ltima tarifa.
Cul es la media de la tarifa por hora que
se paga a los 26 trabajadores?

Autoexamen 3.2
Ejercicios 11-14

Mediana.
Valor que corresponde al punto medio de
los valores despus de organizarlos de
mayor a menor o viceversa.

Ejemplo:
Precios en pesos de casas en cierta colonia son:
$ 80,000 $ 65,000 $ 70,000 $ 275,000 $ 60,000
$ 60,000
$ 65,000
$ 70,000
$ 80,000
$ 275,000

Despus de ordenarlos podemos observar


cual es la mediana.

Ejemplo II:
Las tasa de inters bancario a 3 meses de
los principales bancos del pas son:
Banamex 28.5%, Scotiabank 17.2%,
Santander Serfn 25.4%, Bancomer
28.6%, Banorte 22.6%, HSBC 21.0%

Solucin:
Ordenarlos de mayor a menor o viceversa:
17.2%
21.0%
22.6%
25.4%
28.5%
28.6%

Como existen 2 valores


centrales, se calcula la
mediana de ambas:
22.6+25.4 = 24.0%
2

MODA.
Es el valor de la observacin que aparece
con mas frecuencia.

Autoexamen 3.3
Ejercicios 15-20

Media Geomtrica.
Se utiliza ampliamente en negocios y la
economa,
para
sacar
cambios
porcentuales de ventas, sueldos, cifras
econmicas (PIB).
Su frmula es :
n ____________
MG= (X1)(X2)(Xn) <= Media Aritmtica

Ejemplo:
Las ganancias obtenidas por una
constructora, en cuatro proyectos
recientes fueron de 3%, 2%, 4%, y 6%
Cul es la media geomtrica de la
ganancia?
4__________ 4___
MG= (3)(2)(4)(6) = 144 = 3.46 %
Calcule la media aritmtica y compare. R = 3.75

Un segundo uso de la Media Geomtrica


es encontrar aumentos porcentuales
promedio en un intervalo de tiempo.
Ejemplo:
Si se ganaron $30,000 pesos al ao, en
1990, y $50,000 en el ao 2000. Cul es
la tasa de aumento anual en el periodo?
La tasa de aumento se determina
mediante:

Formula de Aumento Porcentual Promedio


en un Periodo Determinado:
n ___________________
MG= Valor al final del periodo __ 1
Valor al inicio del periodo
n= Nmero de periodos

Ejemplo:
La poblacin en Mxico en 2001 era de
315,020 personas, y en 2007 de 789,915.
Cul fue la tasa del incremento
porcentual anual promedio para el
periodo?
Entre 2001 y 2007 hay una diferencia de 6
aos por lo tanto n=6

6_______
MG= 789,915 _
315,020
6_______

MG= 2.50750 __

MG= 1.16557474 1
MG= 0.16557474
MG= 16.55% (Tasa de Aumento Anual por Ao)

Autoexamen 3.4
Ejercicios 21-28

MEDIA, MEDIANA Y MODA DE


DATOS AGRUPADOS.
Se utiliza cuando se tienen datos de
edades, ingresos etc. y se presentan en
forma de distribucin de frecuencias

Media Aritmtica de Datos Agrupados:


Se utiliza la siguiente frmula:
__

X=fX
n

Donde:

X= Media Aritmtica
X= Valor central o punto medio de
cada clase
f= Frecuencia en cada clase
fx= Frecuencia en cada clase multiplicada por el punto medio de la clase
fx= Suma de esos productos.
n= Nmero total de frecuencias

Ejemplo:
Utilizando el mismo ejemplo de la
agencia Whitner Pontiac.
Precios de
venta
(Miles de
Dlares)
$12 hasta 15
$15 hasta 18
$18 hasta 21
$21 hasta 24
$24 hasta 27
$27 hasta 30
$30 hasta 33

Frecuen
cia

8
23
17
18
8
4
2

Punto
Medio
(X)

fX

$13.5
$16.5
$19.5
$22.5
$25.5
$28.5
$31.5

$108.0
$379.5
$331.5
$405.0
$204.0
$114.0
$63.0
$1,605.0

80

_
X=fX = $1,605 = $20.1 (miles)
n
80
Por lo tanto la media del precio de
venta
de
los
vehculos
es
aproximadamente $20,100

Autoexamen 3.5
Ejercicios 29-34

MEDIANA
n
Mediana= L+ 2 FA (i)

f
Donde: L= Lmite inferior de la clase que contiene a la mediana.
n= Numero total de frecuencias.
f= Frecuencia de la clase que contiene a la mediana.
FA= Nmero acumulado de frecuencias en todas las clases que preceden a la clase que contiene a la median
i= Amplitud de la clase en que se encuentra la mediana.

Ejemplo:
El mismo caso de los automviles
Pontiac: Cul es la mediana del precio
de venta?
Precios de venta
(Miles de Dlares)
$12 hasta 15
$15 hasta 18
$18 hasta 21
$21 hasta 24
$24 hasta 27
$27 hasta 30
$27 hasta 33

Frecuencia

Frecuencia
Acumulada ( FA)

8
23
17
18
8
4
2

8
31
48
66
74
78
80

80

Para calcular la mediana se localizar


la observacin nmero 40. Aplicando la
frmula:
80 - 31
Mediana=$18,000+ 2____ ($3,000)
17
Mediana= $ 19,588

MODA
Es el valor que ocurre con mayor
frecuencia. Para datos agrupados es
posible aproximar la moda usando el
punto medio de la clase que contiene el
mayor nmero de frecuencias de clase.
Pueden darse el caso de tener 2
modas.

Autoexamen 3.6
Ejercicios 35-38

OTRAS MEDIDAS DESCRIPTIVAS

Introduccin:
En ste captulo se continuar con el
desarrollo de medidas para describir
un conjunto de datos, concentrndose
en las medidas que describen la
dispersin o variabilidad de los datos
considerados.

Medidas de Dispersin.
Una medida de dispersin se puede utilizar para
evaluar la confiabilidad de dos o mas promedios.
Existen varias medidas de dispersin:
1.-) Amplitud o intervalo de variacin:
Es la diferencia entre el valor mas grande y el mas
pequeo de un conjunto de datos. Su frmula es:
Amplitud de Variacin= Valor mas grande-Valor mas
pequeo

b.-) Desviacin Media.- Es el promedio aritmtico de


los valores absolutos de las desviaciones con
respecto a la media aritmtica. Su frmula es:
_
DM= /x-x/
n
Donde: x= valor de cada observacin.
_
x= Es la media aritmtica de los valores.
n= Numero de observaciones de la muestra.
//= Valor absoluto.

Ejemplo: El nmero de pacientes atendidos en la sala de urgencias del


IMSS, en una muestra de cinco das el ao pasado fue: 103,97,101,106,
y 103. Determine e interprete la desviacin media.
Primero sacar la media aritmtica= 102

Nmero de casos

_
(x-x)

Desviacin absoluta

103
97
101
106
103

(103-102)
(97-102)
(101-102)
(106-102)
(103-102)

1
5
1
4
1
TOTAL

12

_
DM= /x-x/

12 = 2.4 Pacientes por da


n
5
La media son 102 enfermos diarios y 2.4 es la
desviacin media.
AUTOEXAMEN 4.1 Y EJERCICIOS 1 A 5

POBLACIONAL

VARIANZA
MUESTRAL

EJEMPLO:
La altura de los perros en milmetros:

LAS ALTURAS SON 600 mm, 470 mm, 170 mm, 430

Calcula la media aritmtica:

La lnea verde marca la media de las

Calcula la diferencia de cada


altura con respecto a la
media:

Calcula la varianza y la
desviacin estndar 147 mm:

LA DESVIACIN ESTNDAR NOS


AYUDA A SABER QUE ES
NORMAL, EXTRA GRANDE
EXTRA PEQUEO:

Varianza Poblacional: 2=(x- )2

N
Donde:
2= Varianza Poblacional.
X= Valor de una observacin en la poblacin.
= Media aritmtica en la poblacin
N= Numero total de observaciones en la poblacin.
NOTAS: La varianza y la desviacin estndar se basan en las
desviaciones con respecto a la media.
La varianza solo es positiva o cero, lo ltimo si todas las
observaciones son iguales.

Ejemplo:
Las edades de los alumnos del grupo CO-03-09 de la
UTSJR, son 38,26,13,41, y 22 aos Cul es la
varianza de esa poblacin?
Edad (X)

X-

(X-)2

38
26
13
41
22

10
-2
-15
13
-6

100
4
225
169
36

534

TOTAL 140

= x= 140= 28
N
5
2=(x- )2= 534=106.8 (nota: son aos al cuadrado)
N
5
Si le sacamos raiz cuadrada: 10.3 aos
A lo anterior se le llama desviacin estandar
poblacional.
AUTO EXAMEN 4.2 EJERCICIOS 7 A 12

_
Varianza Muestral:

S2= (x- x)2

n-1
Donde:

S2= Varianza Muestral


X= Valor de cada observacin en la muestra.
_
X= Media de la muestra.
n= Nmero total de observaciones muestrales

Ejemplo: Los salarios en pesos por hora en una


muestra de operarios de medio tiempo de Coca-Cola
son: 2,10,6,8,9. Cul es la desviacin estndar?

_
X= x= 35/5= $7
n

Salario por hora

_
(x-x)

_
(x-x)2

2
10
6
8
9

-5
3
-1
1
2

25
9
1
1
4

TOTAL

$ 35la formula: S2= 40= 10 pesos al cuadrado.


Aplicando
5-1
Pero si le sacamos raiz cuadrada= 3.1 pesos y esta ser la
desviacin estandar

40

AUTOEXAMEN 4.3 EJERCICIOS 13 A 18.

MEDIDAS DE DISPERSIN PARA DATOS


AGRUPADOS EN UNA DISTRIBUCIN DE
FRECUENCIAS.
Amplitud de la Variacin= Lmite superior de la clase mas alta menos
el lmite inferior de la clase mas baja.
Ejemplo:

Precios de venta
(Miles de Dlares)
$12 hasta 15
$15 hasta 18
$18 hasta 21
$21 hasta 24
$24 hasta 27
$27 hasta 30
$30 hasta 33

Frecuencia

8
23
17
18
8
4
2

En ste caso la amplitud de la variacin es: 33-12=21

Desviacin Estndar Datos Agrupados

____________
S= fx2- (fx)2
n___
n-1
Donde: S= Desviacin Estndar Muestral.
X= Punto medio de una clase
f=frecuencia de la clase.
n= Nmero total de observaciones en la muestra

Ejemplo:
Una muestra de las cantidades que los empleados
de Kimberly Clark de Mxico invierten
quincenalmente en el plan de participacin de
utilidades, se organiz en una distribucin de
frecuencias para su estudio. Cul es la desviacin
Estndar de los datos? Cul es la varianza
Muestral?
Cantidad Invertida
$
$
$
$
$
$
$
$

30
35
40
45
50
55
60
65

hasta
hasta
hasta
hasta
hasta
hasta
hasta
hasta

$
$
$
$
$
$
$
$

35
40
45
50
55
60
65
70

Nmero de
Empleados
3
7
11
22
40
24
9
4

Cantidad
Invertida
$ 30 hasta
35
$ 35 hasta
40
$ 40 hasta
45
$ 45 hasta
50
$ 50 hasta
55
$ 55 hasta
60
$ 60 hasta
65
$ 65 hasta
70

Nmero de
Empleados (f)
$
$
$
$
$
$
$
$

3
7
11
22
40
24
9
4
120

Punto
medio (x)

fX

fX x
X

$ 32.50
37.50
42.50
47.50
52.50
57.50
62.50
67.50

$
97.50

3168.75

$6,185
.00

325,500
.00

Sustituyendo en la frmula:
____________
S= fx2- (fx)2
n___=
$ 7.51
n-1

325,500-318,785.2 =
120-1

La Desviacin Estndar Muestral es $ 7.51


La Varianza Muestral es (7.51)2
aproximadamente 56.40 (en dlares al
cuadrado)

AUTOEXAMEN 4.4 Y EJERCICIOS 19 A 22

COEFICIENTE DE
CORRELACIN
Y
COEFICIENTE DE
DETERMINACIN

INTRODUCCIN
En ste tema realizaremos un anlisis y
clculos numricos para expresar la relacin
entre 2 variables.
Determinaremos si la relacin es fuerte,
dbil, directa o inversa.
Por citar algunos ejemplos:
La relacin entre la publicidad y las
ventas.
Las horas que dedican los alumnos del

Anlisis de Correlacin.
Es el grupo de tcnicas para medir la
asociacin entre dos variables.
Lo primero que debemos hacer es trazar los
datos en un diagrama de dispersin.

EJEMPLO:
Cierta compaa que se dedica a la venta de
copiadoras desea saber si existe alguna
relacin entre el nmero de llamadas que
realiza el vendedor y el nmero de ventas
realizadas.
Para realizar el estudio se decide tomar una
muestra aleatoria de 10 vendedores
Observe el cuadro siguiente y emita su
anlisis:

El gerente sospecha que si existe una


relacin entre llamadas de venta y ventas
realizadas.
Visualiza que existen algunos vendedores
que hicieron pocas llamadas y por ende
realizaron pocas ventas.
En general, al aumentar el nmero de
llamadas, tambin aumenta el nmero de
ventas.
De acuerdo a ste ejemplo, el nmero de
llamadas se le considera una variable

Definiendo:
a.-) Variable Dependiente:
Es la variable que se predice o estima, y se
grafica en el eje X.
b.-) Variable Independiente:
Es la variable que proporciona la base para
la estimacin, es la variable de pronstico,
y se grafica en el eje Y.
De acuerdo a lo anterior, realice la grfica
de dispersin para el ejemplo.

En la grfica se puede observar que entre


ms llamadas se realizan ms ventas, esto
es, existe una relacin positiva entre las
dos variables, pero no todos los puntos se
encuentran sobre una recta.
Para determinar la fuerza y la direccin de
una relacin entre dos variables, debemos
determinar el coeficiente de correlacin

COEFICIENTE DE CORRELACIN DE
PEARSON.
Describe la fuerza de relacin entre dos
conjuntos de variables, se designa con la
letra r , y su intervalo de valores es de -1
a 1.
Un coeficiente de correlacin de 1 o de -1,
indica una correlacin perfecta.

De lo anterior tenemos que pueden existir 4


tipos bsicos de correlaciones:
Correlacin positiva.
Correlacin negativa.
Correlacin exponencial.
Sin correlacin.

PROPIEDADES
Cuando el valor de r es cercano a cero
indica que la relacin lineal es muy dbil.
Cuando el valor de r se acerca a -1 se
tiene una relacin fuerte inversa.
Cuando el valor de r se acerca a +1 se
tiene una relacin fuerte directa.

EJERCICIO: Calcular el coeficiente de


correlacin de la empresa que vende
copiadoras

Primero realizaremos un diagrama de


dispersin, despus, trazaremos dos rectas
en la media tanto de las llamadas como en
la media de las computadoras vendidas.

Nuestro diagrama se dividi en cuatro


cuadrantes, y el origen de nuestro trazo es
el punto (22,45).
Ahora llenaremos la tabla siguiente:

Para calcular el coeficiente de correlacin


utilizaremos la siguiente frmula:
Donde lo nico que nos faltara calcular es
la desviacin estndar muestral que vimos
con anterioridad:
2

Varianza Muestral:

S= (x- x)

n-1
Donde

sx = 9.189

sy = 14.337

Sustituyendo los datos en la frmula de


correlacin:

El valor obtenido es positivo, por lo que hay


una relacin directa entre el nmero de
llamadas y el nmero de ventas, lo cul
confirma el razonamiento basado en el
diagrama de dispersin.
As mismo el valor es cercano a 1, esto
indica una asociacin fuerte.

Coeficiente de Determinacin.
Los resultados de un coeficiente de
correlacin (fuerte, moderado, dbil), no
tiene un significado exacto.
Para saberlo utilizaremos el coeficiente de
determinacin, que no es otro clculo, mas
que elevar el coeficiente de correlacin al
cuadrado:
2

Para el ejercicio anterior donde r=0.759, el


coeficiente de determinacin sera 0.576, lo
cul si lo pasamos a porcentaje 57.6 %
Esto nos dice que es posible decir que 57.6
% de la variacin en el numero de
copiadoras vendidas, se contabiliza por la
variacin en el nmero de llamadas de
ventas.

AUTOEXAMEN 13.1
EJERCICIOS 1 A 6

FIN

Vous aimerez peut-être aussi