Vous êtes sur la page 1sur 13

Notas de aula - Estatstica III 32

UNIDADE II. ANLISE BIDIMENSIONAL


1. VARIVEIS BIDIMENSIONAIS

At agora vimos como organizar e resumir informaes pertinentes a uma nica varivel, mas
freqentemente estamos interessados em analisar o comportamento conjunto de duas ou mais
variveis. Aqui tambm a distribuio conjunta de freqncias ser um poderoso instrumento para
ajudar a compreenso dos dados, o que faremos atravs da anlise bidimensional, isto anlise de
duas variveis conjuntamente.

Quando consideramos duas variveis (ou dois conjuntos de dados), podemos ter trs situaes:
(a) as duas variveis so qualitativas;
(b) as duas variveis so quantitativas; e
(c) uma varivel qualitativa e a outra quantitativa.

As tcnicas de anlise de dados nas trs situaes so diferentes. Quando as variveis so
qualitativas, os dados so resumidos em tabelas de dupla entrada ( ou de contingncia), onde
aparecero as freqncias absolutas ou contagens de indivduos que pertencem simultaneamente a
categorias de uma e outra varivel. Quando as duas variveis so quantitativas, as observaes so
provenientes de mensuraes, e tcnicas como grficos de disperso ou de quantis so apropriados.
Quando temos uma varivel qualitativa e outra quantitativa, em geral analisamos o que acontece com
a varivel quantitativa quando os dados so categorizados de acordo com diversos atributos da
varivel qualitativa.

VARIVEIS QUALITATIVAS
Exemplo 1: Suponhamos que queremos analisar o comportamento conjunto das variveis grau de
educao (X) e a regio de procedncia (Y) , contidas no quadro 1.1. A distribuio conjunta de
freqncias dada numa tabela de dupla entrada, e est apresentada na Tabela A , a seguir:

TABELA 4.1 - Distribuio conjunta das freqncias das variveis grau
de instruo (X) e regio de procedncia (Y)
Grau de Educao X
Y
1
o
grau 2
0
grau Superior Total ()
Capital 4 5 2 11
Interior 3 7 2 12
O. Regio 5 6 2 13
Total () 12 18 6 36
Fonte: Quadro 1.1 (Unidade II)
UNID II . ANLISE BIDIMENSIONAL Jozemar Pereira Santos
Notas de aula - Estatstica III 33


Cada clula no corpo da tabela fornece a freqncia absoluta observada das realizaes conjuntas de X e
Y. Assim, observamos 4 empregados da capital com instruo de 1
0
grau, 5 da capital com o 2
0
grau, etc.
A Linha Total () fornece a distribuio da varivel X (grau de instruo), enquanto que, a Coluna
Total () fornece a distribuio da varivel Y (regio de procedncia), denominadas tecnicamente de
distribuies marginais de X e de Y, ao passo que a Tabela A constitui a distribuio conjunta de X e Y.

- FREQUNCIAS PERCENTUAIS OU PROPORES
Em vez de trabalharmos com as freqncias com as freqncias absolutas , podemos construir tabelas
com as freqncias percentuais, com foi feito no caso unidimensional. Mas aqui existem trs
possibilidades de expressarmos a freqncia percentual de cada clula ou casela:
a) Em relao ao total geral (n total de observaes) - Ex.: Tabela 4.2;
b) Em relao ao total de cada coluna (Total ) ou a varivel coluna - Ex.: Tabela 4.3;
c) Em relao ao total de cada linha (Total ) ou a varivel linha - Ex.: Tabela 4.4;
De acordo com o objetivo do problema em estudo, uma delas ser mais conveniente.

TABELA 4.2 - Distribuio conjunta das freqncias das variveis X e Y
(Percentual em relao ao Total Geral)

Grau de Educao X
Y 1
o
grau 2
0
grau Superior Total ()
Capital 4 (11%) 5 (14%) 2 (6%) 11 (31%)
Interior 3 (8%) 7 (19%) 2 (6%) 12 (33%)
O. Regio 5 (14%) 6 (17%) 2 (5%) 13 (36%)
Total () 12 (33%) 18 (50%) 6 (17%) 36 (100%)
Fonte: Quadro 1.1

Assim, podemos afirmar na Tabela 4.2 acima, que 11% dos empregados vm da capital e tm instruo
de 1
0
grau. Os totais marginais fornecem as distribuies unidimensionais de cada uma das variveis.
UNID II . ANLISE BIDIMENSIONAL Jozemar Pereira Santos
Notas de aula - Estatstica III 34


TABELA 4..3 - Distribuio conjunta das freqncias das variveis X e Y
(Percentual em relao X (grau de educao) - Varivel Coluna)

Grau de Educao X
Y 1
o
grau 2
0
grau Superior Total ()
Capital 4 (33%) 5 (28%) 2 (33%) 11 (31%)
Interior 3 (25%) 7 (39%) 2 (33%) 12 (33%)
O. Regio 5 (42%) 6 (33%) 2 (34%) 13 (36%)
Total () 12 (100%) 18 (100%) 6 (100%) 36 (100%)
Fonte: Quadro 1.1

Podemos afirmar que, entre os empregados com instruo at 1
0
grau, 33% vm da capital, enquanto que
dos empregados com instruo de 2
0
grau, 28% vm da capital.


De modo anlogo, podemos construir a distribuio conjunta de freqncias percentuais em relao
varivel linha ou considerando o Total das Linhas ()

TABELA 4..4 - Distribuio conjunta das freqncias das variveis X e Y
(Percentual em relao Y (regio de procedncia) - Varivel Linha)

Grau de Educao X
Y 1
o
grau 2
0
grau Superior Total ()
Capital 4 (36%) 5 (45%) 2 (19%) 11 (100%)
Interior 3 (25%) 7 (58%) 2 (17%) 12 (100%)
O. Regio 5 (38%) 6 (46%) 2 (16%) 13 (100%)
Total () 12 (33%) 18 (50%) 6 (17%) 36 (100%)
Fonte: Quadro 1.1
Podemos dizer que, entre os empregados provenientes da Capital, 36% tm nvel de educao de 1
0
grau,
enquanto que entre os empregados do Interior, 25% tm instruo de 1
0
grau.
UNID II . ANLISE BIDIMENSIONAL Jozemar Pereira Santos
Notas de aula - Estatstica III 35


3. ASSOCIAO ENTRE DUAS VARIVEIS QUALITATIVAS
Um dos principais objetivos de se construir uma distribuio conjunta de freqncias de duas
variveis qualitativas descrever a associao ou relao entre elas, isto , queremos conhecer o grau
de dependncia entre elas, de modo que possamos prever melhor o resultado de uma delas quando
conhecermos a realizao da outra.
Por exemplo, se quisermos estimar qual a renda mdia de uma famlia moradora da cidade de
Joo Pessoa, a informao adicional sobre a classe social a que ela pertence nos permite estimar com
maior preciso essa renda, pois sabemos que existe uma dependncia entre as duas variveis: renda
familiar e classe social. Ou, ainda, suponhamos que um estudante seja sorteado aleatoriamente na
UFPB e devamos adivinhar o sexo desse estudante. Se soubermos que o estudante do curso de
enfermagem, nossa resposta mais provvel ser dizer que a pessoa de sexo feminino. Ou seja, h um
grau de dependncia grande entre as variveis sexo e escolha de rea de estudos.
Vejamos, agora, como identificar a dependncia ou no entre duas variveis atravs da
distribuio conjunta.
Exemplo 2. Queremos verificar se existe ou no associao entre o sexo (X) e a escolha de curso (Y)
por universitrios. Para tal, foi tomada uma amostra aleatria de 200 universitrios, e considere os
resultados apresentados nas respectivas tabelas conjuntas, Tabela 4.5 e Tabela 4.6 a seguir:

Tabela 4.5 Distribuio conjunta dos estudantes Tabela 4.6 Distribuio conjunta dos
estudantes segundo o sexo (X) e o curso escolhido (Y) segundo o sexo (X) e o curso
escolhido (Y)
X
Y

Masculino

Feminino

Total ()
X
Y

Masculino

Feminino

Total ()
Economia 85 (61%) 35 (58%) 120 (60%) Fsica 100 (71%) 20 (33%) 120 (60%)
Administ. 55 (39%) 25 (42%) 80 (40%) C. Sociais 40 (29%) 40 (67%) 80 (40%)
Total () 140 (100%) 60 (100%) 200 (100%) Total () 140 (100%) 60 (100%) 200 (100%)

Observando os percentuais ou propores em relao a coluna total () na Tabela 4.5, verificamos
que, independentemente do sexo 60% dos estudantes preferem Economia e 40% Administrao. No
havendo dependncia entre as variveis, esperaramos essas mesmas propores para cada sexo.
Observando a Tabela 4.5, vemos que os percentuais do sexo masculino (61% e 39%) e do sexo
UNID II . ANLISE BIDIMENSIONAL Jozemar Pereira Santos
Notas de aula - Estatstica III 36

feminino (58% e 42%) so prximas do totais() marginais (60% e 40%). Esses resultados parecem
indicar no haver dependncia entre as duas variveis, para o conjunto de estudantes considerado.
Conclumos ento que, neste caso, as variveis sexo e escolha do curso parecem ser no associadas.

Vamos considerar, agora, a situao semelhante, mas envolvendo alunos de Fsica e Cincias Sociais,
cuja distribuio conjunta est na Tabela 4.6 .

Comparando agora a distribuio dos percentuais ou propores, pelos cursos, independentemente do
sexo (coluna de totais), com as distribuies diferenciadas por sexo (colunas de masculino e
feminino), observamos uma disparidade bem acentuada nas propores. Parece, pois, haver maior
concentrao de homens no curso de Fsica e de mulheres no curso de Cincias Sociais. Portanto,
nesse caso, as variveis sexo e curso escolhido parecem ser associadas.

Quando existe associao entre variveis, sempre interessante quantificar essa associao, o que
ser objeto de estudo a seguir.

4. MEDIDAS ASSOCIAO ENTRE VARIVEIS QUALITATIVAS
De um modo geral, a quantificao do grau de associao ou dependncia entre duas variveis feita
pelos chamados coeficientes de associao ou correlao. Essas so medidas que descrevem, por
meio de um nico nmero, a associao (ou dependncia) entre duas variveis. Para maior facilidade
de compreenso, esses coeficientes usualmente variam entre 0 e 1, ou entre 1 e +1, e a proximidade
de zero indica falta de associao.
Existem muitas medidas que quantificam essa associao entre variveis qualitativas, apresentaremos
apenas duas delas: o chamado coeficiente de contingncia, devido a K. Pearson e uma modificao
desse.

Exemplo 3. Desejamos investigar se h alguma relao entre as notas de um teste qualificao (X) de
pessoas que passaram por um programa de treinamento e seu desempenho(Y) subsequente em um
emprego. E, para tal, tomou-se uma amostra de 400 casos extrados de um arquivo muito extenso.

Tabela 4.7 Distribuio conjunta Notas do teste de qualificao (X) e Desempenho no emprego (Y).
Desempenho no emprego (Y) Nota do teste (X)
Fraco Razovel Bom
Total
abaixo da Mdia 67 (43,0%) 64 (41,0%) 25 (16,0%) 156 (100,0%)
Mdia 42 (24,1%) 76 (43,7%) 56 (32,2%) 174 (100,0%)
acima da Mdia 10 (14,3%) 23 (32,9%) 37 (52,8%) 70 (100,0%)
Total 119 (29,8%) 163 (40,7%) 118 (29,5%) 400 (100,0%)

UNID II . ANLISE BIDIMENSIONAL Jozemar Pereira Santos
Notas de aula - Estatstica III 37


A anlise da tabela 4.7 mostra a existncia de certa dependncia entre as variveis. Caso no houvesse
associao, esperaramos que para qualquer que fosse a nota do teste tivssemos 29,8% de empregados
com desempenho fraco, 40,7% dos empregados com desempenho razovel e 29,5 com desempenho
bom.

Sob a suposio de no existir associao ou dependncia entre as variveis X e Y, a freqncia
esperada de empregados com desempenho fraco e nota abaixo da mdia seria 156 x 0,298 = 46 e para
nota igual a mdia seria 174 x 0,298 = 52 (ver Tabela 4.8).


Tabela 4.8 Freqncias esperadas na Tabela 4.7 assumindo a independncia entre as duas variveis
Desempenho no emprego (Y)
Nota do teste (X) Fraco Razovel Bom

Total
abaixo da Mdia 46 (29,8%) 64 (40,7%) 46 (29,5%) 156 (100,0%)
Mdia 52 (29,8%) 71 (40,7%) 51 (29,5%) 174 (100,0%)
acima da Mdia 21 (29,8%) 28 (40,7%) 21 (29,5%) 70 (100,0%)
Total 119 (29,8%) 163 (40,7%) 118 (29,5%) 400 (100,0%)


Um procedimento para tomar as freqncias esperadas ou tericas (f
e
) em cada casela no corpo da tabela
(sob a suposio de independncia entre as variveis), dada pela expresso abaixo:
(Exp. 1)
P. ex , 1
a
casela f
e
= (119 x 156)/400 f
e
= 46
E, assim sucessivamente.
geral Total
coluna da Total linha da Total
=
e
f

Comparando as duas tabelas, podemos verificar as discrepncias existentes entre os valores ou
freqncias observadas (Tabela 4.7) e os valores ou freqncias esperadas (Tabela 4.8), caso as variveis
no fossem associadas. Na Tabela 4.9, a seguir, resumimos os desvios : valores observados ( f
o
)
valores esperados (f
e
) e tomamos, para efeito, de construo de uma medida de associao entre as duas
variveis os desvios relativos para cada casela atravs da seguinte medida

(
e
e o
f
f f
2
)
, onde f
o
a freqncia observada e f
e
a freqncia esperada. (Exp. 2)
UNID II . ANLISE BIDIMENSIONAL Jozemar Pereira Santos
Notas de aula - Estatstica III 38


Tabela 4.9 Desvios entre os valores observados (f
o
) e as freqncias esperadas (f
e
)
Desempenho no emprego (Y)
Nota do teste (X) Fraco Razovel Bom
abaixo da Mdia 21 (9,59) 0 (0,00) -21 (9,59)
Mdia -10 (1,92) 5 (0,35) 5 (0,49)
acima da Mdia -11 (5,76) -5 (0,89) 16 (12,19)

Obs.: A soma dos desvios ou resduos nula. Isso pode ser verificado facilmente somando-se cada linha.
Uma medida do afastamento global pode ser dada pela soma de todos os desvios relativos (Exp. 2). Essa
medida denominada
2
(qui-quadrado) de Pearson, e dada pela expresso abaixo:
( )


=
e
e o
f
f f
2
2

(Exp. 3). E, no nosso exemplo, teremos:


2
= 9,59 + 0,00 + 9,59 +1,92 + 0,35 + 0,49 + 5,76 + 0,89 + 12,19
2
= 40,78
Um valor grande de
2
indica associao entre as variveis, o que parece ser o caso do exemplo
considerado.
K. Pearson definiu uma medida de associao, baseada na Exp. 3, chamada coeficiente de contingncia,
dada por
,
n
C
+
=
2
2


Exp. 4

que se interpreta de forma anloga ao coeficiente de correlao , a ser definido mais adiante. Este
coeficiente assume valores entre 0 (correspondente a independncia) e um valor mximo menor do que 1.
O valor mximo de C depende do n
0
linhas (l) e do n
o
colunas (c ). Para evitar esse inconveniente,
costuma-se definir um outro coeficiente de associao, dado por
( )( )
,
1 1
2

=
c l
n
T

Exp. 5

que atinge valor mximo igual a 1(um) se n
o
linhas (l ) = n
o
colunas (c ).
UNID II . ANLISE BIDIMENSIONAL Jozemar Pereira Santos
Notas de aula - Estatstica III 39


Para o exemplo 3 temos para coeficientes de associao entre as variveis Notas do teste de qualificao
(X) e Desempenho no emprego (Y) :
( )( )
16 0
1 3 1 3
400 78 40
304 0
400 78 40
78 40
,
,
,
,
,
=

= =
+
= T T C C e


EXERCCIOS DE APLICAO:

Exerc 1. Se a anlise de uma tabela de contingncia mostra que h associao entre as duas variveis
qualitativas em estudo, a intensidade da relao pode ser avaliada pelo coeficiente de contingncia C. O
mximo valor que o coeficiente C pode assumir numa tabela de contingncia l x c , (onde l : n
o
de
nhas e c : n
o
de colunas), dado por li


,
t
t
C mx
1
= ) (
onde t = mnimo entre o n
o
de linhas (l ) e o n
o
de colunas (c )da tabela.
Verifique o mximo valor que C pode assumir no caso do exemplo 3, dado anteriormente.

Exer2. Em um estudo para determinar se h relao ou associao entre o padro de vesturio de
empregados de bancos e seu progresso profissional, uma amostra de tamanho n = 300 acusou os
resultados da tabela abaixo:

Velocidade do Desenvolvimento (Y)
Padro do Vesturio (X) Lento Mdio Rpido

Total ( )
Muito bem trajado 32 56 32
Bem trajado 28 69 22
Maltrajado 15 33 13
Total ( ) 75 158 67

Verifique se existe associao ou dependncia entre o padro de traje (X) e o desenvolvimento
profissional (Y). Em caso positivo, quantifique atravs de uma medida de associao.

UNID II . ANLISE BIDIMENSIONAL Jozemar Pereira Santos
Notas de aula - Estatstica III 40


4. ASSOCIAO ENTRE DUAS VARIVEIS QUANTITATIVAS

Podemos analisar conjuntamente duas variveis quantitativas X e Y, como no caso do estudo de duas
variveis qualitativas. De modo anlogo, a distribuio conjunta pode ser resumida em tabelas de dupla
entrada e, por meio das distribuies marginais, possvel estudar a associao das variveis. Algumas
vezes, para evitar um grande nmero de entradas, faz-se a grupamento dos dados marginais em intervalos
de classes, de maneira semelhante ao resumo feito no caso do estudo unidimensional. Entretanto, alm
desse tipo de anlise, as variveis quantitativas so passveis de procedimentos anliticos e grficos mais
refinados.

O DIAGRAMA DE DISPERSO
Um dispositivo bastante til para se verificar a associao entre duas variveis quantitativas (ou
entre dois conjuntos de dados), considerar o grfico ou diagrama de disperso, tomado sob os eixos
cartesianos XY, para n pares de valores (X
i
,Y
i
) i = 1, 2, . . ., n. Para efeito de entendimentos de
associao entre as duas variveis, consideremos a anlise conjunta das seguintes variveis abaixo:

a) Peso (X) e altura (Y) dos alunos do 1

perodo de Administrao;
b) Acuidade visual (Y) e idade(X) de um grupo de pessoas;
c) Renda familiar (X) e porcentagem dela (Y) gasta com alimentao;
d) Nmero de peas montadas (X) e resultado de um teste de ingls (Y) por operrio.

UNID II . ANLISE BIDIMENSIONAL Jozemar Pereira Santos
Notas de aula - Estatstica III 41


Como v-se, os diagramas de disperso para as variveis X e Y definidas nos itens de (a) a (d)
seriam apresentados como tal e, indicando que:
a) existe de uma associao linear positiva entre peso (X) e altura (Y) dos alunos;
b) existncia de uma associao linear negativa idade (X) e acuidade visual (Y) das pessoas
c) existncia de uma associao linear negativa entre renda (X) e % gastos (Y) com alimentao;
d) no existncia de associao entre n
o
de peas montadas (X) e resultado de teste de ingls (Y).
OBS:
i) Associao linear positiva indica que, quando a varivel X cresce Y tambm cresce (e vice-versa).
ii) Associao linear negativa indica que, quando X cresce Y decresce (e vice-versa).
A partir dos grficos de disperso apresentados, verificamos que a representao grfica das variveis
quantitativas ajuda muito a compreender o comportamento conjunto das duas variveis quanto
existncia ou no de associao entre elas.
Contudo, muito til quantificar essa associao. Existem muitos tipos de associao possveis, mas
aqui apresentaremos o tipo de relao mais simples, que a linear. Isto , iremos definir uma medida
que avalia quanto uma nuvem de pontos no diagram de disperso aproxima-se de uma reta. Esta
medida ser definida de modo a assumir valores no intervalo de 1 a +1.

O COEFICIENTE DE CORRELAO LINEAR - r de Pearson
Definio: Dados n pares de valores (x
1
, y
1
) , (x
2
, y
2
) , . . . , (x
n
, y
n
), denominaremos de coeficiente
de correlao entre as duas variveis X e Y, a seguinte medida

= =
|
|
.
|

\
|
|
|
.
|

\
| n
i
dp
y i
y
dp
x i
x
n
Y X corr
Y X
XY
r
1
1
) ( ) (
) , ( , satisfzendo -1 r
XY
+1. Eq. (1)
ou seja, r
XY
a mdia dos produtos dos valores ou escores padronizados das variveis.
A definio acima pode ser operacionalizada de modo mais conveniente pelas seguintes frmulas:

( ) ( )
(2) Eq. ou
(

|
.
|

\
|

|
.
|

\
|






=


=
2
2
2
2 2 2 2 2
Y Y n X X n
Y X XY n
r
y x n x
y x n
i
y
i
x
r
XY
y n
i i
XY
.

UNID II . ANLISE BIDIMENSIONAL Jozemar Pereira Santos
Notas de aula - Estatstica III 42

O numerador da Eq. (1) fornece o sinal ou sentido da correlao e d origem a uma medida bastante
usada e que definimos a seguir.
Definio: Dados n pares de valores (x
1
, y
1
) , (x
2
, y
2
) , . . . , (x
n
, y
n
), chamaremos de covarincia
entre as variveis X e Y a medida
( ) ( )
n
n
i
y
i
y x
i
x
Y X

=

=
1
) , cov( , ou seja, a mdia dos produtos dos valores centrados das
variveis.
Com essa definio, o coeficiente de correlao pode ser escrito como
) ( ) (
) , cov(
) , (
Y X
XY
dp dp
Y X
Y X corr r

= =

PROPRIEDADES DO COEFICIENTE DE CORRELAO LINEAR
1. Este coeficiente adimensional, logo no afetado pelas unidades adotadas.
Alm disso, apresenta duas propriedades que caracterizam a natureza da relao linear entre as
duas variveis. Uma o sinal (+ ou -) e a outra a magnitude.
2. O sinal o mesmo que o do coeficiente angular ou declividade de uma reta imaginria que se
ajusta aos dados se fossem traados num diagrama de disperso.
3. A magnitude indica quo prximo da reta imaginria esto os pontos individuais.
4. O valor de r [-1 , +1]. Se r = -1, dizemos que h uma correlao linear negativa perfeita e se
r = +1, uma correlao linear positiva perfeita. importante assinalar que um coeficiente de
correlao linear igual a zero (r = 0), no implica em ausncia de relao entre as duas variveis, e
sim h uma ausncia de relao linear entre elas.

UNID II . ANLISE BIDIMENSIONAL Jozemar Pereira Santos
Notas de aula - Estatstica III 43


Exemplo 4: Com o intuito de verificar uma associao entre as variveis nmero de anos de servio
(X) por nmero de clientes (Y), tomou-se uma amostra de 10 agentes de uma Cia. de seguros. Os
dados esto apresentados na tabela abaixo.
Agente Anos- servio N
o
de clientes X
2
Y
2
XY
A 2 48 4 2.304 96
B 3 50 9 2.500 150
C 4 56 16 3.136 224
D 5 52 25 2.704 260
E 4 43 16 1.849 172
F 6 60 36 3.600 360
G 7 62 49 3.844 434
H 8 58 64 3.364 464
I 8 64 64 4.096 512
J 10 72 100 5.184 720
Soma 57 565 383 32.581 3.392
a) Construa o diagrama de
disperso correspondente.

b) Determine o coeficiente
de correlao linear r de
Pearson.

a) Figura 4.3 Grfico de Disperso para Anos de servio (X)
e Nmero de clientes (Y)
Anos servio
12 10 8 6 4 2 0
N

m
e
r
o

c
l
i
e
n
t
e
s
80
70
60
50
40



b) Coeficiente de correlao linear - r de Pearson

( ) ( )
0,88 ou 0,8768
1715
=



=
(

XY XY
r
Y Y n X X n
Y X XY n
r
6585 581
2 2 2 2
,
indicando um moderado grau de linearidade positiva.
UNID II . ANLISE BIDIMENSIONAL Jozemar Pereira Santos
Notas de aula - Estatstica III 44

Para analisar dois conjuntos de dados podemos recorrer, tambm, aos mtodos utilizados
anteriormente para analisar um conjunto de dados, exibindo as anlises feitas separadamente, para
efeito de comparao. Por exemplo, podemos exibir os desenhos esquemticos (box-plots) ou
ramos-e-folhas para os dois conjuntos de observaes.

5. ASSOCIAO ENTRE VARIVEIS QUALITATIVAS E QUANTITATIVAS
Como informado na seo anterior, comum nessas situaes analisar o que acontece com a
varivel quantitativa dentro de cada categoria da varivel qualitativa. Essa anlise pode ser conduzida
por meio de medidas descritivas, histogramas, box-plots. Ilustraremos com um exemplo.

Exemplo 5 : Consideremos os dados do Quadro 1.1 (Unidade II), para os quais desejamos analisar o
comportamento dos salrios (S) dos funcionrios da Cia. fictcia Milsa dentro de cada categoria de
grau de instruo (Y), ou seja, investigar o comportamento conjunto das variveis S e Y.

Tabela 4.10 Medidas resumo para a varivel salrio (S), segundo grau de instruo, na Cia. Milsa.
Grau de Instruo n
s

dp(S)
S
(1)
Q
1
Q
2
Q
3 S
(n)
Fundamental 12 7,84 2,79 4,00 6,01 7,13 9,16 13,65
Mdio 18 11,54 3,62 5,73 8,84 10,91 14,48 19,40
Superior 6 16,48 4,11 10,53 13,65 16,74 18,38 23,30
Total 36 11,12 4,52 4,00 7,55 10,17 14,06 23,30

Figura 4.4 Box Plots de Salrio segundo Grau de Instruo
6 18 12 N =
Grau de Instruo (X)
Superior Mdio Fundamental
S
a
l

r
i
o
s

(
S
)
30
20
10
0

A leitura dos resultados acima sugere
uma dependncia dos salrios em
relao ao grau de instruo: o salrio
aumenta conforme aumenta o grau de
instruo do indivduo. O salrio mdio
de um funcionrio 11,12 s.m, j para
uma funcionrio com curso superior o
salrio mdio passa a ser 16,48 ,
enquanto funcionrios com nvel
fundamental completo recebem, em
mdia, 7,84 s.m.
UNID II . ANLISE BIDIMENSIONAL Jozemar Pereira Santos

Vous aimerez peut-être aussi