Académique Documents
Professionnel Documents
Culture Documents
2003
Neste caso, a população será constituída por todos os compradores de carros novos, de
determinada marca, a amostra o grupo dos 40 compradores de carros novos da mesma
marca e a variável o nº correspondente às reparações ou substituições de peças, feitas
durante o primeiro ano de utilização dos 40 carros.
2. Ao estudar uma população, usualmente o que se pretende estudar são algumas das suas
características numéricas, normalmente desconhecidas que designamos por Parâmetros.
Enquanto que o parâmetro populacional pode ser considerado um valor exacto, mas
desconhecido, a Estatística amostral é conhecida, é um número que descreve a amostra.
Calcula-se o valor de uma estatística a partir dos valores observados na
amostra, variando o valor desta de amostra para amostra. Utiliza-se a estatística para
estimar o parâmetro desconhecido da população, também por isso muitas vezes conhecido
por Estimador.
3. Uma vez recolhida a amostra procede-se ao seu estudo. Este consiste em resumir a
informação contida na amostra em tabelas, gráficos, e calculando algumas características
amostrais – estatísticas . Este é o objectivo da Estatística descritiva.
O objectivo da Inferência Estatística é, utilizando-se técnicas estatísticas convenientes
permitir com base numa amostra tirar conclusões acerca da população. Pois num estudo
estatístico pretende-se, de uma maneira geral, conhecer o mais possível sobre a população,
estimar um parâmetro ou testar uma hipótese.
?
?
? Qualitativ os
?
Dados ? ?
?
? Quantitativos??
discretos
?? ?contínuos
Dados qualitativos, representam a informação que identifica alguma qualidade, categoria
ou característica, não susceptível de medida.
Dados quantitativos, representam a informação resultante de características susceptíveis
de serem medidas, apresentado-se com diferentes intensidades que podem ser de natureza
discreta, se só pode tomar um nº finito ( ou infinito numerável) de valores distintos, ou de
natureza contínua se toma valores numéricos compreendidos num determinado intervalo
de variação.
5.
A. População constituída por todos os agregados familiares da cidade em estudo;
Amostra de dimensão 20, constituída por alguns (20) dos agregados familiares da
referida cidade;
Variável, nº de pessoas de cada agregado familiar, quantitativa discreta.
B. População constituída por todos os países da comunidade;
Amostra de dimensão 3, constituída por alguns (3) dos países da comunidade;
Variável, nº de pessoas de cada país, quantitativa discreta.
C. População constituída por todos os funcionários da fábrica;
b) Variável Sexo
Da análise do diagrama circular, verifica-se que nos alunos seleccionados existem mais
raparigas que rapazes.
Variável Idade
Esta variável é de tipo quantitativo e contínuo, uma vez que a idade pode assumir qualquer
valor de um intervalo, passando-se de um valor a outro continuamente, embora seja usual
apresentá-la de forma discreta. Vamos construir uma tabela de frequências, para
posteriormente construir o histograma, considerando 4 classes de amplitude 1:
0.026
14 15 16 17 18 idade
Sendo uma variável de tipo quantitativo discreto, para construir a tabela de frequências,
consideramos como classes os diferentes valores que surgem na amostra:
30%
Nº de
Freq.abs. Freq. rel.
irmãos
Freq. relativa
0 7 0.184 20%
1 12 0.316
2 12 0.316
3 4 0.105 10%
4 2 0.053
5 0 0.000
6 1 0.026 0%
0 1 2 3 4 5 6
nº irmãos
Variável Cartão
Freq. rel.
Sim Não
De entre os alunos seleccionados a percentagem dos que dispõem ou não de cartão é
idêntica.
Variável Altura
[163.0, 165.6[ 5 0.132 150 152.6 155.2 157.8 160.4 163.0 165.6 altura
Variável Peso
0.342
[43, 46.7[ 5 0.132
[46.7, 50.4[ 13 0.342
[50.4, 54.1[ 7 0.184
[54.1, 57.8[ 3 0.79 0.079
[57.8, 61.5[ 6 0.158 43 46.7 50.4 54.1 57.8 61.5 65.2 peso
[61.5, 65.2[ 4 0.105
O histograma anterior apresenta uma forma que sugere a existência de uma mistura de
duas populações, uma distribuindo-se à volta do valor 48.5, aproximadamente, e outra à
volta do valor 59.5, aproximadamente. Tendo em conta os dados que estamos a analisar
não nos surpreende os resultados obtidos, pois estamos perante observações resultantes das
Populações constituídas pelos pesos dos rapazes e a constituída pelos pesos das raparigas,
que de um modo geral são inferiores.
Variável Desporto
Do mesmo modo que as variáveis Sexo e Cartão, também esta variável é de tipo
qualitativo, pelo que para proceder ao agrupamento dos dados consideramos as diferentes
categorias que a variável assume:
Basket V ólei
Desporto Freq. abs. Freq. rel.
Vólei 3 0.079 Natação
Natação 7 0.184 Ténis
Futebol 8 0.211
Andebol 3 0.079
Ginástica 5 0.132
Ténis 9 0.237 Ginástica Futebol
Basket 3 0.079
Andebol
c) Para comparar os pesos dos rapazes e das raparigas, podemos utilizar diagramas em
caule e folhas ou diagramas de extremos e quartis. Vamos utilizar os dois tipos de
representação:
40 45 50 55 60 65
(consultar páginas 74 e 75 do
manual).
raparigas rapazes
Esta representação realça o que já
mínimo 43 46
havia sido observado com os caules e
máximo 60 65
folhas e podemos ainda observar a
mediana 50 57.5
maior variabilidade existente nos
1º quartil 48 50.5
pesos referentes aos rapazes,
3º quartil 52 61.5
relativamente aos pesos das raparigas
7.
a) Substituindo o F por um 0 e o M por um 1, obtemos 22 zeros e 16 uns. Como a variável
sexo é de tipo qualitativo, podemos usar qualquer etiqueta para representar as
categorias. Então, uma vez que temos um conjunto de números vamos calcular a sua
média:
22 ? 0 ? 16 ? 1
média = ? 0.42 . Substituindo agora o F por 1 e o M por 2, obteremos
38
um conjunto de números de que vamos também calcular a média:
22 ? 1 ? 16 ? 2
média = ? 1.42 . Não podemos dizer que os valores obtidos sejam a
38
média da variável sexo, pois sendo uma variável de tipo qualitativo, não tem sentido
calcular a média . Como acabámos de ver, conforme as etiquetas utilizadas para
representar as classes, assim obteríamos uma média diferente!
c) A mediana das idades dos alunos é 15 e a média é 15.05. Estes valores são
aproximadamente iguais, o que era aliás sugerido pelo histograma – aproximadamente
simétrico- obtido para a variável Idade, num exercício anterior.
f) A média obtida para os pesos dos alunos é aproximadamente 52.9, e o desvio padrão é
aproximadamente 6.0. Então, se os dados tivessem uma distribuição aproximadamente
normal, o que já vimos não ser verdade, esperaríamos obter no intervalo [46.9, 58.9],
aproximadamente 2/3 dos dados, ou seja aproximadamente 25 ou 26 (consultar página
99 do manual).
8.
a)
Nº do sapato Freq. Absoluta Freq. Relativa F. A. Acumulada F. R. Acumulada
Xi ni fi Ni Fi
28 2 0,05 2 0,05
29 5 0,125 7 0,175
31 16 0,4 23 0,575
32 14 0,35 37 0,925
33 3 0,075 40 1
1 k ? ni x i n1 x1 ? ? ? n5 x5 2 ? 28 ? ? ? 3 ? 33
b) x? ? f i xi ?
i? 1
? ? ? 31,1
n i? 1 n n 40
Moda é o valor com maior frequência absoluta, neste caso será 31.
x?n ? ? x? n ?
? ?
? 2?
? ? 1?
?2 ?
x ?20 ? ? x ?21?
Como n é par ( n =40) Me ? = ? 31
2 2
Comparando a média, a moda e a mediana podemos concluir que a
distribuição é simétrica.
c)
2 8899999
3 1...
? 122 ...
? 22333
14? 10?
9.
c) d) c) d) g)
Xi ni fi Ni Fi ni X i
1 20 0.333 20 0.33 20
2 20 0.333 40 0.67 40
3 15 0.250 55 0.92 45
4 5 0.083 60 1 20
125
e) n 2 ? n3 ? n 4 ? 40 , 40 crianças.
4 ? ni x i
n1 x1 ? ? ? n4 x4 125
?
1 i? 1
g) x? fi x i ? ? ? ? 2.08
n i ?1 n n 60
Moda é o valor com maior frequência absoluta, neste caso temos dois valores
para a moda, 1 e 2, diz-se que é bimodal.
x?n ? ? x?n ?
? ?
? 2?
? ? 1?
?2 ?
x?30? ? x ?31?
Como n é par ( n =60) Me ? = ?2
2 2
Comparando a média e a mediana podemos concluir que a distribuição é
aproximadamente simétrica.
x?15? ? x ?16? 1? 1
Q1 = ? ?1
2 2
x?45? ? x ?46? 3?3
Q3 = ? ?3
2 2
10.
a) Como os dados nos são fornecidos agrupados, para calcular as médias, vamos escolher
como elementos representativos das classes os seus pontos médios:
2 ? 5 ? 3 ? 7 ? 5 ? 9 ? 7 ? 11 ? 6 ? 13 ? 4 ? 15 ? 2 ? 17
média da Turma 1 = ? 11.2
29
0 ? 5 ? 3 ? 7 ? 5 ? 9 ? 6 ? 11 ? 5 ? 13 ? 4 ? 15 ? 0 ? 17
média da Turma 2 = ? 11.2
23
b) O facto de termos obtido os mesmos valores para a média não nos permite afirmar que
as turmas tenham tido comportamento semelhante. Para caracterizar um conjunto de
dados é necessário utilizar medidas de localização e dispersão. Vejamos o que se passa
com os desvios padrão dos dois conjuntos de dados:
10.67 =3.27
Como vemos, a dispersão foi muito maior na turma 1 do que na turma 2, o que significa
que os alunos desta turma são mais homogéneos: não há tendência para haver alunos
muito maus nem muito bons.