Vous êtes sur la page 1sur 36

Housing

Grupo: Anlia Lima Cavalcanti (alc5) Caio Csar Sabino Silva (ccss2) Ivson Diniz dos Santos (ids) Las Sousa Andrade (lsa) Lorena de Ftima Sousa Arajo(lfsa)

Motivao
Fundamentar os conceitos da Estatstica Descritiva, aprendidos no decorrer do curso de Probabilidade e Estatstica, e aplic-los fazendo uma anlise dos dados do subrbio da cidade de Boston.

Introduo
Este trabalho foi feito para demonstrar como a anlise dessas informaes permite uma visualizao clara dos problemas de condies de vida nessa cidade. Os dados foram coletados da Biblioteca Statlib, situada na Carnegie Mellon University, no ano de 1993.

Variveis
Proximidade com o Rio Charles; Taxa de crimes per capita; Concentrao de xidos ntricos no ar; Percentagem da populao de classe baixa; Valor mdio das residncias; Distncia relativa aos cinco principais centros de empregos de Boston;

Proximidade com o Rio Charles

Taxa de crimes per capita


Nmero de amostras - 506 Mdia 3.613524 Mediana 0.25651 Moda 2,045 Varincia 73.98658 Desvio-padro - 8.601545 Coeficiente de assimetria - 0,182353

TABELAS

HISTOGRAMAS

INTERVALO DE CONFIANA

Concentrao de xidos ntricos no ar


Nmero de amostras - 506 Mdia 0.5546951 Mediana 0.538 Moda 0,4375 Varincia 0.01342764 Desvio-padro - 0.1158777 Coeficiente de assimetria 1,011368 INTERVALO DE CONFIANA

TABELAS

HISTOGRAMAS

Percentagem da populao de classe baixa


Nmero de amostras - 506 Mdia 12,65306 Mediana 11,36 Moda 7,245 Varincia 50,99476 Desvio-padro 7,141062 Coeficiente de assimetria - 0,757318

TABELAS

HISTOGRAMAS

INTERVALO DE CONFIANA

Valor mdio das residncias


Nmero de amostras - 506 Mdia 22.53281 Mediana 21.2 Moda 20,1526 Varincia 84.58672 Desvio-padro - 9.197104 Coeficiente de assimetria - 0,258800

TABELAS

HISTOGRAMAS

INTERVALO DE CONFIANA

Distncia mdia aos cinco principais centros de Boston


Nmero de amostras - 506 Mdia 3.795043 Mediana 3.20745 Moda 2,021 Varincia 4.434015 Desvio-padro - 2.10571 Coeficiente de assimetria - 0,842491

TABELAS

HISTOGRAMAS

INTERVALO DE CONFIANA

Testes de Hiptese

Comparao da concentrao de xidos


A concentrao de xido ntrico na atmosfera, quando em taxas elevadas, pode prejudicar a sade humana. Esse gs inibe as defesas do sistema pulmonar, podendo resultar em enfisemas. Segundo o EPA (Agncia de Proteo ao Ambiente), uma concentrao maior que 0,5 ppm nociva sade humana. Tendo como base os dados amostrais de Boston, pode-se verificar se a mdia dessa cidade est acima ou abaixo desse valor. H0 : = 0.5 Ha : 0.5 = 5% TESTES

Comparao entre duas amostras do valor mdio das residncias


Entre os diversos fatores que influenciam no preo de uma casa est a sua localizao. Sabe-se que o Rio Charles de grande importncia para a cidade de Boston. Por ser uma regio to destacada, esperado que o valor mdio das casas seja maior que as demais reas. Foi feito um teste para analisar a validade dessa afirmao. 1 : mdia dos dados das amostras perto do rio 2 : mdia dos dados das amostras longe do rio H0 : 1 2 = 0 Ha : 1 2 0 = 5%

TESTES

Comparao entre duas amostras da taxa de crime per capita


Em centros urbanos, os ndices de violncia tendem a ser mais elevados que as demais regies. Separando as amostras pela distncia em relao a essas reas, pode-se verificar se a taxa de crimes per capita maior nas regies mais prximas dos centros.
1 : mdia dos dados das amostras perto dos centros 2 : mdia dos dados das amostras longe dos centros H0 : 1 2 = 0 Ha : 1 2 0 = 10% TESTES

Scott

Sturges

Scott

Raiz de n

Scott

Raiz de n

Scott

Raiz de n

Scott

Raiz de n

n = 33; X = 0.548 S2 = 0.01473205 S = 0.1213757 Resultado no R: One Sample t-test data: amostraNOX t = 2.2718, df = 32, p-value = 0.02996 alternative hypothesis: true mean is not equal to 0.5 95 percent confidence interval: 0.5049621 0.5910379 sample estimates: mean of x 0.548

Pode-se rejeitar H0 com uma confiana de 95%! Agora, podemos testar se a mdia da concentrao maior do que 0,5.

Neste novo teste, tem-se: H0 : = 0.5 Ha : > 0.5 Com o resultado no R: One Sample t-test data: amostraNOX t = 2.2718, df = 32, p-value = 0.01498 alternative hypothesis: true mean is greater than 0.5 95 percent confidence interval: 0.5122102 Inf sample estimates: mean of x 0.548 Conclui-se que a concentrao de xidos em Boston maior do que 0.5, com 95% de confiana!

PROXIMO

Amostra de bairros perto: n = 35; X1= 28.44 S1 = 139.6331 S1 = 11.81664

Amostra de bairros distantes: n = 39; X2 = 22.25641 S2 = 45.15252 S2 = 6.719563

Resultado no R:
Welch Two Sample t-test data: amostraMEDVp and amostraMEDVl t = 2.7255, df = 52.631, p-value = 0.008697 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 1.632288 10.734891 sample estimates: Pode-se rejeitar H0 com mean of x mean of y confiana de 95%! 28.44000 22.25641

uma

Agora, podemos testar se a mdia dos valores das casas maior nos Bairros mais prximos do rio.

Neste novo teste tem-se:

H0 : 1 2 = 0 Ha : 1 2 > 0
Com o resultado do R: Welch Two Sample t-test

data: amostraMEDVp and amostraMEDVl t = 2.7255, df = 52.631, p-value = 0.004349 alternative hypothesis: true difference in means is greater than 0 95 percent confidence interval: 2.384948 Inf sample estimates: mean of x mean of y 28.44000 22.25641

Conclui-se que o valor mdio das casas na regio mais prxima do rio Maior do que nas regies mais distantes, com 95% de confiana.

PROXIMO

Amostra mais prxima: n = 29; X1= 8.801772 S1 = 318.6075 S1 = 17.84958

Amostra mais distante: n = 23; X2 = 0.1622661 S2 = 0.04193775 S2 = 0.2047871

Resultado no R:
Welch Two Sample t-test data: amostraCRIMe and amostraCRIMa t = 2.6063, df = 28.009, p-value = 0.0145 alternative hypothesis: true difference in means is not equal to 0 90 percent confidence interval: 3.000561 14.278451 sample estimates: mean of x mean of y 8.8017721 0.1622661

Deve-se rejeitar H0 com uma confiana de 90%! Agora, podemos testar se a taxa de crime per capita maior nos bairros mais prximos dos centros.

Neste novo teste tem-se: H0 : 1 2 = 0 Ha : 1 2 > 0 Com o resultado do R: Welch Two Sample t-test data: amostraCRIMe and amostraCRIMa t = 2.6063, df = 28.009, p-value = 0.00725 alternative hypothesis: true difference in means is greater than 0 90 percent confidence interval: 4.2887 Inf sample estimates: mean of x mean of y 8.8017721 0.1622661

Conclui-se que a taxa de crime per capita na regio mais prxima dos centros maior do que nas regies mais distantes, com 90% de confiana.