Vous êtes sur la page 1sur 19

Estatstica Computacional Aula 03 Profa.

Ana Maria

Sries Estatsticas:
1) TABELAS: Um dos objetivos da Estatstica sintetizar os valores que uma ou mais variveis podem assumir, para que tenhamos uma viso global da variao dessa ou dessas variveis. E isso ela consegue, inicialmente, apresentando esses valores em tabelas e grficos, que iro nos fornecer rpidas e seguras informaes a respeito das variveis em estudo, permitindo-nos determinaes administrativas e pedaggicas mais coerentes e cientificas. Tabela um quadro que resume em conjunto de observaes. Uma tabela compe-se de: a) corpo conjunto de linhas e colunas que contm informaes sobre a varivel em estudo; b) cabealho parte superior da tabela que especifica o contedo das colunas; c) coluna indicadora parte da tabela que especifica o contedo das linhas; d) linhas retas imaginrias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas; e) casa ou clula espeo destinado a um s nmero; f) titulo conjunto de informaes, as mais completas possveis, respondendo s perguntas: O que?, Quando?, Onde?, localizado no topo da tabela. H ainda a considerar os elementos complementares da tabela, que so as fontes, as notas e as chamadas, colocadas, de preferencia, no seu rodap.

2) SRIES ESTATSTICAS:
1

Estatstica Computacional Aula 03 Profa. Ana Maria

Denominamos srie estatstica toda tabela que apresenta a distribuio de um conjunto de dados estatsticos em funo da poca, do local ou da espcie. Da, podemos inferir que numa srie estatstica observamos a existncia de trs elementos ou fatores: tempo, espao e espcie. Conforme varie um dos elementos da srie, podemos classifica-la em histrica, geogrfica e especifica. As sries histricas, cronolgicas, temporais ou marchas, descrevem os valores da varivel, em determinado local, discriminados segundo intervalos de tempo variveis. Exemplo:

As sries geogrficas, espaciais territoriais ou de localizao, descrevem valores da varivel, em determinado instante, discriminados segundo regies. Exemplo:

Estatstica Computacional Aula 03 Profa. Ana Maria

As sries especficas ou categricas descrevem os valores da varivel, em determinado tempo e local, discriminados segundo especificaes ou categorias. Exemplo:

3) SRIES CONJUGADAS DE DUPLA ENTRADA: Muitas vezes temos necessidade de apresentar, em uma nica tabela, a variao de valores de mais de uma varivel, isto , fazer uma conjugao de duas ou mais sries. Conjugando duas sries em uma nica tabela, obtemos uma tabela de dupla entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificao: uma horizontal (linha) e uma vertical (coluna). Exemplo:

Estatstica Computacional Aula 03 Profa. Ana Maria

A conjugao, no exemplo dado, foi srie geogrfica-srie histrica, que d origem srie geogrfico-histrica ou geogrfico-temporal. Podem existir, se bem que mais raramente, pela dificuldade de representao, sries composta de trs ou mais entradas.

4) DISTRIBUIO DE FREQUNCIA: A tabela primitiva (ROL), vamos considerar, em particular, a forma pela qual podemos descrever os dados estatsticos resultantes de variveis quantitativas, como o caso de notas obtidas pelos alunos de uma classe, estaturas de um conjunto de pessoas, salrios recebidos pelos operrios de uma fbrica etc. Suponhamos termos feito uma coleta de dados relativos s estaturas de 40 alunos, que compe uma amostra dos alunos de um colgio. A resultante a seguinte tabela de valores: TABELA X.0

166 162 155 154

160 161 152 161

161 168 153 156

150 163 160 172

162 156 155 153

160 173 155 157

165 160 169 156

167 155 151 158

164 164 170 158

160 168 164 161

A esse tipo de tabela, cujos elementos no foram numericamente organizados, denominamos de tabela primitiva. Partindo dos dados acima tabela primitiva difcil averiguar em torno de que valor tende a se concentrar as estaturas, qual a menor ou qual a maior estatura, ou ainda, quantos alunos se acham abaixo ou acima de uma dada estatura. Assim, conhecidos os valores de uma varivel, difcil formarmos uma ideia exata do comportamento do grupo como um todo, a partir dos dados no ordenados. A maneira mais simples de organizar os dados atravs de certa ordenao (crescente ou decrescente). A tabela obtida aps a ordenao dos dados recebe o nome de ROL.

Estatstica Computacional Aula 03 Profa. Ana Maria

TABELA X.1 ESTATURAS DE 40 ALUNOS DO COLGIO A 150 151 152 153 154 155 155 155 155 156 156 156 157 158 158 160 160 160 160 160 161 161 161 161 162 162 163 163 164 164 164 165 166 167 168 168 169 170 172 173

Agora, podemos saber com relativa facilidade qual a menor estatura (150 cm) e qual a maior (173 cm); que a amplitude de variao foi de 173150=23 cm; e ainda, a ordem que um valor particular da varivel ocupa no conjunto. Com um exame mais acurado, vemos que h uma concentrao das estaturas em algum valor entre 160 cm a 165 cm, ainda mais, que h poucos valores abaixo de 155 cm e acima de 170 cm. No exemplo, ao qual trabalhamos a varivel em questo, estatura, ser observada e estudada muito mais facilmente quando dispusermos valores ordenados em uma coluna e colocarmos, ao lado de cada valor, o nmero de vezes que aparece repetido. Denominamos frequncia o nmero de alunos que fica relacionado a um determinado valor da varivel. Obtemos, assim, uma tabela que recebe o nome de distribuio de frequncia.

TABELA X.2*

Mas o processo dado ainda inconveniente, j que exige muito espao, mesmo quando o nmero de valores da varivel (n) de tamanho razovel. Sendo possvel, a soluo mais aceitvel, pela prpria natureza da varivel contnua, o agrupamento dos valores em vrios intervalos.

Estatstica Computacional Aula 03 Profa. Ana Maria

Assim, se um dos intervalos for, por exemplo, 154

158*, em vez de

dizermos que a estatura de 1 aluno de 154 cm; de 4 alunos, 155 cm; de 3 alunos, 156 cm; e de 1 aluno, 157 cm, diremos que 9 alunos tem estaturas entre 154, inclusive, a 158 cm. Deste modo, estaremos agrupando os valores da varivel em intervalos, sendo que, em Estatstica, preferimos chamar os intervalos de classes. Chamada de frequncia de uma classe o nmero de valores da varivel pertencentes classe, os dados da Tabela X.2*, podem ser dispostos como na Tabela X.3, denominada distribuio de frequncia com intervalos de classe:

Tabela X.3

Ao agruparmos os valores da varivel em classes, ganhamos em simplicidade, mas perdemos em pormenores. Assim, na Tabela X.2, podemos verificar facilmente que 4 alunos tem 161 cm de altura e que no existe nenhum aluno com 171 cm de altura. J na Tabela X.3 no podemos ver se algum aluno tem a estatura de 159 cm. No entanto, sabemos com segurana que onze alunos tm estatura compreendida entre 158 e 162 cm. O que pretendemos com a construo dessa nova tabela realar o que h de essencial nos dados, tambm, tornar possvel o uso de tcnicas analticas para sua total descrio, at porque a Estatstica tem por finalidade

Estatstica Computacional Aula 03 Profa. Ana Maria

especfica analisar o conjunto de valores, desinteressando-se por casos isolados. 4.1) Elementos de uma distribuio de frequncia: Classe: Classes de frequncia ou simplesmente classes so intervalos de variao da varivel. As classes so representadas simbolicamente por i, sendo i=1,2,3,....k (onde k o nmero total de classes da distribuio). Assim, em nosso exemplo, o intervalo 154 |-- 158 define a segunda classe (i=2). Como a distribuio formada de seis classes, podemos afirmar que k=6. 4.2) Limites de Classe: Denominamos limites de classe os extremos de cada classe. O menor nmero o limite inferior da classe (l i) e o maior nmero, o limite superior da classe (Li). Na segunda classe, por exemplo, temos: (li) = 154 e (Li) = 158 4.3) Amplitude de um intervalo de classe: Amplitude de um intervalo de classe ou simplesmente, intervalo de classe a medida do intervalo que define a classe. Ela obtida pela diferena entre os limites superior e inferir dessa classe e indicada por hi. Assim: hi = (Li) - (li). Na distribuio da Tabela X.3, temos: h2 = L2 l 2 h2 = 158 154 = 4 h2 = 4 cm

4.4) Amplitude Total da Distribuio: Amplitude Total da Distribuio (AT) a diferena entre o limite superior da ltima classe (limite superior mximo) e o limite superior da ltima classe (limite superior mximo) e o limite inferior da primeira classe ( limite inferior mnimo): AT = L(max) l(min). Em nosso exemplo, temos: AT = 174 150 = 24 AT = 24 cm

4.5) Amplitude Amostral: Amplitude amostral (AA) a diferena entre o valor mximo e o valor mnimo da amostra:
7

Estatstica Computacional Aula 03 Profa. Ana Maria

AA=x(max) x(min) Em nosso exemplo, temos: AA = 173 -150 = 23 AA = 23cm

Observe que a amplitude total da distribuio jamais coincide com a amplitude amostral. 4.6) Ponto mdio de uma classe: Ponto mdio de uma classe (xi) , como o prprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais. Para obtermos o ponto mdio de uma classe, calculamos a semissoma dos limites da classe (mdia aritmtica):

Assim, o ponto mdio da segunda classe, em nosso exemplo, :

x2 = l2 + L2 / 2

x2 = 154 + 158/2

x2 = 156 cm

4.7) Frequncia simples e Absoluta: Frequncia simples e Absoluta, ou simplesmente, frequncia de uma classe ou de um valor individual o nmero de observaes correspondentes a essa classe ou a esse valor. A frequncia simples simbolizada por fi (lemos f ndice i ou frequncia da classe i). Assim, em nosso exemplo, temos: fi = 4, f2 = 9, f3 = 11, f4 = 8, f5= 5 e f6 = 3 A soma de todas as frequncias representada pelo smbolo de somatrio*:
k

fi
i= 1

evidente que:
k

fi = n
i= 1

Estatstica Computacional Aula 03 Profa. Ana Maria

Para a distribuio em estudo, temos:


6

fi = 40
i= 1

No havendo possibilidade de engano, usamos: fi = 40 Podemos agora, das distribuio de frequncia das estaturas dos quarenta alunos do Colgio A, a seguinte representao tabular tcnica: Tabela X.4

4.8) Tipos de Frequncias: a) Frequncias simples ou absolutas (fi) so os valores que realmente representam o nmero de dados de cada classe. Como vimos, a soma das frequncias simples igual ao nmero total dos dados: fi = n b) Frequncias relativas (fri) so os valores das razes entre as frequncias simples e a frequncia total: fri = fi / fi Logo, a frequncia relativa da terceira classe, em nosso exemplo (Tabela X.4), : fr3 = f3 / fi fr3 = 11/40 = 0,275 fr3 = 0,275

Estatstica Computacional Aula 03 Profa. Ana Maria

Evidentemente: fri = 1 ou 100% c) Frequncia acumulada (Fi) o total das frequncias de todos os valores inferiores ao limite superiores ao limite superior do intervalo de uma dada classe: Fk = f1 + f2 + ......+ fk ou Fk = fi ( i = 1, 2, ..., k) Assim, no exemplo apresentado no inicio do texto sobre distribuio de frequncia, a frequncia acumulada corresponde terceira classe :
3

F 3 = f i = f 1 + f2 + f3
i= 1

F3 = 4 + 9 + 11

F3 = 24

o que significa existirem 24 alunos com estatura inferior a 162 cm (limite superior do intervalo da terceira classe). d) Frequncia acumulada relativa (Fr i) de uma classe a frequncia acumulada da classe, dividida pela frequncia total da distribuio: Fri = Fi/ fi Assim, para a terceira classe, temos: Fr3 = F3/ fi Fr3 = 24/40 = 0,600 Fr3 = 0,600

Considerando a Tabela X.3, podemos montar a seguinte tabela com a frequncias estudadas: Tabela X.5

10

Estatstica Computacional Aula 03 Profa. Ana Maria

O conhecimento dos vrios tipos de frequncia ajuda-nos a responder a muitas questes com relativa facilidade, como as seguintes: a) Quantos alunos tm estaturas entre 154 cm, inclusive, e 158 cm? Esses so os valores da varivel que formam a segunda classe. Como f2 = 9, a resposta : 9 alunos. b) Qual a percentagem de alunos cujas estaturas so inferiores a 154 cm? Esses valores so os que formam a primeira classe. Como fri = 0,100, obtenhamos a resposta multiplicando a frequncia relativa por 100: 0,100 x 100 = 10 Logo, a percentagem de alunos 10%. c) Quantos alunos tem estatura abaixo de 162 cm? evidente que as classes de ordem 1,2 e 3. Assim, o nmero de alunos dado 3 por: f1 + f2 + f3 = fi = F3 = 24
i=1

Portanto, 24 alunos tem estatura abaixo de 162 cm. d) Quantos alunos tem estatura no inferior a 158 cm? O nmero de alunos dado por:
6

= fi = f3 + f4+ f5 + f6 = 11+8+5+3=27
i=3

Ou ento:
6

= fi F2 = n F2 = 40-30= 27
i=3

4.9) Distribuio de Frequncia sem intervalos de classe:

Quando se trata

de varivel discreta de variao relativamente pequena, cada valor pode ser tomado como um intervalo de classe (intervalo degenerado) e, nesse caso, a distribuio chamada de distribuio sem intervalos de classe, tomando a seguinte forma:

11

Estatstica Computacional Aula 03 Profa. Ana Maria

TABELA X.6

Exemplo: Seja x a varivel nmero de cmodos das casas ocupadas por vinte famlias entrevistadas: TABELA X.7

Completada com vrios tios de frequncia temos: TABELA X.8

12

Estatstica Computacional Aula 03 Profa. Ana Maria

4.10) Nmero de Classes e Intervalos de Classes: A primeira preocupao que temos, na construo de uma distribuio do nmero de classes e consequentemente da amplitude dos limites dos intervalos de classe. Para determinao do nmero de classes de uma distribuio podemos lanar mo da regra de Sturges, que nos d o nmero de classes em funo do nmero de valores da varivel:

onde: i = o nmero de classe. n = o nmero total de dados.

Essa regra nos permite obter a seguinte tabela: TABELA X.9

Alm da regra de Sturges, existem formulas empricas que pretendem resolver o problema da determinao do nmero de classes que deve ter a distribuio*. Entretanto, a verdade que, essas formulas no nos levam a uma deciso final, essa vai depender, na realidade de um julgamento pessoal, que deve estar a natureza dos dados, da unidade usada para express-los e ainda, do objetivo que se tem em vista, procurando, sempre que possvel, evitar classe com frequncia nula ou com frequncia relativa** muito exagerada etc. Decidido o nmero de classes que deve ter a distribuio, resta-nos resolver o problema da determinao da amplitude total pelo nmero de classes:
13

Estatstica Computacional Aula 03 Profa. Ana Maria

Quando o resultado no exato, devemos arredonda-lo para mais. Outro problema que surge a escolha dos limites dos intervalos, os quais devero ser tais que forneam, na medida do possvel, para pontos mdios, nmero que facilitem os clculos nmeros naturais. Em nosso exemplo, temos: para n = 40 pela tabela X.5, i = 6 Logo:

isso , seis classes de intervalos iguais a 4. 4.11) Representao Grfica de uma distribuio: Uma distribuio de frequncia pode ser representada pelo histograma, pelo polgono de frequncia e pelo polgono de frequncia acumulada*. Construmos qualquer, grficos mencionados utilizando o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da varivel e na linha vertical (eixo da coordenadas), as frequncias. a) Histograma: formado por um conjunto de retngulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos mdios coincidam com os pontos mdios dos intervalos de classes. As larguras dos retngulos so iguais s amplitudes dos intervalos de classe. As alturas dos retngulos devem ser proporcionais s frequncias das classes, sendo a amplitude dos intervalos igual. Isso nos permite tomar as alturas numericamente iguais s frequncias. distribuio da Tabela X.5 corresponde ao seguinte histograma:

14

Estatstica Computacional Aula 03 Profa. Ana Maria

Histograma
12 10 8 6

4
2 0 152 156 160 164 168 172

4.12) Polgono de Frequncia: O polgono de frequncia um grfico de linha, sendo as frequncias marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos mdios dos Intervalos de classe. Para realmente obtermos um polgono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos mdios da classe anterior primeira e da posterior ltima, da distribuio. A distribuio da Tabela X.5 corresponde ao seguinte polgono de frequncia:

Poligono da Distribuio de Frequencia Absoluta (fi)


12
11 10 9

8
7 6 5 5 3 2 fi

0 150 155 160 165 170 175

4.13) Polgono de Frequncia Acumulada: O Polgono de Frequncia Acumulada traado marcando-se as frequncias acumuladas sobre
15

Estatstica Computacional Aula 03 Profa. Ana Maria

perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Assim, a distribuio da Tabela X.5 corresponde ao seguinte polgono de frequncia acumulada:

Poligono da Distribuio de Frequencia acumulada


45 40 35 30 25 20 15 10 5 0 152

37
32 25

40

FI 14 5 156 160 164 168 172

Uma distribuio de frequncia sem intervalos de classe representada graficamente por um diagrama onde cada valor da varivel representado por um segmento de reta vertical e de comprimento proporcional respectiva frequncia. Assim a distribuio de frequncia da Tabela X.10, temos: TABELA X.10

16

Estatstica Computacional Aula 03 Profa. Ana Maria

No Excel:

Distribuio de Frequncia sem intervalo


8
7 6 5 5 7

4
3 2 1

4
2 1 1

fi

0 1 2 3 4 5 6

4.14) A Curva de Frequncia a) A Curva de Frequncia Curva Polida; Como, em geral, os dados coletados pertencentes a uma amostra extrada de uma populao podem imaginar as amostras tornando-se cada vez mais amplas e a amplitude das classes ficando cada vez menor, o que nos permite concluir que a linha poligonal (contorno do polgono de frequncia) tende a se transformar numa curva a curva de frequncia - , mostrando, de modo mais evidente, a verdadeira natureza da distribuio da populao. Podemos dizer, ento, que, enquanto o polgono de frequncia nos d a imagem real do fenmeno estudado, a curva de frequncia nos d a imagem real do fenmeno estudado, a curva de frequncia nos d a imagem tendencial.
17

Estatstica Computacional Aula 03 Profa. Ana Maria

Assim, aps o traado de um polgono de frequncia, desejvel, muitas vezes, que se lhe faa um polimento, de modo a mostrar o que seria tal polgono com o nmero maior de dados. Esse procedimento claro, no nos dar uma certeza absoluta de que a curva obtida curva polida seja tal a curva resultante de um grande nmero de dados. Porm, podemos afirmar que ela assemelha-se mais curva de frequncia do que ao polgono de frequncia obtido de uma amostra limitada. O polimento, geometricamente, corresponde eliminao dos vrtices da linha poligonal. Consegue-se isso com o emprego de uma formula bastante simples, a qual, a partir das frequncias reais, nos fornece novas frequncias frequncias calculadas que se localizaro, como no polgono de frequncia, nos pontos mdios. A formula que nos d a frequncia calculada (fc i) :

Onde: fci = a frequncia calculada da classe considerada; fi = a frequncia simples da classe considerada; fi 1 = a frequncia simples da classe anterior classe considerada; fi+ 1 = a frequncia simples da classe posterior classe considerada; Quando fazemos uso da curva polida, convm mostrar as frequncias realmente observadas por meio de pontos ou pequenos crculos, de modo que qualquer interessado possa, por si mesmo, julgar at que ponto os dados originais foram polidos. Para a distribuio da tabela X.11, temos:

18

Estatstica Computacional Aula 03 Profa. Ana Maria

TABELA X.11

Curva de Frequencia
12 10 8 6 4 2

0 145 150 155 160 165 170 175

Obs.: As formas de curvas de frequncia sero vistas quando estudarmos Inferncia Estatstica (Estimao e intervalos de confiana).

19

Vous aimerez peut-être aussi