Vous êtes sur la page 1sur 25

CONTEDO UNIDADES DE 1 A 11

UNIDADE 7 MEDIDAS DE TENDNCIA CENTRAL Como j mencionado anteriormente, diversos procedimentos, em estatstica, visam a uma reduo do conjunto de informaes coletadas de modo a identificar padres que facilitem a anlise, a elaborao de hipteses e a tomada de decises. neste contexto que se enquadra a procura por valores especficos ou ndices que representem o conjunto inteiro de dados coletados. Tais nmeros devem se assemelhar, o mximo possvel, aos demais valores do conjunto considerado. Ou seja, a identificao de valores tpicos, ou centrais, um dos procedimentos mais fundamentais da estatstica. por essa razo que tais valores recebem a denominao genrica de medidas de tendncia central. As medidas de tendncia central mais empregadas so a mdia, a moda e a mediana.

1) Mdia 1.1) Mdia aritmtica A mdia aritmtica ou mdia simples, qual nos referiremos daqui por diante apenas pelo nome mdia, obtida pela soma de todos os valores do conjunto de dados, dividida pelo nmero total de dados do conjunto. Para exemplificar, considere o seguinte conjunto de dados X = {1, 3, 5, 7}. H, neste conjunto, um total de 4 elementos (n = 4). Para encontrar o valor da mdia, basta somar os valores dos 4 elementos e dividir por 4:

No exemplo acima, observamos que o valor da mdia, representada por (l-se xis barra), igual a 4. A representao genrica desta frmula para o clculo da mdia, partindo-se de uma amostra qualquer X = {x1, x2, x3,..., xn}, :

A leitura da frmula acima : xis barra igual ao somatrio de xis-i, onde i varia de 1 at n, dividido por n. Ao desenvolvermos esta frmula, teramos:

Pgina 27 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11

Neste caso, a leitura seria: xis barra igual ao primeiro valor de x mais o segundo valor de x mais o terceiro valor de x .... mais o ensimo valor de x, e a soma final disso tudo dividido por n. Ou seja, x representa cada valor da amostra. Logo, x1 representa o primeiro valor da amostra, x2 representa o segundo, e assim por diante. O i, da representao xi, apenas serve para indicar que o x pode assumir um valor qualquer dentro do grupo (primeiro valor, segundo valor, etc.). Em nosso exemplo numrico, teramos:

importante ressaltar que existe uma diferena de representao entre a mdia amostral e a mdia populacional, diferena esta existente apenas na simbologia adotada:

Nesta frmula, a letra grega (mi) representa a mdia populacional, e a letra maiscula N representa o nmero total de elementos populacionais. Em se tratando de amostra, utiliza-se o j mencionado x barra para representar a mdia e a letra minscula n para representar o total de elementos da amostra. De qualquer modo, seja em casos populacionais ou amostrais, a dinmica do clculo exatamente a mesma.

1.2) Mdia ponderada Quando se pretende atribuir maior importncia a determinados valores do conjunto de dados, de modo que isto se reflita no clculo final da mdia, usual atribuir pesos diferenciados aos dados. A mdia assim calculada denominada mdia ponderada (representada por acordo com a frmula ), e seu clculo realizado de

Pgina 28 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11

O clculo de mdias finais, adotadas por diversas instituies de ensino, realizado desta forma. comum atribuir pesos 1, 2, 3 e 4 aos quatro bimestres letivos (primeiro, segundo, terceiro e quarto, respectivamente). Neste contexto, se considerarmos que as notas bimestrais (b1, b2, b3 e b4) de um aluno foram, nesta seqncia, 3, 4, 6 e 8, sua mdia final ponderada seria:

2) Moda Outra maneira de se determinar um valor que seja representativo de um conjunto de dados amostrais ou populacionais pelo critrio da maioria. Neste caso, o valor que aparece o maior nmero de vezes, ou seja, o mais freqente, aquele que ir representar o conjunto. Como exemplo, considere os nmeros de filhos de dez casais que freqentam certa comunidade:

O nmero de filhos que mais se repete nesta amostra 2. Dizemos, pois, que a moda amostral 2. O smbolo utilizado para representar a moda. Em nosso exemplo, portanto, teramos = 2.

Pgina 29 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11
Nem sempre um conjunto de dados possuir uma moda. Isto acontece nos conjuntos em que todos os valores apresentam a mesma freqncia. Neste caso, estamos diante de uma distribuio amodal. Por outro lado, existem conjuntos de dados em que dois valores so igualmente mais freqentes. Sendo assim, a distribuio ser bimodal. Existem tambm as distribuies multimodais, em que no conjunto de dados h trs ou mais valores que apresentam a freqncia mxima.

3) Mediana A mediana de um conjunto de dados corresponde ao valor central quando os dados so dispostos em ordem crescente ou decrescente. Em outras palavras, a mediana o valor central de um conjunto de dados ordenados, e representada pelo smbolo .

Quando a quantidade de dados no conjunto mpar, a mediana exatamente o valor que ocupa a posio central no conjunto ordenado de dados. Veja o exemplo abaixo, que representa o nmero de cries em sete crianas em idade pr-escolar, freqentadoras de uma creche pblica:

A disposio {2, 1, 0, 1, 0, 0, 3}, apresentada na tabela, no est ordenada. Ao ordenarmos de modo crescente estes dados, teramos a seguinte disposio de nmeros de cries: {0, 0, 0, 1, 1, 2, 3}. O valor central desta distribuio, ou seja, o nmero que ocupa a posio central dentre as sete posies existentes no conjunto, o nmero 1: {0, 0, 0, 1, 1, 2, 3}. Podemos, pois, afirmar que, neste conjunto de dados, = 1, pois a quantidade de valores que se encontra esquerda deste nmero a mesma que se encontra direita. Por outro lado, se a quantidade de dados no conjunto par, no haver apenas um valor central, e sim dois valores centrais. A mediana, neste caso, ser a mdia entre estes dois valores centrais do conjunto ordenado de dados. Como exemplo dessa situao, considere a tabela abaixo, que representa as idades de seis crianas selecionadas ao acaso em um parque de diverses:

Ao ordenarmos os valores da tabela, teramos: {1, 2, 3, 4, 5, 8}. Os valores centrais desta

distribuio ordenada seriam 3 e 4: {1, 2, 3, 4, 5, 8}. Portanto,

Pgina 30 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11
importante salientar que a mediana uma medida que no afetada pela presena de valores extremos no conjunto de dados, ao contrrio da mdia. Voltemos ao exemplo do nmero de cries por criana, mencionado anteriormente: {0, 0, 0, 1, 1, 2, 3}. Tanto a mediana quanto a mdia deste conjunto de dados apresentam valor igual a 1. Porm, se este conjunto de dados fosse: {0, 0, 0, 1, 1, 2, 15}, a presena do valor extremo 15 afetaria substancialmente a mdia, que seria 2,7 neste caso, ao passo que a mediana continuaria a ser igual a 1. Portanto, em situaes como esta, em que existe a presena de um dado muito destoante dos demais, o uso da mediana como valor representativo do conjunto prefervel ao uso da mdia.

Pgina 31 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11

UNIDADE 8 MEDIDAS DE TENDNCIA CENTRAL PARA DADOS DISPOSTOS EM TABELAS DE FREQNCIAS Quando os dados encontram-se dispostos em tabelas de distribuio de freqncias, mesmo que os valores brutos sejam desconhecidos, possvel obter a mdia, moda ou mediana do conjunto. O que caracteriza estas situaes o fato de existirem observaes repetidas de valores dentro do conjunto de dados, sejam valores individuais (discretos) ou valores agrupados, que se incluem em intervalos de classes determinados (contnuos). Nestes casos, na determinao da mdia, moda ou mediana, os valores das freqncias absolutas devem ser computados.

1) Medidas de tendncia central para variveis quantitativas discretas Vamos nos basear em um exemplo para ilustrar a forma de se obter a mdia, a mediana e a moda de um conjunto de dados caracterizado por apresentar poucos valores diferentes entre si (varivel quantitativa discreta). Para tanto, considere a tabela abaixo, que apresenta a freqncia de erros de impresso encontrados em uma amostra de 50 pginas de um livro.

Veja que existem apenas 5 valores diferentes entre si no conjunto de dados, os quais se repetem em nmeros de vezes igualmente distintos. Se a tabela acima fosse revertida em uma tabela de dados brutos, encontraramos uma distribuio como a que se segue abaixo:

Pgina 32 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11

Para obter a mdia de um conjunto de dados brutos, como os dispostos na tabela acima, teramos que efetuar o seguinte clculo:

No entanto, a realizao deste clculo seria facilitada se multiplicssemos cada nmero de erros pela freqncia com que aparece no conjunto de dados e somssemos os resultados de todas estas multiplicaes, antes de dividir por 50. Essa freqncia fornecida pela tabela de distribuio de freqncias. Sendo assim, teramos:

Quando se dispe da tabela de distribuio de freqncias, a partir da qual pretende-se determinar a mdia, convm adicionar uma coluna, na qual os valores das multiplicaes dos dados (xi) por suas respectivas freqncias (fi) possam ser inseridos, como demonstrado abaixo:

Pgina 33 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11
Portanto, o clculo da mdia, levando em considerao as freqncias absolutas, pode ser representado pela frmula:

Considerando que a soma de todas as freqncias igual ao nmero de dados do conjunto (ou seja, fi = n ), temos:

No exemplo adotado, por pgina do livro analisado.

, ou seja, h, em mdia, 0,66 erro de impresso

Para obter a mediana, necessrio ordenar os dados. No entanto, os dados j se encontram ordenados de cima para baixo na tabela. Ou seja, os primeiros 25 valores so iguais a zero, os prximos 20 valores so iguais a 1, e assim por diante. Como o tamanho da amostra par (n = 50), a mediana igual mdia entre os valores que ocupam a 25 e a 26 posies nesta distribuio ordenada. Sendo assim, temos

A moda, por outro lado, o valor mais freqente do conjunto de dados. Em uma tabela de distribuio de freqncias, este valor facilmente identificvel. No nosso exemplo, o valor mais freqente igual a 0, que se repete 25 vezes.

2) Medidas de tendncia central para variveis quantitativas contnuas Para variveis quantitativas contnuas, cujos valores em uma tabela de freqncias so agrupados em classes, difcil estabelecer os valores exatos da mdia, da mediana e da moda quando os dados brutos no so conhecidos. Sendo assim, um dos procedimentos mais usuais a obteno de valores aproximados, determinados a partir dos pontos mdios das classes. Vamos tomar como exemplo a tabela a seguir, que representa a distribuio de freqncias de tempos da ltima conexo internet de um grupo de 50 pessoas: Pgina 34 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11

Para a obteno da mdia, uma das etapas consiste em multiplicar os pontos mdios de cada classe por suas respectivas freqncias absolutas, tal como realizado para as variveis quantitativas discretas. Esta tarefa facilitada pela adio de uma coluna direita da tabela acima, contendo os valores destas multiplicaes, como demonstrado abaixo:

Pgina 35 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11

A mesma frmula para determinao da mdia a partir da tabela de freqncias de dados discretos tambm serve para valores agrupados em classes. Sendo assim, temos:

Para a obteno da mediana, procedemos como j descrito no caso das variveis quantitativas discretas, levando em considerao que cada classe representada apenas pelo seu ponto mdio. Sendo assim, consideramos que, na ordenao de dados da tabela, os 6 primeiros valores so iguais a 12,5, os prximos 10 valores so iguais a 24,5, e assim por diante. Como o tamanho amostral par (n = 50), determinamos a mediana da seguinte forma:

A moda corresponde ao valor mais freqente da distribuio. Na tabela, verificamos que a classe modal possui 13 valores. O ponto mdio desta classe igual a 36,5. Logo, a moda aproximada deste conjunto de dados igual a 36,5.

Pgina 36 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11

UNIDADE 9 MEDIDAS DE DISPERSO OU VARIAO Como visto anteriormente, as medidas de tendncia central (mdia, mediana e moda) so ndices cuja determinao se justifica pela necessidade de resumir as informaes contidas no conjunto de dados. No entanto, ao caracterizar uma amostra ou populao por meio destes ndices, informaes importantes sobre a variao numrica existente no conjunto no so reveladas. Para registrar de maneira resumida a variabilidade contida nos dados, so calculadas as medidas de disperso ou variao. O termo disperso sugere a idia de quanto os dados esto separados uns dos outros. Existem conjuntos de dados cujos valores so muito diferentes uns dos outros, o que caracteriza uma grande disperso ou variabilidade. Por outro lado, existem situaes em que os valores numricos dos dados so muito prximos uns dos outros, o que revela uma disperso ou variabilidade reduzida. Para exemplificar o que acabamos de afirmar, considere os conjuntos de dados A = {5, 5, 5, 5, 5} e B = {2, 5, 5, 6, 7}. Em ambos os casos, o tamanho amostral o mesmo (n = 5) e as medidas de tendncia central tm o mesmo valor ( , tanto em A quanto em B). No entanto, evidente que em A no existe variao nenhuma, e em B a variabilidade numrica existe. Dizendo de outra forma, o conjunto A mais homogneo que B. A caracterizao da variabilidade contida nos dados algo essencial no contexto da estatstica. Parmetros scio-econmicos, tais como analfabetismo, distribuio de renda, dentre outros, podem ser comparados entre municpios, estados e pases com base na variabilidade de seus ndices. Por exemplo, de se esperar que a renda familiar em pases desenvolvidos seja mais homognea que nos pases em desenvolvimento. Sero apresentados, a seguir, alguns ndices que pretendem dimensionar a variabilidade contida em conjuntos de dados: a amplitude total, a soma dos desvios simples e absolutos e o desvio mdio.

1) Amplitude total Esta a mais simples das medidas de variabilidade. A amplitude total (AT) dos dados fornecida pela diferena entre o maior e o menor valor do conjunto. Se considerarmos o conjunto de dados C = {1, 5, 5, 5, 7, 7, 9, 9, 15}, ento a amplitude total do conjunto C seria ATC = 15 1 = 14. A amplitude total no um bom ndice de medida de disperso, pois no leva em considerao a variabilidade de dados. Para ter uma idia exata do que estamos dizendo, considere outro conjunto de dados D = {1, 2, 3, 6, 8, 10, 12, 15}. Embora o valor de ATD tambm seja igual a 15, possvel observar Pgina 37 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11
que o conjunto D possui uma disperso de dados nitidamente maior que o conjunto C. Portanto, um bom ndice de disperso deve considerar a diversidade de nmeros existentes no conjunto total.

2) Soma dos desvios simples

Um ndice que leva em considerao a diversidade entre os valores de um conjunto de dados o desvio simples. O termo desvio (d) aqui empregado com o significado de diferena entre cada valor do conjunto e um valor de referncia do grupo, que a mdia. Formalizando esta idia como uma expresso, teramos que o desvio simples de um valor em relao mdia seria:

onde, di = desvio simples de qualquer valor i em relao mdia xi = qualquer valor i do conjunto de dados = mdia Como o interesse dimensionar a variabilidade do conjunto inteiro, todos os desvios simples individuais devem ser empregados no clculo de um ndice que represente o grupo. Uma possibilidade poderia ser a soma dos desvios simples, representada por:

onde SDS = soma dos desvios simples; somatrio dos desvios simples de cada valor i em relao mdia. Apesar de servir aos propsitos de considerar toda a variabilidade existente no conjunto de dados, existe um problema quanto ao uso da soma dos desvios simples como medida de disperso. Para compreender esse problema, considere o conjunto de dados X = {2, 4, 6, 8}, cuja mdia igual a 5. Os desvios simples, neste caso, seriam:

Pgina 38 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11

Sendo assim, ao efetuarmos a soma destes desvios simples, teramos:

Como podemos constatar, a soma de todos os desvios simples igual a zero, uma vez que os desvios negativos e positivos se anulam. Isso verdadeiro para qualquer conjunto de dados. Portanto, a soma dos desvios simples no pode ser uma medida de disperso dos dados, mas ser til na determinao de outros ndices, conforme veremos adiante.

3) Soma dos desvios absolutos Para evitar que os valores negativos e positivos dos desvios se anulem, como ocorre no caso da soma dos desvios simples, uma alternativa seria utilizar somente os valores dos mdulos de cada desvio simples na soma final. Neste caso, os mdulos, que so apenas valores positivos, so denominados desvios absolutos. Considerando o exemplo anterior, no conjunto de dados X = {2, 4, 6, 8} os valores dos desvios absolutos seriam iguais aos mdulos dos desvios simples:

Sendo assim, a soma dos desvios absolutos (SDA) seria:

Problemas no uso da soma dos desvios absolutos como medida de disperso podem ocorrer quando estes ndices obtidos a partir de conjuntos de dados de tamanhos muito diferentes so Pgina 39 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11
comparados. Um conjunto grande de valores, mas pouco varivel, pode fornecer uma SDA maior que outro conjunto pequeno, porm de maior variabilidade. Para que esse tipo de erro no ocorra, utiliza-se o desvio mdio.

4) Desvio mdio O desvio mdio equivale a uma medida de disperso obtida pela mdia dos desvios absolutos. Em outras palavras, o desvio mdio (DM) equivale ao quociente entre a SDA e o tamanho do conjunto de dados (n):

O clculo do desvio mdio para o conjunto de dados X = {2, 4, 6, 8} est apresentado abaixo:

Dentre todas as medidas de disperso apresentadas at agora, o desvio mdio a mais aceitvel, pois leva em considerao toda a variabilidade contida nos dados e o tamanho do conjunto.

Pgina 40 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11

UNIDADE 10 VARINCIA E DESVIO PADRO PARA DADOS BRUTOS De todas as medidas de disperso estudadas at o momento, o desvio mdio aquela que se enquadra melhor nos propsitos de dimensionar a variabilidade contida nos dados. No entanto, uma medida pouco empregada em estatstica. A preferncia, nestes casos, recai sobre o clculo dos desvios ao quadrado. O uso dos desvios ao quadrado ao invs dos desvios absolutos se justifica pelo fato de que, ao se elevar ao quadrado o valor de um desvio, alm de remover os eventuais sinais negativos, faz com que os maiores desvios tenham efetivamente um peso maior no valor do ndice de variabilidade calculado. A seguir, veremos como os desvios ao quadrado so utilizados na obteno de dois dos mais importantes ndices da estatstica, a varincia e o desvio padro.

1) Soma dos desvios ao quadrado A forma de se obter os valores dos desvios ao quadrado o conjunto de dados brutos X = {2, 4, 6, 8}, cuja mdia = 5. simples. Como exemplo, usaremos

Para calcular os valores dos desvios ao quadrado, seguiremos as etapas descritas abaixo:

Pgina 41 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11
Portanto, os valores 9, 1, 1 e 9 correspondem aos desvios ao quadrado que estvamos interessados em obter. No entanto, os valores individuais dos desvios ao quadrado devem ser somados para obter um nmero nico que represente o conjunto. Sendo assim, ainda h mais uma etapa a cumprir.

Este valor da soma dos desvios ao quadrado ser utilizado para o clculo da varincia.

2) Varincia Quando o valor da soma dos desvios absolutos calculado, o prximo procedimento a obteno do desvio mdio (vide unidade 14), por meio da diviso desta soma pelo tamanho do conjunto de dados (n). No caso dos desvios ao quadrado, esse procedimento tambm realizado, com o intuito de obter uma mdia dos desvios ao quadrado, tambm conhecida como varincia ( 2). Desta forma, a varincia, como descrita acima, pode ser representada pela seguinte expresso geral:

No exemplo mencionado no item anterior, o valor da soma dos desvios ao quadrado igual a 20 para o conjunto de dados cujo tamanho n = 4. Neste caso temos:

importante ressaltar que o smbolo adotado para representar a varincia, a letra grega sigma ao quadrado (2), somente deve ser utilizado quando o conjunto de dados analisado corresponde a uma Pgina 42 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11
populao. Quando o conjunto de dados se referir a uma amostra extrada de uma populao qualquer, a varincia simbolizada pela letra s minscula elevada ao quadrado (s2). A mesma diferenciao de smbolos descrita para a varincia, tambm existe para a representao da mdia. A mdia populacional costuma ser representada pela letra grega (mi), enquanto a mdia amostral representada pelo j mencionado smbolo (xis barra). O mesmo ocorre tambm para o tamanho do conjunto de dados: a letra maiscula N usada para conjuntos populacionais, e a letra minscula n, para amostras. Sendo assim, a melhor representao para a varincia populacional seria:

Para efetuar o clculo da varincia amostral, necessrio realizar uma pequena modificao na frmula da varincia apresentada anteriormente. Essa modificao denominada correo amostral, representada a seguir:

Observe que a correo amostral consiste apenas em substituir N da frmula aplicada para dados populacionais, para n-1. Na prtica, essa correo praticamente no mudar o resultado final se a amostra contar com 30 ou mais elementos na sua composio.

3) Desvio padro Por representar valores de desvios elevados ao quadrado, a varincia tambm expressa a variabilidade contida nos dados como uma grandeza tambm elevada ao quadrado, como, por exemplo, m2, anos2, etc. Para que a variabilidade dos dados no seja expressa em uma grandeza ao quadrado, e sim em uma grandeza da mesma ordem que os valores apresentados pelos dados brutos, costuma-se tirar a raiz quadrada do valor da varincia. O resultado desta operao denominado desvio padro. Portanto, de acordo com a descrio acima, o desvio padro calculado de acordo com a seguinte frmula:

Pgina 43 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11

Quando se dispe de amostras, e no de conjuntos populacionais, o desvio padro simbolizado pela letra minscula s, e sua frmula, aps a correo amostral, passa a ser:

No exemplo mencionado nos itens anteriores, o valor calculado para a varincia foi 2 = 5. Logo, o desvio padro, neste caso, seria:

H casos particulares em que se pretende comparar a variabilidade dos dados de duas ou mais variveis medidas por grandezas diferentes. Por exemplo, imagine que um pesquisador esteja interessado em comparar as variaes de idade e de estatura em um grupo de estudantes. A idade, fornecida em anos, e a estatura, medida em centmetros, certamente fornecero valores de varincia e desvio padro muito distintos e, portanto, incomparveis. Nestes casos, recomendvel usar o coeficiente de variao para comparar as duas variveis. O coeficiente de variao (cv) um ndice sem grandeza (adimensional), que se obtm pela diviso do desvio padro pela mdia do conjunto. Esta prtica denominada normalizao. Portanto, a frmula para o clculo do coeficiente de variao pode ser escrita do seguinte modo:

No exemplo que temos mencionado, o valor do desvio padro 2,24 e a mdia igual a 5. Sendo assim, o coeficiente de variao, neste caso, : Pgina 44 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11

O valor do coeficiente de variao tambm pode ser representado na forma de porcentagem. Neste caso, basta multiplicar o valor fracionrio por 100. No exemplo acima, temos que cv = 0,448 x 100 = 44,8%.

4) Organizando as idias em uma tabela de desvios Uma maneira de organizar o raciocnio no clculo da varincia e desvio padro organizar os dados brutos em uma tabela e criar duas colunas, uma para incluir os valores dos desvios e outra, para os desvios ao quadrado. Considere, como exemplo, o conjunto de dados abaixo, relativos aos salrios (em milhares de reais) recebidos anualmente pelos dez trabalhadores de um dos principais setores de uma empresa: 41, 38, 39, 45, 47, 41, 44, 41, 37, 42. Observe que a descrio acima se refere a uma populao e no a uma amostra, pelo fato de que esto sendo considerados todos os dez trabalhadores do setor mencionado. Para calcularmos a varincia e o desvio padro dos salrios, o primeiro passo obter a mdia:

Em seguida, fazemos a montagem da tabela contendo os dados brutos e os respectivos valores dos desvios em relao mdia:

Pgina 45 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11

Como esta populao sob estudo conta com apenas 10 indivduos, temos N = 10. Como o valor da soma dos desvios ao quadrado foi obtido na tabela varincia: , possvel, pois, calcular a

Em seguida, calculamos o desvio padro:

Podemos, inclusive, determinar o coeficiente de variao:

importante salientar que os valores salariais fornecidos neste exemplo compem uma populao. Se estivssemos diante de 10 valores extrados de uma populao, ou seja, se os 10 valores Pgina 46 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11
correspondessem a uma amostra e no a uma populao, teramos ento que aplicar a correo amostral para n = 10. Os valores da varincia, desvio padro e coeficiente de variao, neste caso, seriam:

UNIDADE 11 - VARINCIA E DESVIO PADRO PARA DADOS DISPOSTOS EM TABELAS DE FREQNCIAS Muitas vezes os dados encontram-se distribudos em tabelas de freqncias, e, nestas situaes, como j descrito para as medidas de tendncia central, as freqncias devem entrar no clculo dos atributos estatsticos. No poderia ser diferente no caso da varincia e do desvio padro. Descreveremos, a seguir, como estas medidas de disperso so determinadas a partir destas tabelas.

1) Medidas de disperso para variveis quantitativas discretas O primeiro procedimento para se obter a varincia e desvio padro de dados organizados em tabelas de freqncia o mesmo que foi adotado para os conjuntos de dados brutos, ou seja, a determinao da mdia. Em seguida, devem ser obtidos os valores dos desvios ao quadrado, os quais sero, finalmente, multiplicados pelas freqncias com que os dados se apresentam na tabela e somados. Para ilustrar esta seqncia de etapas, adotaremos o mesmo exemplo utilizado na unidade 13, que se refere s freqncias de erros de impresso encontrados em uma amostra de 50 pginas de um livro.

Pgina 47 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11

Como descrito na unidade 13, a mdia obtida da seguinte forma:

Uma vez determinada a mdia, o prximo passo obter os desvios. Para organizar melhor as idias, recomendvel dispor os desvios na prpria tabela de dados:

Observe na tabela acima que as freqncias dos dados ( fi ) apenas iro participar dos clculos aps os desvios ao quadrado terem sido determinados. Aps a soma dos resultados das multiplicaes dos desvios ao quadrado pelas respectivas freqncias ter sido obtida Pgina 48 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11
, a varincia pode ser calculada, lembrando que os dados acima correspondem a uma amostra, e, portanto, necessrio fazer a correo amostral (n-1):

Uma vez determinada a varincia, podemos efetuar o clculo do desvio padro:

Ou seja, na amostra de 50 pginas do livro, h uma mdia de 0,66 erro por pgina e um desvio padro de 0,85 erro por pgina. 2) Medidas de disperso para variveis quantitativas contnuas Para as tabelas de dados agrupados em classes, o procedimento permanece o mesmo que o descrito no item anterior. No entanto, importante lembrar que os nmeros que iro representar cada classe nos clculos efetuados so os pontos mdios. Adotaremos o mesmo exemplo citado na unidade 13, relativo distribuio de freqncias de tempos (em minutos) da ltima conexo internet de um grupo de 50 pessoas:

Pgina 49 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11

O clculo da mdia para os dados acima feito da seguinte forma:

Uma vez calculada a mdia, o prximo passo determinar os desvios. Para melhor organizao, os desvios so dispostos na tabela:

Pgina 50 de 51

docsity.com

CONTEDO UNIDADES DE 1 A 11

Para calcular a varincia, teramos:

A partir da varincia, calculamos o desvio padro:

Portanto, nesta amostra de 50 pessoas, a ltima conexo internet demorou em mdia 41,8 minutos, com desvio padro de 20,16 minutos.

Pgina 51 de 51

docsity.com