Vous êtes sur la page 1sur 18

Estatstica descritiva

Origem: Wikipdia, a enciclopdia livre.

A estatstica descritiva um ramo da estatstica que aplica vrias tcnicas para descrever e sumariar um conjunto de dados.

Tcnicas
As tcnicas usadas costumam classificar-se como: 1.Grficos descritivos: So usados vrios tipos de grficos para sumarizar os dados. Por exemplo: Histogramas. 2.Descrio Tabular: Na qual se usam tabelas para sumarizar os dados. Por exemplo tabelas de Frequncias. 3.Descrio Paramtrica: Na qual estimamos os valores de certos parmetros, os quais assumimos que completam a descrio do conjunto dos dados. Por exemplo: Mdia.

Objetivos dos parmetros

Podemos querer escolher um parmetro que nos mostre como as diferentes observaes

so semelhantes. Os textos acadmicos costumam chamar a este objetivo de "medidas de tendncia central".

Podemos querer escolher parmetros que nos mostrem como aquelas observaes

diferem. Costuma chamar-se a este tipo de parmetros de "medidas de disperso.

Exemplos
Medidas de tendncia central
Costumamos responder ao primeiro desafio com o uso da mdia aritmtica, a mediana, ou a moda. Por vezes escolhemos valores especficos da funo distribuio acumulada chamados quantis como quartis, decis, ou percentis.

Medidas de disperso
As medidas mais comuns de variabilidade para dados quantitativos so a varincia; a sua raiz quadrada, o desvio padro. A amplitude total, adistncia interquartlica e o desvio absoluto so mais alguns exemplos de medidas de disperso.

Mdia aritmtica
Origem: Wikipdia, a enciclopdia livre.

H dois tipos de mdia aritmtica - simples ou ponderada.

Mdia aritmtica simples

A mdia aritmtica simples a mais utilizada no nosso dia-a-dia. obtida dividindo-se a soma das observaes pelo nmero delas. umquociente geralmente representado pelo smbolo . Se

tivermos uma srie de n valores de uma varivel x, a mdia aritmtica simples ser determinada pela expresso:

Mdia aritmtica ponderada , de forma que cada

Consideremos uma coleo formada por n nmeros:

um esteja sujeito a um peso [Nota: "peso" sinnimo de "ponderao"], respectivamente, indicado por: . A mdia aritmtica ponderada desses n nmeros a soma

dos produtos de cada um multiplicados por seus respectivos pesos, dividida pela soma dos pesos, isto :

Obviamente, a mdia aritmtica e a mdia ponderada podem ser generalizadas para estruturas algbricas mais complexas; a nica restrio que a soma dos pesos seja um nmero invertvel (em particular, no pode ser zero).

Exemplos
Um aluno tirou as notas 5, 7, 9 e 10 em quatro provas. A sua mdia ser (5 + 7 + 9
+ 10) / 4 = 7.75

Um aluno fez um teste (peso 1) e uma prova (peso 2), tirando 10 no teste e 4 na
prova. A sua mdia (ponderada) ser (10 x 1 + 4 x 2) / (1 + 2). Teramos ento: (10 + 8) / 3. Logo, o resultado da mdia aritmtica ponderada para este exemplo : 6. Se o teste e a prova tivessem mesmo peso (e no importa qual o valor do peso, importa apenas a relao entre os pesos), a mdia ponderada aritmtica seria sempre 7. Isto , se o aluno fizesse um teste (peso 3) e uma prova (peso 3) obtendo respectivamente a mesma pontuao anterior (10 e 4), teramos: (10 x 3 + 4 x 3) / (3 + 3). Continuando: (30 + 12) / 6. O resultado para pesos iguais ser sempre: "7". Veja: (30 + 12) / 6 = 7.

Um tringulo no plano tem vrtices dados pelas coordenadas cartesianas (2, 1), (4,
-1) e (3, 6). O seu baricentro a mdia dos vrtices, ou seja (3, 2).

Mediana (estatstica)
Origem: Wikipdia, a enciclopdia livre.

Em teoria da probabilidade e em estatstica, a mediana uma medida de tendncia central, um nmero que caracteriza as observaes de uma determinada varivel de tal forma que este nmero (a mediana) de um grupo de dados ordenados separa a metade inferior da amostra, populao ou distribuio de probabilidade, da metade superior. Mais concretamente, 1/2 da populao ter valores inferiores ou iguais mediana e 1/2 da populao ter valores superiores ou iguais mediana. A mediana pode ser calculada para um conjunto de observaes ou para funes de distribuio de probabilidade.

Clculo da mediana para dados ordenados


No caso de dados ordenados de amostras de tamanho n, se n for mpar, a mediana ser o elemento central os elementos e . . Se n for par, a mediana ser o resultado da mdia simples entre

Exemplos
Para a seguinte populao: 1, 3, 5, 7, 9 A posio central 5 (igual mdia) a mediana ser n+1/2 ---> 5+1/2 = 3 a mediana o 3 elemento que 5. No entanto, para a populao: 1, 2, 4, 10, 13 A mediana "4""3termo" (enquanto a mdia 6) Para populaes pares: 1, 2, 4, 8, 9, 10 A mediana (3+4)/2, que o 3,5 termo, e a mdia 5,5 .

Clculo da mediana para dados classificados

Quando se trata de um conjunto de dados classificados, o clculo da mediana feito atravs do histograma, ou atravs da funo cumulativa de frequncias relativas. A mediana o ponto do eixo das abcissas correspondente a 50% da frequncia relativa acumulada. No caso de variveis contnuas, a mediana calculada pela soluo da equao ou, equivalentemente, .

No caso de variveis discretas, e quando as frequncias esto calculadas por unidade, a mediana o ponto do eixo das abcissas para o qual a frequncia relativa acumulada inferior ou igual a 50% e superior ou igual a 50% para o ponto imediatamente a seguir.

Bibliografia

Murteira, Bento; Black, George (1983). Estatstica Descritiva. McGraw-Hill.

Moda (estatstica)
Origem: Wikipdia, a enciclopdia livre.

Em estatstica descritiva, a moda o valor que detm o maior nmero de observaes, ou seja, o valor ou valores mais frequentes. A moda no necessariamente nica, ao contrrio da mdia ou da mediana. especialmente til quando os valores ou observaes no so numricos, uma vez que a mdia e a mediana podem no ser bem definidas. A moda de {ma, banana, laranja, laranja, laranja, pssego} laranja. A srie {1, 3, 5, 5, 6, 6} apresenta duas modas (bimodal): 5 e 6. A srie {1, 3, 2, 5, 8, 7, 9} no apresenta moda. Bimodal: possui dois valores modais Amodal: no possui moda.

Percentil
Origem: Wikipdia, a enciclopdia livre.

Definio
Em estatstica descritiva, o k-simo percentil Pk o valor x (xk) que corresponde frequncia cumulativa de N k/100, onde N o tamanho amostral. Portanto:

O 1 percentil determina o 1 % menor dos dados e O 98 percentil determina o 98 % menor dos dados.

O 25 percentil o primeiro quartil; o 50 percentil a mediana. De igual forma, o 10 percentil o primeiro decil e o 80 percentil o oitavo decil. A definio de Mendenhall e Sincich para o p-simo percentil de N valores ordenados correspondente ao valor que ocupa a posio prximo. , arredondada para o inteiro mais

Obs.: A frmula percentil utilizada pelo Excel retornar valores diferentes da definio de

Mendenhall and Sincich.

A definio Minitab dada como a interpolao linear do valor correspondente posio.

Referncias
Weisstein, Eric W. Percentile. MathWorld -- A Wolfram Web Resource. consultado em 03/04/2007. Percentil - Excel Office OnLine -- consultado em 13/05/2008.

Decil
Origem: Wikipdia, a enciclopdia livre.
Em estatstica descritiva, decil qualquer um dos nove valores que dividem os dados ordenados de uma varivel em dez partes iguais, de modo que cada parte representa 1/10 da amostra ou populao. Assim:

O 1 decil o ponto de corte para 10% dos dados mais baixos, i. e., o percentil 10. O 5 decil o ponto de corte para 50% dos dados, i. e., o percentil 50, 2 quartil, ou mediana. O 9 decil o limite para 90% dos dados mais baixos, i. e., o percentil 90.

Quartil
Origem: Wikipdia, a enciclopdia livre.

Na estatstica descritiva, um quartil qualquer um dos trs valores que divide o conjunto ordenado de dados em quatro partes iguais, e assim cada parte representa 1/4 da amostra ou populao. Assim, no caso duma amostra ordenada,

primeiro quartil (designado por Q1/4) = quartil inferior = o valor aos 25% da amostra ordenada = 25 percentil

segundo quartil (designado por Q2/4) = mediana = o valor at ao qual se encontra 50% da amostra ordenada = 50 percentil, ou 5 decil.

terceiro quartil (designado por Q3/4) = quartil superior = valor a partir do qual se encontram 25% dos valores mais elevados = valor aos 75% da amostra ordenada = 75 percentil

diferena entre os quartis superior e inferior chama-se amplitude inter-quartil.

Exemplo 1: Amostra: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36 Amostra ordenada: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49 Q1/4 = 15 Q2/4 = 40 Q3/4 = 43 Exemplo 2: Amostra ordenada: 7, 15, 36, 39, 40, 41 Q1/4 = 15 Q2/4 = (39+36)/2 = 37.5 Q3/4 = 40

Varincia
Origem: Wikipdia, a enciclopdia livre.

Na teoria da probabilidade e na estatstica, a varincia de uma varivel aleatria uma medida da sua disperso estatstica, indicando quo longe em geral os seus valores se encontram do valor esperado. A varincia de uma varivel aleatria real o seu segundo momento central e tambm o seu segundo cumulante (os cumulantes s diferem dos momentos centrais a partir do 4 grau, inclusive).
ndice
[esconder]

1 Definio 2 Propriedades 3 Varincia da populao e varincia da amostra 4 Generalizaes 5 Histria do conceito 6 Ver tambm

[editar]Definio

Se = E(X) o valor esperado (mdia) da varivel aleatria X, ento a varincia

Isto , o valor esperado do quadrado do desvio de X da sua prpria mdia. Em linguagem comum isto pode ser expresso como "A mdia do quadrado da distncia de cada ponto at a mdia". assim a "mdia do quadrado dos desvios". A varincia da varivel aleatria "X" geralmente designada por , , ou simplesmente 2.

Notar que a definio acima pode ser usada quer para variveis aleatrias discretas, quer para contnuas. Muitas distribuies, tais como a distribuio Cauchy, no tm varincia porque o integral relevante diverge. Em particular, se uma distribuio no tem valores esperados, ela tambm no tem varincia. O contrrio no verdadeiro: h distribuies para as quais existe valor esperado mas no existe varincia, como, por exemplo, a distribuio t de Student com 2 graus de liberdade. Um contra-exemplo mais simples uma distribuio discreta sobre em que a probabilidade de cada ponto n proporcional a convergente . O valor esperado ser calculado atravs de uma srie , e a varincia atravs de uma srie divergente .

[editar]Propriedades

Se a varincia pode ser calculada (ou seja, a integral ou o somatrio convergem), podemos concluir que ela nunca negativa, porque os quadrados so sempre positivos ou nulos.

A unidade de varincia o quadrado da unidade de observao. Por exemplo, a varincia de um conjunto de alturas medidas em centmetrosser dada em centmetros quadrados. A varincia de um preo, medido, por exemplo, em euros por metro cbico, ser dada em euros quadrados por metro sexta potncia, uma unidade que no faz nenhum sentido prtico. Este facto inconveniente e levou muitos estatsticos a usar a raiz quadrada da varincia, conhecida como o desvio padro, como um sumrio da disperso. Pode ser provado facilmente a partir da definio que a varincia no depende do valor mdio . Isto , se a varivel "deslocada" por uma quantidade b ao tomarmos X+b, a varincia da varivel aleatria resultante permanece inalterada. Por contraste, se a varivel for multiplicada por um factor de escala a, a varincia ento multiplicada por a2. Mais formalmente, se a e b forem constantes reais e X uma varivel aleatria cuja varincia est definida, ento:

Outra frmula para a varincia que se deduz de forma simples a partir da definio acima :

Na prtica usa-se muito frequentemente esta frmula para calcular mais rapidamente a varincia. Uma razo para o uso da varincia em preferncia a outras medidas de disperso que a varincia da soma (ou diferena) de variveis aleatrias independentes a soma das suas varincias. Uma condio no to estricta, chamada de incorrelao (uncorrelatedness) tambm suficiente. Em geral,

Aqui a covarincia, a qual zero para variveis aleatrias no correlacionadas.


[editar]Varincia

da populao e varincia da

amostra
Em estatstica, o conceito de varincia tambm pode ser usado para descrever um conjunto de observaes. Quando o conjunto das observaes uma populao, chamada de varincia da populao. Se o conjunto das observaes

(apenas) uma amostra estatstica, chamamos-lhe de varincia amostral (ou varincia da amostra). A varincia da populao yi onde i = 1, 2, ...., N dada por

onde a mdia da populao. Na prtica, quando lidando com grandes populaes, quase sempre impossvel achar o valor exacto da varincia da populao, devido ao tempo, custo e outras restries aos recursos. Um mtodo comum de estimar a varincia da populao atravs da tomada de amostras. Quando estimando a varincia da populao usando n amostras aleatrias xi onde i = 1, 2, ..., n, a frmula seguinte um estimador no enviesado:

onde

a mdia da amostra.

Notar que o denominador n-1 acima contrasta com a equao para a varincia da populao. Uma fonte de confuso comum que o termovarincia da amostra e a notao s2 pode referir-se quer ao estimador no enviesado da varincia da populao acima como tambm quilo que em termos estrictos, a varincia da amostra, calculada usando n em vez de n-1. Intuitivamente, o clculo da varincia pela diviso por n em vez de n-1 d uma subestimativa da varincia da populao. Isto porque usamos a mdia da amostra como uma estimativa da mdia da populao , o que no conhecemos. Na prtica, porm, para grandes n, esta distino geralmente muito pequena.
[editar]Generalizaes

Se X uma varivel aleatria vectorial, com valores em Rn, e considerado como um vector coluna, ento a generalizao natural da varincia E[(X )(X )T], onde = E(X) e XT a transposta de X, e logo um vector-linha. A varincia uma matriz quadrada no-negativa definida, referida geralmente como a matriz de covarincia. Se X uma varivel aleatria de valores complexos, ento a sua varincia E[(X )(X )*], onde X* o conjugado complexo de X. Esta varincia, assim como no caso real, uma matriz quadrada nonegativa definida, cuja diagonal so nmeros reais no-negativos.
[editar]Histria

do conceito

O termo varincia foi introduzido por Ronald Fisher num ensaio de 1918 intitulado de The Correlation Between Relatives on the Supposition of Mendelian Inheritance. O conceito de varincia anlogo ao conceito de momento de inrcia em mecnica clssica.
[editar]

Valor esperado
Origem: Wikipdia, a enciclopdia livre.
Em Estatstica, em teoria das probabilidades, o valor esperado (ou esperana, ou expectncia) de uma varivel aleatria a soma das probabilidades de cada possibilidade de sada da experincia multiplicada pelo seu valor. Isto , representa o valor mdio "esperado" de uma experincia se ela for repetida muitas vezes. Note-se que o valor em si pode no ser esperado no sentido geral; pode ser improvvel ou impossvel. Se todos os eventos tiverem igual probabilidade o valor esperado a mdia aritmtica.

ndice
[esconder]

1 Definio matemtica 2 Exemplos 3 Operador esperana 4 Esperana do produto 5 Esperana condicional 6 Referncias

[editar]Definio

matemtica
e com as suas probabilidades

Para uma varivel aleatria discreta X com valores possveis representadas pela funop(xi), o valor esperado calcula-se pela srie:

desde que a srie seja convergente. Para uma varivel aleatria contnua X o valor esperado calcula-se mediante o integral de todos os valores da funo de densidade f(x):

Generalizando, seja g uma funo que toma valores no espao amostral de X. Ento temos:

Deve-se notar que, no caso geral,

no comuta com a funo g, ou seja:

Para o caso mais geral de e com

ser uma varivel aleatria de mais de uma dimenso,

assumindo valores em um espao vetorialnormado, temos:

em que a integral de Lebesgue usada.

[editar]Exemplos

a varivel aleatria X dada por p(X = -1) = p(X = 1) = 1/2

tem valor esperado 0.

por

a varivel aleatria X dada para n = 1, 2,

3, ... no tem valor esperado.

[editar]Operador

esperana

O valor esperado de uma combinao linear de variveis aleatrias a combinao linear dos seus valores esperados:

Por esse motivo, a funo E[] que associa a cada varivel aleatria o seu valor esperado um operador linear, chamado de operador esperana.

[editar]Esperana
No caso geral, temos que

do produto

No caso particular de X e Y serem variveis aleatrias independentes, temos que:

[editar]Esperana

condicional

Seja uma varivel aleatria uma sigma-lgebra no espao amostral , tal que .

A esperana condicional de X, dado avarivel aleatria

[1]

[2]

. Esta varivel Z tem as seguintes propriedades:

Z no contm mais

informao que a contida em . Ou seja,

a varivel aleatria (que sempre uma funo) mensurvel com relao a (=constante em qualquer subconjunto da partio correspondente a ) [3]

relao

Z satisfaz a

, onde IA uma varivel indicadora, que vale 1 se se . e0

Referncias
1.
SILVA, Marcos Eugnio

da. Uma Nota sobre Esperana Condicional e Expectativas Racionais. Disponvel em: <http://www.econ.fea.usp.br/m edsilva/material/eae0308/texto s/Esperanca_Condicional_e_ ER1.pdf>

2.

Esperana Condicional.

Disponvel em: <http://ferrari.dmat.fct.unl.pt/p

ersonal/mle/DocMAII/DocMAII 0102/espcondicional.pdf>. Acesso em: 05 de abril de 2011.

3.

SILVA, Marcos Eugnio

da. Uma Nota sobre Esperana Condicional e Expectativas Racionais. Disponvel em: <http://www.econ.fea.usp.br/m edsilva/material/eae0308/texto s/Esperanca_Condicional_e_ ER1.pdf>

Desvio padro
Origem: Wikipdia, a enciclopdia livre.

Em probabilidade e Estatstica, o desvio padro a medida mais comum da disperso estatstica. O desvio padro define-se como a raiz quadrada da varincia. definido desta forma de maneira a dar-nos uma medida da disperso que: 1. 2. seja um nmero no-negativo; use as mesmas unidades de medida que os nossos dados.

Faz-se uma distino entre o desvio padro (sigma) do total de uma populao ou de uma varivel aleatria, e o desvio padro s de um subconjunto em amostra. O termo desvio padro foi introduzido na estatstica por Karl Pearson no seu livro de 1894: "Sobre a disseco de curvas de frequncia assimtricas".

ndice
[esconder]

o o

1 Definio e clculo 1.1 Desvio padro de uma varivel aleatria 1.2 Desvio padro amostral 2 Propriedades 3 Ver tambm 4 Ligaes Externas

[editar]Definio [editar]Desvio

e clculo

padro de uma varivel aleatria

O desvio padro de uma varivel aleatria X definido como:

onde

o valor esperado de X.

Nem todas as variveis aleatrias possuem desvio padro, porque esses valores esperados no precisam existir. Por exemplo, o desvio padro de uma varivel que flui em uma distribuio de Cauchy indefinido.

[editar]Desvio

padro amostral
toma os valores , ento o desvio padro para esta

Se uma varivel aleatria

amostra de n nmeros (ou desvio padroamostral) pode ser calculado da seguinte forma. Primeiro calcula-se a mdia de , , atravs de:

(veja notao sigma). Depois, o desvio padro amostral calculado como:

A diviso por n

1 aparece quando exigimos que a varincia amostral


.

seja

um estimador no tendencioso da varincia populacional Quando os dados esto agrupados(frequncia) temos:

onde k o nmero de observaes diferentes. Em outras palavras, o desvio padro amostral de uma varivel aleatria X pode ser calculada como:

1.
2.

Para cada valor xi calcula-se a diferena .

entre xi e o valor mdio

Calcula-se o quadrado dessa diferena. No caso dos

dados estarem tabelados (com frequncias), multiplica-se cada um destes quadrados pela respectiva frequncia. 3. Encontra-se a soma dos quadrados das diferenas. No

caso dos dados estarem tabelados (com frequncias), a soma a dos produtos dos quadrados das diferenas pela respectiva frequncia.

4.
seja, (n 5.

Divide-se este resultado por: (nmero de valores - 1), ou

1).Esta quantidade a varincia s2.


Tome a raiz quadrtica deste resultado.

[editar]Propriedades

A distribuio normal.

De uma distribuio normal unimodal, gaussiana, simtrica, de afunilamento mdio (ou mesocrtica) podemos dizer o seguinte:

68% dos valores encontram-se a uma distncia da mdia inferior a

um desvio padro.

95% dos valores encontram-se a uma distncia da mdia inferior a

duas vezes o desvio padro.

99,7% dos valores encontram-se a uma distncia da mdia inferior

a trs vezes o desvio padro. Esta informao conhecida como a regra dos "68-95-99,7".

Vous aimerez peut-être aussi