Académique Documents
Professionnel Documents
Culture Documents
A estatstica descritiva um ramo da estatstica que aplica vrias tcnicas para descrever e sumariar um conjunto de dados.
Tcnicas
As tcnicas usadas costumam classificar-se como: 1.Grficos descritivos: So usados vrios tipos de grficos para sumarizar os dados. Por exemplo: Histogramas. 2.Descrio Tabular: Na qual se usam tabelas para sumarizar os dados. Por exemplo tabelas de Frequncias. 3.Descrio Paramtrica: Na qual estimamos os valores de certos parmetros, os quais assumimos que completam a descrio do conjunto dos dados. Por exemplo: Mdia.
Podemos querer escolher um parmetro que nos mostre como as diferentes observaes
so semelhantes. Os textos acadmicos costumam chamar a este objetivo de "medidas de tendncia central".
Podemos querer escolher parmetros que nos mostrem como aquelas observaes
Exemplos
Medidas de tendncia central
Costumamos responder ao primeiro desafio com o uso da mdia aritmtica, a mediana, ou a moda. Por vezes escolhemos valores especficos da funo distribuio acumulada chamados quantis como quartis, decis, ou percentis.
Medidas de disperso
As medidas mais comuns de variabilidade para dados quantitativos so a varincia; a sua raiz quadrada, o desvio padro. A amplitude total, adistncia interquartlica e o desvio absoluto so mais alguns exemplos de medidas de disperso.
Mdia aritmtica
Origem: Wikipdia, a enciclopdia livre.
A mdia aritmtica simples a mais utilizada no nosso dia-a-dia. obtida dividindo-se a soma das observaes pelo nmero delas. umquociente geralmente representado pelo smbolo . Se
tivermos uma srie de n valores de uma varivel x, a mdia aritmtica simples ser determinada pela expresso:
um esteja sujeito a um peso [Nota: "peso" sinnimo de "ponderao"], respectivamente, indicado por: . A mdia aritmtica ponderada desses n nmeros a soma
dos produtos de cada um multiplicados por seus respectivos pesos, dividida pela soma dos pesos, isto :
Obviamente, a mdia aritmtica e a mdia ponderada podem ser generalizadas para estruturas algbricas mais complexas; a nica restrio que a soma dos pesos seja um nmero invertvel (em particular, no pode ser zero).
Exemplos
Um aluno tirou as notas 5, 7, 9 e 10 em quatro provas. A sua mdia ser (5 + 7 + 9
+ 10) / 4 = 7.75
Um aluno fez um teste (peso 1) e uma prova (peso 2), tirando 10 no teste e 4 na
prova. A sua mdia (ponderada) ser (10 x 1 + 4 x 2) / (1 + 2). Teramos ento: (10 + 8) / 3. Logo, o resultado da mdia aritmtica ponderada para este exemplo : 6. Se o teste e a prova tivessem mesmo peso (e no importa qual o valor do peso, importa apenas a relao entre os pesos), a mdia ponderada aritmtica seria sempre 7. Isto , se o aluno fizesse um teste (peso 3) e uma prova (peso 3) obtendo respectivamente a mesma pontuao anterior (10 e 4), teramos: (10 x 3 + 4 x 3) / (3 + 3). Continuando: (30 + 12) / 6. O resultado para pesos iguais ser sempre: "7". Veja: (30 + 12) / 6 = 7.
Um tringulo no plano tem vrtices dados pelas coordenadas cartesianas (2, 1), (4,
-1) e (3, 6). O seu baricentro a mdia dos vrtices, ou seja (3, 2).
Mediana (estatstica)
Origem: Wikipdia, a enciclopdia livre.
Em teoria da probabilidade e em estatstica, a mediana uma medida de tendncia central, um nmero que caracteriza as observaes de uma determinada varivel de tal forma que este nmero (a mediana) de um grupo de dados ordenados separa a metade inferior da amostra, populao ou distribuio de probabilidade, da metade superior. Mais concretamente, 1/2 da populao ter valores inferiores ou iguais mediana e 1/2 da populao ter valores superiores ou iguais mediana. A mediana pode ser calculada para um conjunto de observaes ou para funes de distribuio de probabilidade.
Exemplos
Para a seguinte populao: 1, 3, 5, 7, 9 A posio central 5 (igual mdia) a mediana ser n+1/2 ---> 5+1/2 = 3 a mediana o 3 elemento que 5. No entanto, para a populao: 1, 2, 4, 10, 13 A mediana "4""3termo" (enquanto a mdia 6) Para populaes pares: 1, 2, 4, 8, 9, 10 A mediana (3+4)/2, que o 3,5 termo, e a mdia 5,5 .
Quando se trata de um conjunto de dados classificados, o clculo da mediana feito atravs do histograma, ou atravs da funo cumulativa de frequncias relativas. A mediana o ponto do eixo das abcissas correspondente a 50% da frequncia relativa acumulada. No caso de variveis contnuas, a mediana calculada pela soluo da equao ou, equivalentemente, .
No caso de variveis discretas, e quando as frequncias esto calculadas por unidade, a mediana o ponto do eixo das abcissas para o qual a frequncia relativa acumulada inferior ou igual a 50% e superior ou igual a 50% para o ponto imediatamente a seguir.
Bibliografia
Moda (estatstica)
Origem: Wikipdia, a enciclopdia livre.
Em estatstica descritiva, a moda o valor que detm o maior nmero de observaes, ou seja, o valor ou valores mais frequentes. A moda no necessariamente nica, ao contrrio da mdia ou da mediana. especialmente til quando os valores ou observaes no so numricos, uma vez que a mdia e a mediana podem no ser bem definidas. A moda de {ma, banana, laranja, laranja, laranja, pssego} laranja. A srie {1, 3, 5, 5, 6, 6} apresenta duas modas (bimodal): 5 e 6. A srie {1, 3, 2, 5, 8, 7, 9} no apresenta moda. Bimodal: possui dois valores modais Amodal: no possui moda.
Percentil
Origem: Wikipdia, a enciclopdia livre.
Definio
Em estatstica descritiva, o k-simo percentil Pk o valor x (xk) que corresponde frequncia cumulativa de N k/100, onde N o tamanho amostral. Portanto:
O 1 percentil determina o 1 % menor dos dados e O 98 percentil determina o 98 % menor dos dados.
O 25 percentil o primeiro quartil; o 50 percentil a mediana. De igual forma, o 10 percentil o primeiro decil e o 80 percentil o oitavo decil. A definio de Mendenhall e Sincich para o p-simo percentil de N valores ordenados correspondente ao valor que ocupa a posio prximo. , arredondada para o inteiro mais
Obs.: A frmula percentil utilizada pelo Excel retornar valores diferentes da definio de
Referncias
Weisstein, Eric W. Percentile. MathWorld -- A Wolfram Web Resource. consultado em 03/04/2007. Percentil - Excel Office OnLine -- consultado em 13/05/2008.
Decil
Origem: Wikipdia, a enciclopdia livre.
Em estatstica descritiva, decil qualquer um dos nove valores que dividem os dados ordenados de uma varivel em dez partes iguais, de modo que cada parte representa 1/10 da amostra ou populao. Assim:
O 1 decil o ponto de corte para 10% dos dados mais baixos, i. e., o percentil 10. O 5 decil o ponto de corte para 50% dos dados, i. e., o percentil 50, 2 quartil, ou mediana. O 9 decil o limite para 90% dos dados mais baixos, i. e., o percentil 90.
Quartil
Origem: Wikipdia, a enciclopdia livre.
Na estatstica descritiva, um quartil qualquer um dos trs valores que divide o conjunto ordenado de dados em quatro partes iguais, e assim cada parte representa 1/4 da amostra ou populao. Assim, no caso duma amostra ordenada,
primeiro quartil (designado por Q1/4) = quartil inferior = o valor aos 25% da amostra ordenada = 25 percentil
segundo quartil (designado por Q2/4) = mediana = o valor at ao qual se encontra 50% da amostra ordenada = 50 percentil, ou 5 decil.
terceiro quartil (designado por Q3/4) = quartil superior = valor a partir do qual se encontram 25% dos valores mais elevados = valor aos 75% da amostra ordenada = 75 percentil
Exemplo 1: Amostra: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36 Amostra ordenada: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49 Q1/4 = 15 Q2/4 = 40 Q3/4 = 43 Exemplo 2: Amostra ordenada: 7, 15, 36, 39, 40, 41 Q1/4 = 15 Q2/4 = (39+36)/2 = 37.5 Q3/4 = 40
Varincia
Origem: Wikipdia, a enciclopdia livre.
Na teoria da probabilidade e na estatstica, a varincia de uma varivel aleatria uma medida da sua disperso estatstica, indicando quo longe em geral os seus valores se encontram do valor esperado. A varincia de uma varivel aleatria real o seu segundo momento central e tambm o seu segundo cumulante (os cumulantes s diferem dos momentos centrais a partir do 4 grau, inclusive).
ndice
[esconder]
1 Definio 2 Propriedades 3 Varincia da populao e varincia da amostra 4 Generalizaes 5 Histria do conceito 6 Ver tambm
[editar]Definio
Isto , o valor esperado do quadrado do desvio de X da sua prpria mdia. Em linguagem comum isto pode ser expresso como "A mdia do quadrado da distncia de cada ponto at a mdia". assim a "mdia do quadrado dos desvios". A varincia da varivel aleatria "X" geralmente designada por , , ou simplesmente 2.
Notar que a definio acima pode ser usada quer para variveis aleatrias discretas, quer para contnuas. Muitas distribuies, tais como a distribuio Cauchy, no tm varincia porque o integral relevante diverge. Em particular, se uma distribuio no tem valores esperados, ela tambm no tem varincia. O contrrio no verdadeiro: h distribuies para as quais existe valor esperado mas no existe varincia, como, por exemplo, a distribuio t de Student com 2 graus de liberdade. Um contra-exemplo mais simples uma distribuio discreta sobre em que a probabilidade de cada ponto n proporcional a convergente . O valor esperado ser calculado atravs de uma srie , e a varincia atravs de uma srie divergente .
[editar]Propriedades
Se a varincia pode ser calculada (ou seja, a integral ou o somatrio convergem), podemos concluir que ela nunca negativa, porque os quadrados so sempre positivos ou nulos.
A unidade de varincia o quadrado da unidade de observao. Por exemplo, a varincia de um conjunto de alturas medidas em centmetrosser dada em centmetros quadrados. A varincia de um preo, medido, por exemplo, em euros por metro cbico, ser dada em euros quadrados por metro sexta potncia, uma unidade que no faz nenhum sentido prtico. Este facto inconveniente e levou muitos estatsticos a usar a raiz quadrada da varincia, conhecida como o desvio padro, como um sumrio da disperso. Pode ser provado facilmente a partir da definio que a varincia no depende do valor mdio . Isto , se a varivel "deslocada" por uma quantidade b ao tomarmos X+b, a varincia da varivel aleatria resultante permanece inalterada. Por contraste, se a varivel for multiplicada por um factor de escala a, a varincia ento multiplicada por a2. Mais formalmente, se a e b forem constantes reais e X uma varivel aleatria cuja varincia est definida, ento:
Outra frmula para a varincia que se deduz de forma simples a partir da definio acima :
Na prtica usa-se muito frequentemente esta frmula para calcular mais rapidamente a varincia. Uma razo para o uso da varincia em preferncia a outras medidas de disperso que a varincia da soma (ou diferena) de variveis aleatrias independentes a soma das suas varincias. Uma condio no to estricta, chamada de incorrelao (uncorrelatedness) tambm suficiente. Em geral,
da populao e varincia da
amostra
Em estatstica, o conceito de varincia tambm pode ser usado para descrever um conjunto de observaes. Quando o conjunto das observaes uma populao, chamada de varincia da populao. Se o conjunto das observaes
(apenas) uma amostra estatstica, chamamos-lhe de varincia amostral (ou varincia da amostra). A varincia da populao yi onde i = 1, 2, ...., N dada por
onde a mdia da populao. Na prtica, quando lidando com grandes populaes, quase sempre impossvel achar o valor exacto da varincia da populao, devido ao tempo, custo e outras restries aos recursos. Um mtodo comum de estimar a varincia da populao atravs da tomada de amostras. Quando estimando a varincia da populao usando n amostras aleatrias xi onde i = 1, 2, ..., n, a frmula seguinte um estimador no enviesado:
onde
a mdia da amostra.
Notar que o denominador n-1 acima contrasta com a equao para a varincia da populao. Uma fonte de confuso comum que o termovarincia da amostra e a notao s2 pode referir-se quer ao estimador no enviesado da varincia da populao acima como tambm quilo que em termos estrictos, a varincia da amostra, calculada usando n em vez de n-1. Intuitivamente, o clculo da varincia pela diviso por n em vez de n-1 d uma subestimativa da varincia da populao. Isto porque usamos a mdia da amostra como uma estimativa da mdia da populao , o que no conhecemos. Na prtica, porm, para grandes n, esta distino geralmente muito pequena.
[editar]Generalizaes
Se X uma varivel aleatria vectorial, com valores em Rn, e considerado como um vector coluna, ento a generalizao natural da varincia E[(X )(X )T], onde = E(X) e XT a transposta de X, e logo um vector-linha. A varincia uma matriz quadrada no-negativa definida, referida geralmente como a matriz de covarincia. Se X uma varivel aleatria de valores complexos, ento a sua varincia E[(X )(X )*], onde X* o conjugado complexo de X. Esta varincia, assim como no caso real, uma matriz quadrada nonegativa definida, cuja diagonal so nmeros reais no-negativos.
[editar]Histria
do conceito
O termo varincia foi introduzido por Ronald Fisher num ensaio de 1918 intitulado de The Correlation Between Relatives on the Supposition of Mendelian Inheritance. O conceito de varincia anlogo ao conceito de momento de inrcia em mecnica clssica.
[editar]
Valor esperado
Origem: Wikipdia, a enciclopdia livre.
Em Estatstica, em teoria das probabilidades, o valor esperado (ou esperana, ou expectncia) de uma varivel aleatria a soma das probabilidades de cada possibilidade de sada da experincia multiplicada pelo seu valor. Isto , representa o valor mdio "esperado" de uma experincia se ela for repetida muitas vezes. Note-se que o valor em si pode no ser esperado no sentido geral; pode ser improvvel ou impossvel. Se todos os eventos tiverem igual probabilidade o valor esperado a mdia aritmtica.
ndice
[esconder]
1 Definio matemtica 2 Exemplos 3 Operador esperana 4 Esperana do produto 5 Esperana condicional 6 Referncias
[editar]Definio
matemtica
e com as suas probabilidades
Para uma varivel aleatria discreta X com valores possveis representadas pela funop(xi), o valor esperado calcula-se pela srie:
desde que a srie seja convergente. Para uma varivel aleatria contnua X o valor esperado calcula-se mediante o integral de todos os valores da funo de densidade f(x):
Generalizando, seja g uma funo que toma valores no espao amostral de X. Ento temos:
[editar]Exemplos
por
[editar]Operador
esperana
O valor esperado de uma combinao linear de variveis aleatrias a combinao linear dos seus valores esperados:
Por esse motivo, a funo E[] que associa a cada varivel aleatria o seu valor esperado um operador linear, chamado de operador esperana.
[editar]Esperana
No caso geral, temos que
do produto
[editar]Esperana
condicional
Seja uma varivel aleatria uma sigma-lgebra no espao amostral , tal que .
[1]
[2]
Z no contm mais
a varivel aleatria (que sempre uma funo) mensurvel com relao a (=constante em qualquer subconjunto da partio correspondente a ) [3]
relao
Z satisfaz a
Referncias
1.
SILVA, Marcos Eugnio
da. Uma Nota sobre Esperana Condicional e Expectativas Racionais. Disponvel em: <http://www.econ.fea.usp.br/m edsilva/material/eae0308/texto s/Esperanca_Condicional_e_ ER1.pdf>
2.
Esperana Condicional.
3.
da. Uma Nota sobre Esperana Condicional e Expectativas Racionais. Disponvel em: <http://www.econ.fea.usp.br/m edsilva/material/eae0308/texto s/Esperanca_Condicional_e_ ER1.pdf>
Desvio padro
Origem: Wikipdia, a enciclopdia livre.
Em probabilidade e Estatstica, o desvio padro a medida mais comum da disperso estatstica. O desvio padro define-se como a raiz quadrada da varincia. definido desta forma de maneira a dar-nos uma medida da disperso que: 1. 2. seja um nmero no-negativo; use as mesmas unidades de medida que os nossos dados.
Faz-se uma distino entre o desvio padro (sigma) do total de uma populao ou de uma varivel aleatria, e o desvio padro s de um subconjunto em amostra. O termo desvio padro foi introduzido na estatstica por Karl Pearson no seu livro de 1894: "Sobre a disseco de curvas de frequncia assimtricas".
ndice
[esconder]
o o
1 Definio e clculo 1.1 Desvio padro de uma varivel aleatria 1.2 Desvio padro amostral 2 Propriedades 3 Ver tambm 4 Ligaes Externas
[editar]Definio [editar]Desvio
e clculo
onde
o valor esperado de X.
Nem todas as variveis aleatrias possuem desvio padro, porque esses valores esperados no precisam existir. Por exemplo, o desvio padro de uma varivel que flui em uma distribuio de Cauchy indefinido.
[editar]Desvio
padro amostral
toma os valores , ento o desvio padro para esta
amostra de n nmeros (ou desvio padroamostral) pode ser calculado da seguinte forma. Primeiro calcula-se a mdia de , , atravs de:
A diviso por n
seja
onde k o nmero de observaes diferentes. Em outras palavras, o desvio padro amostral de uma varivel aleatria X pode ser calculada como:
1.
2.
dados estarem tabelados (com frequncias), multiplica-se cada um destes quadrados pela respectiva frequncia. 3. Encontra-se a soma dos quadrados das diferenas. No
caso dos dados estarem tabelados (com frequncias), a soma a dos produtos dos quadrados das diferenas pela respectiva frequncia.
4.
seja, (n 5.
[editar]Propriedades
A distribuio normal.
De uma distribuio normal unimodal, gaussiana, simtrica, de afunilamento mdio (ou mesocrtica) podemos dizer o seguinte:
um desvio padro.
a trs vezes o desvio padro. Esta informao conhecida como a regra dos "68-95-99,7".