Vous êtes sur la page 1sur 8

1Eantion n statistic, un eantion este un subset al populaiei.

. Se pot face inferene statistice dac eantionul este reprezentativ pentru ntreaga populaie. Entitile statistice din eantion trebuie s fie aleatoare, sau s fie alese dup o metod care asigur reprezentativitatea eantionului relativ la populaia total. 2Caracteristici cantitative(date): sunt caracteristicile care iau valori numerice. O caracteristic (variabil aleatoare) este discret dac ia anumite valori ntr-un interval dat. n general acestea rezult dintr-o numrare sau enumerare, iar valorile unei astfel de caracteristici cantitative discrete sunt izolate. Exemplu: numrul de copii, numrul de ore, numrul de igri, numrul de accidente de circulaie, numrul de voturi, etc. O caracteristic (variabil aleatoare) este continu dac, teoretic poate s ia orice valoare ntr-un interval dat. n general acestea rezult n urma unor msurtori, iar valorile unei astfel de caracteristici sunt regrupate n subintervale numite clase. Exemplu: nlimea, greutatea, tensiunea arterial, etc. valori concrete care rezulta in urma unor masuratori de proces 3Caracteristici calitative(date): sunt caracteristicile care genereaz rspunsuri de tip categorial (dihotomice sau cu mai multe alternative). Nominale trsturile se evalueaz pe scale nominale indivizii se distribuie ntr-o mulime de clase ale caracteristicii care sunt desemnate prin nume; Exemplu: distribuia bolnavilor dup grupa de snge, culoarea ochilor, cetenie, naionalitate, etc. Ordinale trsturile se evalueaz pe scale ordinale indivizii se distribuie n clase ale caracteristicii desemnate prin nume sau numere care indic ordinea claselor; Exemplu: distribuia studenilor n funcie de cum au rspuns la ntrebarea: Ct de bine vorbii limba engleza? Deloc, Puin,Satisfctor, Fluent. Sunt formalizari ale unor caracteristici de studiu care reflectaimpartirea pe categorii,fara a exista o semnificatie de ordine intre valorile numerice 4 Date Ordinale trsturile se evalueaz pe scale ordinale indivizii se distribuie n clase ale

caracteristicii desemnate prin nume sau numere care indic ordinea claselor; Exemplu: distribuia studenilor n funcie de cum au rspuns la ntrebarea: Ct de bine vorbii limba engleza? Deloc, Puin,Satisfctor, Fluent. -date calitative,existand raport de ordine -sunt de regula scoruri acordate intre un minim si un maxim,prin valori naturale,exprimand diferentieri calitative intre valori diferite(variabile scor) Date ordinale. Sunt de regul date care se pot ordona. Dup ce se ordoneaz, se codific, acordndu-se niste scoruri ntre un minim si un maxim. Aceste scoruri pot fi numere naturale, exprimnd diferenieri calitative ntre diferite valori.

5 Frecvena absolut reprezint numrul de apariii a unei valori ntr-un set de date. n Excel: funciile COUNTIF, sau FREQUENCY. -pt valorile continue se face impartirea in intervale si senumara valorile dintrun interval 6 Frecvena relativ - este raportul dintre frecvena absolut i numrul de date luate n calcul. Frecvena relativ se poate exprima i sub form procentual.fr(v)=fa(v)/N 7Histograma - este un tip de grafic pe coloane, folosit pentru a reprezenta frecvenele. Fiecare coloana este proportionala cu frecvena relativ a valorii pe care o reprezint. 8Quartilele sunt 3 valori care mpart un set de date n 4 subgrupe, fiecare cuprinznd cte 25% din date.n Excel: funcia QUARTILE. 9 Tipuri de parametrii statistici -masurarea tendintei de centralizare -masurarea tendintei de variatie(imprastiere) -indicatori de normalitate 10.Parametrii statistici care masoara tendinta de centralitate :media(ponderata,trunchiata,interquartilica),mediana(valoarea de mijloc),modulul 11 Valoarea centrala:Xc=(Xmin+Xmax)2 12Media interquartilic - este media calculat pe baza a 50% din date, eliminnd primele 25% i

ultimele 25% din valori, dup ordonarea crescatoare.media valorilor cuprinsa intre Q2 si Q3 13valoarea modala=valoarea care apare cel mai frecvent intrun set de valori ex:MODE -se utilizeaza numai cand se lucreaza cu fracvente,fiind valoarea luata cel mai frecvent 14. Repartiie unimodal: MODE.SNGL(d) 15Repartiie multimodal:MODE.MULT(d) 16Mediana - se determin ordonnd datele de la minim la maxim i considernd valoarea aflat la mijloc. Avantajul medianei fa de medie este c aceasta nu este influenat de datele deviate. n EXCEL: funcia MEDIANEx.emplu:Pentru variabile aleatoare (caracteristici) discrete, mediana este valoarea de pe locul (N+1)/2, unde N este numrul total de indivizi. 17? Enumerai parametrii statistici care msoar tendina de dispersie (mprtiere).

Parametri care masoara tendinta de dispersie: Amplitudinea variatiei, intervalul interquartilic, dispersia, abaterea standard, coeficientul de variatie.

18Functii pt calculul dispersiei n Excel: - funcia VAR.S pentru cazul in care ne referim la esantion (VARiance for Sample). - functia VAR.P pentru cazul in care luam in considerare intreaga populatie (VARiance for Population). - functia VAR doar pentru compatibilitate cu versiunea de Excel 2007. 19Functii Abterea standard - este rdcina ptrat din dispersie. Valoarea de selecie se noteaz cu S iar cea teoretica cu s. n Excel: STDEV.S (STandard DEViation for Sample) si STDEV.P (STandard DEViation for Population) . 20abaterea standard=radical din dispersie 21 Coeficientul de variaie - este raportul dintre abaterea standard i media unui set de valori. Se folosete la compararea variaiilor a dou distribuii de valori. Interpretare:Cv<-0,1 Omogene,dispersie mica/0,1<-Cv<0,2Dispersie medie/0,2<-Cv Neomogene,dispersie mare 22 Amplitudinea variatiei : Amplitudinea absolut a varianei (A) se obine ca diferena ntre

valoarea maxim (xmax) i valoarea minim (xmin) ale irului i are rolul de a msura dimensiunea

intervalului de mprtiere n interiorul cruia se distribuie valorile irului: A= Valoarea Maxima Valoarea Minima 23 ? Intervalul interquartilic este intervalul cuprins ntre quartila 1 i 3. 24 Proportioa variatiei. Este definit ca procentul din date care nu sunt egale cu valoarea modala:PV(d) = 1 - Fr(MODE(d)), sau PV%(d) = 100 Fr%(MODE(d)) 25 coeficientul de asimetrie-evalueaza devierea stanga-dreapta fata de o repartitie normala(masoara o deviatie pe ox fata de o curba normala) functia skewness 26coeficientul de exces-masoara o deviatie pe axa oy fata de o curba normala(evalueaza amplificarea sau aplatizarea sus-jos fata de o repartitie normala) functia kurtosis 27 Entropia unei variabile calitative (H). Entropia determin gradul de incertitudine

purtat de datele unei variabile aleatoare calitative de studiu, precum si cantitatea de informaie coninut n aceast variabil aleatoare. H(X) = -SUM[p(xi) ln(p(xi))] Unde xi sunt valorile posibile ale variabilei, p(xi) sunt probabilittile (frecvenele relative) de apariie ale valorilor. Cu ct valoarea entropirei este mai apropiat de 0, cu att incertitudinea este mai mic, deoarece cantitatea de informaie coninut n variabil este mai mare. 28Parametrii de centralitate pt date cantitative:media,media ponderata,mediana,media interquartilica,modul,valoarea central,media armonica,media geometrica. 29Parametrii de variatie,imprastiere pt data cantitative:amplitudinea variatiei,abaterea standard,intervalul interquartilic,dispersia,coeficientul de variatie 30 Care sunt parametrii de variaie pentru date calitative nominale? Proportia variatiei +entropia. 31 Care sunt parametrii de variaie pentru date calitative ordinale? Dispersia, abaterea standard, coeficientul de variatie, entropia. 32 Care sunt datele calitative pentru care exist quartile? Pt. datele ordinale se pot calcula quartilele. 33Parametrii de centralitate pt date calitative nominale:valoarea modala(singura)

34Parametrii de centralitate pt date calitative ordinale:mediana,modulul

35. Parametrii care determin o repartiie normala: media teoretic (Locul, sau amplasarea datelor); abaterea standard teoretic (Variabilitatea, imprtierea, sau disperasrea datelor) 36. Parametrii care determina o repartitie binominala 37. Propriti ale repartitiei normale: Simetric,Unimodal,Domeniul: (-, + ),Aria de sub curb = 1(evenimentul sigur) 38. Realizarea unei diagrame Q-Q plot: 1) Transformai valorile: (x-m)/s. 2) Calculai Quartilele.3) Construii graficul de tip Scatter (Q, QN).4) Repartiie Normal: prima bisectoare; cu cat punctele de pe graphic sunt mai apropiate de prima bisectoare cu atat ele sunt mai asemanatoare. 39. Testele statistice pe care le cunoastem sunt: Testul z.Testul t (testul Student). Testul Anova (Analysis of variance).Testul F (testul lui Fisher). Testul 2 (testul lui Pearson). 40. Indicatori folositi pentrua verifica normalitatea datelor: Skewness (asimetrie) si Kurtosis (exces).Metoda grafic.Metoda interquartilic. Q-Q plot. 41. Testul 2 (testul lui Pearson) se aplica cu ajutorul funciei CHISQ.TEST(d(f),d(pN))n Excel 2010 42. Rezultatul testului 2 (testul lui Pearson) : valoarea p (probabilitatea ca ipoteza nul s fie adevrat). p(d(f)~ d(pN)) ~ 1 H0 adevarat 43. Ipotezele statistice: Ipoteza nula H0: fi=pi, i=1, 2, unde fi sunt frecventele relative de esantionare,pi sunt probabilitatile teoretice ale distributiei normale (Gaussienne). este stabilit de experimentator.De exemplu: absena diferenelor. Ipoteza alternativa, H1: fi pi. Experimentatorul trebuie s resping H0 nainte de a lua n considerare ipoteza alternativ H1. 44. Erori de tipul I - Respingerea ipotezei nule H0 atunci cnd aceasta este adevarat. Probabilitatea acestei erori se noteaz cu . 45.Erori de tipul II - Acceptarea ipotezei nule H0 atunci cnd aceasta e fals . Probabilitatea acestei erori se noteaz cu . 46.Cunoastem 3 tipuri de teste t: Testul t perechi (variabile dependente).Testul t neperechi si variaii egale.Testul t neperechi si variaii diferite. 47.Pentru a compara tendinte de centralitate pt variabile independente folosim testele: Testul t neperechi si variaii egale.Testul t neperechi si variaii diferite. 48. Pentru a compara tendinte de centralitate pt variabile dependente folosim Testul t perechi 49. Testul z se foloseste cnd este ndeplinit una din condiiile urmtoare: Dimensiunea esantionului este mare (n>30).Se cunoaste dispersia teoretic 2. 50. Repartitia t student: este de fapt o familie de repartiii continue de probabilitate, care se folosesc atunci cand dimensiunea eantionului este mic (mai mic decat 30) i nu se cunoate abaterea standard teoretic. 51. Folosind o repartiie normal, se poate determina urmtorul interval de incredere pentru media teoretic: :

]
Zc

, unde ZC este z critic

Funcia CONFIDENCE.NORM returneaz valoarea expresiei

corespunztor valoarei alese pentru probabilitatea a (numit risc), s este abaterea standard, iar n este dimensiunea eantionului. Prin urmare, intervalul de incredere este dat de expresia: {x-confidece.norm,x+confidece.norm} Pt excel 2007 se foloseste CNONFIDECE 52. Folosind o repartiie t (Student), se poate determina urmtorul interval de incredere pentru media teoretic: [ , ] Funcia CONFIDENCE.T returneaz valoarea expresiei , unde tc este t critic dimensiunea eantionului. Folosind o repartiie t (Student), se poate determina urmtorul interval de incredere pentru media teoretic:

Funcia CONFIDENCE.T returneaz valoarea expresiei , unde tc este t critic corespunztor valorii alese pentru risc (), s este abaterea standard, iar n este dimensiunea eantionului.

53. Dac X1, X2, ... Xn este o succesiune de eantioane extrase din aceeai populaie care are media teoretic , iar X=(x1,x2,x3,.xn ) (x barat!!!) este variabila aleatoare a mediilor acestor eantioane, atunci media acestei variabile aleatoare este 54. Dac X1, X2, ... Xn este o succesiune de eantioane extrase din aceeai populaie care are media teoretic i dispersia teoretic 2, iar X=(x1,x2,x3,.xn ) (x barat!!!) este variabila aleatoare a mediilor acestor eantioane, atunci dispersiia acestei variabile aleatoare este 2/n. 55. Teorema limitei centrale :Fie X1, X2,....,Xn un ir de variabile aleatoare independente ( ) ( ) avnd aceeai repartiie i => variabila aleatoare a mediilor are o repartitie normala ( )

56. Numrul de grade de libertate notat cu df (degrees of freedom), care este egal cu dimensiunea eantionului minus 1. 57. Testul ANOVA (ANalysis Of VAriance). Se aplic pentru a compara mai mult de 2 grupuri. 58. H0: m1=m2=mn; H1: exist indici i, j astfel inct mimj . t test: valoarea p si caracteristica F. 59. Conditia de acceptare a ipotezei nule: Dac p>alpha, atunci se accept H0 60. Conditia de respingere a ipotezei nule: Daca p<alpha , se respinge H0 si se accept H1.Dac se accept H1, atunci se poate trece la compararea grupurilor dou cte dou prin testul t,pentru a identifica sursa diferenelor semnificative. 61. Box-Plot este un grafic n care sunt reprezentate att mediile,ct i intervalele de ncredere ale acestor medii.Se folosete pentru a face o comparare vizual att ntre medii, ct i ntre intervalele de ncrederecorespunztoare acestor medii. 62. Crearea unui Box-Plot: Calculam abaterile standard si intervalele de ncredere. Cream un grafic de tip XY (scatter) pentru medii. Introducem att n cmpul +, ct si n cmpul -,adresa domeniului celor trei valori CONFIDENCE.T. 63.Convarianta este: Media produilor termenilor omologi a dou variabile corelate. ( )
( )( )

( )

( )

, 64.Posibilitatie de calcul pt covariatie: Excel 2010:1) Funcia COVARIANCE.S(dX, dY) esantion;2) Funcia COVARIANCE.P(dX, dY) populaie;3) Funcia COVAR(dX, dY) compatib. Excel 2007;4) Data AnalysisCovariance 65. Interpretarea covarianei:1) COV(X, Y) > 0 X si Y variaz n acelasi sens.;2) COV(X, Y) < 0 X si Y variaz n sensuri opuse.;3) COV(X, Y) = 0 nu exist relaie liniarntre X si Y. Dezavantaj: depinde de unitatea de msur. 66.Coeficientul de corlelatie este:
( )

67. Posibilitatea de calcul a coef de corelatie in Excel 2010:1) Funcia CORREL.S(dX, dY) esantion;2) Funcia CORREL.P(dX, dY) populaie;3) Funcia CORREL(dX, dY) compatib. Excel 2007;4) Data Analysis|Correlation 68. Proprieti si interpretare a coeficientului de corelatie( regula lui Colton) :1) -1 rXY +1;2) rXY intensitatea relaiei liniare ntre X si Y;3) rXY ~ 0 nu exist relaie liniar ntre X si Y;4) rXY ~ 1 relaie liniar pozitiv ntre X si Y;5) rXY ~ -1 relaie liniar negativ ntre X si Y 69. O regresie este o functie care aproximeaza tendinta norului de puncte. 70.Determinarea unei regresii in excel: 1) Grafic tip XY (nor de puncte) 2) Clic-dreapta pe un punct si aleg Add Trendline 3) Aleg tipul Linear.4) Marchez opiun:- Display Equation on chart- Display R-squared value5) nchid cu Close. 6) Fac alte tipuri de regresii si o aleg pe cea care are coeficientul de determinare (R2) mai mare. Regresia cea mai buna este cea care descrie cel mai bine norul de puncte, adica coeficientul de determinare R2 este mai aproape de 1 (valoarea lui R2 cea mai mare).

Vous aimerez peut-être aussi