Vous êtes sur la page 1sur 27

Lean Six Sigma Training

Modulul I1 – Regresie Liniara Simpla


2018

Slide 1 © 2018 Business Future Solutions


Agenda
Ziua 1 Ziua 2 Ziua 3 Ziua 4 Ziua 5
Introducere in Statistica Regresie
Harta Procesului
metodologie Inferentiala Liniara Simpla
Introducere in
Fundamente Statistici Six
Testarea
Lean Sigma
Ipotezelor
Analiza
Fundamente Introducere in
Six Sigma
Sistemului de Mintab
Masurare
Selectia Testarea
Proiectelor
FMEA
Ipotezelor
© 2018 Business Future Solutions
Introducere

Obiective
Ne propunem sa discutam despre:

Corelație și Coeficient de corelație

Introducere in regresie

Regresie liniara simplă

3 © 2018 Business Future Solutions


Corelație
Scopul primar al analizei de corelație lineară este măsurarea puterii de asociație lineară între două
variabile (X şi Y).

Dacă X creste și nu există nici o modificare definită a valorilor Y, nu există nici o corelație sau nici o
asociație intre X si Y.

Dacă X creste și există o modificare a valorilor Y, atunci există o corelație.

Corelația este pozitivă când Y tinde să crească și negativă când Y tinde să scadă.

Dacă perechile ordonate (X, Y) tind să urmeze o linie dreaptă există o corelație lineară.

Precizia modificării lui Y pe măsură ce X creste determină puterea corelației lineare.

Pentru a efectua o analiză de corelație lineară aveți nevoie de:


 Date bivariate – Două elemente de date care sunt variabile
 Datele bivariate sunt compuse din perechi ordonate (X/Y)
 X este o variabilă independentă (explanatorie)
 Y este variabilă dependentă
Slide 4 © 2018 Business Future Solutions
Puterea Și Direcția Corelației

Strong Pos (r = 0.986) Moderate Pos (r = 0.641)


22

20
20
18

Moderate
18
Strong
Pos

Pos
16 16

14
14
8 9 10 11 12 8 9 10 11 12
X X

Weak Neg (r = - 0.111) Moderate Neg (r = -0.755)


18.0

12
11 16.5

Moderate
15.
Weak
Neg

Neg
10
9
13.5

8 9 10 11 12 8 9 10 11 12
12.0
X X

Slide 5 © 2018 Business Future Solutions


Coeficient de corelație

Ho: Fără corelație Ho ho ho….

Ha: Există corelație Ha ha ha….

Coeficientul de corelație asumă (totdeauna) o valoare între –1 si +1.

Coeficientul de corelație al populației, R, este estimat de Coeficientul de


corelație eșantion, r:

6 © 2018 Business Future Solutions


Limitări de corelație

 Mărimea Coeficientului de corelație este oarecum relativă și trebuie utilizată cu


precauție.
 Ca de obicei, semnificația statistică este judecată comparând o valoare P cu gradul
ales de risc alfa.

 Îndrumările pentru semnificație practică sunt următoarele:

 Dacă | r | > 0.80, relația este practic semnificativă


 Dacă | r | < 0.20, relația nu este practic semnificativă
Zona de corelație Zona de corelație
lineara negativa Fără corelație lineara lineara pozitiva

-1.0 -0.8 -0.2 0 0.2 0.8 +1.0

Slide 7 © 2018 Business Future Solutions


Corelație vs. Cauzalitate
• Datele arată că speranța medie de viață a crescut atunci când rata de divorț a
crescut!
• Există o corelație între atacurile rechinilor și vânzările de înghețată?

Corelația nu implică legătura de cauzalitate! O a treia variabilă


poate fi “cauza ascunsă" care produce atât x cât și y să varieze.
Slide 8 © 2018 Business Future Solutions
Exemplu de corelație Valori X Valori Y
Reclamă Vânzări
Coeficientul de corelație [r]:
41 679
54 1390
• Este o valoare pozitiva dacă o variabilă
63 1852
creste pe măsură ce creste cealaltă
54 1359
variabilă.
48 1610
• Este o valoare negativă dacă o variabilă
46 1460
scade pe măsură ce cealaltă creste.
62 1222

Formula de corelație 61 596


64 1421
71 1684
65 1942
47 1399
55 1408

Fisier “Sales vs Marketing.mtw”


Slide 9 © 2018 Business Future Solutions
Analiza corelației
Grafic>Diagramă de dispersie>Simplu…

© 2018 Business Future Solutions


Diagrama de dispersie

© 2018 Business Future Solutions


Exemplu de corelație

Coeficientul de corelație este ridicat și valoarea P


este scăzută. Respingeți ipoteza nulă, există o
corelație.
Corelație: Vânzări, reclamă
Corelaţia Pearson Vânzări/Reclama = 0.816
Valoare-P = 0.001

Slide 12 © 2018 Business Future Solutions


Analiza regresiei
Ultima etapă a analizei corecte a datelor continui este determinarea ecuației de
regresie.
Ecuația de regresie poate prezice în mod matematic Y pentru orice X dat.
MINITABTM dă ajustarea optimă pentru datele introduse.

Ecuații de predicție:
Y = a + bx (Linear sau model de ordinul 1)
Y = a + bx + cx2 (Pătratic sau model de ordinul 2)
Y = a + bx + cx2 + dx3 (Cubic sau model de ordinul 3)
Y = a (bx) (Exponențial)

Slide 13 © 2018 Business Future Solutions


Regresie simplă vs. multiplă
Regresie simplă:
– Un X, Un Y
– Analiza în MINITABTM folosind
• Stat>Regresie>Diagramă linie ajustată
sau
• Stat>Regresie>Regresie

Regresie multiplă:
– Două sau mai multe X-uri, Un Y
– Analiza în MINITABTM folosind
• Stat>Regresie>Regresie

În ambele cazuri valoarea R-sq semnifică contribuţia variaţiei de intrare


la variaţia de ieşire aşa cum se explică în model.

Slide 14 © 2018 Business Future Solutions


Rezultat grafic al analizei de regresie

Slide 15 © 2018 Business Future Solutions


Rezultat statistic al analizei de regresie
Analiza regresiei: Vânzări vs. Reclamă
Valoarea R-Sq din 66.7% = 91031 / 136550
Ecuația de regresie este R-Sq (adj) din 63.6% = (91031 – 4138.1)/ 136550
Vânzări = 897.0 + 9.746 Reclamă

S = 64.3281 R-Sq = 66.7% R-Sq(adj) = 63.6%


Analiza variației
Pătrate medii
Sursă DF SS MS F P
Regresie 1 91031 91030.9 22.00 0.001
Eroare 11 45519 4138.1
Total 12 136550
Valoarea R-Sq din 66,7% cuantifică puterea asociației dintre Vânzări și Reclamă. În
acest caz, ecuația noastră de predicție explică 67,7% din variația totală văzută în
“Vânzări”. 32,3% din variația văzută în “Vânzări” nu este explicată de ecuația
noastră.
Slide 16 © 2018 Business Future Solutions
Ecuație de regresie (predicție)

Analiza de regresie: Vânzări vs. Reclamă


Ecuația de regresie este

Vânzări = 897.0 + 9.746 Reclamă

Constanta Nivel X
Coeficient

Estimați nivelul de vânzări pentru 60 în cheltuielile de reclamă.


Soluția:
Vânzări = 897.0 + 9.746 * 60 = 1,481.76
Slide 17 © 2018 Business Future Solutions
Ecuație Regresie (Predicție)

~1482

Slide 18 © 2018 Business Future Solutions


Reziduale
Diferența dintre val. observata yi si val. ajustata corespunzătoare
Rezidualele sunt foarte utile pentru a studia daca un model de regresie
dat este adecvat pentru datele disponibile.
Erori Vanzari Calculat
-47 1,250 1,297
-44 1,380 1,424
-86 1,425 1,511
2 1,425 1,424
85 1,450 1,365
-46 1,300 1,346
-102 1,400 1,502
18 1,510 1,492
54 1,575 1,521
61 1,650 1,589
-1 1,530 1,531
85 1,440 1,355
17 1,450 1,433

Slide 20 © 2018 Business Future Solutions


Metoda celor mai mici patrate
Metoda celor mai mici patrate minimizeaza suma patratelor rezidualelor.
n
2
  2

Σi 1 2 3 4
2

=
2
  2

i=1

Y 2   0  1 X2 

 2


4
2


1 3
Y i   0  1 Xi

Slide 21 © 2018 Business Future Solutions


Metoda celor mai mici patrate

‘Ajustarea optima’ se refera la faptul ca diferența dintre valorile reale Y


si valorile Y prevăzute este minima. Dar diferențele pozitive
compensează pe cele Negative. Deci erori pătratice!

LS minimizează suma diferențelor pătrate (erorilor) (SSE - Sum of the


Squared Errors)

Slide 22 © 2018 Business Future Solutions


Analiza rezidualelor

Pentru a examina daca modelul de regresie este adecvat pentru datele


analizate, putem verifica diagramele reziduale.
Diagramele reziduale sunt:

Histograma a rezidualelor
Rezidualele fata de valorile ajustate.
Rezidualele fata de variabila independenta.
Rezidualele de-a lungul timpului daca datele sunt cronologice.

Slide 23 © 2018 Business Future Solutions


Condiții pentru inferența de regresie
Trasând rezidualele in raport cu variabila explanatorie ajutam la verificarea acestor condiții deoarece o diagrama reziduala
mărește modelele.
Trebuie sa fie
distribuite aleatoriu
fără modele.
Rezidualele trebuie sa
stea aproape de linia
dreapta (sa se
încadreze in linia
trasata cu un creion
gros una fata de alta). Nu trebuie sa
apară tendințe
in sus sau in
jos si trebuie sa
aibă
aproximativ
același număr
de puncte
deasupra liniei
si sub linie
(variație
aproximativ
Slide 24 © 2018 Business Future Solutions constanta).
Rezultat grafic al regresiei
Pentru o demonstrație, verificați alte ajustări de regresie.
Stat>Regresie>Diagrama linie ajustata

Pătratic si Cubic – Verificați valoarea r2 fata de modelul linear pentru


a determina daca diferența dintre variația explicata de ecuația
noastră este semnificativa.

Slide 25 © 2018 Business Future Solutions


Rezultat grafic al regresiei

Patratic

Cubic
Daca valoarea R-Sq se
îmbunătățește semnificativ, sau daca
asumpțiile rezidualelor sunt întrunite
mai bine ca rezultat al folosirii
ecuației pătratice sau cubice se
recomanda sa folosiți ecuația cea
mai ajustata.
Slide 26 © 2018 Business Future Solutions
Sumar
In acest moment, aveți posibilitatea sa:

Realizați pașii necesari in cadrul unei analize


de regresie si corelație
Explicați când corelația si regresia sunt
recomandate

SFARSIT (THE END)

Slide 27 © 2018 Business Future Solutions


Intrebari

© 2018 Business Future Solutions

Vous aimerez peut-être aussi