Académique Documents
Professionnel Documents
Culture Documents
INFERENZA PARAMETRICA
Parte seconda
VARIABILI CASUALI LEGATE ALLA DISTRIBUZIONE NORMALE................................ 2
DISTRIBUZIONE CHI-QUADRO............................................................................................................. 2
DISTRIBUZIONE T DI STUDENT............................................................................................................ 5
DISTRIBUZIONE DELLA VARIANZA CAMPIONARIA.............................................................................. 7
STIMA DEGLI INTERVALLI DI CONFIDENZA....................................................................... 8
INTERVALLO DI CONFIDENZA DELLA MEDIA CON VARIANZA NOTA................................................... 8
INTERVALLO DI CONFIDENZA DELLA MEDIA CON VARIANZA NON NOTA......................................... 12
INTERVALLO DI CONFIDENZA DELLA VARIANZA.............................................................................. 16
INTERVALLO DI CONFIDENZA DELLA DIFFERENZA TRA DUE MEDIE CON VARIANZE NOTE............. 19
INTERVALLO DI CONFIDENZA DELLA DIFFERENZA TRA DUE MEDIE CON VARIANZE NON NOTE..... 20
INTERVALLO DI CONFIDENZA DI UNA PERCENTUALE....................................................................... 23
Appunti ad uso degli studenti
di
C. Romaniello
ITI Leonardo da Vinci Carpi (MO)
Inferenza_2 pagina 2
Variabili casuali legate alla distribuzione Normale
Accanto alla distribuzione Normale si trovano altre distribuzioni, che incontreremo spesso, che sono
in vario modo collegate alla Normale.
Distribuzione Chi-quadro
Vale il seguente Teorema 1.
Sia Z una variabile casuale Normale Standard, ( ) 0,1 Z N , allora la trasformata
2
Z si
distribuisce secondo una v.c. Chi-quadro con 1 grado di liberrt
( )
2 2
1
Z .
Ovvero il quadrato di una normale standard si distribuisce secondo una Chi-quadro con 1 g.d.l. .
La v.c. Chi-quadro gode della seguente Propriet.
Siano date due v.c. Chi-quadro con m ed n gradi di libert. Allora la loro somma ancora una v.c.
Chi-quadro con m n + g.d.l.
( ) ( ) ( )
2 2 2
m n m n
+
+ =
e la loro differenza ancora una v.c. Chi-quadro con m n g.d.l., con m n >
( ) ( ) ( )
2 2 2
m n m n
=
Ad esempio,
( ) ( ) ( )
2 2 2
5 3 8
+ = e
( ) ( ) ( )
2 2 2
5 3 2
= .
Come conseguenza di ci la variabile casuale somma dei quadrati di n v.c. Normali Standard sar
una v.c. Chi-quadro con n g.d.l.
( )
2 2
1
n
i n
i
Z
=
Inferenza_2 pagina 3
Il valore atteso di una Chi-quadro pari ai suoi gradi di libert, e la sua varianza pari al doppio dei
suoi gradi di libert
( )
2
n
E n ( =
( )
2
2
n
V n ( =
Poich una v.c. Chi-quadro ricavata dal quadrato di una v.c. Normale Standard, assumer solo
valori positivi. Inoltre landamento della distribuzione Chi-quadro dipende dai gradi di libert.
Per valori piccoli dei gradi di libert ha un andamento asimmetrico. Mentre allaumentare dei gradi
di libert la forma della distribuzione diventa simmetrica e si approssima ad una Normale con
media e varianza pari alla media e varianza della Chi-quadro.
Nella tabella della pagina seguente riportato landamento della distribuzione
( )
2
n
(in blue), per
vari valori dei suoi g.d.l. n, messo a confronto con landamento della distribuzione
( )
2
, 2 N n n = = (in rosso). La linea tratteggiata in verde tracciata proprio in corrispondenza
della media
( )
2
n
E n ( = =
.
Inferenza_2 pagina 4
Inferenza_2 pagina 5
Distribuzione t di Student
Vale il seguente Teorema 2.
Sia Z una variabile casuale Normale Standard, ( ) 0,1 Z N , e sia Y una v.c. Chi-quadro con n
g.d.l.,
( )
2
n
Y , allora la trasformata
Z
Y
n
si distribuisce secondo una v.c. t di Student con n
gradi di libert
( )
n
Z
t
Y
n
.
Il valore atteso e la varianza sono rispettivamente
( )
0 0
n
E t n = > (
e
( )
2
2
n
n
V t n
n
= > (
La distribuzione t di Student ha un andamento molto simile a quello della Normale Standard.
Entrambe le distribuzioni sono simmetriche attorno allo zero. La Normale Standard per ha le due
code che decadono pi velocemente a zero ed una maggiore densit concentrata attorno alla media.
Inferenza_2 pagina 6
Allaumentare dei gradi di libert comunque la t di Student si approssima abbastanza velocemente
alla Normale Standard. Per 30 n = gi la t quasi del tutto coincidente con la Normale Standard,
come si pu vedere nella tabella seguente, dove landamento della distribuzione t (in blue), per vari
valori dei g.d.l., messa a confronto con landamento della distribuzione ( )
2
0, 1 N = =
Per questo motivo la distribuzione t di Student viene utilizzata solo per i piccoli campioni: 30 n .
Per 30 n > praticamente ininfluente usare la t di Student o la Normale Standard.
Inferenza_2 pagina 7
Distribuzione della varianza campionaria
valido il seguente Teorema 3.
Sia data una variabile casuale Normale ( )
2
, X N , allora si dimostra che vale il seguente
risultato
( )
( )
( )
2
2 2
2 1
1 2 2 2
1
n
i
i
n
X X
n S n S
= =
Dimostrazione
Si gi visto (controlla gli appunti Inferenza_1 alle pagine 8 e 9) che la devianza pu essere
riscritta come
( )
2
2 2
1 1
( ) ( )
n n
i i
i i
X X X n X
= =
=
Quindi possiamo scrivere
( )
2
2 2 2
2
1 1 1
2 2 2 2
2 2 2
2
2
1 1
2
2
( ) ( ) ( )
( )
( )
n n n
i i i
i i i
n n
i i i
i i
i
Z
Z
X X X n X X
n X
X X X X
n n
= = =
= =
=
=
= = =
| | | | | |
= = =
| |
|
\ \
|
\
( ) ( ) ( ) ( ) ( )
2 2 2 2 2 2 2
1 1 1 1
1 1
n n
i n n i
i i
Z Z
= =
= = = =
come volevasi dimostrare.
Inferenza_2 pagina 8
Stima degli intervalli di confidenza
La stima di un parametro incognito pu essere effettuata in due modi.
Si pu calcolare un unico valore del parametro: il caso, ad esempio, della stima della media che si
ottiene utilizzando la media campionaria, come si gi visto negli appunti Statistica_1. In questo
caso si parla di stima puntuale.
Ma possibile anche determinare un intervallo, al cui interno, con un livello di confidenza
prefissato, siamo fiduciosi che cada il valore incognoto del parametro da stimare. In questo caso si
parla allora di stima degli intervalli di confidenza (o stima intervallare, o stima per intervallo).
Stimare gli intervalli di confidenza possibile solo ipotizzando che il carattere oggetto di studio
nella popolazione sia distribuito secondo una Normale ( )
2
, X N .
Dalla popolazione si estrae quindi un campione di n unit ciascuna delle quali eredita la
distribuzione Normale della popolazione.
In caso contrario non si riesce a pervenire a distribuzioni note delle statistiche campionarie.
Le distribuzioni che utilizzeremo sono oltre alla Normale, la Chi-quadro e la t di Student.
Affronteremo il problema degli intervalli di confidenza per alcune situazioni tipiche:
1. intervallo di confidenza della media con varianza nota;
2. intervallo di confidenza della media con varianza non nota;
3. intervallo di confidenza della varianza;
4. intervallo di confidenza della differenza tra due medie con varianze note;
5. intervallo di confidenza della differenza tra due medie con varianze non note;
6. intervallo di confidenza di una percentuale;
Intervallo di confidenza della media con varianza nota
Si fissa innanzitutto il livello di confidenza dellintervallo, che viene indicato con 1 , dove
solitamente 0, 05 = oppure 0, 01 = .
Si vogliono trovare due funzioni dei dati campionari, ( )
1 i
h X e ( )
2 i
h X , tali per cui la probabilit
che la media incognita compresa tra le due funzioni sia pari a 1 :
( ) ( ) { }
1 2
Pr 1
i i
h X h X = .
Inferenza_2 pagina 9
Per calcolare gli estremi dellintervallo necessario conoscere la forma distributiva delle variabili
coinvolte. Nel nostro caso dovremmo conoscere la distribuzione delle due funzioni ( )
1 i
h X e
( )
2 i
h X . Ma non sappiamo ancora nulla su come queste funzioni siano fatte.
Allora lidea di partire dalla media campionaria che, oltre ad essere lo stimatore puntuale per la
media della popolazione, ha una distribuzione nota
2
, X N
n
| |
|
\
Quindi partiamo da un intervallo di confidenza dell 1 con al centro la media campionaria
( ) ( ) { }
1 2
Pr 1
i i
k X X k X =
dove ( )
1 i
k X e ( )
2 i
k X sono altre due funzioni dei dati campionari distinte da ( )
1 i
h X e ( )
2 i
h X .
Si va quindi a standardizzare la media campionaria
( ) ( )
1 2
Pr 1
i i
k X k X X
n n n
=
`
)
dove, per tutte le ipotesi fatte, si ha
( ) 0, 1
X
N
n
e quindi i due estremi dellintervallo sono dei percentili della Normale Standard
( )
1
2
i
k X
z
n
= e
( )
2
1
2
i
k X
z
n
=
Lintervallo di confidenza diventa
1
2 2
Pr 1
X
z z
n
=
`
)
dove
2
z
e
1
2
z
sono, rispettivamente, l
2
esimo
e l 1
2
esimo
| |
|
\
percentile della
distribuzione Normale Standard.
Inferenza_2 pagina 10
Cio alla sinistra di
2
z
, e
alla sinistra di
1
2
z
.
Nel seguente grafico sono rappresentati i due percentili.
Si noti che, data la simmetria della Normale, i due percentili sono uguali fra di loro in valore
assoluto. In particolare vale che
1
2
0 z
> e
1
2 2
0 z z
= <
Poich il nostro obiettivo trovare un intervallo di confidenza per la media , dobbiamo
modificare lespressione
1
2 2
X
z z
n
in maniera tale che al centro rimanga solo la media.
Inferenza_2 pagina 11
Innanzitutto togliamo il denominatore della frazione, moltiplicando tutto per
n
, ottenendo
1
2 2
z X z
n n
Quindi consideriamo le due diseguaglianze separatemente
2
z X
n
1
2
X z
n
con semplici passaggi algebrici , spostando dallaltro lato delle diseguaglianza cambiando di
segno
2
z X
n
+
1
2
X z
n
+
e spostando tutto il resto dallaltro lato cambiando di segno
( )
2
2
i
h X
X z
n
( )
1
2
1
i
h X
X z
n
si ottengono gli estremi superiore e inferiore dellintervallo di confidenza per la media di
popolazione, che sono proprio le due funzioni ( )
1 i
h X e ( )
2 i
h X che si volevano trovare.
Lintervallo di confidenza per la media con varianza nota allora
1
2 2
Pr 1 X z X z
n n
=
`
)
.
Si noti che dal punto di vista matematico le quantit n, ,
2
z
e
1
2
z
= con
1
2
0 z
> , lintervallo
di confidenza si ottiene sottraendo e sommando la stessa quantit
1
2 2
z z
n n
= dalla
media campionaria.
Inferenza_2 pagina 12
Inoltre lampiezza dellintervallo, estremo superiore meno estremo inferiore, sar pari proprio al
doppio di questa stessa quantit
( ) ( )
2 1
1
2 2
Ampiezza
i i
h X h X X z X z X
n n
| |
= = =
|
\ 2
z X
n
1
2
1 1
2 2 2
2
z
n
z z z
n n n
+ =
| |
= =
|
\
Esempio.
Immaginiamo di voler stimare la media di un carattere che in popolazione si distribuisce secondo
una Normale con varianza nota
2
9 = . Si estrae un campione di 16 n = unit e su questo si calcola
la media campionaria che, ipotizziamo, risulti essere 3, 4 x = .
Calcolare lintervallo di confidenza per al livello di confidenza del 95%.
Allora si ha 1 0, 95 = quindi 0, 025
2
= e 1 0, 975
2
= .
Sulle tavole della Normale troviamo il percentile
0,975
1, 96 z = . Allora gli estremi dellintervallo
sono
( )
1
1
2
3 3
3,4 1, 96 3,4 1, 96 3,4 1, 47 1, 93
4 16
i
h X X z
n
= = = = =
( )
2
2
3,4 1, 47 4,87
i
h X X z
n
= = + =
e lampiezza dellintervallo 2 1, 47 2, 94 =
Intervallo di confidenza della media con varianza non nota
Nel caso in cui la varianza in popolazione non nota, non si conoscer nemmeno la varianza della
media camnpionaria. Quindi nella procedura di ricerca dellintervallo di confidenza non pi
possibile standardizzare la media campionaria per ottenere una distribuzione Normale Standard.
possibile tuttavia stimare la varianza di popolazione con la varianza campionaria,
2
S o
2
S . In
questo caso si perviene ad una distribuzione t di Student.
Andiamo a dimostrare questa affermazione.
Inferenza_2 pagina 13
Si dimostra che
( ) 1
1
n
X X
t
S
S
n
n
Iniziamo con il verificare che
1
S S
n n
=
.
Infatti ,se
2 2
1
n
S S
n
=
, e passando alla
radice quadrata
2 2
1
S S
n n
=
si ha proprio
1
S S
n n
=
.
Per la dimostrazione allora prendiamo in considerazione lespressione con lo scostamento
quadratico medio campionario corretto S
X
S
n
= moltiplichiamo e dividiamo il denominatore
S
n
per
X
S
n
= =
= ; inoltre dividiamo e
moltiplichiamo il termine
S
per 1 n
1
Z
1
1
S n
n
= =
= per cui diventa
( ) 1
1
n
Z
t
Y
n
=
`
)
I due estremi dellintervallo sono dei percentili della t di Student con 1 n gradi di liberta
( )
1
2
i
k X
t
S
n
= e
( )
2
1
2
i
k X
t
S
n
=
che sono, come i percentili della Normale Standard, luno lopposto dellaltro
1
2
0 t
> e
1
2 2
0 t t
= <
Lintervallo di confidenza diventa
1
2 2
Pr 1
X
t t
S
n
=
`
)
e, con dei passaggi che sono del tutto equivalenti a quelli visti nel caso di varianza nota, si arriva al
seguente intervallo di confidenza della media con varianza non nota
1
2 2
Pr 1
S S
X t X t
n n
=
`
)
Notare lanalogia con il caso di varianza nota. Cosa cambia? Al posto dei percentili della Normale
Standard qui abbiamo i percentili della t di Student; e al posti di abbiamo S .
Nel caso si utilizzi lo scostamento quadratico medio campionario distorto S si perviene ad una
formulazione analoga dellintervallo di confidenza
1
2 2
Pr 1
1 1
S S
X t X t
n n
=
`
)
ricordando, come abbiamo visto in precedenza, che
1
S S
n n
=
.
Inferenza_2 pagina 15
Sempre in analogia con il caso di varianza nota, lampiezza dellintervallo di confidenza della
media con varianza non nota sar pari a
1 1
2 2
2 2
1
S S
t t
n n
| |
| |
=
|
|
\ \
Esempio.
Immaginiamo di voler stimare la media di una variabile casuale X che in popolazione si
distribuisce secondo una Normale con varianza non nota. Si estrae un campione di 25 n = unit e su
questo si calcola la media campionaria e la varianza campionaria corretta che, ipotizziamo, risultano
essere 10 x = e
2
36 S = .
Calcolare lintervallo di confidenza per al livello di confidenza del 95%.
Allora 1 0, 95 = quindi 0, 025
2
= e 1 0, 975
2
= .
Sulle tavole della t di Student con 24 g.d.l. troviamo il percentile
0,975
2, 06 t = . Allora gli estremi
dellintervallo sono
( )
1
1
2
6 6
10 2, 06 10 2, 06 10 2, 472 7, 528
5 25
i
S
h X X t
n
= = = = =
( )
2
2
10 2, 472 12,472
i
S
h X X t
n
= + = + =
e lampiezza dellintervallo 2 2, 472 4, 944 = .
Se avessimo calcolato la varianza campionaria distorta
2
36 24
34, 56
25
S
= = il risultato sarebbe
stato lo stesso, come si pu verificare
( )
1
1
2
34, 56
10 2, 06 10 2, 06 1, 44 10 2, 472 7, 528
24 1
i
S
h X X t
n
= = = = =
Inferenza_2 pagina 16
Intervallo di confidenza della varianza
Si vuole trovare lintervallo di confidenza per la varianza incognita di una variabile casuale X che in
popolazione si suppone distribuita secondo una Normale.
Ormai dovrebbe essere chiaro che il punto di partenza per il calcolo dellintervallo di confidenza
lo stimatore del parametro incognito.
Nel caso della varianza si pu utilizzare o la varianza campionaria distorta
2
S o la varianza
campionaria corretta
2
S .
Consideriamo
2
S , e partiamo sempre da un intervallo di confidenza dell 1 con al centro lo
stimatore del parametro incognito
( ) ( ) { }
2
1 2
Pr 1
i i
k X S k X =
Per il Teorema 3 vale
( )
( )
2 2
2
1 2 2
1
n
n S n S
=
quindi si applicher la medesima trasformazione agli estremi dellintervallo
( ) ( )
2
1 2
2 2 2
Pr 1
i i
n k X n k X n S
= `
)
dove
( )
1
2
2
i
n k X
= e
( )
2
2
1
2
i
n k X
= sono rispettivamente l
2
esimo
e l 1
2
esimo
| |
|
\
percentile della distribuzione Chi-quadro con 1 n g.d.l. .
2
2
1
2 2
Pr 1
n S
=
`
)
Poich la Chi-quadro non una distribuzione simmetrica, a differenza degli intervalli per la media,
gli intervalli per la varianza non sono simmetrici.
Nella figura che segue sono rappresentati i percentili della distribuzione Chi-quadro.
Inferenza_2 pagina 17
Come gi fatto per gli intervalli precedenti, consideriamo separatamente le due disequazioni
2
2
2
n S
e
2
2
1
2
n S
e risolviamole rispetto a
2
.
Basta moltiplicare ambo i membri per
2
, e dividerli per il percentile
2
e
1
2
a seconda che si
tratti della prima o seconda disequazione. Si otterr quindi
2
2
2
n S
e
2
2
1
2
n S
Inferenza_2 pagina 18
che rappresentano rispettivamente lestremo superiore e lestremo inferiore dellintervallo di
confidenza per la varianza
2 2
2
1
2 2
Pr 1
n S n S
=
`
)
Se, in luogo della varianza campionaria distorta, avessimo utilizzato la varianza campionaria
correta, si avrebbe la seguente formulazione dellintervallo
( ) ( )
2 2
2
1
2 2
1 1
Pr 1
n S n S
=
`
)
che dal punto di vista numerico del tutto coincidente con il precedente, in quanto vale
( )
( )
2
2 2
1
1
n
i
i
n S n S X X
=
= =
.
Si potrebbe quindi formulare in maniera univoca lintervallo di confidenza per la varianza
utilizzando la devianza
( ) ( )
2 2
2 1 1
1
2 2
Pr 1
n n
i i
i i
X X X X
= =
` =
)
Esempio
Immaginiamo di voler stimare la varianza
2
di una variabile casuale X che in popolazione si
distribuisce secondo una Normale. Si estrae un campione di 10 n = unit e su questo si calcola la
varianza campionaria distorta che, ipotizziamo, risulta essere
2
20 S = .
Calcolare lintervallo di confidenza per
2
al livello di confidenza del 95%.
Quindi 1 0, 95 = , 0, 025
2
= e 1 0, 975
2
= .
Sulle tavole della distribuzione Chi-quadro con 1 9 n = g.d.l. troviamo il valore dei due percentili
0,025
2, 70 = e
0,975
19 = , e i due estremi dellintervallo di confidenza
2
1
2
10 20
10, 53
19
n S
= = e
2
2
10 20
74, 07
2, 7
n S
= = .
Inferenza_2 pagina 19
Intervallo di confidenza della differenza tra due medie con varianze note
Si ipotizzano due popolazioni normali indipendenti fra di loro
( )
2
,
X X
X N e ( )
2
,
Y Y
Y N
Si ipotizza inoltre che le due varianze siano note.
Interessa stimare la differenza tra le due medie che sono incognite
X Y
.
Abbiamo gi visto (vedi appunti Inferenza_1 pag.13) che, estratti due campioni dalle due
popolazioni di numerosit, rispettivamente,
1
n e
2
n , lo stimatore della differenza tra due medie
( )
2 2
1 2
,
X Y
X Y
X Y N
n n
| |
+
|
\
.
Si vuole ora trovare un intervallo di confidenza per
X Y
.
Si fissa il livello di confidenza 1 , e al solito si parte da un intervallo con al centro lo stimatore
del parametro
( ) ( ) { }
1 2
Pr 1
i i
k X X Y k X =
e andiamo a standardizzare
( )
2 2 1
2 2
1 2
Pr 1
X Y
X Y
X Y
z z
n n
=
`
+
)
quindi, dopo qualche passaggio algebrico che non ripetiamo, perch tanto sono sempre gli stessi,
lintervallo di confidenza sar
2 2 2 2
1
1 2 1 2 2 2
Pr 1
X Y X Y
X Y
X Y z X Y z
n n n n
+ + =
`
)
Inferenza_2 pagina 20
Intervallo di confidenza della differenza tra due medie con varianze non note
Si ipotizzano ancora due popolazioni normali indipendenti fra di loro
( )
2
,
X X
X N e ( )
2
,
Y Y
Y N
Per ora le due varianze non sono note.
Allora non vale pi la distribuzione Normale. Come nel caso di una unica media ritroveremo la
distribuzione t di Student.
Sar necessario tuttavia fare una ulteriore ipotesi, che le varianze delle due popolazioni siano uguali
fra di loro
2 2 2
X Y
= =
Estratti due campioni dalle due popolazioni di numerosit, rispettivamente,
1
n e
2
n , se fosse
nota si avrebbe ancora una volta la distribuzione Normale Standard
( ) ( ) ( )
( )
2 2
2
1 2 1 2 1 2
0, 1
1 1 1 1
X Y X Y X Y
X Y X Y X Y
N
n n n n n n
= =
| |
+ + +
|
\
Ma poich non nota occorre stimarla, ed questo fatto che porta ad una distribuzione t di
Student.
Come stimare ?
Poich si suppone che le due popolazioni hanno la stessa varianza, e poich da ciascuna
popolazione stato estratto un campione, la stima della varianza sar una media aritmetica delle
due varianze campionarie,
2
X
S e
2
Y
S , ponderate con le numerosit dei due campioni
( ) ( )
( ) ( )
1 2
2 2
2 2 2 2
1 1 2 1 2 1 2
1 2 1 2 1 2
1 1
2 2 2
n n
i j
i j X Y X Y
X X Y Y
n S n S n S n S
S
n n n n n n
= =
+
+ +
= = =
+ + +
Dividendo per
1 2
2 n n + otteniamo uno stimatore corretto.
Inferenza_2 pagina 21
Sostituiamo con
2 2
1 2
1 2
2
X Y
n S n S
S
n n
+
=
+
nella scrittura
( )
1 2
1 1
X Y
X Y
n n
+
.
Allora si dimostra che
( )
( )
1 2
1 2
2
1 1
X Y
n n
X Y
S
n n
t
+
+
Dimostrazione
( )
1 2
1 1
X Y
X Y
S
n n
=
+
dividiamo e moltiplichiamo per , ottenendo
( )
1 2
1 1
X Y
X Y
S
n n
= =
+
che possiamo riscrivere nel modo seguente
( )
( )
2
2
1 2
0,1
1 1
X Y
Z N
X Y Z Z
S S
S
n n
=
= = = =
+
utilizzando la definizione data prima di
2
S
( ) ( )
2 2 2 2 2 2
1 2 1 2 1 2
2 2
1 2 1 2 1 2
2
1
2 2 2
X Y X Y X Y
Z Z Z
n S n S n S n S n S n S
n n n n n n
= = = =
+ + +
+ + +
( )
2 2
1 2
2 2
1 2
1
2
X Y
Z
n S n S
n n
= =
| |
+
|
+ \
ricordando che
( )
2
1
2
1
2
1
X
n
n S
e
( )
2
2
2
2
2
1
Y
n
n S
( ) ( )
( )
( )
( )
( )
( )
1 2
1 2
1 2
1 2
1 2
2
2
2 2
1
1 1
1
2
2
n n
n n
n n
Z Z
n n
n n
t
+
+
= =
+
+
+
come si voleva dimostrare
negli ultimi passaggi si utilizzato il Teorema 3 delle distribuzione della varianza campionaria ed
il Teorema 2 della distribuzione t di Student
Inferenza_2 pagina 22
Si fissa il livello di confidenza 1 , e al solito si parte da un intervallo con al centro lo stimatore
del parametro
( ) ( ) { }
1 2
Pr 1
i i
k X X Y k X =
applicando la trasformazione della t di Student si ottiene
( )
1
2 2
1 2
Pr 1
1 1
X Y
X Y
t t
S
n n
=
`
+
)
dopo i soliti passaggi algebrici si arriva allintervallo di confidenza
1
1 2 1 2 2 2
1 1 1 1
Pr 1
X Y
X Y t S X Y t
n n n n
+ + =
`
)
Esempio
Si vogliono confrontare le medie di due popolazioni indipendenti Normali, di cui non si conoscono
le varianze, ma lecito pensare che queste siano uguali fra di loro.
Si estrae allora un campione di numerosit
1
10 n = dalla prima popolazione sul quale si calcola la
media campionaria 20 X = e la varianza campionaria distorta
2
3, 60
X
S = .
Ed un campione di numerosit
2
16 n = dalla seconda popolazione sul quale si calcola la media
campionaria 20, 5 Y = e la varianza campionaria corretta
2
3, 75
Y
S = .
Si vuole trovare lintervallo di confidenza al livello di 1 0, 99 = .
Sulle tavole della distribuzione t di Student con
1 2
2 10 16 2 24 n n + = + = g.d.l. leggiamo il
valore del percentile
1
2
2, 80 t
= .
Calcoliamo il valore dello scostamento quadratico medio campionario
2 2
1 2
1 2
10 3, 6 16 3, 75 36 60 96
4 2
2 24 24 24
X Y
n S n S
S
n n
+ + +
= = = = = =
+
allora lestremo inferiore dellintervallo di confidenza sar
1
1 2 2
1 1 1 1 8 5
20 20, 5 2,8 2 0, 5 5, 6 0, 5 5, 6 0, 4 2, 74
10 16 80
X Y t S
n n
+
+ = + = = =
e quello superiore
1
1 2 2
1 1
0, 5 5, 6 0, 4 1, 74 X Y t S
n n
+ = + = .
Inferenza_2 pagina 23
Intervallo di confidenza di una percentuale
Nel caso la quantit incognita la percentuale con la quale si manifesta un certo fenomeno nella
popolzione, si gi visto che il suo stimatore corretto la frequenza campionaria, per la quale vale
lapprossimazione ad una normale quando la numerosit campionaria abbastanza grande
( ) 1
,
n
p p
f N p
n
| |
|
\
Se si vuole trovare lintervallo di confidenza per la percentuale, come al solito, partiremo da un
intervallo centrato sulla frequenza campionaria, fissato il livello di confidenza 1
( ) ( ) { }
1 2
Pr 1
i i
k X f k X =
e andremo a standardizzare
( )
( ) ( )
( )
( )
1 2
Pr 1
1 1 1
i i
k X p k X p f p
p p p p p p
n n n
=
`
)
Possiamo quindi risolvere le disequazioni rispetto a p , come abbiamo sempre fatto, arrivando al
seguente intervallo per la percentuale
( ) ( )
1
2 2
1 1
Pr 1
p p p p
f z p f z
n n
= `
)
Ma c un problema che dovrebbe essere ben evidente. Poich la varianza della frequenza
campionaria dipende dal valore della percentuale, che incognita, quellintervallo non
calcolabile.
Allora come si fa? Andremo a stimare la percentuale p con la frequenza campionaria f . Se
pensiamo a campioni sufficientemente grandi, vale sempre la distribuzione Normale.
Alla fine cio lintervallo di confidenza per la percentuale
( ) ( )
1
2 2
1 1
Pr 1
f f f f
f z p f z
n n
= `
)
Inferenza_2 pagina 24
Esempio
Si vuole stimare lintervallo di confidenza della percentuale di unit statistiche di una certa
popolazione nelle quali si manifesta una certa qualit.
Si sceglie un campione di 25 n = unit, e si calcola la frequenza campionaria, che supponiamo
essere 0, 2 f = .
Si vuole trovare lintervallo di confidenza al livello di 1 0, 99 = .
Quindi 0, 01 = e 1 0, 995
2
= .
Sulle tavole della distribuzione Normale Standard leggiamo il valore del percentile
0,995
2, 58 z = .
Lestremo inferiore dellintervallo di confidenza sar
( )
( )
1
1
2
1 0, 2 0, 8 0,16
0,2 2, 58 0,2 2, 58
25 25
0, 4
0,2 2, 58 0,2 0, 2064 0, 0064
5
i
f f
h X f z
n
= = = =
= = =
Poich una percentuale non pu essere negativa si pone ( )
1
0
i
h X = .
Lestremo inferiore dellintervallo di confidenza invece
( )
( )
2
2
1
0,2 0, 2064 0,4064
i
f f
h X f z
n
= = + =