Vous êtes sur la page 1sur 11

Elementi di Teoria sugli Stimatori

Susanna Ragazzi
Universit degli Studi di Ferrara
Centro per la Modellistica, il Calcolo e la Statistica
Technical Report 01-2006

1. La Teoria degli Stimatori Definizione Si definisce stima tn


qualunque funzione T (.) nota e a valori
1.1 Premessa reali definita sulla n-upla di numeri reali
(x1 , ..., xn ), cio tn = T (x1 , ..., xn ). La stima
Linferenze statistica concerne lo studio
di un parametro dunque un numero reale.
di informazioni campionarie per prendere
Definizione Si definisce stimatore
decisioni riguardanti tutta la popolazione.
Tn una qualunque funzione T (.) nota e a val-
Parte centrale dellinferenza la teoria che
ori reali definita sulla n-upla di variabili ca-
discute la determinazione numerica di un
suali (X1 , ..., Xn ), cio Tn = T (X1 , ..., Xn ).
parametro , incognito ma fisso, caratter-
Quindi lo stimatore definito come una vari-
izzante la popolazione X f (x; ), anche
abile casuale.
detta teoria degli stimatori. Si discutono al-
cune importanti propriet degli stimatori ed Una questione assai rilevante, sia per
in particolare della propriet di sufficienza, e la valutazione di una particolare procedura
di come accertare quali requisiti conferiscono di stima che per il confronto di stima-
alla stima un giudizio di qualit ossia si dis- tori alternativi, la conoscenza della dis-
cute il problema della validit statistica di tribuzione campionaria dello stimatore Tn. In
uno stimatore. generale per individuare lo stimatore Tn per
1.2 Differenza tra Stimatore e Stima un parametro si deve:
di un Parametro 1. stabilire cosa si intende con "bont di
Sostanzialmente la differenza tra stima- uno stimatore", enucleando gli aspetti
tore e stima di un parametro che il primo ritenuti pi sensibili della distribuzione
una statistica (=una qualunque a funzione di Tn per la determinazione numerica
a valori reali del campione casuale da cui di . Tale discussione risulta piuttosto
proviene la popolazione) mentre il secondo complessa poich essendo un numero
il corrispondente valore numerico calcolato e Tn una variabile casuale esistono molti
sulla base del campione osservato. modi per parlare di bont, accuratezza,
Sia considerata una variabile casuale affidabilit di uno stimatore.
X f (x; ) la cui forma funzionale nota
2. individuare dei "metodi di costruzione
a meno del vettore di parametri (),
degli stimatori", di stabilire quindi
dove con () si intende lo spazio paramet-
come si effettua la sintesi dei valori
rico.
di (X1 , ..., Xn) per giungere a Tn =
Sia X = (X1 , ..., Xn ) un campione ca-
T (X1 , ..., Xn ) in modo tale da fornire
suale estratto dalla variabile casuale x la
propriet desiderabili allo stimatore per
cui determinazione numerica fornisce il cam-
stimare correttamente .
pione osservati x = (x1 , ..., xn ) possibile
enunciare le seguenti: 3. considerare che per natura lo stima-
tore un prodotto statistico per cui la
sua bont dipende dalla validit degli una variabile casuale pu non esserlo per
assunti da rispettare, dalla correttezza quello di unaltra variabile casuale apparte-
delle derivazioni e dal rigore con cui nente ad una famiglia diversa (Garthwaite et
viene usato nelle applicazioni. al. 1995, pp19-20).
In sede applicativa la definizione formale
1.3 Le propriet degli Stimatori: La di stimatore sufficiente risulta piuttosto com-
Sufficienza e le Propriet Finite plessa da verificare, a tal fine si introduce il
La Sufficienza degli Stimatori Il con- teorema proposto da Fisher, noto come teo-
cetto di sufficienza nella teoria degli stima- rema di fattorizzazione nel quale si esplica le
tori sottost ad un principio di riduzione condizioni necessarie e sufficienti per verifi-
del campione osservato (x1 , ..., xn ) in un sot- care se un dato stimatore Tn sufficiente per
tospazio di dimensione molto inferiore, per .
la determinazione numerica del parametro
da stimare secondo il quale tra le infi- Teorema 1 (di Fattorizzazione di
nite possibili riduzioni di (x1 , ..., xn ) la statis- Fisher) Sia (X1 , ..., Xn ) un campione ca-
tica sufficiente dovr preservare lessenziale suale generato da X f(x; ) allora Tn =
riguardo . T (X1 , ..., Xn ) sufficiente per se e solo
Sia X = (X1 , ..., Xn ) un campione ca- se esistono due funzioni non negative g(.) e
suale generato dalla variabile casuale X h(.) tali che la funzione di verosimiglianza si
f (x; ) dove () il parametro oggetto possa fattorizzzare nel modo seguente:
di stima. L(; x) = g(T (x1 , ..., xn ); )h(x1 , ..., xn)
dove g(.) dipende dalle osservazioni
Definizione Si dice che Tn suffi- campionarie solo attraverso la sintesi
ciente per se la distribuzione condizionata T (x1 , ..., xn )ottenuta dallo stimatore Tn ,
di (X1 , ..., Xn ) , assunto che Tn abbia un val- mentre h(.) funzione del campione e non
ore t0 non dipende da ; cio Tn sufficiente dipende dal parametro .
per se e solo se (X1 , ..., Xn | Tn = t0 ) non
dipende da . E possibile inoltre generalizzare la
Se lo stimatore Tn sufficiente per al- definizione di stimatore sufficiente al caso
lora la distribuzione condizionata: di un vettore di m > 1 parametri
(X1 , ..., Xn | Tn = t0 ) = nel modo seguente. Se un vettore
h(x1 , ..., xn , Tn = t0 ; ) di parametri della variabile casuale X
f (x; ) dalla quale generato un campione
g(Tn = t0 ; )
non dipende da ; anche se la dis- casuale (X1 , ..., Xn ) allora lo stimatore vet-
tribuzione di ciascuna variabile Xi dipende tore Tn congiuntamente sufficiente (=joint
da e la distribuzione multivariatandel cam- sufficiente) per il vettore di parametri
 se la distribuzione di (X1 , ..., Xn | Tn =
pione casuale f (x1 , ..., xn ; ) = f (xi ; )
i=1 t0 ) non dipende da . In maniera
dipenda ancora da . analoga si generalizza il teorema di fat-
torizzazione: un vettore di stimatori Tn
In questo modo tutte le informazioni congiuntamente sufficiente per il vettore
circa il parametro vengono trasferite nello di parametri se e solo possibile scri-
stimatore Tn in modo integrale. vere L(; x) = g(T(x1 , ..., xn ); )h(x1 , ..., xn )
E importante osservare che se uno sti- dove e T(x1 , ..., xn ) sono rispettivamente
matore sufficiente per un parametro di vettori di parametri e numeri.
Limportanza della Sufficienza La pro- con f (x) si denota la funzione di densit
priet di sufficienza di uno stimatore molto della variabile casuale., f (x) denota la fun-
importante perch da un lato si consider- zione di densit della variabile casuale)
ano stimatori che non trascurano nessuna in-
formazione campionaria rilevante dallaltro Si osserva che se Tn sufficiente per al-
non includono informazioni ridondanti per la lora lo sar anche per qualsiasi altra funzione
stima del parametro. biunivoca di Tn , per questo tra le infinite
Limportanza della sufficienza si pu for- funzioni di uno stimatore Tn si deve individ-
malizzare col seguente Teorema uare quella che realizza la massima riduzione
possibile (conservando linformazione campi-
Teorema 2 Linformazione di onaria utile per il parametro ).
Fisher fornita da uno stimatore sufficiente
Tn coincide con quella fornita dallintero Definizione Si dice che Tn uno
campione casuale (X1 , ..., Xn ). stimatore sufficiente minimale per se per
Dimostrazione Grazie al teorema qualsiasi altro stimatore sufficiente Tn la
di fattorizzazione, linformazione di Fisher statistica Tn una funzione di Tn .
sar funzione del campione solo attraverso

log g(T (x); ) perch Si osserva che lo stimatore Tn opera una

partizione dello spazio campionario Cn Rn
log h(x1 , ..., xn ) = 0.
in funzione del valore t0 assunto nel campi-
one; cos , levento Tn = t0 formato da tutte
Si ricorda che per informazione attesa di
le n-uple di Cn tali che T (x1 , ..., xn ) = t0 . Il
Fisher si intende:  2
problema allora quello di operare su Cn la
In () = E log L(; X) = suddivisione pi fine possibile, cio con il mi-
 2  nor numero di insiemi possibili.

E log L(; X)
2 Teorema 3 (di Lehmann e

dove log L(; X) rappresenta la fun- Scheff) Siano (X1 , ..., Xn ) e (Y1 , ..., Yn )
due campioni casuali generati da
zione score; cio la derivata della funzione
log-verosimiglianza (=logaritmo della fun- X f (x; ). Si individui una par-
zione di verosimiglianza). tizione dello spazio campionario Cn tale che
i due campioni appartengano ad essa se e
Si ricorda che per valore atteso indicato solo se L(; X)/L(; Y ) non dipende da .
con E(X) di una variabile casuale X si in- Allora ogni stimatore corrispondente a tale
tende lequivalente della media aritmetica partizione sufficiente minimale.
nella statistica descrittiva, definito come il
momento (il momento semplice di ordine k Il teorema di Lehmann e Scheff del 1950
di una variabile casuale X discreta definito fornisce le condizioni necessarie e sufficienti
come la media per lesistenza e la ricerca di statistiche suf-
n della
k
k-esima potenza dei val-
ficienti minimali.
ori k = i=1 xi pi - con pi si denota la fun-
zione di massa di probabilit della variabile Le propriet di Ancillarit e Com-
casuale X discreta- di una variabile casuale pletezza La propriet di ancillarit di una
X continua definito come la media della k- statistica insieme alla sufficienza collegata
+
esimapotenza di valori k = xk f (x)dx alla propriet di completezza, introdotta da
Lehmann e Scheff nel 1950, la ,propri- Propriet Finite di uno Stimatore Si fa
et di completezza in statistica di im- ora riferimento a quei stimatori validi sola-
portanza fondamentale poich per famiglie mente per le dimensioni campionarie finite.
complete alcune procedure inferenziali sono Le propriet finite di maggiore rilevanza
uniche (Cox e HinKley 1974, pp 30-31). di uno stimatore sono sostanzialmente due:
La propriet di ancillarit di una statis- la propriet di non distorsione e la propriet
tica connessa alle informazioni contenute in di efficienza.
un campione casuale (introdotta da Fisher). La propriet di non distorsione cos-
tituisce uno degli elementi fondamentali
Definizione Una statistica Tn an- circa il giudizio di bont di uno stimatore
cillare se la sua distribuzione di probabilit poich, come si vedr in seguito, indica
non dipende dal parametro . come baricentro dello stimatore Tn proprio
Dalla definizione di ancillarit si deduce il parametro che si vuole stimare.
che una statistica ancillare non contiene in-
formazioni sul parametro ma se utilizzata Definizione Un stimatore Tn non
assieme ad una statistica sufficiente mini- distorto (=unbiased) per il parametro se
male allora pu migliorare le informazioni su il valore atteso di Tn uguale a . Cio
. E(Tn ) = .
Definizione Sia X f (x; ) e Tn
uno stimatore sufficiente per . Si dice che Si osserva che la distorsione (=bias) di
Tn uno stimatore completo se, per qualsiasi uno stimatore Tn definita in generale da:
funzione q(Tn ) tale che E [q(Tn )] = 0, per b(Tn ) = E(Tn ) ; di conseguenza la distori-
ogni , sussiste lidentit q(Tn ) 0. sione positiva se E(Tn ) > 0, se E(Tn ) <
0 definita negativa. Uno stimatore non
In altri termini, uno stimatore Tn com- distorto presenta distorsione identicamente
pleto se lunica funzione di Tn il cui valor nulla.
medio 0 la funzione identicamente nulla.
E possibile individuare il legame tra suf- Teorema 6 Se Tn uno stimatore
ficienza minimale, completezza ed ancillarit sufficiente e completo per ed esiste una
nel teorema di Basu del 1955. funzione (Tn ) tale che lo stimatore (Tn )
sia non distorto per , cio E [(Tn )] = ,
Teorema 4 (di Basu) Se Tn una allora (Tn ) unico.
statistica sufficente minimale, allora Tn in- Dimostrazione Si supponga che es-
dipendente da ogni statistica ancillare. istano due funzioni di Tn , siano 1 (Tn) e
2 (Tn ) sufficienti, complete e non distorte
Osservazione Lutilit del teorema per . Allora: E [ 1 (Tn ) 2 (Tn )] = 0;
di Basu (il cui viceversa falso) affiora ma a causa della completezza, la relazione
quando possibile dimostrare lindipendenza E [ 1 (Tn ) 2 (Tn)] = 0 implica 1 (Tn )
di due statistiche senza conoscerne la dis- 2 (Tn ) 0 per ogni , e quindi 1 (Tn )
tribuzione congiunta. 2 (Tn ).
Teorema 5 Una statistica suffi- La propriet di non distorsione di im-
ciente completa sempre minimale. portanza fondamentale poich indica come
Dimostrazione Da Zacks (1971) baricentro della distribuzione dello stimatore
sufficienza e completezza implicano suffi- Tn proprio il parametro da stimare; in-
cienza minimale, ma non vero il viceversa. fatti il valore medio di una variabile casuale
tanto pi rappresentativo quanto pi la var- uno stimatore.
ianza piccola. Definizione Uno stimatore T1n si
Si ricorda che la varianza di uno stima- dice pi efficiente di uno stimatore T2n
tore misura la dispersione dello stimatore at- per lo stesso parametro se M SE(T1n ) <
torno al suo valor medio quindi se lo stima- M SE(T2n ). In generale per confrontare due
tore distorto, cio se E(Tn ) = , la varianza stimatori per un dato parametro si utilizza i
non pu essere indicativa circa la bont dello reciproci dei MSE e si misura lefficienza
stesso. relativa di T1n rispetto a T2n tramite il
Conviene considerare la variabile casuale seguente indice:
definita da (Tn ) per pervenire ad un cri- 1
terio utile sia a stimatori distorti che non M SE(T1n )
ef f (T1n | T2n ) = =
distorti, infatti se tale variabile accentrata 1
sullo zero allora lo stimatore assume valori M SE(T2n )
campionari attorno al parametro , sarebbe M SE(T2n )
.
inoltre auspicabile che la sua distribuzione M SE(T1n )
fosse con alta probabilit addensata sullo
zero. Il teorema di Markov assicura che Se ef f (T1n | T2n ) > 1 allora si preferisce
per variabili casuali Tn dotate di momento lo stimatore T1n rispetto a T2n ; se ef f(T1n |
secondo, questa probabilit tanto pi ele- T2n ) < 1 si preferisce lo stimatore T2n
vata quanto pi piccolo il momento secondo rispetto a T1n infine se ef f (T1n | T2n ) = 1
della variabile casuale (Tn ). allora i due stimatori sono equivalenti in ter-
Un criterio valido per la bont di uno mini di M SE..
stimatore consiste nel richiedere che la media Si osserva che se entrambi gli stimatori
dei quadrati della variabile casuale (Tn ) sono non distorti per , allora lefficienza
sia minima. relativa di T1n rispetto a T2n equivale a:
V ar(T2n )
ef f (T1n | T2n) = .
Definizione Si definisce er- V ar(T1n )
rore quadratico medio (=Mean Square In altri termini lefficienza relativa di uno
Error) di uno stimatore Tn per il stimatore rispetto ad un altro il rapporto
parametro il seguente valore medio: tra le rispettive numerosit occorrenti per ot-
M SE(Tn ) = E(Tn )2 . tenere lo stesso M SE e la stessa varianza nel
Lerrore quadratico medio di uno sti- caso di stimatori non distorti.
matore uguale alla varianza dello stima- Viene ora introdotta la disuguaglianza (o
tore pi la distorsione al quadrato, ossia limite) di Cramr e Rao utile a risolvere il
M SE(Tn ) = V ar(Tn ) + b2 (Tn ). Si osserva problema di trovare un limite inferiore per
che lerrore quadratico medio di uno stima- la variabilit di uno stimatore di un certo
tore non distorto coincide con la varianza parametro.
dello stimatore.
Lerrore quadratico risulta importante Definizione Se esiste uno stima-
poich il confronto degli stimatori deve tore Tn non distorto per il parametro che,
avvenire sempre confrontando i rispettivi fra tutti gli stimatori non distorti quello
M SE come criterio di vicinanza relativa con varianza pi piccola, cio il pi effi-
rispetto al parametro preferendo quello con ciente, allora Tn sar detto stimatore non
M SE inferiore. Questo concetto pu essere distorto con varianza minima (=UMVUE
formalizzato con il concetto di efficienza di
Uniformly Minimun Variance Unbiased Es- uno stimatore non distorto che raggiunge il
timator). limite di Cramr e Rao.

Teorema 7 Se esiste uno stimatore


Disuguaglianza di Cramr e Rao Tn non distorto per che raggiunge il limite
Se (X1 , ..., Xn ) un campione casuale gen- di Cramr e Rao allora esso unico.
erato da X f (x; ) sotto le usuali con- Dimostrazione Siano T1n e T2n due
dizioni di regolarit sulla famiglia della vari- stimatori non distorti per con la stessa var-
abile casuale X allora per ogni stimatore ianza: V ar(T1n ) = V ar(T2n ) = 1/In () = v,
Tn non distorto per si ha: V ar(Tn ) allora il nuovo stimatore Tn definito come
1 1 Tn = (T1n + T2n )/2 sar non distorto e pre-
= ; dove con In () si intende
In () nI() senter varianza uguale a:
linformazione di Fisher. V ar(Tn ) =
Dimostrazione Sia per uno stima- 1
tore generico Tn leventuale distorsione in- [V ar(T1n ) + V ar(T2n ) + 2Cov(T1n , T2n )] =
4
dicata con bn (Tn ; ) = b(), mentre con 1
v(1 + );
b() sia indicata la derivata della distor- 2
sione rispetto a . Allora si ha che: avendo posto che = Corr(T1n , T2n ). Se
< 1 allora V ar(Tn ) < v, ma impossibile
E(Tn ) = + b(), e che E(Tn ) = 1 + perch v il valore minimo per la varianza

b(). Daltra parte se E(Vn ) = 0 al- di uno stimatore non distorto per . Allora
lora sar anche che Cov(Tn , Vn ) = E(Tn Vn ) deve essere = 1 che implica MT2n = c0 +
per le condizioni di regolarit, vale la c1 T1n . Tuttavia essendo non distorti per
 sar anche: = E(T2n ) = c0 + c1 E(T1n ) =
seguente: E(Tn Vn ) = Tn ( log f)f  dx =
c0 +c1 , il che avviene solo se c0 0, c1 1.
 f   Ma questo significa che T1n T2n , cio che
Tn ( )f dx = Tn ( f )dx = Tn f
f lo stimatore unico.

dx = E(Tn ) = 1 + b (), dove con f e f 
Grazie alla disuguaglianza di Cramr e
si indica la funzione di densit congiunta del
Rao possibile introdurre il concetto di effi-
campione e la sua derivata rispetto a ; men-
cienza assoluta o semplicemente efficienza.
tre dx = dx1 ...dxn . Per la disuguaglianza di
Definizione Uno stimatore Tn non
Cauchy e Schwarz (=per due variabili casuali
distorto si dice efficiente per un parametro
che possiedono il momento
 secondo vale sem-
di una variabile casuale X f (x; ), che
pre Cov(X, Y ) V ar(X)V ar(Y )) sar
 2 soddisfa le usuali condizioni di regolarit, se
[Cov(Tn , Vn )] V ar(Tn )V ar(Tn ) e quindi:
e solo se: V ar(Tn ) = [In ()]1 .
[Cov(TnVn )]2
V ar(Tn ) =
V ar(Vn ) Si osserva quindi che se uno stimatore
[E(Tn Vn )]2 [1 + b ()]2 efficiente esiste ed non distorto, quello
= .
V ar(Vn ) In () stimatore la cui varianza raggiunge il lim-
Se lo stimatore non distorto b() = ite inferiore della disuguaglianza di Cramr
b () = 0, cos dimostrata la disug- e Rao.
uaglianza. Confrontando la varianza di uno stima-
tore con la varianza di uno stimatore effi-
Nel 1991 Pieraccini e Rizzi dimostrano ciente (se esso esiste) si misura lefficienza
il teorema seguente che afferma lunicit di
di uno stimatore, cio si confronta la vari- [1 + b ()]2
V ar(Tn ) .
anza di ogni stimatore con il limite inferiore In ()
di Cramr e Rao. Tuttavia se gli stimatori sono non dis-
torti, pi coerente esprimere la disug-
Definizione Si definisce efficienza
uaglianza in termini di M SE cio:
di uno stimatore Tn la quantit:
1 [1 + b ()]2
M SE(Tn ) + [b()]2 .
V ar(Tn ) In ()
ef f (Tn ) = =
1
Se () una funzione che soddisfa le
1/In ()
usuali condizioni di regolarit tale che
[V ar(Tn )In ()]1 .
(Tn ) sia il corrispondente stimatore
Dato che 0 ef f (Tn ) 1 uno stimatore
non distorto per () allora:
preferibile quanto pi la sua efficienza
vicina ad 1, se Tn lo stimatore efficiente
( ())2
allora ef f (Tn ) 1. V ar(Tn ) .
In ()
1.4 Alcuni Commenti Molto importante il teorema seguente
Lefficienza determina dunque quanto la poich fornisce le risposte circa le condizioni
distribuzione di uno stimatore Tn sia vic- sotto le quali la varianza di uno stimatore
ina ad un parametro , aggiungendo inoltre, possa effettivamente raggiungere il limite in-
nelle condizioni di regolarit di una famiglia feriore della disuguaglianza di Cramr e Rao.
parametrica, la valutazione di quanto tale
vicinanza sia piccola o grande in rapporto a Teorema 8 Condizione necessaria e
quella massima raggiungibile dallo stimatore sufficiente affinch esista uno stimatore Tn
efficiente. efficiente e non distorto per che sia:
E importante sottolineare che:
Vn = log L(; X) = In ()(Tn ).

Dimostrazione La disuguaglianza
Lefficienza di uno stimatore impone  2
[Cov(Tn , Vn )] V ar(Tn )V ar(Tn ) diventa
la conoscenza della variabile casuale
perch, dopo aver controllato le con- unuguaglianza se e solo se esiste una re-
lazione lineare tra Tn e Vn , cio se: Vn =
dizioni di regolarit, si devono cal-
colare le derivate della funzione log- c0 + c1 Tn . Se si applica ad ambo i membri
verosimiglianza ed i rispettivi valor il valor medio, ricordando che E(Vn ) = 0,
medi. E(Tn ) = si ha che:
0 = c0 + c1 c0 = c1 ,
La varianza di qualsiasi stima- il quale sostituito alla relazione Vn = c0 +
tore non pu superare il reciproco c1 Tn , implica che:
dellinformazione di Fisher, ma questo Vn = c1 + c1 Tn = c1 (Tn ).
non significa che necessariamente Se si moltiplica questultima relazione
esiste uno stimatore che raggiunga per Vn e si considera il valore medio di en-
effettivamente quel limite. trambi i membri, ricordando che E(Vn Tn ) =
1 si ha che:
Se lo stimatore Tn presenta la distor- E(Vn )2 = c1 E(Vn Tn ) c1 E(Vn ) =
sione b() la disuguaglianza di Cramr c1 (1) c1 (0) = c1 ,
e Rao si generalizza come segue: da cui si deduce che:
c1 = E(Vn )2 = In () ed infine: condizionati per qualsiasi stimatore, la suf-
Vn = In ()(Tn ). ficienza di T1n che permette di ottenere lo
Osservazione Emulando la di- stimatore Tn = E(T2n | T1n ). Infatti per ef-
mostrazione per uno stimatore non distorto fettuare tale calcolo si deve conoscere la fun-
possibile pervenire alla famiglia delle vari- zione di densit (T2n | T1n = t), la quale non
abili casuali per la quale esiste uno stimatore dipende da solo perch T1n uno stimatore
efficiente, cio la famiglia esponenziale. sufficiente.
Osservazione Lefficienza pu es-
sere verificata solo se le condizioni di rego- Il teorema di Rao e Blackwell fornisce
larit sono valide, che non avviene sempre, le indicazioni su come costruire uno stima-
come ad esempio per variabili casuali Uni- tore pi efficiente di uno stimatore non dis-
formi e per variabili casuali troncate. In torto utilizzando la conoscenza di uno sti-
questi casi il limite di Cramr e Rao pu matore sufficiente. Tale teorema impor-
essere abbassato parlando cos di super ef- tante perch mostra che uno stimatore non
ficienza. (Azzalini 1992 e Rizzi 1992a). distorto di con varianza minima deve essere
funzione di una statistica sufficiente Tn ; al-
E possibile individuare i legami tra i trimenti la media condizionata produrrebbe
concetti di sufficienza, non distorsione ed ef- stimatori piefficienti.
ficienza trattai finora con il seguente teo-
rema: Osservazione Se esiste uno stima-
tore UM V UE per e (Tn ) non distorto
Teorema 9 (di Rao e Blackwell) Sia per ; dove Tn uno stimatore completo suf-
(X1 , ..., Xn ) un campione casuale estratto da ficiente (minimale), allora (Tn ) uno sti-
X f (x; ) e sia T1n uno stimatore suffi- matore UM V UE.
ciente per mentre T2n un qualsiasi sti-
matore non distorto di . Allora posto Tn = Un requisito di semplicit per la formu-
E(T2n /T1n ) si ha che: lazione analitica di uno stimatore la linear-
i) Tn funzione esclusiva di T1n ; it.
ii) E(Tn ) funzione esclusiva di Definizione Uno stimatore si dice
T1n ; lineare se pu essere espresso mediante
iii) V ar(Tn ) V ar(T2n ). una combinazione lineare di variabili casu-
Dimostrazione T2n uno stima- ali campionarie,
 cio se:
tore non distorto per , per le propriet del Tn = ni=1 ai Xi ;
valor medio si ha che: dove le costanti ai con i = 1, ..., n sono
E(Tn ) = E(E(T2n | T1n )) = E(T2n ) = . quantit note.
E noto che per ogni variabile casuale La linearit semplifica la derivazione dei
doppia (X, Y ) si ha: momenti di uno stimatore e, in taluni casi,
V ar(Y ) = V ar(Y | X) + anche della sua distribuzione di probabilit.
V ar [E(Y | X)] V ar [E(Y | X)] ; E possibile ora riassumere le propriet
segue che: di uno stimatore derivato da un campione
V ar(T2n ) V ar(E(T2n | T1n )) = casuale di numerosit finita:
V ar(Tn );
la quale dimostra il punto iii) del Teo- La sufficienza una propriet essenziale
rema. Si osservi infine che mentre la ii) e per lintera Inferenza statistica e la com-
la iii) derivano da propriet dei valori medi pletezza aggiunge la garanzia della unic-
it per lo stimatore; insieme inducono Le propriet connesse alla propriet di
sufficienza minimale. consistenza (in media quadratica, in prob-
abilit, quasi certa) sono di maggior rilievo
Efficienza e non distorsione, in con- nellambito delle propriet asintotiche di uno
dizione di regolarit della famiglia di stimatore.
variabili casuali assicurano una vici-
nanza tra i valori campionari ed il val- Definizione Uno stimatore Tn si
ore teorico del parametro perch garan- dice consistente in media quadratica per
tiscono il massimo addensamento possi- se:
bile della distribuzione dello stimatore lim lim
M SE(Tn ) = E(Tn
attorno al parametro. n n
)2 = 0.
Quando la variabile casuale appartiene
ad una famiglia per la quale la varianza Uno stimatore consistente in media
dello stimatore raggiunge il limite della quadratica se il suo M SE tende a zero al
disuguaglianza di Cramr e Rao, allora crescere della numerosit campionaria. Es-
esiste uno stimatore efficiente, non dis- sendo il MSE di uno stimatore la somma
torto, sufficiente e completo (quindi suf- di due quantit non negative (V ar(Tn ) e
ficiente minimale). Tale stimatore uni- [b(Tn )]2 ) la definizione sopra equivalente
coi. alla verifica contemporanea delle seguenti
condizioni:
lim
1.5 Propriet Asintotiche di Uno Sti- - V ar(Tn ) = 0
matore n
lim
- [bn (Tn )]2 = 0.
Premesssa Si sono finora discusse le pro- n
priet statistiche degli stimatori quando la Se uno stimatore non distorto (o as-
numerosit campionaria finita, ragionev- intoticamente non distorto) allora consis-
ole peraltro richiedere un miglioramento di tente in media quadratica se la varianza dello
tali propriet quando la numerosit campi- stimatore tende a zero al crescere della nu-
onaria diverge con lintroduzione di ulteri- merosit campionaria, e vale anche il vicev-
ori propriet statistiche, in modo da rendere ersa; di conseguenza possibile affermare che
sempre pi rappresentativo il campione per la consistenza in media quadratica implica la
la popolazione ed in modo da utilizzare nella distorsione asintotica.
"direzione giusta" ogni nuovo dato disponi-
bile. Definizione Uno stimatore Tn
consistente in probabilit per se per ogni
La Non Distorsione Asintotica, La
* > 0 fissato, si ha:
Consistenza Definizione Uno stima- lim
tore Tn si dice asintoticamente non distorto Pr(|Tn | < *) = 1.
n
per se:
lim lim Notazione Per indicare la consis-
E(Tn ) = b(Tn ) = 0.
n n tenza in probabilit di uno stimatore si us-
Quindi uno stimatore asintoticamente p
ano le seguenti notazioni: Tn oppure
non distorto uno stimatore eventualmente p lim(Tn ) = .
distorto per n finito, ma cui la distorsione La consistenza inm probabilit risulta
tende a zero al crescere della numerosit particolarmente utile quando si conosce la
campionaria.
distribuzione di probabilit della variabile se valgono solo quando la dimensione cam-
casuale X. pionaria diverge.
Esiste unanalogia tra la convergenza
quasi certa di una successione di variabili Osservazione Uno stimatore Tn per
casuali ad una costante e la convergenza di il parametro viene definito stimatore BAN
uno stimatore: la si pu definire come una (=Best Asymptotically Normal), oppure
forma pi forte di consistenza. CAN E (=Consistent Asymptotically Nor-
A tal fine sia data la seguente definizione. mal Efficient), se asintoticamente Normale,
consistente in media quadratica e possiede la
Definizione Uno stimatore Tn varianza pi piccola nella classe di tutti gli
qc
consistente quasi certamente per se Tn stimatori di consistenti ed asintoticamente
; ovvero se per ogni * > 0 si ha che: Normali.
lim 1.6 Principi Generali per la Stima di
Pr(|Tn | < *, m n) = 1.
n Un Parametro
LEfficienza Asintotica e Normal-
it Asintotica Definizione Uno sti- Viene ora presentato un elenco dei prin-
matore Tn non distorto per si dice asin- cipi generali per effettuare la stima di un
toticamente efficiente se: parametro.
lim 1
V ar(Tn ) = 1. La stima di un parametro deve essere
n In ()
lim espressa nella stessa unit di misura del
ef f(Tn) = 1. parametro. Per controllare il rispetto
n
Quindi uno stimatore Tn asintotica- di tale criterio ci si affida al valore
mente efficiente se, pur non raggiungendo il medio del campione per constatare che
limite di Cramr e Rao per un n finito, lo lunit di misura rispetta quella attesa.
raggiunge quando n diverge. Connesso a tale requisito vi il prin-
cipio dellinvarianza in base al quale
Definizione Uno stimatore Tn per il linferenza non pu essere modificata
parametro si dice asintoticamente Normale dalla particolare unit di misura utiliz-
se: zata o dal particolare problema di cui si
lim Tn E(Tn )
Pr(  t) = (t); discute.
n V ar(Tn )
cio al crescere della numerosit campi- 2. Se tutte le informazioni del campione
onaria la funzione di ripartizione dello sti- sono accurate allo stesso modo, nes-
matore standardizzato tende alla funzione suna sintesi dovrebbe privilegiare qual-
di ripartizione della variabile casuale Z  cuna pi di altre per cui il loro ordine
N (0, 1). di acquisizione dovrebbe essere irrile-
vante. Ci implica che per la stima di
Si osserva che luso della distribuzione un parametro occorre utilizzare funzioni
Normale per approssimare la distribuzione simmetriche di (x1 , ..., xn) il che conduce
di uno stimatore semplifica le elaborazioni al concetto di scambiabilit.
numeriche, inoltre la convergenza alla Nor-
malit delle variabili casuali Tn consente di 3. La sintesi Tn , per il parametro deve
applicare allo stimatore tutte le propriet essere coerente per nel senso che deve
notevoli di cui gode tale distribuzione, anche valutare e non ().
4. Un principio differente di coerenza, de- 1.7 Riferimenti Bibliografici
nominato consistenza, afferma che se 1) Azzalini, A. Inferenza Statis-
le unit campionarie sono repliche in- tica. Una introduzione basata sul concetto
dipendenti e somiglianti della popo- di verosimiglianza, Berlin, Springer-Verlag
lazione ciascuna di esse deve apportare (1992). pp 137-138.
delle informazioni aggiuntive per la de- 2) Casella, G. e Berger, R.L. Statis-
terminazione di , cio al crescere di n tical Inference, Belmont, CA, Duxbury Press
la distribuzione di Tn deve essere uni- (1990). pp 222, pp 316.
modale ma che occorre richiedere che la 3) Lehmann, E.L. Theory of Point
probabilit |Tn | < * per * > 0 pic- Estimation, New York, J. Wiley &Sons
colo tenda a crescere con n. (1983).
4) Pieraccini, L. (1976) Fondamenti
5. Un altro principio quello di richiedere
che uno stimatore Tn possieda una di inferenza statistica, Torino, Giappichelli
(1991). pp 210-211, 212-214, 260-268.
probabilit elevata di assumere val-
5) Piccolo, D. Statistica, Bologna, Il
ori attorno a a parit di ampiezza
Mulino (1998). pp 534-577.Ricci, F. Sta-
dellintervallo. Questo conduce al con-
tistica ed elaborazione statistica delle infor-
cetto di massima concentrazione di
mazione, Bologna, Zanichelli (1975).
probabilit; infatti se T1n e T2n sono due
6) Rao, C.R. Linear Statistical In-
stimatori per per i quali:
ference and Its Applications, New York,
Pr(T1n ) Pr(T2n ), J.Wiley &Sons, II Edizione (1973).
per tutti i > 0; allora T1n uniforme- 7) Ricci, F. Statistica ed elab-
mente preferibile a T2n . orazione statistica delle informazione,
Bologna, Zanichelli (1975).
6. Deve essere rispettato il principio di uti- 8) Rizzi, A: Inferenza Statistica,
lizzare al meglio le osservazioni campi- Torino, Utet-Libreria (1992a). pp 113-117.
onarie nel senso di estrarre da un cam-
pione tutto e solo ci che riguarda il
parametro da stimare. Questo conduce
al principio di sufficienza di uno stima-
tore che prioritario e decisivo per tutta
la discussione sulla scelta dello stima-
tore.

7. Vi numerosi altri principi e a sec-


onda dellimpostazione inferenziale si
preferisce luno o laltro, si cita, tra
tutti, il principio di condizionamento
secondo il quale la stima per deve es-
sere ricavata condizionatamente al val-
ore assunto dalle informazioni presenti
nel campione.

Vous aimerez peut-être aussi