Académique Documents
Professionnel Documents
Culture Documents
Disclaimer/Attenzione/Warning: Questo file solo un aiuto per preparare la parte scritta dell'esame di statistica, NON SI GARANTISCE la correttezza di alcun esercizio, d'altronde io non sono un professore e nemmeno uno che si intende della materia. Introduzione e spiegazione modalit d'esame:
In questo pdf mostrer come si svolgono alcuni esercizi degli appelli del 2008, da quanto ho notato la tipologia negli appelli successivi (2009) rimasta simile o uguale. Se imparate a fare quelli che vi sto per proporre dovreste riuscire a passare la parte scritta dell'esame senza morire dalla sofferenza.
Tranquilli ora spiego come ho fatto, prendiamo per esempio la prima. Quante palline volete prendere? 3. Perfetto. Quante palline ci sono in totale nell'urna U1? 13. Dovreste aver capito il senso del denominatore. Stessa cosa per il numeratore. Quante palline nere vi servono? 2. Ottimo. Quante palline nere ci sono in totale nell'urna U1? 3. Quante palline gialle vi servono? 1. Quante palline gialle ci sono in totale nell'urna U1? 2. Ora che avete capito il senso di queste due probabilit vi fornisco i risultati. P(E|U1)=0,021 e P(E|U2)=0,3 . Per sicurezza inserisco una formula nel caso non sappiate cos' il coefficiente binomiale va... non si sa mai.
Finiamo allora sto cazzo di primo quesito, ora che abbiamo le due probabilit che facciamo? Semplice facciamo questo:
dunque abbiamo calcolato la probabilit che le 3 palline siano 2 nere ed una gialla in base al contenuto di U1 per la probabilit che siano estratte da U1 sommando la probabilit che le 3 palline siano 2 nere ed una gialla in base al contenuto di U2 per la probabilit che siano estratte da U2. Dunque la risposta P(E)=0,1465 cio il 14,65%. Passiamo al secondo quesito. Sostanzialmente la domanda dice: qual' la probabilit che 1 pallina bianca e 2 gialle (e questo lo consideriamo l'evento E) siano estratte dell'urna U2?. In termini statistici ci sta chiedendo di trovare P(U2|E) che significa probabilit dell'una U2 dato E. Qui arriva l'amico Bayes con la sua formula
Dunque al denominatore semplicemente bisogna mettere P(E) che poi diventa quella roba li, al numeratore invece prendiamo la probabilit che le tre palline siano 1 bianca e 2 gialle in base al contenuto di U2 per la probabilit che siano estratte da U2. Semplice dai, al denominatore tutte le probabilit, al numeratore invece solo quella che ci interessa (cio quella riguardante U2). Ora abbiamo tutto quello che ci serve per calcolare P(U2|E), si procede allo stesso modo che abbiamo visto analizzando la soluzione del primo punto, vi lascio comunque i risultati se volete provare. P(E|U2) = 0,05 P(E|U1) = 0,028 e P(U2|E) = 0,59 che la soluzione. Mi sembrano abbastanza facili questi esercizi no? Bisogna solo capire il meccanismo, nel dubbio comunque ve ne risolvo un altro che richiede sempre l'utilizzo di Bayes. Esercizio 1 Luglio 2008 Tema A Una ditta acquista la materia prima da tre fornitori diversi, A, B e C, nelle seguenti proporzioni: 50%, 35% e 15%. I tre fornitori offrono la materia prima con livelli diversi di qualit: nello specifico A offre materia prima con probabilit di scarto pari a p A = 0.011 , B offre materia prima con probabilit di scarto pari a p B = 0.025 ed infine C offre materia prima con probabilit di scarto pari a pC = 0.035 .
a) Qual la probabilit che la materia prima acquistata sia di scarto ? b) Se la materia prima di scarto, qual la probabilit che essa sia stata acquistata da C ? Partiamo dal primo quesito. L'evento E in questo caso che la materia sia di scarto. Come si calcola? Solito modo che abbiamo visto anche nell'esercizio di prima
in questo caso non dobbiamo nemmeno sbatterci a calcolare P(E|A),P(E|B) e P(E|C) perch li da addirittura l'esercizio stesso e sono P(E|A)=0,011 P(E|B)=0,025 e P(E|C)=0,035. Il risultato P(E) = 0,0195 cio il 1,95%. Il secondo quesito chiede qual' la probabilit che la materia di scarto sia stata acquistata da C, statisticamente chiede la P(C|E). Bayes 4ever.
Solita storia spiegata prima, in questo caso non dobbiamo calcolare nulla di incredibile. Il denominatore l'abbiamo gi ed 0,0195 (in questo caso i professori sono stati davvero gentili rispetto all'esercizio precedente). Ok il risultato P(C|E) = 0,26 cio il 26%.
Dunque calcoliamo la probabilit della negazione dell'evento E (il simbolo di negazione piccolo ma se notate bene c', non potevo far di meglio) cio:
Ora che sappiamo tutto basta calcolarci la probabilit di E negato ed applicare la formula in alto per trovare la probabilit dell'evento E. Vabbe dai per gentilezza vi mostro un attimo come procedere
Il risultato a grandi linee 0,003 dunque applicando la formula P(E)=1-0,003=0,997 cio il 99,7%. Passiamo al secondo quesito, questo chiede di risolvere lo stesso problema approssimando la distribuzione di Poisson alla distribuzione vera, in realt per distribuzione vera non si intende quella dell'acqua vera (battutone!) ma sta chiedendo di approssimare la Poisson alla Binomiale (quella che appunto abbiamo usato prima), qualcuno si chieder : ma perch ? Ed io che non voglio lasciarvi nell'ignoranza pi totale vi spiego: La Poisson non altro che il limite per n->inf della Binomiale in cui si assume che =np. Ripassiamo un secondo la formula generale di Poisson:
Ora usiamo lo stesso ragionamento fatto sopra solo che al posto di usare la Binomiale usiamo la Poisson dunque
lo facciamo diventare
applichiamo ancora
ed otterremo P(E) = 0,9972, in linea con il risultato che avevamo ottenuto precedentemente.
a) In quanti modi possono essere ripartiti i 12 membri della giuria? b) Sapendo che uno dei 12 membri della giuria desidera appartenere alla sottogiuria saggistica qual' la probabilit che selezionando a caso la formazione delle tre sottogiurie la soluzione trovata non vada bene per tale membro? Allora, dai questa la facciamo in fretta! La risposta al primo quesito :
al numeratore non si parte da 12 perch suppongo che un membro sia gi stato selezionato per saggistica, per trovare il risultato dunque dobbiamo applicare la solita formula
Disclaimer/Attenzione/Warning: Fino a qui gli esercizi dovrebbero essere corretti, anche se non garantisco nulla come al solito. D'ora in poi per le formule che utilizzer sono quelle prese dell'eserciziario della puntoexe , alcune differiscono da quelle inserite nelle slide del professor Fagiuoli anche se teoricamente dovrebbero essere equivalenti, le varianze si suppongono tutte corrette. NON SI GARANTISCE NULLA, se vi va male l'esame non abbiate nemmeno il minimo pensiero di rompermi le scatole, gi mi sono fatto due mazzi cosi per scrivere tutto questo.
Si costruisca lintervallo di confidenza per la vera differenza tra di efficacia media dei due prodotti software (si adotti una confidenza pari ad ).
L'esercizio ci fornisce due varianze campionarie (si suppone corrette), da queste dobbiamo tentare di trovare una stima della varianza delle due popolazioni, il puntoexe propone questa formula:
Leggendo il testo del problema evinciamo che n1=n2=30 siccome entrambi i software operano su 30 calcolatori. Il risultato del calcolo S2 = 5,85 . Scriviamo allora a quali valori compresa la differenza tra medie di questo esercizio. Diamo prima la formula generale
da questa formula ricaviamo che l'intervallo di confidenza per la differenza tra medie :
l'esercizio finisce qua, il professore non vuole che calcoliate i valori dell'intervallo siccome non fornisce la tavole statistiche e nemmeno il valore di . Altro giro altra corsa!
Esercizio sul Test sulla differenza tra media di due popolazioni se non sono note la varianze
Esercizio 1 maggio 2008 Tema B Si considerino due prodotti software (PS1, PS2) per recuperare file erroneamente cancellati. Vogliamo stimare la media della differenza di efficacia tra i due prodotti (cio il numero medio di file recuperati) e per tale ragione consideriamo una situazione nella quale su ognuno di 30 calcolatori siano stati cancellati erroneamente 100 file (50 file vengono trattati con PS1 e i restanti 50 vengono trattati con PS2, i file hanno tutti caratteristiche identiche). Dalla sperimentazione si 2 = 1.2 mentre per osserva che il numero medio di file recuperati con PS1 X 1 = 42.8 con s1 2 PS2 si ottiene un numero medio di file recuperati X 2 = 38.1 con s2 = 4.5 .
C ragione di pensare che il prodotto software PS1 sia migliore del prodotto software PS2, ovvero garantisca efficienza media pi alta? (si adotti una significativit pari ad ). Sostanzialmente abbiamo ste cazzo di due medie e ste cazzo di varianze campionarie, dobbiamo vedere se il software PS1 sia migliore di PS2 per questo buttiamo in tavola due ipotesi H0 ed H1
Non avendo la varianza delle due popolazioni mi devo ripescare questa formula:
Sostituendo i valori troviamo che t=4,7, ora dobbiamo chiederci se questo valore entri o meno nella regione critica, la regione critica per questo test quella che va tra (t;58, +inf), se il valore di t calcolato entra nella ragione critica allora si rifiuta l'ipotesi H0 e dunque PS1 migliore di PS2 perch vale l'ipotesi H1, altrimenti se il valore fuori dalla regione critica allora non si rifiuta l'ipotesi H0 dunque non vi sostanziale differenza tra il software PS1 ed il software PS2. Fine dell'esercizio.
ovviamente ho messo 0,5625 perch la deviazione la radice quadrata della varianza dunque 0.752=0,5625. La statistica da usare
applicando i dati ricaviamo che X2=76,61, la regione critica (X21-;24, +inf), se il valore 76,61
rientra nella regione critica allora necessario arrestare la macchina altrimenti non necessario arrestarla. Fine dell'esercizio.
a) Stimare i coefficienti della regressione di y su x b) Si calcoli l'intervallo di confidenza del coefficiente della regressione x per un livello di confidenza 1-a generico. c) Stimare il valore atteso della variabile di risposta y quando il regressore vale 0.