Vous êtes sur la page 1sur 5

 

TD 1 : Estimation ponctuelle et
Intervalle de confiance
Exercice 1.
Cours p 32

observations => modèle de proba ?

Représentation graphique => allure de la répartition => famille de loi de probabilité => loi exacte ?

On a la loi à un ou deux paramètres près => estimation de ces paramètres = quelles sont les
valeurs "vraisemblables" au vu des données ?

2 méthodes vues en cours : moments / maximum vraisemblance

Un opérateur téléphonique souhaite modéliser les consommations des clients ayant des forfaits
de 2 heures mensuelles. Il a relevé la proportion mensuelle du forfait consommé par 15 clients.

Au vu de l'histogramme, on modélise les observations à l'aide d'une loi puissance de densité

Notons X_1, X_2, ... X_n les variables aléatoires associées aux proportions de forfait utilisées
respectivement par les n consommateurs de l'analyse.

1. Calculer . En déduire l'estimateur des moments de  

On isole :

On remplace =''moyenne théorique'' par la moyenne observée :

signifie 'approximation'. On ne connaitra jamais mais on a une valeur approchée .


C'est la valeur la plus vraisemblable au vu des données.
estimateur = théorique, estimation = application numérique de l'estimateur

 
2. Donner l'estimateur du maximum de vraisemblance.

Vraisemblance d'un modèle = probabilité d'avoir eu nos observations avec ce modèle


Attention à ne pas oublier l'indice dans ! Ne pas remplacer par les valeurs de ou de .

On veut la vraisemblance maximale.

Rappel : , et .

On cherche quand cette dérivée s'annule

3. On admet qu'on peut montrer que

En déduire un intervalle de confiance de niveau sous la forme pour le paramètre


.

On n'a qu'une approximation de . On veut donner une "fourchette" pour la vraie valeur = notion
de marge d'erreur.

Définition d'un IC de niveau pour :

Souvent et symétriques autour de : et , = marge d'erreur.

Démarche : 1. écrire la défintion puis 2. insérer le Z dans la probabilité puis 3. dessin de


l'équation pour se ramener à une lecture de table.

avec . Dessin de l'équation : on repré


Ici et , et .

1. Application. Dans les 15 mesures effectuées ci-dessus, l'estimation du maximum de


vraisemblance de vaut . Peut-on affirmer avec une probabilité de se tromper de
5% que ?

Non on ne peut pas affirmer car on peut avoir par exemple .

Exercice 2
Cours p 39 et 45

On a construit un algorithme, noté A1, dont on souhaite déterminer les performances en terme
de temps de calcul. Soit le temps de réalisation de l'algorithme A1 sur la -ème simulation. On
suppose les X-i indépendants et de loi .

On réalise n=41 simulations. On obtient une moyenne empirique de 55 minutes et une variance
empirique égale à 97.6 minutes .

1. Donner des estimations sans biais convergentes de et de .


3 variances : variance théorique , variance empirique (=observée) et variance estimée
.

2. Donner l'intervalle de confiance de niveau 95% de . 

3. On souhaite comparer avec un algorithme concurrent A2. Cet algorithme n'est


malheureusement pas disponible et compliqué à implémenter. On décide donc de
reprendre les données de l'article présentant A2. Il s'agit de simulations similaires aux
précédentes mais la graine du générateur n'est a priori pas la même. Soient , , ... les
temps obtenus par l'algorithme A2. On suppose les indépendants et de loi .
On obtient une moyenne empirique minutes et un écart-type estimé
minutes.

Donner l’intervalle de confiance de niveau 95% de m y .


Comparer à l’intervalle donné en question 2. Est-il nécessaire d’implémenter l’algorithme A2
?

On peut affirmer .

Remarque : on peut mettre en place un test de comparaison, plus rigoureux ici.

Exercice 3
Cours p 47

Une entreprise hésite à changer son logo et lance un sondage parmi ses salariés pour savoir quel
logo plait le plus. Le taux de participation au sondage est de 67%. Parmi les 1011 réponses, 51%
des personnes interrogées déclaraient préférer le deuxième logo.

1. Donner un intervalle de confiance asymptotique de niveau 95% de la proportion de salariés


qui préfèrent le second logo.

2. Combien de personnes faudrait-il interroger pour avoir une largeur d'intervalle 0.02 avec
des données similaires ?
Nombre de réponses nécessaires : .
Si on prend en compte les non-réponses, nombre de personnes interrogées >
9601/0.67=14330. A mettre en parallèle avec les sondages de la primaire de la droite.

En France un sondage au niveau national doit avoir lieu sur plus de 800 personnes (largeur
7% = marge d'erreur de 3.5% avec un niveau 95%) et a en général lieu sur 1000 personnes.

Vous aimerez peut-être aussi