Vous êtes sur la page 1sur 40

MODULE: MATHÉMATIQUES POUR L’INGÉNIEUR

Éléments du Module:

1 - Optimisation numérique

2 - Estimation et analyse des données

3 - Rappels sur l’algèbre matricielle

4 - Détection et estimation

CHERIF Walid – Mathématiques pour l’ingénieur Année Universitaire: 2016/2017


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Schéma explicatif 𝑥𝑘 𝜎 = 7.5 : 𝜃?

échantillon (𝑥1 , 𝑥5 , 𝑥6 , 𝑥8 , 𝑥10 ).


𝑃𝑜𝑝𝑢𝑙𝑎𝑡𝑖𝑜𝑛
𝑋 = 10 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑠 𝜃 (79; 70; 81 ; 86 ; 90)
(𝜃 𝑝𝑜𝑖𝑑𝑠, 𝜎 𝑠𝑝𝑜𝑟𝑡)
𝜎 ( 7 ; 9 ; 6.5 ; 5 ; 3)

1ère estimation d′ une valeur autre que celles de l′ échantillon


𝑥1 𝑥𝟐 𝑥𝟑 𝑥𝟒 𝑥𝟓 𝑥𝟔 𝑥𝟕 𝑥𝟖 𝑥𝟗 𝑥1𝟎
Moindres carrés
𝜃 79 64 77 82 70 81 87 86 88.5 90
valable uniquement pr 2 critères
𝜎 7 10 7.5 6 9 6.5 4.5 5 4 3
valable uniquement qd l′ ajustement linéaire est possible

Une salle de gym voudrait étudier le nombre d′ heures que consacre cette population pour le sport
le plus logique dans son étude serait de considérer la moyenne des heures
1 𝑛
on dit alors que 𝑥 = 𝑖=1 𝑥𝑖 est une estimaation approximation de 𝜃.
𝑛
L′ échantillon 𝑥2 , 𝑥3 , 𝑥4 , 𝑥5 , 𝑥9 nous donne une deuxième estimation de 𝜃.

CHERIF Walid – Mathématiques pour l’ingénieur Année Universitaire: 2016/2017


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Estimation et analyse des données


TD

CHERIF Walid – Mathématiques pour l’ingénieur Année Universitaire: 2016/2017


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 01: Échantillonnage

Soit l’ensemble de 10 individus: 𝑥1 𝑥𝟐 𝑥𝟑 𝑥𝟒 𝑥𝟓 𝑥𝟔 𝑥𝟕 𝑥𝟖 𝑥𝟗 𝑥1𝟎


𝜃 79 64 77 82 70 81 87 86 88.5 90
𝜎 7 10 7.5 6 9 6.5 4.5 5 4 3

On en choisit l’échantillon suivant: 𝑥 = (𝑥1 , 𝑥5 , 𝑥6 , 𝑥8 , 𝑥10 ).


On en choisit un 2ème échantillon: 𝑥′ = (𝑥1 , 𝑥2 , 𝑥7 , 𝑥9 , 𝑥10 ).

Une nouvelle salle de Gym est en phase d’étude pour démarrer. Elle a besoin d’une information à partir de cet échantillon.

1. Quelle valeur de 𝜎 devra-t-elle considérer?


2. Estimer 𝜎 à partir de 𝑥 puis 𝑥′.
3. Donner une règle pour choisir un échantillon d’une population de distances uniformes.

CHERIF Walid – Mathématiques pour l’ingénieur Année Universitaire: 2016/2017


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 02: Approximation par les moindres carrés

On reprend l’exemple de l’exercice 1 avec le même échantillon:


On voudrait connaitre le poids d’une personne qui s’entraine 𝜎 = 7.5 heures. 𝑥1 𝑥𝟓 𝑥𝟔 𝑥𝟖 𝑥1𝟎
𝜃 79 70 81 86 90
1. Etudier la corrélation.
𝜎 7 9 6.5 5 3
2. Donner l’équation d’ajustement par les moindres carrés.
3. Un deuxième modèle est: 𝜃 = 92 − 0.3 𝜎 2 + ln (𝜎). Lequel est plus précis?
4. Estimer plus efficacement 𝜎 = 7.5 heures. Comparer la aux données de la population.

𝑐𝑜𝑣(𝑥,𝑦) 𝑐𝑜𝑣 𝑥,𝑦


• et (𝑦 − . 𝑥 ): dans l’équation nous informent sur le degré de dépendance entre les 2 caractères?
𝑉(𝑥) 𝑉 𝑥

• Le coefficient de corrélation nous informe sur le degré de dépendance entre les 2 critères?

CHERIF Walid – Mathématiques pour l’ingénieur Année Universitaire: 2016/2017


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Schéma explicatif

1. Espérance

L'espérance d'une variable aléatoire 𝑿 est la moyenne des valeurs prises par la variable,
pondérées par leurs probabilités.

- L'espérance d'une variable discrète 𝑿 de support 𝐒(𝑿) est : 𝑬 𝑿 = 𝒙∈𝑺(𝑿) 𝒙𝑷(𝑿 = 𝒙)


- L'espérance d'une variable aléatoire 𝑿 de densité 𝒇 sur 𝑹 est : 𝑬 𝑿 = 𝑹
𝒙𝒇 𝒙 𝒅𝒙

Signification de l’espérance: Cette espérance est négative: le


On lance un dé. Si on obtient 6 on reçoit 8 dh ; sinon on perd 2 dh. jeu est plutôt défavorable.
On note G le gain obtenu. Quelle est l'espérance de ce gain?

𝟓 𝟏 𝟓 𝟏 −𝟏
𝑮 ∈ −𝟐; 𝟖 𝑷 𝑮 = −𝟐 = 𝑷 𝑮=𝟖 = 𝑬 𝑮 = −𝟐 . + 𝟖. =
𝟔 𝟔 𝟔 𝟔 𝟑

CHERIF Walid – Mathématiques pour l’ingénieur Année Universitaire: 2016/2017


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Schéma explicatif

2. Variance

La variance est une mesure servant à caractériser la dispersion d'un échantillon.


Elle indique de quelle manière la variable aléatoire se disperse autour de sa moyenne ou son espérance.

2
La variance d'une variable aléatoire 𝑿 est 𝑽 𝑿 =𝑬 𝑿−𝑬 𝑿 = 𝑬 𝑿² − (𝑬 𝑿 )²
On a : E(E(X)) = E(X)

Une variance nulle signifie que toutes les valeurs sont identiques.
Une petite variance est signifie que les valeurs sont proches les unes des autres alors qu'une variance
élevée signifie qu’elles sont trop écartées.

CHERIF Walid – Mathématiques pour l’ingénieur Année Universitaire: 2016/2017


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Schéma explicatif

Loi de probabilité Statistique

À partir d’un ensemble d’expériences, nous donne la Étude de la tendance centrale d’un échantillon
probabilité (ou chance) qu’un événement soit réalisé (dispersion, valeurs modales, moyennes…)

Les lois usuelles sont caractérisées par:


la fonction de répartition
l’espérance 0,546 𝜃: 𝑡𝑎𝑖𝑙𝑙𝑒 2,72
la variance
2. Quand E et V sont inconnues à priori, on
peut les estimer par des fonctions qui donnent échantillon
1,65 1,72 1,85 1,9 1,95 discret
des valeurs proches
1. Loi varie. Mais, doit garder l’information contenue dans l’ensemble de départ
Exemple :
la taille d’un adulte est une variable continue qui peut prendre toutes les valeurs entre 0,546 m et 2,72 m.
La taille réelle est continue, la mesure effectuée est une approximation, donc une valeur ponctuelle, discrète.

CHERIF Walid – Mathématiques pour l’ingénieur Année Universitaire: 2016/2017


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Schéma explicatif

Notion d’intervalle de confiance

Exemple:
Fonction de répartition de la loi Normale centrée réduite
𝒛
𝟏 𝒖𝟐
𝝓 𝒛 = 𝒆𝒙𝒑 − 𝒅𝒖 (On a: 𝝓 𝒛 = 𝟏 − 𝝓 −𝒛 )
𝟐𝝅 −∞ 𝟐

Tables des lois associées à la loi Normale

𝒛 0,00 0,01 0,02 0,03 …


0,0 0,5000 0,5040 0,5080 0,5120 …
0,1 0,5398 0,5438 𝝓 𝒛 …

CHERIF Walid – Mathématiques pour l’ingénieur Année Universitaire: 2016/2017


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Schéma explicatif

Notion d’intervalle de confiance

Quantiles de la loi Normale

𝑍 une variable aléatoire qui suit la loi normale centrée réduite

la table donne, pour 𝛼 fixé, la valeur 𝑧1−𝛼/2 tq:

𝑃 { 𝑍 ≥ 𝑧1−𝛼/2 } = 𝛼

𝜶 0,00 0,01 0,02 0,03 …


0,0 ∞ 2,5758 2,3263 2,1701 …
0,1 1,6449 1,5982 …

𝑧1−𝛼/2

CHERIF Walid – Mathématiques pour l’ingénieur Année Universitaire: 2016/2017


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Loi normale centrée réduite

Valeurs de :
𝟏 𝒕 𝒙𝟐
𝜫 𝒕 = 𝒆𝒙𝒑 − 𝒅𝒙
𝟐𝝅 −∞ 𝟐
en fonction de 𝒕.

CHERIF Walid - Probabilité

CHERIF Walid – Mathématiques pour l’ingénieur Année Universitaire: 2016/2017


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Loi de Student :

Valeurs de :
𝒕𝜶 tq: 𝑷 𝑻 > 𝒕𝜶 = 𝜶
en fonction de 𝜶 et du
degré de liberté 𝜈.

CHERIF Walid – Mathématiques pour l’ingénieur Année Universitaire: 2016/2017


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Loi de Poisson :

Valeurs de : 𝑷 𝑿 = 𝒌 .

CHERIF Walid – Mathématiques pour l’ingénieur Année Universitaire: 2016/2017


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Loi de χ² :

CHERIF Walid – Mathématiques pour l’ingénieur Année Universitaire: 2016/2017


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 03: Intervalle de confiance d’une loi de probabilité

Soit un échantillon de 10000 personnes sur une population, on sait que le taux moyen de personnes à
soigner pour un problème de cholestérol élevé est de 7.5%. Donner un intervalle dans lequel on soit sûr à
95%, de trouver le nombre exact de personnes à soigner sur les 10000.

1. On soit sûr à 95% → 𝛼 = 5%

2. On cherche un intervalle de confiance pour une proportion

3. On calcule la probabilité qu’une personne ait le problème de cholestérol : 𝑝 = 0,075

4. On approche par une loi normale 𝑁(𝑛𝑝, 𝑛𝑝(1 − 𝑝))

5. On lit à partir de la table: 𝑧1−𝛼/2 = 𝑧97,5% = 1,96

𝑋𝑛 1−𝑋𝑛 𝑋𝑛 1−𝑋𝑛
6. Finalement, l’IC est: 𝑋𝑛 − 𝑧1−𝛼 , 𝑋𝑛 + 𝑧1−𝛼 = [698; 802]
2 𝑛 2 𝑛

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 04: Intervalle de confiance d’une loi de probabilité

On cherche à doser la glycémie: on dispose d’un échantillon de sang. Et on cherche la concentration en glucose.
Si on fait plusieurs dosages, on va obtenir plusieurs résultats. Cela est dû, non à la variabilité de la glycémie, mais
aux erreurs analytiques.
On assimile la glycémie « vraie » à la moyenne « vraie » de la variable aléatoire « résultat du dosage ».
Supposons que l’on connaisse la variance des résultats, car on connaît bien la technique analytique.
Par exemple, σ = 10 mg/l.
On suppose que les résultats expérimentaux sont distribués normalement.
𝜎 𝜎
Il s’agit d’un intervalle de confiance loi normale (estimer µ pour σ connu) 𝐼𝐶1−𝛼 𝜇 = [𝑥𝑛 − 𝑧1− . 𝛼 , 𝑥𝑛 + 𝑧1− . ]
𝛼
2 𝑛 2 𝑛
Si on effectue un dosage donnant 90 mg/l, on a pour intervalle de confiance:
IC0,95 = [90 - 2σ ; 90 + 2σ] = [70 ; 110] soit un intervalle de longueur 40.
Si on effectue deux dosages donnant 90 et 96 mg/l, on a:
𝜎 𝜎
IC0,95 = [93 - 2 ; 93 + 2 ] = [78,9 ; 107,1] soit un intervalle de longueur 28,2.
2 2
Si l’on effectue trois dosages donnant 90, 96 et 93 mg/l, on a:
𝜎 𝜎
IC0,95 = [93 - 2 ; 93 + 2 ] = [81,5 ; 104,5] soit un intervalle de longueur 23.
3 3

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 05: Un échantillon multidimensionnelle – analyse en composante principale ACP

Variables quantitatives
On étudie plusieurs variables sur les individus concernés.
1 𝑗 𝑝
Données: 1

𝑋: matrice à 𝑛 lignes et 𝑝 colonnes 𝑖


Individus 𝑥𝑖𝑗
Chacune des 𝑛 lignes représente un individu
et chacune des 𝑝 colonnes une variable.
𝑛
𝑥𝑖𝑗 valeur de l'individu 𝑖 pour la variable 𝑗
𝑛
1
les moyennes des var: 𝑥𝑗 = 𝑥𝑖𝑗
𝑛
𝑖=1

les écart-types: 𝑛
1
𝑠𝑗 = (𝑥𝑖𝑗 − 𝑥𝑗 )²
𝑛
𝑖=1

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 05: Un échantillon multidimensionnelle – analyse en composante principale ACP

On s’intéresse maintenant à une étude multidimensionnelle: la variation mensuelles des poids des individus

Janvier Février Mars Avril Mai Juin Juillet Aout Septembre Octobre Novembre Décembre
Individu 1 79 77 75.5 78 74 76 76 77 78 76 79 77
Individu 2 77.5 76 75 74 72 79 72 77 77 80 77.5 76
Individu 3 77 79 73 75 70 80 74 78 76 82 77 79
Individu 4 82 82 76 82 86 84 81.5 77 80 79 82 82
Individu 5 78 78 70 76 79 86 83.5 76 74 82 78 78
Individu 6 81 81 78.5 80 76 85 86 74 79 88 81 81
Individu 7 87 83 74 85 73 83 89 73 86 91 87 83
Individu 8 86 85 79 85 79 80 87 75 87 89 86 85
Individu 9 88.5 83.5 78 84 77 78 85 77 89 85 88.5 83.5

Individu 10 83 80 76 79 76 77 82 77 83 80 83 80

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 05: Un échantillon multidimensionnelle – analyse en composante principale ACP

Chaque individu représente une personne caractérisée par 12 valeurs qui correspondent aux observations de leurs
poids chaque mois.
La matrice 𝑋 peut être analysée à travers ses lignes (les individus) ou à travers ses colonnes (les poids)

L’ACP résume l'information portée par X


Quels individus sont proches de l’individu moyen?
Quelles sont les variables (mois) qui expliquent le plus la variabilité inter-individus ?

la distance entre deux individus (𝑥𝑖1 , … , 𝑥𝑖 12 ) et (𝑥𝑘1 , … , 𝑥𝑘 12 ):


12

𝑑2 𝑖, 𝑘 = (𝑥𝑖𝑗 − 𝑥𝑘𝑗 )²
𝑗=1

Exemple: 𝑑 𝑥1 , 𝑥5 = 16,45
le poids de l’individu 𝑥1 est plus proche de 𝑥5 que de 𝑥9 .
𝑑 𝑥1 , 𝑥9 = 21,7

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 05: Un échantillon multidimensionnelle – analyse en composante principale ACP

mesure de l'information portée par le nuage

La somme des distances inter-individus:

𝑑2 𝑖, 𝑘 = (𝑥𝑖𝑗 − 𝑥𝑘𝑗 )²
𝑖 𝑘 𝑖 𝑘 𝑗

point moyen du nuage

𝐺 = (𝑥1 , … 𝑥𝑗 , … 𝑥12 ).

81,9 80,45 75,5 79,8 76,2 80,8 81,6 76,1 80,9 83,2 81,9 80,45

Ce point regroupe les moyennes mensuelles des poids.

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 05: Un échantillon multidimensionnelle – analyse en composante principale ACP

Centrage des données

𝐺 𝑒𝑠𝑡 𝑢𝑡𝑖𝑙𝑖𝑠é 𝑐𝑜𝑚𝑚𝑒 𝑜𝑟𝑖𝑔𝑖𝑛𝑒 𝑑𝑢 𝑟𝑒𝑝è𝑟𝑒 Variables quantitatives


1 𝑗 𝑝
Et on représente les valeurs (𝑥𝑖𝑗 −𝑥𝑗 ) au lieu de 𝑥𝑖𝑗 . 1
Réduction des données 𝑥𝑖𝑗 − 𝑥𝑗
𝑖 𝑥𝑖𝑗 ←
Individus 𝑠𝑗
𝑥𝑖𝑗 −𝑥𝑗
On considère au lieu de 𝑥𝑖𝑗 − 𝑥𝑗 .
𝑠𝑗
𝑛
L'analyse des données centrées réduites fournit une information sur
les individus plus facile à lire que dans la matrice 𝑋 initiale. Centrage et réduction

l‘écart à la moyenne se mesure en nombres d‘écart-types


Exemple: le poids de l’individu 𝑥9 est supérieur à la moyenne d'environ 2 écart-types

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 05: Un échantillon multidimensionnelle – analyse en composante principale ACP

le coefficient de corrélation linéaire 𝑛


𝑐𝑜𝑣(𝑋, 𝑌) 1 𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦
𝑟= = ( )( )
𝑠𝑋 𝑠𝑌 𝑛 𝑠𝑋 𝑠𝑌
𝑖=1

Pour 2 variables: 𝑥𝑖 et 𝑥𝑘

12
1 𝑥𝑗𝑖 − 𝑥𝑖 𝑥𝑗𝑘 − 𝑥𝑘
𝑟𝑖,𝑘 = ( )( )
12 𝑠𝑖 𝑠𝑘
𝑗=1

𝑟𝑖,𝑘 correspond au cosinus de l'angle formé par les deux vecteurs colonnes et 𝑥𝑖 et 𝑥𝑘 .

𝑥𝑖 = 𝑛 𝑥𝑖 , 𝑥𝑘 = 𝑥𝑖 . 𝑥𝑘 . cos 𝑖 , 𝑘
= 𝑛. cos(𝑖 , 𝑘)

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 05: Un échantillon multidimensionnelle – analyse en composante principale ACP

La matrice des corrélations : matrice carrée de taille 𝑝 𝑥 𝑝 regroupant les coefficients de corrélation de toutes les
variables prises deux à deux. Janvier Février Mars Avril Mai Juin Juillet Août Septembre Octobre Novembre Décembre

Janvier 1 𝑟1,2 𝑟1,3 𝑟1,4 …

Février 1

Mars 1

Avril 1

Mai 1

Juin 1

Juillet 1

Août 1

Septembre 1

On cherche à expliquer la variabilité Octobre 1

entre les individus Novembre 1

Décembre 1

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 05: Un échantillon multidimensionnelle – analyse en composante principale ACP

L'inertie
𝑛 𝑝
1 𝑥𝑖𝑗 − 𝑥𝑗
𝐼= ( )² c'est une mesure de l'information portée par les données.
𝑛 𝑠𝑗
𝑖=1 𝑗=1

Interprétation en lien avec le nuage 𝑁𝑝 des individus


𝑝 𝑥𝑖𝑗 −𝑥𝑗
Pour un individu 𝑖 : 𝑗=1 ( )² représente la distance entre cet individu et le centre de gravité du nuage.
𝑠𝑗

Interprétation en lien avec le nuage 𝑁𝑛 des variables


𝑛 𝑥𝑖𝑗−𝑥𝑗
Pour une variable 𝑗 : 𝑖=1( )² est le carré de la longueur du vecteur la représentant dans l'espace 𝑁𝑛 .
𝑠 𝑗
𝑝
1
𝐼= 𝑛=𝑝 Pour une ACP normée , l'inertie est donc toujours égale au nombre de variables.
𝑛
𝑗=1

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 05: Un échantillon multidimensionnelle – analyse en composante principale ACP

On cherche la meilleure représentation axiale de 𝑁𝑝 . plus précisément, on cherche la direction de 𝑅𝑝 (l'espace de


représentation des individus) de sorte à ce que les distances entre les points initiaux 𝑀𝑖 soient les plus proches
possibles de leurs projetés orthogonaux.

Recherche du meilleur axe de projection.

on cherche la direction 𝑢1 de 𝑅𝑝 telle que


𝑛
𝑖=1 𝑂𝐻²𝑖 soit maximale

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 05: Un échantillon multidimensionnelle – analyse en composante principale ACP

On cherche un plan de projection optimal 𝑃 qui contient 𝑢1 : le "meilleur" axe.


On caractérise alors 𝑃 par 𝑢1 et par un second 𝑢2 qui est à la fois orthogonal à 𝑢1 et dans 𝑃.
Le vecteur 𝑢2 ainsi construit est le vecteur de 𝑅𝑝 orthogonal à 𝑢1 et qui maximise l'inertie projetée.
la direction donnée par 𝑢2 est celle qui maximise l'inertie projetée dans le sous-espace de 𝑅𝑝 orthogonal à 𝑢1 .

De manière itérative, on construit la suite d'axes 𝑢3 … 𝑢𝑝

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 05: Un échantillon multidimensionnelle – analyse en composante principale ACP

Interprétation duale

Dans le nuage 𝑁𝑝 , un individu est repéré par ses 𝑝


coordonnées qui représentent les valeurs
prises par cet individu sur chacune des variables.

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 05: Un échantillon multidimensionnelle – analyse en composante principale ACP

Interprétation duale

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 06: Estimateur et estimation

Application contrôle 2013

CHERIF Walid – Mathématiques pour l’ingénieur


Contrôle 2013

Exemple 01 :

Donner:
1- Estimateurs:
1.1. Un estimateur de la moyenne
1.2. Un estimateur de la variance
2- Estimations ponctuelles
2.1. Une estimation de la moyenne
2.2. Une estimation de la variance
2.3. Une estimation de l’écart type
3- Intervalle de confiance de la moyenne μ
Contrôle 2013

Exemple 01 :

CHERIF Walid - Estimation et analyse de données


Contrôle 2013

Exemple 01 :

CHERIF Walid - Estimation et analyse de données


Contrôle 2013

Exemple 01 :

CHERIF Walid - Estimation et analyse de données


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 07: l’estimation ponctuelle

Application exam 2014

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Les individus d'une population possèdent un caractère 𝑋 qui suit une loi de densité :
2
𝜃 −𝜃𝑥
𝑓𝜃 𝑥 = 𝑒 2 (𝜃 > 0).
2𝜋
Pour étudier 𝜃, on a effectué une suite de 𝑛 expériences indépendantes qui ont donné les réalisations 𝑥1 , … 𝑥𝑛 de 𝑛
variables aléatoires 𝑋1 , … 𝑋𝑛 i. i. d. de même loi que 𝑋.
1. Déterminer un estimateur 𝜃0 du paramètre 𝜃 par la méthode du maximum de vraisemblance.
2. 𝜃0 est-il exhaustif ? Justifier.
3. Calculer la moyenne et la variance de 𝜃0 .
4. En déduire un estimateur 𝜃1 de 𝜃 non biaisé.
5. Donner la variance de 𝜃1 . Est-il convergent ?
6. La loi de 𝑋 appartient-elle à la famille exponentielle ? Si oui, quelle fonction de 𝜃 peut être estimée efficacement ?
Soit 𝐵 𝑛 𝜃 la borne de Cramer-Rao pour l'estimation de 𝜃. Dans l'ensemble des estimateurs non biaisés de 𝜃, on
𝐵𝑛 𝜃
définit l’efficacité relative de 𝜃1 comme étant 𝑒 𝜃1 =
𝑣𝑎𝑟 𝜃1
7. Calculer 𝑒(𝜃1 ). Commenter.
1 𝑛
Soit : 𝑠² = (𝑋 − 𝑋)².
𝑛 𝑖=1 𝑖
8. Donnez un estimateur 𝜃2 non biaisé de 𝜃, qui soit lié simplement à 𝑠², et donner son efficacité relative.
9. Entre 𝜃1 et 𝜃2 , lequel choisiriez-vous pour vos estimations ?

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 07: l’estimation ponctuelle Application exam 2014

Données :
1 𝑥−𝜇
1 − ²
Loi densité de probabilité de la loi normale 𝑁(𝜇, 𝜎) est : 𝑓 𝑥 = 𝑒 2 𝜎
𝜎 2𝜋
La loi Chi-deux : 𝜒²𝑛 a pour espérance : 𝑛 et variance : 2𝑛
𝑛 1 1 1 1
Si : 𝜃 𝑖=1 𝑋𝑖 ² ~ 𝜒²𝑛 alors : 𝐸 = 𝐸 =
𝑧 𝑛−2 𝑧² (𝑛−2)(𝑛−4)
𝑛𝑠²
𝑋 et 𝑠² sont indépendants, et ~ 𝜒²𝑛−1
𝜎²

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 09: introduction à l’exploration de données

Arbres de décision Algorithme

Algorithme d'apprentissage
Entrée : échantillon S
début
Initialiser l'arbre vide ; la racine est le noeud courant
répéter
Décider si le noeud courant est terminal
Si le noeud est terminal alors
Affecter une classe
sinon
Sélectionner un test et créer le sous-arbre
FinSi
Passer au noeud suivant non exploré s'il en existe
Jusqu'à obtenir un arbre de décision
fin

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 09: introduction à l’exploration de données


Révision Sommeil Jeu Sortie Age Taille Stylos Cahiers Moyenne Position Label
6 8 14 4 20 1,81 2 4 12 2 6
Arbres de décision 6 2 11 5 19 1,81 3 4 12 2 6
3 9 13 5 19 1,81 3 3 14 2 7
7 5 12 7 21 1,81 2 2 14 4 8
6 3 12 6 20 1,86 1 2 10 4 8
Exemple 8 4 14 5 18 1,81 5 2 10 4 8
9 5 10 2 20 1,81 6 4 8 3 11
7 6 11 3 19 1,81 8 3 13 3 11,5
9 5 9 3 19 1,81 4 2 13 5 12
13 6 9 3 21 1,81 2 3 12 5 12
6 7 9 3 18 1,74 2 3 12 5 12,75
7 8 13 3 19 1,81 3 3 12 5 14
7 8 12 4 19 1,81 1 3 13 6 14,12
8 7 8 5 20 1,81 1 1 14 6 15
9 8 8 6 21 1,86 3 1 15 1 15,07
13 9 9 6 22 1,81 4 1 15 1 15,12
9 9 9 4 21 1,81 5 1 15 3 15,25
9 9 6 7 20 1,81 5 3 15 3 15,5
14 9 9 3 19 1,81 5 3 16 3 16
11 9 8 4 18 1,81 2 3 16 4 17
9 8 8 3 19 1,74 4 4 16 4 17,75
14 8 6 1 21 1,81 1 4 15 4 18
11 9 4 2 20 1,81 1 5 14 4 18,25
13 9 7 3 19 1,81 1 5 15 5 18,25
13 9 5 1 19 1,81 2 5 16 5 19

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Exercice 09: introduction à l’exploration de données

Arbres de décision

Lecture des règles d’association

1. Donnez une approximation de la note de l’étudiant 1.

2. Que serait cette note si l’étudiant 1 avait passé


11heures en jeu?

3. Que serait cette note si l’étudiant 1 avait eu en


moyenne 15,5? Conclure.

Révision Sommeil Jeu Sortie Age Taille Stylos Cahiers Moyenne Position Label

12 6 9 4 19 1,83 2 2 13 5

CHERIF Walid – Mathématiques pour l’ingénieur


1 - Optimisation numérique 2 - Estimation et analyse des données 3 - Rappels sur l’algèbre matricielle 4 - Détection et estimation

Axes de révision

p01

CHERIF Walid – Mathématiques pour l’ingénieur Année Universitaire: 2016/2017

Vous aimerez peut-être aussi