Académique Documents
Professionnel Documents
Culture Documents
Année 2023-2024
Exercices de TD
1re période
1. Donner la population étudiée, l’unité statistique, les variables étudiées et leur type. Quels dia-
grammes sont adaptés pour la représentation graphique de telles variables ?
2. Déterminer le tableau de contingence en fréquences des deux variables étudiées et donner les
fréquences marginales.
3. Quelle est la proportion d’individus qui ont reçu une éducation laxiste et éduquent pareillement
leurs enfants ?
4. Donner la proportion d’individus ayant reçu une éducation laxiste qui éduquent ainsi leurs enfants.
5. Représenter par un diagramme en barres les fréquences marginales des modalités de la variable
Éducation actuelle.
6. Donner les fréquences conditionnelles de la variable Éducation d’origine sachant la variable Éduca-
tion actuelle.
7. Représenter par des diagrammes en barres les fréquences conditionnelles de la variable Education
actuelle sachant la variable Education d’origine.
A B
273/350 (78%) 289/250 (83%)
2
2 Rappels : Variables continues
Exercice 2.1 : Moyenne pondérée
Montrer que
n
, n
X X
∗
u = wi xi wi
i=1 i=1
minimise la fonction
n
X
C(u) = wi (xi − u)2
i=1
où, pour tout 1 ≤ i ≤ n : wi > 0.
et x la moyenne générale.
1. Ecrire la formule de la moyenne générale et montrer qu’elle se décompose comme suit :
I
X ni
x= xi.
n
i=1
Temps (en min) [0, 60[ [60, 100[ [100, 180[ [180, 280[ Total
Sexe
Femme 0 1 18 71 90
Homme 51 53 29 1 134
Total 51 54 47 72 224
1. Vérifier par le calcul que le temps moyen consacré aux tâches domestiques des femmes est égal à
210.33 min et que la variance est égale à 1483.22 min2 .
2. Retrouver, par le calcul, que la part de variabilité du temps consacrée aux tâches domestiques qui
est expliquée par le sexe est de 71, 92%. Vous utiliserez les éléments de calculs adéquats fournis
dans le tableau ci-dessous.
1. Dans un casino, lorsqu’un joueur joue à la roulette et mise 1 euro sur le rouge, alors il a une
probabilité de gagner de 18/38 (et de 20/38 de perdre). On observe 100 fois le nombre de parties
qu’il faut à un joueur qui parie toujours cela, pour perdre 5 euro. On obtient la répartition suivante.
Sur la figure, la moyenne a été ajoutée par une croix rouge. Commentez ce graphique.
2. On note le poids d’un groupe de 100 femmes et d’un groupe de 80 hommes, sous l’eau. Voici les
données pour les femmes puis pour les hommes :
2.0 2.0 2.1 1.6 1.9 2.0 2.0 1.3 1.3 1.2 2.3 1.9
2.1 1.2 2.0 1.6 1.1 2.2 2.2 1.4 1.7 2.4 1.8 1.7
2.0 2.1 1.6 1.7 1.8 0.7 1.9 1.7 1.7 1.1 2.0 2.3
0.5 1.3 2.7 1.8 2.0 1.7 1.2 0.7 1.1 1.1 1.7 1.7
1.2 1.2 0.7 2.3 1.7 2.4 1.0 2.4 1.4 1.9 2.5 2.2
2.1 1.4 2.4 1.8 2.5 1.3 0.5 1.7 1.9 1.8 1.3 2.0
2.2 1.7 2.0 2.5 1.2 1.4 1.4 1.2 2.2 2.0 1.8 1.4
1.9 1.4 1.3 2.5 1.2 1.5 0.8 2.0 2.2 1.8 2.0 1.6
1.5 1.6 1.5 2.6
3.7 3.6 4.0 4.3 3.8 3.4 4.1 4.0 3.7 3.4 3.5 3.8 3.7 4.9
3.5 3.8 3.3 4.8 3.4 4.6 3.5 5.3 4.4 4.2 2.5 3.1 5.2 3.8
3.3 3.4 4.1 4.6 4.0 3.7 4.3 3.8 4.7 4.4 5.0 3.2 3.1 4.2
4.9 4.5 3.8 4.2 2.7 3.8 3.8 2.0 3.4 4.9 3.3 4.3 5.6 3.2
4.7 4.5 5.2 5.0 5.0 4.0 3.8 5.3 4.5 3.8 3.8 3.4 3.6 3.3
4.2 5.1 4.0 4.7 4.4 3.6 4.7 4.5 2.3 4.0
(a) Pour chaque groupe dessiner l’histogramme en faisant des classes de largeur 0.5kg et comparer
les deux histogrammes obtenus.
(b) Pour chaque série tracer la boite à moustache associée (il vous faudra calculer la médiane, le
premier et le 3ème quartile).
(c) Commenter.
4
3 Corrélation, régression linéaire
Exercice 3.1 : Démonstration de l’inégalité de Cauchy-Schwarz
L’objectif est de démontrer que, pour tous vecteurs u et v, on a
n
X n
X n
X
A = ∥u∥2 = ui2 , B = ∥v∥2 = vi2 , C =< u, v >= ui vi .
i=1 i=1 i=1
1. Montrer que
En déduire que
f (t) = At 2 + 2Ct + B.
Montrer que (1) est vraie si le polynôme f admet au plus une racine.
3. Conclure.
Individu 1 2 3 4 5 6 7 8 9 10
xi 2.42 2.54 2.45 2.53 2.64 2.52 2.6 2.64 2.6 3.12
yi 6.6 6.58 6.56 6.55 6.54 6.52 6.51 6.5 6.49 6.28
3. Commenter.
6
4 Classification non-supervisée
Exercice 4.1 : Algorithme des k-means
On s’intéresse à la classification fournie par l’algorithme de k-means. La figure suivante présente deux
jeux de données (à gauche) et le résultat de leur classification en k = 2 groupes (au centre) et k = 5
groupes (à droite) en prenant, à chaque fois, le meilleur résultats parmi 100 tirages de points initiaux.
r = ∥OM∥, \
θ = (Ox, OM)
4. Montrer que les couples (x, y ) et (r, θ) vérifient les équations suivantes :
x = r cos(θ), y = r sin(θ).
7
La figure suivante donne le résultat de la classification par k-means des données du second exemple,
après passage en coordonnées polaires.
↓
Retour en
coordonnées cartésiennes Classification en 2 groupes
5. Etablir la correspondance entre les points représentés selon les coordonnées cartésiennes et les
points représentés en coordonnées polaires.
6. Commenter les classifications obtenues après le changement de coordonnées.
7. Donner un exemple de deux groupes de points dans le plan R2 pour lesquels la transformation en
coordonnées polaires ne permettrait pas de retrouver une classification satisfaisante.
Pk = Pk ({1, . . . n})
l’ensemble des partitions de n éléments en k ensembles. On mesure la qualité d’une partition en k groupes
par la dispersion intra-classes
k X
X
Dintr a (C) = ∥xi − xg ∥2
g=1 i∈Cg
qui doit être la plus faible possible. On note Dk∗ le minimum de la dispersion intra-classes parmi l’ensemble
des partitions en k classes :
D∗ (k) = min Dintr a (C).
C∈Pk
8
1. On considère une partition quelconque C = {C1 , C2 } de P2 pour n ≥ 2 observations. Montrer que
k
1 X k−g k
S(n, k) = (−1) gn.
k! g
g=1
x1 x2
1 6.4 1.0
2 1.1 3.0
3 6.9 2.3
4 7.8 5.0
5 2.9 3.8
∥xi − xj ∥2 1 2 3 4 5
1 0 32 2 18 20
2 32 0 34 50 4
3 2 34 0 8 18
4 18 50 8 0 26
5 20 4 18 26 0
On rappelle que, à chaque étape, l’algorithme choisit de réunir deux points mg et mℓ (affectés des poids
Wg et Wℓ ) en leur barycentre
1
m= (Wg mg + Wℓ mℓ )
Wg + Wℓ
en minimisant le critère
D(g, ℓ) = Wg ∥mg − m∥2 + Wℓ ∥mℓ − m∥2 .
1. Montrer que
ab a2
=a− .
a+b a+b
2. En déduire que
Wg Wℓ
D(g, ℓ) = ∥mg − mℓ ∥2 .
Wg + Wℓ
11
12
5 Méthodes numériques
Exercice 5.1 : Recherche de la racine d’une fonction
On veut résoudre l’équation x = e −x . On définit pour cela la fonction
f (x) = x − e −x .
Méthode de Newton
1. Montrer que l’équation x = e −x admet une solution unique x ∗ ∈ [0, 1].
2. Écrire la formule d’itération de l’algorithme de Newton pour la recherche de la racine de f (x).
3. Calculer la première itération de l’algorithme pour x (0) = 0.
Méthode du point fixe On rappelle que la solution de l’équation f (x) = x peut être recherchée au
moyen de l’algorithme du point fixe qui vise à résoudre une équation de la forme g(x) = x au moyen de
la récurrence
x (h) = g(x (h−1) ).
Il suffit pour cela de prendre, par exemple, g(x) = f (x) + x.
4. Partant toujours de x (0) = 0, calculer les deux premières itérations de l’algorithme du point fixe
pour la fonction g1 (x) = f (x) + x.
5. On considère la fonction g2 (x) = x − f (x). Montrer que les solutions de f (x) = 0 sont les mêmes
que celles de g2 (x) = x.
6. Partant toujours de x (0) = 0 calculer les deux premières itérations de l’algorithme du point fixe
pour la fonction g2 .
7. Que peut-on dire de |g1′ (x)| pour x ∈ R∗+ ? Même question pour |g2′ (x)|. Commenter.
f (x) = xe −x .
Algorithme de Newton
1. Montrer que f (x) est maximale pour x ∗ = 1.
2. Écrire la formule de mise à jour l’algorithme de Newton visant à trouver le maximum de la fonction
f.
3. Vérifier que x ∗ est bien un point stationnaire de la formule de mise à jour.
4. Calculer les trois premières itérations de l’algorithme en partant de x (0) = 0.
14