Académique Documents
Professionnel Documents
Culture Documents
Intitulé :
Analyse Exploratoire d’une Base
de donnée
Projet réalisé par :
Emna Ben Zrig Sabrine Jenane
1MP QSE
2021-2022
Sommaire
1 Description et présentation de la base de donnée choisie
A) Tri à plat:
Nombre d’hôpitaux par gouvernorat :
Le nombre moyen des hôpitaux dans les 24 gouvernorats est de 7.04, avec un écart type de 3.198. En termes de dispersion, la variance
est élevée (10.225) en raison de valeurs extrêmes importantes entre les gouvernorats dont la valeur maximum est de 14 hôpitaux à
Tunis. Le nombre d’hôpitaux le plus fréquent est 7 et c’est ce qui est confirmé par le mode.
Statistiques
Manquant 0
Moyenne 7,04
Médiane 7,00
Mode 7
Variance 10,225
Minimum 2
Maximum 14
Selon le graphique obtenu, qui est sous forme d’un
histogramme montrant le nombre d’hôpitaux par
gouvernorat selon la fréquence, on peut dire que la
moyenne est de l’ordre de 7 avec la fréquence la plus
élevée (=5), la fréquence la plus faible est celle qui est
relative au nombre le plus élevé d’hôpitaux 14, selon ce
graphe cette fréquence est égale à 1 .
Selon cet histogramme on voit que la courbe gaussienne
montre une répartition normale puisque moyenne =
mode= médiane (Mo = Me = X) , ce qui est indiqué dans
le résultat du tableau statistique.
Nombre d'habitants par gouvernorat :
Nombre d'habitants par gouvernorat
N Valide 23
Manquant 0
Moyenne 462840,00
Médiane 439824,00
Mode 114474
Variance 58183512244,636
Minimum 114474
Maximum 1073110
Le nombre moyen d'habitants par gouvernorat est de 462840 qui sont à peu près égale à la valeur de la médiane
(439824), ce qui montre que la distribution de la population est symétrique chose qui est démontrée aussi par
l'histogramme est la courbe gaussienne associée.
En termes de dispersion, la variance est élevée (58183512244,636) en raison de valeurs extrêmes importantes.
En fait, il existe des gouvernorats dont la population est très importante (Tunis, Arianna, Sfax..) et d'autres
gouvernorats a faible population (Zaghouan, Tataouine, Tozeur..). Notre population est donc très hytérogène en
terme de nombre d'habitants.
Nombre de cliniques par gouvernorat:
Statistiques
Maximum 33
Selon cet histogramme on voit que la courbe
gaussienne montre une répartition anormale, la
a. Présence de plusieurs modes. La plus petite valeur est affichée.
répartition des cliniques est dispersée et s’éloigne
Le nombre moyen des cliniques dans les 24 gouvernorats est de 3.96, avec un écart type plus fortement de la loi normale, puisque la
de 6.832 moyenne diffère du mode et diffère de la médiane,
ce qui est indiqué dans le résultat du tableau
En termes de dispersion, la variance est très élevée (46.680) en raison de valeurs extrêmes statistique
importantes entre les gouvernorats dont la valeur maximale est de 33 cliniques à Tunis
alors que dans d’autres gouvernorats y’a aucune clinique notant comme exemple
‘’Manouba’’.
Le nombre de clinique le plus fréquent est exprimé par le mode ,dans cet exemple on a
plusieurs modes et ce qui est affiché dans le tableau statistiques est la plus petite valeur 0 .
Nombre de laboratoires publics par gouvernorat
Statistiques
Nombre de laboratoire public par gouvernorat
N Valide 23
Manquant 0
Moyenne 9,39
Médiane 11,00
Mode 6a
Variance 18,885
Minimum 1
Maximum 18
Somme 216
Statistiques
Manquant 0
Moyenne 368,17
Médiane 82,00
Mode 55
Variance 632135,787
Asymétrie 3,770
Minimum 4
Maximum 3717
La densité moyenne est de 368 habitants par kilomètre carrée avec un écart type de 795.
La différence importante entre les valeurs de la moyenne, le mode et la médiane montre que la distribution n'est
plus symétrique. Ce qui est démontré aussi par l'histogramme et la courbe gaussienne qui montrent une
distribution déséquilibrée de densité démographique entre les différentes zones.
La valeur très élevée de la variance (632135) montre une hétérogénéité très importante en terme de densité
démographique entre les 24 gouvernorats et donc la présence de zones surpeuplées (Tunis, Ariana et Ben arous)
et de zones désertiques (Tatouine et Kebeli).
Zone développement régionale ou non :
Zone de développement régionale ou non
Pourcentage
Fréquence Pourcentage Pourcentage valide cumulé
Valide oui 12 52,2 52,2 52,2
N Moyenne Ecart type Erreur standard Borne inférieure Borne supérieure Minimum Maximum
oui 17 6,94 2,331 ,565 5,74 8,14 3 12
ANOVA
Somme des carrés ddl Carré moyen F Sig. L'analyse des données des deux variables nombre d’hôpitaux
Intergroupes ,682 1 ,682 ,064 ,803
par gouvernorat et zone de développement régionale ou pas
Intragroupes 224,275 21 10,680 indique que (F = 0,064, ddl = 22, p = 0,803). On peut donc
Total 224,957 22 conclure que le développement régionale n'influence pas le
nombre d’hôpitaux par gouvernorat.
deux variables quantitatives :
Relation entre les deux variables quantitatives : nombre d'hôpitaux et nombre de médecins :
Mesures symétriques
Erreur Signification
asymptotique T approximativ
Valeur standarda approximatifb e
Intervalle par R de Pearson ,547 ,151 2,993 ,007c
Intervalle
N d'observations valides 23
a. L'hypothèse nulle n'étant pas considérée.
b. Utilisation de l'erreur asymptotique standard en envisageant l'hypothèse nulle.
c. Basé sur une approximation normale.
Le coefficient de corrélation de Pearson est de 0,547 > 0,5, il existe donc une forte
corrélation positive entre le nombre d'hôpitaux publics et le nombre de médecins.
C'est à dire plus que le nombre d'hôpitaux dans les gouvernorats augmente plus que
le nombre de médecins augmente aussi.
Deux variables qualitatives :
Zone développée ou pas et présence ou pas de CHU
Statistiques descriptives
Corrélations
Présence ou pas des
Moyenne Ecart type N
Zone développée ou centres hôpitaux
Zone développée ou non 1,26 ,449 23
non universitaires
Zone développée ou non Corrélation de Pearson 1 -,569**
Présence ou pas des centres 1,48 ,511 23
Sig. (bilatérale) ,005
hôpitaux universitaires
N 23 23
Présence ou pas des centres hôpitaux Corrélation de Pearson -,569 **
1
universitaires Sig. (bilatérale) ,005
N 23 23
**. La corrélation est significative au niveau 0.01 (bilatéral).
Lors d’une analyse factorielle, la matrice des corrélations est employée pour regrouper des
variables deux à deux au sein de différents facteurs. La corrélation représente le lien entre
deux variables parmi toutes les observations. L’analyse factorielle regroupe donc au sein
d’un même facteur toutes les variables ayant de fortes corrélations entre elles.
En regardant les résultats dans le tableau ci-dessus, on peut voir que la corrélation entre zone
développée ou non et la présence ou pas des CHU a donné une valeur de coefficient de corrélation
de Pearson (r) de -0,569, ce qui indique une association négative entre les deux variables. De plus, la
valeur P de l'association était de 0,005.
• Pour conclure, lors de l’analyse exploratoire de notre base de
données, notre hypothèse est validée .
• Il existe une inégalité entre les 24 gouvernorats tunisiens au niveau du
secteur médical et au niveau de la répartition démographique de la
population.