Académique Documents
Professionnel Documents
Culture Documents
Groupe 5
In [ ]: df.head()
Product_id int64
Price int64
Sale int64
weight float64
resoloution float64
ppi int64
cpu core int64
cpu freq float64
internal mem float64
ram float64
RearCam float64
Front_Cam float64
battery int64
thickness float64
dtype: object
Statistiques descriptives :
Product_id Price Sale weight resoloution
count 161.000000 161.000000 161.000000 161.000000 161.000000 \
mean 675.559006 2215.596273 621.465839 170.426087 5.209938
std 410.851583 768.187171 1546.618517 92.888612 1.509953
min 10.000000 614.000000 10.000000 66.000000 1.400000
25% 237.000000 1734.000000 37.000000 134.100000 4.800000
50% 774.000000 2258.000000 106.000000 153.000000 5.150000
75% 1026.000000 2744.000000 382.000000 170.000000 5.500000
max 1339.000000 4361.000000 9807.000000 753.000000 12.200000
Matrice de corrélation :
Product_id Price Sale weight resoloution ppi
Product_id 1.000000 0.165136 0.218548 0.035869 -0.017817 0.207271 \
Price 0.165136 1.000000 0.273263 0.144555 0.404010 0.817614
Sale 0.218548 0.273263 1.000000 0.016114 0.017154 0.235896
weight 0.035869 0.144555 0.016114 1.000000 0.890416 -0.054683
resoloution -0.017817 0.404010 0.017154 0.890416 1.000000 0.181292
ppi 0.207271 0.817614 0.235896 -0.054683 0.181292 1.000000
cpu core -0.008634 0.686811 0.069517 0.216257 0.472226 0.487990
cpu freq 0.092428 0.727383 0.099133 0.222730 0.505454 0.713168
internal mem 0.261186 0.776738 0.489308 0.098849 0.202660 0.618560
ram 0.236194 0.896915 0.373127 0.149283 0.327216 0.748724
RearCam 0.172812 0.739538 0.292164 -0.029448 0.249892 0.774008
Front_Cam 0.071020 0.675286 0.437233 -0.005971 0.202720 0.491371
battery 0.031745 0.559946 0.120338 0.833783 0.843462 0.302517
thickness 0.039807 -0.716773 -0.047991 -0.185262 -0.533708 -0.496791
battery thickness
Product_id 0.031745 0.039807
Price 0.559946 -0.716773
Sale 0.120338 -0.047991
weight 0.833783 -0.185262
resoloution 0.843462 -0.533708
ppi 0.302517 -0.496791
cpu core 0.459728 -0.697935
cpu freq 0.473137 -0.614458
internal mem 0.461506 -0.367412
ram 0.541001 -0.521074
RearCam 0.287821 -0.550998
Front_Cam 0.295283 -0.493542
battery 1.000000 -0.412682
thickness -0.412682 1.000000
La variable "Price" (prix) est positivement corrélée avec les variables "Ram", "ppi", "cpu
core", "cpu freq", "internal mem", "RearCam" (caméra arrière) et "Front_Cam" (caméra
frontale). Cela suggère que ces caractéristiques ont tendance à augmenter le prix des
téléphones. La variable "Price" est négativement corrélée avec la variable "thickness"
(épaisseur). Cela suggère que les téléphones plus minces ont tendance à être plus chers.
Il y a une forte corrélation positive entre les variables "ppi" et "resoloution" (résolution
de l'appareil photo). Cela signifie que les téléphones avec une résolution d'appareil
photo plus élevée ont également une densité de pixels plus élevée. La variable "weight"
(poids) est positivement corrélée avec la variable "battery" (capacité de la batterie). Cela
suggère que les téléphones avec une plus grande capacité de batterie ont tendance à
être plus lourds.
Dans le cadre de ce projet, nous allons formuler 3 hypothèses qu'on tentera de vérifier à
l'aide des tests statistiques.
Hypothèse 1 : Il y a une différence significative de prix entre les téléphones avec une
grande RAM (mémoire) (supérieure à la moyenne) et ceux avec une faible RAM
(inférieure ou égale à la moyenne).
# Séparer les données en deux groupes : téléphones avec grande RAM et téléphones
telephones_grande_ram = df[df["ram"] > ram_moyenne]
telephones_petite_ram = df[df["ram"] <= ram_moyenne]
In [ ]: # Hypothèse 2 : Analyse de la variance (ANOVA) pour comparer les prix entre diff
groupe_capacite_batterie = df.groupby("battery")
resultats_anova = stats.f_oneway(*[groupe_capacite_batterie.get_group(g)["Price"
In [ ]: # Créer un graphique à barres pour comparer les prix entre les téléphones avec g
plt.bar(["Grande RAM", "Petite RAM"], [telephones_grande_ram["Price"].mean(), te
plt.xlabel("RAM")
plt.ylabel("Prix moyen")
plt.title("Comparaison des prix entre les téléphones avec grande RAM et petite R
plt.show()
Le graphique ci-haut confirme le résultat du test. Il n'y a pas une différence de prix
considérable entre les téléphones qui ont une grande mémoire et ceux qui ont peu
d'espace.
In [ ]: # Créer un graphique en boîte pour comparer les prix entre les différents groupe
plt.boxplot([groupe_capacite_batterie.get_group(g)["Price"] for g in groupe_capa
labels=list(groupe_capacite_batterie.groups.keys()))
plt.xlabel("Capacité de batterie")
plt.ylabel("Prix")
plt.title("Comparaison des prix entre les différents groupes de capacité de batt
plt.show()
La figure montre que les prix deviennent plus élevés lorsque la capacité de la batterie
augmente.