Vous êtes sur la page 1sur 1

In [8]: _= '''

L’objectif de l’étude est de déterminer dans quelle mesure les paramètre


des imprimantes 3D affectent la qualité, la précision et la résistance d
il y a neuf paramètres d'entrées :
-Layer Height (mm)
-Wall Thickness (mm)
-Infill Density (%)
-Infill Pattern ()
-Nozzle Temperature (Cº)
-Bed Temperature (Cº)
-Print Speed (mm/s)
-Material ()
-Fan Speed (%)
et trois paramètres de sortie mesurés :
-Roughness (µm)
-Tension (ultimate) Strenght (MPa)
-Elongation (%)

'''

In [56]: import pandas as pd


import matplotlib.pyplot as plt
#import des bibliotheques a utiliser

df = pd.read_csv('D:\IA\data.csv')
#lecture de la base de donnée (dataset)

df.head(5)
#affichage des 5 premières données

Out[56]: layer_height wall_thickness infill_density infill_pattern nozzle_temperature bed_tempe

0 0.02 8 90 grid 220

1 0.02 7 90 honeycomb 225

2 0.02 1 80 grid 230

3 0.02 4 70 honeycomb 240

4 0.02 6 90 grid 250

In [25]: df.info()
#affichage de toutes les caractéristiques de la dataset

variables_qualitatives = df.select_dtypes(include=['object'])

variables_quantitatives = df.select_dtypes(exclude=['object'])

print("Variables qualitatives :")


print(variables_qualitatives.columns.tolist())

print("Variables quantitatives :")


print(variables_quantitatives.columns.tolist())
#determination des differents types de variables

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 50 entries, 0 to 49
Data columns (total 12 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 layer_height 50 non-null float64
1 wall_thickness 50 non-null int64
2 infill_density 50 non-null int64
3 infill_pattern 50 non-null object
4 nozzle_temperature 50 non-null int64
5 bed_temperature 50 non-null int64
6 print_speed 50 non-null int64
7 material 50 non-null object
8 fan_speed 50 non-null int64
9 roughness 50 non-null int64
10 tension_strenght 50 non-null int64
11 elongation 50 non-null float64
dtypes: float64(2), int64(8), object(2)
memory usage: 4.8+ KB
Variables qualitatives :
['infill_pattern', 'material']
Variables quantitatives :
['layer_height', 'wall_thickness', 'infill_density', 'nozzle_temperatur
e', 'bed_temperature', 'print_speed', 'fan_speed', 'roughness', 'tensio
n_strenght', 'elongation']

In [57]: df['material'].value_counts()
#compte des différents types de matériaux

abs 25
Out[57]:
pla 25
Name: material, dtype: int64

In [59]: df['material'].value_counts().plot(kind='pie', autopct='%1.1f%%')


plt.axis('equal') # Pour s'assurer que le diagramme circulaire est un c
plt.title("Diagramme circulaire de 'material'")
plt.show()

In [ ]: # d'après le graphe ci-dessus, on constate qu'il autant de matériel de

In [26]: df['infill_pattern'].value_counts()
#identifier et dénombrer les différents types de motif de remplissage

grid 25
Out[26]:
honeycomb 25
Name: infill_pattern, dtype: int64

In [60]: df['infill_pattern'].value_counts().plot(kind='pie', autopct='%1.1f%%')


plt.axis('equal') # Pour s'assurer que le diagramme circulaire est un c
plt.title("Diagramme circulaire de 'infill_pattern'")
plt.show()

In [ ]: # d'après le graphe ci-dessus, on constate qu'il autant de motif de remp

In [36]: for x in variables_quantitatives:


print("La moyenne de",x, "est:")
print(df[x].mean())
print()
for x in variables_quantitatives:
print("La valeur maximale de",x, "est:")
print(df[x].max())
print("\n")
for x in variables_quantitatives:
print("La valeur minimale de",x, "est:")
print(df[x].min())
print()
for x in variables_quantitatives:
print("La mediane de",x, "est:")
print(df[x].median())

#determination de la moyenne, la médiane, la valeur maximale et mini

La moyenne de layer_height est:


0.10600000000000001
La moyenne de wall_thickness est:
5.22
La moyenne de infill_density est:
53.4
La moyenne de nozzle_temperature est:
221.5
La moyenne de bed_temperature est:
70.0
La moyenne de print_speed est:
64.0
La moyenne de fan_speed est:
50.0
La moyenne de roughness est:
170.58
La moyenne de tension_strenght est:
20.08
La moyenne de elongation est:
1.6720000000000002

La valeur maximale de layer_height est:


0.2
La valeur maximale de wall_thickness est:
10
La valeur maximale de infill_density est:
90
La valeur maximale de nozzle_temperature est:
250
La valeur maximale de bed_temperature est:
80
La valeur maximale de print_speed est:
120
La valeur maximale de fan_speed est:
100
La valeur maximale de roughness est:
368
La valeur maximale de tension_strenght est:
37
La valeur maximale de elongation est:
3.3

La valeur minimale de layer_height est:


0.02
La valeur minimale de wall_thickness est:
1
La valeur minimale de infill_density est:
10
La valeur minimale de nozzle_temperature est:
200
La valeur minimale de bed_temperature est:
60
La valeur minimale de print_speed est:
40
La valeur minimale de fan_speed est:
0
La valeur minimale de roughness est:
21
La valeur minimale de tension_strenght est:
4
La valeur minimale de elongation est:
0.4

La mediane de layer_height est:


0.1
La mediane de wall_thickness est:
5.0
La mediane de infill_density est:
50.0
La mediane de nozzle_temperature est:
220.0
La mediane de bed_temperature est:
70.0
La mediane de print_speed est:
60.0
La mediane de fan_speed est:
50.0
La mediane de roughness est:
165.5
La mediane de tension_strenght est:
19.0
La mediane de elongation est:
1.55

In [14]: _='''analyse de chaque colonne :


-layer_height : variable quantitative, valeur max=0.2, valeur min = 0.02
-wall_thickness : variable quantitative, valeur max=10, valeur min = 1,
-infill_density : variable quantitative, valeur max=90, valeur min = 10
-nozzle_temperature : variable quantitative, valeur max=250, valeur min
-bed_temperature : variable quantitative, valeur max=80, valeur min = 60
-print_speed : variable quantitative, valeur max=120, valeur min = 40, l
-fan_speed : variable quantitative, valeur max=100, valeur min = 0, la m
-roughness : variable quantitative, valeur max=368, valeur min = 21, la
-tension_strenght : variable quantitative, valeur max=37, valeur min = 0
- elongation : variable quantitative, valeur max=3.3, valeur min = 0.4,

'''

In [46]: for x in variables_quantitatives:


print("L'histogramme de la variable '",x,"' est le suivant:")
fig, ax = plt.subplots()
df[x].plot.hist(ax=ax)
plt.show()
print()
#répresentation de l'histogramme de toutes les variables quantitati

L'histogramme de la variable ' layer_height ' est le suivant:

L'histogramme de la variable ' wall_thickness ' est le suivant:

L'histogramme de la variable ' infill_density ' est le suivant:

L'histogramme de la variable ' nozzle_temperature ' est le suivant:

L'histogramme de la variable ' bed_temperature ' est le suivant:

L'histogramme de la variable ' print_speed ' est le suivant:

L'histogramme de la variable ' fan_speed ' est le suivant:

L'histogramme de la variable ' roughness ' est le suivant:

L'histogramme de la variable ' tension_strenght ' est le suivant:

L'histogramme de la variable ' elongation ' est le suivant:

In [ ]: _='''
layer_height :
wall_thickness :
infill_density :
nozzle_temperature :
bed_temperature :
-print_speed :
-fan_speed :
-roughness :
-tension_strenght :
- elongation :

'''

In [49]: df['infill_density'].plot.box()
#réprésentation d'un graphique en boîte (boîtes à moustaches) pour visua

<Axes: >
Out[49]:

In [54]: Q1 = df['infill_density'].quantile(0.25)
Q2 = df['infill_density'].quantile(0.75)
iqr = Q2 - Q1
coefficient = iqr * 1.5
li = Q1 - coefficient
ls = Q2 + coefficient
result = df[(df['infill_density'] > li) | (df['infill_density'] < ls)]
result.sort_values("infill_density")

#détermination des quartiles et delimitation d'un seuil

Out[54]: layer_height wall_thickness infill_density infill_pattern nozzle_temperature bed_temp

31 0.15 7 10 honeycomb 225

13 0.06 6 10 honeycomb 240

6 0.02 5 10 grid 205

7 0.02 10 10 honeycomb 210

39 0.15 1 10 honeycomb 220

46 0.20 4 20 grid 205

11 0.06 2 20 honeycomb 225

29 0.10 1 30 honeycomb 220

21 0.10 2 30 honeycomb 225

17 0.06 8 30 honeycomb 210

37 0.15 10 30 honeycomb 210

42 0.20 7 30 grid 230

9 0.02 8 40 honeycomb 220

26 0.10 4 40 grid 205

5 0.02 10 40 honeycomb 200

48 0.20 7 40 grid 215

16 0.06 3 40 grid 205

20 0.10 1 40 grid 220

38 0.15 6 40 grid 215

25 0.10 1 50 honeycomb 200

33 0.15 1 50 honeycomb 240

22 0.10 1 50 grid 230

19 0.06 10 50 honeycomb 220

36 0.15 4 50 grid 205

30 0.15 4 50 grid 220

14 0.06 3 50 grid 250

12 0.06 10 50 grid 230

27 0.10 3 50 honeycomb 210

32 0.15 6 50 grid 230

45 0.20 5 60 honeycomb 200

47 0.20 5 60 honeycomb 210

24 0.10 2 60 grid 250

49 0.20 3 60 honeycomb 220

8 0.02 9 70 grid 215

3 0.02 4 70 honeycomb 240

23 0.10 9 80 honeycomb 240

34 0.15 7 80 grid 250

35 0.15 3 80 honeycomb 200

18 0.06 5 80 grid 215

10 0.06 6 80 grid 220

40 0.20 4 80 grid 220

2 0.02 1 80 grid 230

44 0.20 3 80 grid 250

1 0.02 7 90 honeycomb 225

41 0.20 9 90 honeycomb 225

4 0.02 6 90 grid 250

28 0.10 4 90 grid 215

15 0.06 10 90 honeycomb 200

43 0.20 6 90 honeycomb 240

0 0.02 8 90 grid 220

In [55]: pg=df[(df['infill_density']<=ls)&(df['infill_density']>=li)]
pg['infill_density'].plot.box()

<Axes: >
Out[55]:

In [ ]: _='''
on constate que malgrés le fait qu'on ait ajuster les paramètres, donnée
notre nouveau graphique en boites tracé ne fait état d'aucun point abbé
une bonne cohérence des données
une précision lors de la collecte des données
une bonne distribution des données
'''

In [ ]: _='''
Le prochain dataset dont on fera l'etude descriptive des donnees, porte
Une série d’expériences d’usinage ont été menées sur des blocs de cire d
sur le banc d’essai de recherche sur la fabrication et l’automatisation
Les données d’usinage ont été collectées à partir d’une machine CNC pou
de la vitesse d’avance et de la pression de serrage. Chaque expérience a
gravée dans la face supérieure.
'''

In [80]: import pandas as pd


import matplotlib.pyplot as plt
#import des bibliotheques a utiliser
gf = pd.read_csv(r'D:\dataset\test.csv')
#lecture de la base de donnée (dataset)

gf.head(5)
#affichage des 5 premières données

Out[80]: No material feedrate clamp_pressure tool_condition machining_finalized passed_visu

0 1 wax 6 4.0 unworn yes

1 2 wax 20 4.0 unworn yes

2 3 wax 6 3.0 unworn yes

3 4 wax 6 2.5 unworn no

4 5 wax 20 3.0 unworn no

In [19]: gf.info()
#affichage de toutes les caractéristiques de la dataset

variables_qualitatives = gf.select_dtypes(include=['object'])

variables_quantitatives = gf.select_dtypes(exclude=['object'])

print("Variables qualitatives :")


print(variables_qualitatives.columns.tolist())

print("Variables quantitatives :")


print(variables_quantitatives.columns.tolist())
#determination des differents types de variables

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 18 entries, 0 to 17
Data columns (total 7 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 No 18 non-null int64
1 material 18 non-null object
2 feedrate 18 non-null int64
3 clamp_pressure 18 non-null float64
4 tool_condition 18 non-null object
5 machining_finalized 18 non-null object
6 passed_visual_inspection 14 non-null object
dtypes: float64(1), int64(2), object(4)
memory usage: 1.1+ KB
Variables qualitatives :
['material', 'tool_condition', 'machining_finalized', 'passed_visual_in
spection']
Variables quantitatives :
['No', 'feedrate', 'clamp_pressure']

In [20]: gf['material'].value_counts()
#compte des différents types de matériaux

wax 18
Out[20]:
Name: material, dtype: int64

In [61]: gf['material'].value_counts().plot(kind='pie', autopct='%1.1f%%')


plt.axis('equal') # Pour s'assurer que le diagramme circulaire est un c
plt.title("Diagramme circulaire de 'material'")
plt.show()

In [52]: # d'après le graphe ci-dessus, on constate que tous les matériaux sont d

In [23]: gf['tool_condition'].value_counts()
#compte des différents types de matériaux

worn 10
Out[23]:
unworn 8
Name: tool_condition, dtype: int64

In [62]: gf['tool_condition'].value_counts().plot(kind='pie', autopct='%1.1f%%')


plt.axis('equal') # Pour s'assurer que le diagramme circulaire est un c
plt.title("Diagramme circulaire de 'tool_condition'")
plt.show()

In [ ]: #il en ressort qu'il ya plus d'entites de type worn que de type unworn

In [25]: gf['machining_finalized'].value_counts()
#compte des différents types de matériaux

yes 14
Out[25]:
no 4
Name: machining_finalized, dtype: int64

In [63]: gf['machining_finalized'].value_counts().plot(kind='pie', autopct='%1.1


plt.axis('equal') # Pour s'assurer que le diagramme circulaire est un c
plt.title("Diagramme circulaire de 'machining_finalized'")
plt.show()

In [ ]: # ceci montre que l'usinages est finalisé dans presque 75% des cas

In [27]: gf['passed_visual_inspection'].value_counts()
#compte des différents types de matériaux

yes 10
Out[27]:
no 4
Name: passed_visual_inspection, dtype: int64

In [48]: gf['passed_visual_inspection'].value_counts().plot(kind='pie', autopct=


plt.axis('equal') # Pour s'assurer que le diagramme circulaire est un c
plt.title("Diagramme circulaire de 'passed_visual_inspection'")
plt.show()

In [ ]: # La réussite de l’inspection visuelle est realisee dans presque 75% des

In [29]: for x in variables_quantitatives:


print("La moyenne de",x, "est:")
print(gf[x].mean())
print()
for x in variables_quantitatives:
print("La valeur maximale de",x, "est:")
print(gf[x].max())
print("\n")
for x in variables_quantitatives:
print("La valeur minimale de",x, "est:")
print(gf[x].min())
print()
for x in variables_quantitatives:
print("La mediane de",x, "est:")
print(gf[x].median())

#determination de la moyenne, la médiane, la valeur maximale et mini

La moyenne de No est:
9.5
La moyenne de feedrate est:
9.722222222222221
La moyenne de clamp_pressure est:
3.4166666666666665

La valeur maximale de No est:


18
La valeur maximale de feedrate est:
20
La valeur maximale de clamp_pressure est:
4.0

La valeur minimale de No est:


1
La valeur minimale de feedrate est:
3
La valeur minimale de clamp_pressure est:
2.5

La mediane de No est:
9.5
La mediane de feedrate est:
6.0
La mediane de clamp_pressure est:
3.5

In [ ]: _='''analyse de chaque colonne :


-No : variable quantitative, valeur max=18, valeur min = 1, la médiane =
-feedrate : variable quantitative, valeur max=20, valeur min = 3, la méd
-clamp_pressure : variable quantitative, valeur max=4, valeur min = 2.5

'''

In [30]: for x in variables_quantitatives:


print("L'histogramme de la variable '",x,"' est le suivant:")
fig, ax = plt.subplots()
gf[x].plot.hist(ax=ax)
plt.show()
print()
#répresentation de l'histogramme de toutes les variables quantitati

L'histogramme de la variable ' No ' est le suivant:

L'histogramme de la variable ' feedrate ' est le suivant:

L'histogramme de la variable ' clamp_pressure ' est le suivant:

In [32]: gf['feedrate'].plot.box()
#réprésentation d'un graphique en boîte (boîtes à moustaches) pour visua

<Axes: >
Out[32]:

In [35]: Q1 = gf['feedrate'].quantile(0.25)
Q2 = gf['feedrate'].quantile(0.75)
iqr = Q2 - Q1
coefficient = iqr * 1.5
li = Q1 - coefficient
ls = Q2 + coefficient
result = gf[(gf['feedrate'] > li) | (gf['feedrate'] < ls)]
result.sort_values("feedrate")

#détermination des quartiles et delimitation d'un seuil

Out[35]: No material feedrate clamp_pressure tool_condition machining_finalized passed_vis

17 18 wax 3 2.5 worn yes

13 14 wax 3 3.0 worn yes

12 13 wax 3 4.0 worn yes

11 12 wax 3 3.0 unworn yes

10 11 wax 3 4.0 unworn yes

16 17 wax 3 2.5 unworn yes

14 15 wax 6 3.0 worn yes

0 1 wax 6 4.0 unworn yes

5 6 wax 6 4.0 worn yes

3 4 wax 6 2.5 unworn no

2 3 wax 6 3.0 unworn yes

9 10 wax 12 4.0 worn yes

8 9 wax 15 4.0 worn yes

6 7 wax 20 4.0 worn no

4 5 wax 20 3.0 unworn no

1 2 wax 20 4.0 unworn yes

15 16 wax 20 3.0 worn no

7 8 wax 20 4.0 worn yes

In [36]: dg=gf[(gf['feedrate']<=ls)&(gf['feedrate']>=li)]
dg['feedrate'].plot.box()

<Axes: >
Out[36]:

In [ ]: _='''
on constate que malgrés le fait qu'on ait ajuster les paramètres, donnée
notre nouveau graphique en boites tracé ne fait état d'aucun point abbé
une bonne cohérence des données
une précision lors de la collecte des données
une bonne distribution des données
'''

In [ ]: _='''
Dataset HousePrediction
'''

In [44]: import pandas as pd


import matplotlib.pyplot as plt
#import des bibliotheques a utiliser
ep =pd.read_csv(r'D:\IA\train.csv')
#lecture de la base de donnée (dataset)
ep.head(5)
#ouverture et analyse de la base de donnee comportant les prix predits d

Out[44]: Id MSSubClass MSZoning LotFrontage LotArea Street Alley LotShape LandContou

0 1 60 RL 65.0 8450 Pave NaN Reg Lv

1 2 20 RL 80.0 9600 Pave NaN Reg Lv

2 3 60 RL 68.0 11250 Pave NaN IR1 Lv

3 4 70 RL 60.0 9550 Pave NaN IR1 Lv

4 5 60 RL 84.0 14260 Pave NaN IR1 Lv

5 rows × 81 columns

In [ ]: #Au vu de ces informations on constate que certaines colones ont des en

In [42]: ep.info()
#affichage de toutes les caractéristiques de la dataset

variables_qualitatives = ep.select_dtypes(include=['object'])

variables_quantitatives = ep.select_dtypes(exclude=['object'])

print("Variables qualitatives :")


print(variables_qualitatives.columns.tolist())

print("Variables quantitatives :")


print(variables_quantitatives.columns.tolist())
#determination des differents types de variables

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1460 entries, 0 to 1459
Data columns (total 81 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 Id 1460 non-null int64
1 MSSubClass 1460 non-null int64
2 MSZoning 1460 non-null object
3 LotFrontage 1201 non-null float64
4 LotArea 1460 non-null int64
5 Street 1460 non-null object
6 Alley 91 non-null object
7 LotShape 1460 non-null object
8 LandContour 1460 non-null object
9 Utilities 1460 non-null object
10 LotConfig 1460 non-null object
11 LandSlope 1460 non-null object
12 Neighborhood 1460 non-null object
13 Condition1 1460 non-null object
14 Condition2 1460 non-null object
15 BldgType 1460 non-null object
16 HouseStyle 1460 non-null object
17 OverallQual 1460 non-null int64
18 OverallCond 1460 non-null int64
19 YearBuilt 1460 non-null int64
20 YearRemodAdd 1460 non-null int64
21 RoofStyle 1460 non-null object
22 RoofMatl 1460 non-null object
23 Exterior1st 1460 non-null object
24 Exterior2nd 1460 non-null object
25 MasVnrType 1452 non-null object
26 MasVnrArea 1452 non-null float64
27 ExterQual 1460 non-null object
28 ExterCond 1460 non-null object
29 Foundation 1460 non-null object
30 BsmtQual 1423 non-null object
31 BsmtCond 1423 non-null object
32 BsmtExposure 1422 non-null object
33 BsmtFinType1 1423 non-null object
34 BsmtFinSF1 1460 non-null int64
35 BsmtFinType2 1422 non-null object
36 BsmtFinSF2 1460 non-null int64
37 BsmtUnfSF 1460 non-null int64
38 TotalBsmtSF 1460 non-null int64
39 Heating 1460 non-null object
40 HeatingQC 1460 non-null object
41 CentralAir 1460 non-null object
42 Electrical 1459 non-null object
43 1stFlrSF 1460 non-null int64
44 2ndFlrSF 1460 non-null int64
45 LowQualFinSF 1460 non-null int64
46 GrLivArea 1460 non-null int64
47 BsmtFullBath 1460 non-null int64
48 BsmtHalfBath 1460 non-null int64
49 FullBath 1460 non-null int64
50 HalfBath 1460 non-null int64
51 BedroomAbvGr 1460 non-null int64
52 KitchenAbvGr 1460 non-null int64
53 KitchenQual 1460 non-null object
54 TotRmsAbvGrd 1460 non-null int64
55 Functional 1460 non-null object
56 Fireplaces 1460 non-null int64
57 FireplaceQu 770 non-null object
58 GarageType 1379 non-null object
59 GarageYrBlt 1379 non-null float64
60 GarageFinish 1379 non-null object
61 GarageCars 1460 non-null int64
62 GarageArea 1460 non-null int64
63 GarageQual 1379 non-null object
64 GarageCond 1379 non-null object
65 PavedDrive 1460 non-null object
66 WoodDeckSF 1460 non-null int64
67 OpenPorchSF 1460 non-null int64
68 EnclosedPorch 1460 non-null int64
69 3SsnPorch 1460 non-null int64
70 ScreenPorch 1460 non-null int64
71 PoolArea 1460 non-null int64
72 PoolQC 7 non-null object
73 Fence 281 non-null object
74 MiscFeature 54 non-null object
75 MiscVal 1460 non-null int64
76 MoSold 1460 non-null int64
77 YrSold 1460 non-null int64
78 SaleType 1460 non-null object
79 SaleCondition 1460 non-null object
80 SalePrice 1460 non-null int64
dtypes: float64(3), int64(35), object(43)
memory usage: 924.0+ KB
Variables qualitatives :
['MSZoning', 'Street', 'Alley', 'LotShape', 'LandContour', 'Utilities',
'LotConfig', 'LandSlope', 'Neighborhood', 'Condition1', 'Condition2',
'BldgType', 'HouseStyle', 'RoofStyle', 'RoofMatl', 'Exterior1st', 'Exte
rior2nd', 'MasVnrType', 'ExterQual', 'ExterCond', 'Foundation', 'BsmtQu
al', 'BsmtCond', 'BsmtExposure', 'BsmtFinType1', 'BsmtFinType2', 'Heati
ng', 'HeatingQC', 'CentralAir', 'Electrical', 'KitchenQual', 'Functiona
l', 'FireplaceQu', 'GarageType', 'GarageFinish', 'GarageQual', 'GarageC
ond', 'PavedDrive', 'PoolQC', 'Fence', 'MiscFeature', 'SaleType', 'Sale
Condition']
Variables quantitatives :
['Id', 'MSSubClass', 'LotFrontage', 'LotArea', 'OverallQual', 'OverallC
ond', 'YearBuilt', 'YearRemodAdd', 'MasVnrArea', 'BsmtFinSF1', 'BsmtFin
SF2', 'BsmtUnfSF', 'TotalBsmtSF', '1stFlrSF', '2ndFlrSF', 'LowQualFinS
F', 'GrLivArea', 'BsmtFullBath', 'BsmtHalfBath', 'FullBath', 'HalfBat
h', 'BedroomAbvGr', 'KitchenAbvGr', 'TotRmsAbvGrd', 'Fireplaces', 'Gara
geYrBlt', 'GarageCars', 'GarageArea', 'WoodDeckSF', 'OpenPorchSF', 'Enc
losedPorch', '3SsnPorch', 'ScreenPorch', 'PoolArea', 'MiscVal', 'MoSol
d', 'YrSold', 'SalePrice']

In [ ]: #Au vu de ces informations on constate que certaines colones ont des en

In [43]: for x in variables_quantitatives:


print("La moyenne de",x, "est:")
print(ep[x].mean())
print()
for x in variables_quantitatives:
print("La valeur maximale de",x, "est:")
print(ep[x].max())
print("\n")
for x in variables_quantitatives:
print("La valeur minimale de",x, "est:")
print(ep[x].min())
print()
for x in variables_quantitatives:
print("La mediane de",x, "est:")
print(ep[x].median())

#determination de la moyenne, la médiane, la valeur maximale et mini

La moyenne de Id est:
730.5
La moyenne de MSSubClass est:
56.897260273972606
La moyenne de LotFrontage est:
70.04995836802665
La moyenne de LotArea est:
10516.828082191782
La moyenne de OverallQual est:
6.0993150684931505
La moyenne de OverallCond est:
5.575342465753424
La moyenne de YearBuilt est:
1971.267808219178
La moyenne de YearRemodAdd est:
1984.8657534246574
La moyenne de MasVnrArea est:
103.68526170798899
La moyenne de BsmtFinSF1 est:
443.6397260273973
La moyenne de BsmtFinSF2 est:
46.54931506849315
La moyenne de BsmtUnfSF est:
567.2404109589041
La moyenne de TotalBsmtSF est:
1057.4294520547944
La moyenne de 1stFlrSF est:
1162.626712328767
La moyenne de 2ndFlrSF est:
346.99246575342465
La moyenne de LowQualFinSF est:
5.844520547945206
La moyenne de GrLivArea est:
1515.463698630137
La moyenne de BsmtFullBath est:
0.42534246575342466
La moyenne de BsmtHalfBath est:
0.057534246575342465
La moyenne de FullBath est:
1.5650684931506849
La moyenne de HalfBath est:
0.38287671232876713
La moyenne de BedroomAbvGr est:
2.8664383561643834
La moyenne de KitchenAbvGr est:
1.0465753424657533
La moyenne de TotRmsAbvGrd est:
6.517808219178082
La moyenne de Fireplaces est:
0.613013698630137
La moyenne de GarageYrBlt est:
1978.5061638868744
La moyenne de GarageCars est:
1.7671232876712328
La moyenne de GarageArea est:
472.9801369863014
La moyenne de WoodDeckSF est:
94.2445205479452
La moyenne de OpenPorchSF est:
46.66027397260274
La moyenne de EnclosedPorch est:
21.954109589041096
La moyenne de 3SsnPorch est:
3.4095890410958902
La moyenne de ScreenPorch est:
15.060958904109588
La moyenne de PoolArea est:
2.758904109589041
La moyenne de MiscVal est:
43.489041095890414
La moyenne de MoSold est:
6.321917808219178
La moyenne de YrSold est:
2007.8157534246575
La moyenne de SalePrice est:
180921.19589041095

La valeur maximale de Id est:


1460
La valeur maximale de MSSubClass est:
190
La valeur maximale de LotFrontage est:
313.0
La valeur maximale de LotArea est:
215245
La valeur maximale de OverallQual est:
10
La valeur maximale de OverallCond est:
9
La valeur maximale de YearBuilt est:
2010
La valeur maximale de YearRemodAdd est:
2010
La valeur maximale de MasVnrArea est:
1600.0
La valeur maximale de BsmtFinSF1 est:
5644
La valeur maximale de BsmtFinSF2 est:
1474
La valeur maximale de BsmtUnfSF est:
2336
La valeur maximale de TotalBsmtSF est:
6110
La valeur maximale de 1stFlrSF est:
4692
La valeur maximale de 2ndFlrSF est:
2065
La valeur maximale de LowQualFinSF est:
572
La valeur maximale de GrLivArea est:
5642
La valeur maximale de BsmtFullBath est:
3
La valeur maximale de BsmtHalfBath est:
2
La valeur maximale de FullBath est:
3
La valeur maximale de HalfBath est:
2
La valeur maximale de BedroomAbvGr est:
8
La valeur maximale de KitchenAbvGr est:
3
La valeur maximale de TotRmsAbvGrd est:
14
La valeur maximale de Fireplaces est:
3
La valeur maximale de GarageYrBlt est:
2010.0
La valeur maximale de GarageCars est:
4
La valeur maximale de GarageArea est:
1418
La valeur maximale de WoodDeckSF est:
857
La valeur maximale de OpenPorchSF est:
547
La valeur maximale de EnclosedPorch est:
552
La valeur maximale de 3SsnPorch est:
508
La valeur maximale de ScreenPorch est:
480
La valeur maximale de PoolArea est:
738
La valeur maximale de MiscVal est:
15500
La valeur maximale de MoSold est:
12
La valeur maximale de YrSold est:
2010
La valeur maximale de SalePrice est:
755000

La valeur minimale de Id est:


1
La valeur minimale de MSSubClass est:
20
La valeur minimale de LotFrontage est:
21.0
La valeur minimale de LotArea est:
1300
La valeur minimale de OverallQual est:
1
La valeur minimale de OverallCond est:
1
La valeur minimale de YearBuilt est:
1872
La valeur minimale de YearRemodAdd est:
1950
La valeur minimale de MasVnrArea est:
0.0
La valeur minimale de BsmtFinSF1 est:
0
La valeur minimale de BsmtFinSF2 est:
0
La valeur minimale de BsmtUnfSF est:
0
La valeur minimale de TotalBsmtSF est:
0
La valeur minimale de 1stFlrSF est:
334
La valeur minimale de 2ndFlrSF est:
0
La valeur minimale de LowQualFinSF est:
0
La valeur minimale de GrLivArea est:
334
La valeur minimale de BsmtFullBath est:
0
La valeur minimale de BsmtHalfBath est:
0
La valeur minimale de FullBath est:
0
La valeur minimale de HalfBath est:
0
La valeur minimale de BedroomAbvGr est:
0
La valeur minimale de KitchenAbvGr est:
0
La valeur minimale de TotRmsAbvGrd est:
2
La valeur minimale de Fireplaces est:
0
La valeur minimale de GarageYrBlt est:
1900.0
La valeur minimale de GarageCars est:
0
La valeur minimale de GarageArea est:
0
La valeur minimale de WoodDeckSF est:
0
La valeur minimale de OpenPorchSF est:
0
La valeur minimale de EnclosedPorch est:
0
La valeur minimale de 3SsnPorch est:
0
La valeur minimale de ScreenPorch est:
0
La valeur minimale de PoolArea est:
0
La valeur minimale de MiscVal est:
0
La valeur minimale de MoSold est:
1
La valeur minimale de YrSold est:
2006
La valeur minimale de SalePrice est:
34900

La mediane de Id est:
730.5
La mediane de MSSubClass est:
50.0
La mediane de LotFrontage est:
69.0
La mediane de LotArea est:
9478.5
La mediane de OverallQual est:
6.0
La mediane de OverallCond est:
5.0
La mediane de YearBuilt est:
1973.0
La mediane de YearRemodAdd est:
1994.0
La mediane de MasVnrArea est:
0.0
La mediane de BsmtFinSF1 est:
383.5
La mediane de BsmtFinSF2 est:
0.0
La mediane de BsmtUnfSF est:
477.5
La mediane de TotalBsmtSF est:
991.5
La mediane de 1stFlrSF est:
1087.0
La mediane de 2ndFlrSF est:
0.0
La mediane de LowQualFinSF est:
0.0
La mediane de GrLivArea est:
1464.0
La mediane de BsmtFullBath est:
0.0
La mediane de BsmtHalfBath est:
0.0
La mediane de FullBath est:
2.0
La mediane de HalfBath est:
0.0
La mediane de BedroomAbvGr est:
3.0
La mediane de KitchenAbvGr est:
1.0
La mediane de TotRmsAbvGrd est:
6.0
La mediane de Fireplaces est:
1.0
La mediane de GarageYrBlt est:
1980.0
La mediane de GarageCars est:
2.0
La mediane de GarageArea est:
480.0
La mediane de WoodDeckSF est:
0.0
La mediane de OpenPorchSF est:
25.0
La mediane de EnclosedPorch est:
0.0
La mediane de 3SsnPorch est:
0.0
La mediane de ScreenPorch est:
0.0
La mediane de PoolArea est:
0.0
La mediane de MiscVal est:
0.0
La mediane de MoSold est:
6.0
La mediane de YrSold est:
2008.0
La mediane de SalePrice est:
163000.0

In [45]: for x in variables_quantitatives:


print("L'histogramme de la variable '",x,"' est le suivant:")
fig, ax = plt.subplots()
ep[x].plot.hist(ax=ax)
plt.show()
print()
#répresentation de l'histogramme de toutes les variables quantitati

L'histogramme de la variable ' Id ' est le suivant:

L'histogramme de la variable ' MSSubClass ' est le suivant:

L'histogramme de la variable ' LotFrontage ' est le suivant:

L'histogramme de la variable ' LotArea ' est le suivant:

L'histogramme de la variable ' OverallQual ' est le suivant:

L'histogramme de la variable ' OverallCond ' est le suivant:

L'histogramme de la variable ' YearBuilt ' est le suivant:

L'histogramme de la variable ' YearRemodAdd ' est le suivant:

L'histogramme de la variable ' MasVnrArea ' est le suivant:

L'histogramme de la variable ' BsmtFinSF1 ' est le suivant:

L'histogramme de la variable ' BsmtFinSF2 ' est le suivant:

L'histogramme de la variable ' BsmtUnfSF ' est le suivant:

L'histogramme de la variable ' TotalBsmtSF ' est le suivant:

L'histogramme de la variable ' 1stFlrSF ' est le suivant:

L'histogramme de la variable ' 2ndFlrSF ' est le suivant:

L'histogramme de la variable ' LowQualFinSF ' est le suivant:

L'histogramme de la variable ' GrLivArea ' est le suivant:

L'histogramme de la variable ' BsmtFullBath ' est le suivant:

L'histogramme de la variable ' BsmtHalfBath ' est le suivant:

L'histogramme de la variable ' FullBath ' est le suivant:

L'histogramme de la variable ' HalfBath ' est le suivant:

L'histogramme de la variable ' BedroomAbvGr ' est le suivant:

L'histogramme de la variable ' KitchenAbvGr ' est le suivant:

L'histogramme de la variable ' TotRmsAbvGrd ' est le suivant:

L'histogramme de la variable ' Fireplaces ' est le suivant:

L'histogramme de la variable ' GarageYrBlt ' est le suivant:

L'histogramme de la variable ' GarageCars ' est le suivant:

L'histogramme de la variable ' GarageArea ' est le suivant:

L'histogramme de la variable ' WoodDeckSF ' est le suivant:

L'histogramme de la variable ' OpenPorchSF ' est le suivant:

L'histogramme de la variable ' EnclosedPorch ' est le suivant:

L'histogramme de la variable ' 3SsnPorch ' est le suivant:

L'histogramme de la variable ' ScreenPorch ' est le suivant:

L'histogramme de la variable ' PoolArea ' est le suivant:

L'histogramme de la variable ' MiscVal ' est le suivant:

L'histogramme de la variable ' MoSold ' est le suivant:

L'histogramme de la variable ' YrSold ' est le suivant:

L'histogramme de la variable ' SalePrice ' est le suivant:

In [47]: for x in variables_qualitatives:


print("Le diagramme circulaire de la variable '", x, "' est le suiva
fig, ax = plt.subplots()
counts = ep[x].value_counts()
ax.pie(counts, labels=counts.index, autopct='%1.1f%%')
ax.set_title("Diagramme circulaire de la variable '" + x + "'")
plt.show()
print()
# Réprésentation du diagramme circulaire de toutes les variables qua

Le diagramme circulaire de la variable ' MSZoning ' est le suivant:

Le diagramme circulaire de la variable ' Street ' est le suivant:

Le diagramme circulaire de la variable ' Alley ' est le suivant:

Le diagramme circulaire de la variable ' LotShape ' est le suivant:

Le diagramme circulaire de la variable ' LandContour ' est le suivant:

Le diagramme circulaire de la variable ' Utilities ' est le suivant:

Le diagramme circulaire de la variable ' LotConfig ' est le suivant:

Le diagramme circulaire de la variable ' LandSlope ' est le suivant:

Le diagramme circulaire de la variable ' Neighborhood ' est le suivant:

Le diagramme circulaire de la variable ' Condition1 ' est le suivant:

Le diagramme circulaire de la variable ' Condition2 ' est le suivant:

Le diagramme circulaire de la variable ' BldgType ' est le suivant:

Le diagramme circulaire de la variable ' HouseStyle ' est le suivant:

Le diagramme circulaire de la variable ' RoofStyle ' est le suivant:

Le diagramme circulaire de la variable ' RoofMatl ' est le suivant:

Le diagramme circulaire de la variable ' Exterior1st ' est le suivant:

Le diagramme circulaire de la variable ' Exterior2nd ' est le suivant:

Le diagramme circulaire de la variable ' MasVnrType ' est le suivant:

Le diagramme circulaire de la variable ' ExterQual ' est le suivant:

Le diagramme circulaire de la variable ' ExterCond ' est le suivant:

Le diagramme circulaire de la variable ' Foundation ' est le suivant:

Le diagramme circulaire de la variable ' BsmtQual ' est le suivant:

Le diagramme circulaire de la variable ' BsmtCond ' est le suivant:

Le diagramme circulaire de la variable ' BsmtExposure ' est le suivant:

Le diagramme circulaire de la variable ' BsmtFinType1 ' est le suivant:

Le diagramme circulaire de la variable ' BsmtFinType2 ' est le suivant:

Le diagramme circulaire de la variable ' Heating ' est le suivant:

Le diagramme circulaire de la variable ' HeatingQC ' est le suivant:

Le diagramme circulaire de la variable ' CentralAir ' est le suivant:

Le diagramme circulaire de la variable ' Electrical ' est le suivant:

Le diagramme circulaire de la variable ' KitchenQual ' est le suivant:

Le diagramme circulaire de la variable ' Functional ' est le suivant:

Le diagramme circulaire de la variable ' FireplaceQu ' est le suivant:

Le diagramme circulaire de la variable ' GarageType ' est le suivant:

Le diagramme circulaire de la variable ' GarageFinish ' est le suivant:

Le diagramme circulaire de la variable ' GarageQual ' est le suivant:

Le diagramme circulaire de la variable ' GarageCond ' est le suivant:

Le diagramme circulaire de la variable ' PavedDrive ' est le suivant:

Le diagramme circulaire de la variable ' PoolQC ' est le suivant:

Le diagramme circulaire de la variable ' Fence ' est le suivant:

Le diagramme circulaire de la variable ' MiscFeature ' est le suivant:

Le diagramme circulaire de la variable ' SaleType ' est le suivant:

Le diagramme circulaire de la variable ' SaleCondition ' est le suivan


t:

In [65]: for x in variables_qualitatives:


print("Les comptes de la variable '", x, "' sont les suivants:")
counts = ep[x].value_counts()
for value, count in counts.iteritems():
print(value, ":", count)
print()
# Compte des différentes variables

Les comptes de la variable ' MSZoning ' sont les suivants:


RL : 1151
RM : 218
FV : 65
RH : 16
C (all) : 10

Les comptes de la variable ' Street ' sont les suivants:


Pave : 1454
Grvl : 6

Les comptes de la variable ' Alley ' sont les suivants:


Grvl : 50
Pave : 41

Les comptes de la variable ' LotShape ' sont les suivants:


Reg : 925
IR1 : 484
IR2 : 41
IR3 : 10

Les comptes de la variable ' LandContour ' sont les suivants:


Lvl : 1311
Bnk : 63
HLS : 50
Low : 36

Les comptes de la variable ' Utilities ' sont les suivants:


AllPub : 1459
NoSeWa : 1

Les comptes de la variable ' LotConfig ' sont les suivants:


Inside : 1052
Corner : 263
CulDSac : 94
FR2 : 47
FR3 : 4

Les comptes de la variable ' LandSlope ' sont les suivants:


Gtl : 1382
Mod : 65
Sev : 13

Les comptes de la variable ' Neighborhood ' sont les suivants:


NAmes : 225
CollgCr : 150
OldTown : 113
Edwards : 100
Somerst : 86
Gilbert : 79
NridgHt : 77
Sawyer : 74
NWAmes : 73
SawyerW : 59
BrkSide : 58
Crawfor : 51
Mitchel : 49
NoRidge : 41
Timber : 38
IDOTRR : 37
ClearCr : 28
StoneBr : 25
SWISU : 25
MeadowV : 17
Blmngtn : 17
BrDale : 16
Veenker : 11
NPkVill : 9
Blueste : 2

Les comptes de la variable ' Condition1 ' sont les suivants:


Norm : 1260
Feedr : 81
Artery : 48
RRAn : 26
PosN : 19
RRAe : 11
PosA : 8
RRNn : 5
RRNe : 2

Les comptes de la variable ' Condition2 ' sont les suivants:


Norm : 1445
Feedr : 6
Artery : 2
RRNn : 2
PosN : 2
PosA : 1
RRAn : 1
RRAe : 1

Les comptes de la variable ' BldgType ' sont les suivants:


1Fam : 1220
TwnhsE : 114
Duplex : 52
Twnhs : 43
2fmCon : 31

Les comptes de la variable ' HouseStyle ' sont les suivants:


1Story : 726
2Story : 445
1.5Fin : 154
SLvl : 65
SFoyer : 37
1.5Unf : 14
2.5Unf : 11
2.5Fin : 8

Les comptes de la variable ' RoofStyle ' sont les suivants:


Gable : 1141
Hip : 286
Flat : 13
Gambrel : 11
Mansard : 7
Shed : 2

Les comptes de la variable ' RoofMatl ' sont les suivants:


CompShg : 1434
Tar&Grv : 11
WdShngl : 6
WdShake : 5
Metal : 1
Membran : 1
Roll : 1
ClyTile : 1

Les comptes de la variable ' Exterior1st ' sont les suivants:


VinylSd : 515
HdBoard : 222
MetalSd : 220
Wd Sdng : 206
Plywood : 108
CemntBd : 61
BrkFace : 50
WdShing : 26
Stucco : 25
AsbShng : 20
BrkComm : 2
Stone : 2
AsphShn : 1
ImStucc : 1
CBlock : 1

Les comptes de la variable ' Exterior2nd ' sont les suivants:


VinylSd : 504
MetalSd : 214
HdBoard : 207
Wd Sdng : 197
Plywood : 142
CmentBd : 60
Wd Shng : 38
Stucco : 26
BrkFace : 25
AsbShng : 20
ImStucc : 10
Brk Cmn : 7
Stone : 5
AsphShn : 3
Other : 1
CBlock : 1

Les comptes de la variable ' MasVnrType ' sont les suivants:


None : 864
BrkFace : 445
Stone : 128
BrkCmn : 15

Les comptes de la variable ' ExterQual ' sont les suivants:


TA : 906
Gd : 488
Ex : 52
Fa : 14

Les comptes de la variable ' ExterCond ' sont les suivants:


TA : 1282
Gd : 146
Fa : 28
Ex : 3
Po : 1

Les comptes de la variable ' Foundation ' sont les suivants:


PConc : 647
CBlock : 634
BrkTil : 146
Slab : 24
Stone : 6
Wood : 3

Les comptes de la variable ' BsmtQual ' sont les suivants:


TA : 649
Gd : 618
Ex : 121
Fa : 35

Les comptes de la variable ' BsmtCond ' sont les suivants:


TA : 1311
Gd : 65
Fa : 45
Po : 2

Les comptes de la variable ' BsmtExposure ' sont les suivants:


No : 953
Av : 221
Gd : 134
Mn : 114

Les comptes de la variable ' BsmtFinType1 ' sont les suivants:


Unf : 430
GLQ : 418
ALQ : 220
BLQ : 148
Rec : 133
LwQ : 74

Les comptes de la variable ' BsmtFinType2 ' sont les suivants:


Unf : 1256
Rec : 54
LwQ : 46
BLQ : 33
ALQ : 19
GLQ : 14

Les comptes de la variable ' Heating ' sont les suivants:


GasA : 1428
GasW : 18
Grav : 7
Wall : 4
OthW : 2
Floor : 1

Les comptes de la variable ' HeatingQC ' sont les suivants:


Ex : 741
TA : 428
Gd : 241
Fa : 49
Po : 1

Les comptes de la variable ' CentralAir ' sont les suivants:


Y : 1365
N : 95

Les comptes de la variable ' Electrical ' sont les suivants:


SBrkr : 1334
FuseA : 94
FuseF : 27
FuseP : 3
Mix : 1

Les comptes de la variable ' KitchenQual ' sont les suivants:


TA : 735
Gd : 586
Ex : 100
Fa : 39

Les comptes de la variable ' Functional ' sont les suivants:


Typ : 1360
Min2 : 34
Min1 : 31
Mod : 15
Maj1 : 14
Maj2 : 5
Sev : 1

Les comptes de la variable ' FireplaceQu ' sont les suivants:


Gd : 380
TA : 313
Fa : 33
Ex : 24
Po : 20

Les comptes de la variable ' GarageType ' sont les suivants:


Attchd : 870
Detchd : 387
BuiltIn : 88
Basment : 19
CarPort : 9
2Types : 6

Les comptes de la variable ' GarageFinish ' sont les suivants:


Unf : 605
RFn : 422
Fin : 352

Les comptes de la variable ' GarageQual ' sont les suivants:


TA : 1311
Fa : 48
Gd : 14
Ex : 3
Po : 3

Les comptes de la variable ' GarageCond ' sont les suivants:


TA : 1326
Fa : 35
Gd : 9
Po : 7
Ex : 2

Les comptes de la variable ' PavedDrive ' sont les suivants:


Y : 1340
N : 90
P : 30

Les comptes de la variable ' PoolQC ' sont les suivants:


Gd : 3
Ex : 2
Fa : 2

Les comptes de la variable ' Fence ' sont les suivants:


MnPrv : 157
GdPrv : 59
GdWo : 54
MnWw : 11

Les comptes de la variable ' MiscFeature ' sont les suivants:


Shed : 49
Gar2 : 2
Othr : 2
TenC : 1

Les comptes de la variable ' SaleType ' sont les suivants:


WD : 1267
New : 122
COD : 43
ConLD : 9
ConLI : 5
ConLw : 5
CWD : 4
Oth : 3
Con : 2

Les comptes de la variable ' SaleCondition ' sont les suivants:


Normal : 1198
Partial : 125
Abnorml : 101
Family : 20
Alloca : 12
AdjLand : 4

C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():
C:\Users\PC\AppData\Local\Temp\ipykernel_948\1844451391.py:4: FutureWar
ning: iteritems is deprecated and will be removed in a future version.
Use .items instead.
for value, count in counts.iteritems():

In [66]: ep['SalePrice'].plot.box()
#réprésentation d'un graphique en boîte (boîtes à moustaches) pour visua

<Axes: >
Out[66]:

In [ ]: #On observe des points abberents

In [73]: Q1 = ep['SalePrice'].quantile(0.25)
Q2 = ep['SalePrice'].quantile(0.75)
iqr = Q2 - Q1
coefficient = iqr * 1
li = Q1 - coefficient
ls = Q2 + coefficient
result = ep[(ep['SalePrice'] > li) | (ep['SalePrice'] < ls)]
result.sort_values("SalePrice")

#détermination des quartiles et delimitation d'un seuil

Out[73]: Id MSSubClass MSZoning LotFrontage LotArea Street Alley LotShape LandC

495 496 30 C (all) 60.0 7879 Pave NaN Reg

916 917 20 C (all) 50.0 9000 Pave NaN Reg

968 969 50 RM 50.0 5925 Pave NaN Reg

533 534 20 RL 50.0 5000 Pave NaN Reg

30 31 70 C (all) 50.0 8500 Pave Pave Reg

... ... ... ... ... ... ... ... ...

803 804 60 RL 107.0 13891 Pave NaN Reg

898 899 20 RL 100.0 12919 Pave NaN IR1

1169 1170 60 RL 118.0 35760 Pave NaN IR1

1182 1183 60 RL 160.0 15623 Pave NaN IR1

691 692 60 RL 104.0 21535 Pave NaN IR1

1460 rows × 81 columns

In [74]: eg=ep[(ep['SalePrice']<=ls)&(ep['SalePrice']>=li)]
eg['SalePrice'].plot.box()

<Axes: >
Out[74]:

In [76]: _='''
En éliminant les points aberrants dans le diagramme en boîte, nous avon
la visualisation et nous nous concentrons davantage sur la tendance géné
Cela permet une meilleure interprétation des mesures centrales, de la di
des données sans être biaisé par des valeurs atypiques.
Cela peut nous aider à obtenir une image plus précise et représentative
'''

In [78]: print("ensemble_X :")


for column in ep.columns.tolist():
if column != "SalePrice":
print(column)
print()
print()
print("ensemble_Y")
print("SalePrice")

ensemble_X :
Id
MSSubClass
MSZoning
LotFrontage
LotArea
Street
Alley
LotShape
LandContour
Utilities
LotConfig
LandSlope
Neighborhood
Condition1
Condition2
BldgType
HouseStyle
OverallQual
OverallCond
YearBuilt
YearRemodAdd
RoofStyle
RoofMatl
Exterior1st
Exterior2nd
MasVnrType
MasVnrArea
ExterQual
ExterCond
Foundation
BsmtQual
BsmtCond
BsmtExposure
BsmtFinType1
BsmtFinSF1
BsmtFinType2
BsmtFinSF2
BsmtUnfSF
TotalBsmtSF
Heating
HeatingQC
CentralAir
Electrical
1stFlrSF
2ndFlrSF
LowQualFinSF
GrLivArea
BsmtFullBath
BsmtHalfBath
FullBath
HalfBath
BedroomAbvGr
KitchenAbvGr
KitchenQual
TotRmsAbvGrd
Functional
Fireplaces
FireplaceQu
GarageType
GarageYrBlt
GarageFinish
GarageCars
GarageArea
GarageQual
GarageCond
PavedDrive
WoodDeckSF
OpenPorchSF
EnclosedPorch
3SsnPorch
ScreenPorch
PoolArea
PoolQC
Fence
MiscFeature
MiscVal
MoSold
YrSold
SaleType
SaleCondition

ensemble_Y
SalePrice

In [ ]: _='''
Pour l'analyse de ce dataset, l'ensemble y (la cible) est le prix de ve
lorqu'on a tous les autres.
'''

Vous aimerez peut-être aussi