Vous êtes sur la page 1sur 73

Introduction à IBM SPSS

Préparé et présenté par : Sous l’encadrement de :


GHOUZLAOUI Zakaria Mr MOUTACHAOUIK
LAKHDAR Madiha
T’BOUBCHAT Taoufik
TIDRARI Rayhana

ENSAM Casablanca - 3ème année CI Génie Industriel 1


Plan de présentation
Fondement conceptuel de la statistique
-Importer des données depuis (CSV, XLSX, SGBDR)

-Modifier les propriétés des variables

-Créer des variables calculés (alphanumérique, numérique et temporelles)

-Identifier et éliminer les doublons et les observations inhabituelles

-Comparer deux jeux de données

Analyse et remplacement des données manquantes


-Multiple Amputation

-Series Mean

-Expectation maximization

2
Fondement conceptuel de la statistique
Importation des données depuis (CSV, XLSX, SGBDR)

Depuis CSV:

3
4
5
6
Fondement conceptuel de la statistique
Importation des données depuis (CSV, XLSX, SGBDR)

Depuis XLSX

7
8
Fondement conceptuel de la statistique
Importation des données depuis (CSV, XLSX, SGBDR)

Depuis une base de données:

9
10
11
Fondement conceptuel de la statistique
Modification des propriétés des variables

12
13
Fondement conceptuel de la statistique
-Création des variables calculés (alphanumérique, numérique et temporelles)

Création d’une variable alphanumérique:

14
15
Fondement conceptuel de la statistique
-Création des variables calculés (alphanumérique, numérique et temporelles)

Création d’une variable alphanumérique:

16
17
Fondement conceptuel de la statistique
-Création des variables calculés (alphanumérique, numérique et temporelles)

Création d’une variable temporelle:

18
Fondement conceptuel de la statistique
Identification et élimination des doublons et les observations inhabituelles

19
Fondement conceptuel de la statistique
Comparaison de deux jeux de données

20
21
Analyse et remplacement des données manquantes
Multiple Amputation

22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
Analyse et remplacement des données manquantes
Series Mean

Avantages

* Les valeurs manquantes dans vos données ne réduisent pas la taille de votre échantillon. Comme l’imputation
moyenne remplace toutes les valeurs manquantes, vous pouvez conserver l’ensemble de votre base de données.
• la moyenne d'échantillon de votre variable n'est pas biaisée. La substitution moyenne peut être une approche valide,
-----------------------------------------------------------------------------------------------
les inconvénients
• La substitution moyenne entraîne un biais dans les estimations multivariées telles que les coefficients de corrélation
ou de régression. Les valeurs imputées par la moyenne d’une variable ont, en général, une corrélation de zéro avec
les autres variables.
• Puisque toutes les valeurs imputées sont exactement la moyenne de notre variable, nous serions trop sûrs de
l'exactitude de notre estimation moyenne. En d'autres termes, l'intervalle de confiance autour de l'estimation
ponctuelle de notre moyenne serait trop étroit.

49
Analyze -> Descriptive statistics -> Frequencies…

50
51
52
53
Transform -> Recorde into Same Variables

54
55
56
57
58
Transform -> Replace missing values

59
26,932.5 $
Analyse et remplacement des données manquantes
Multiple Amputation

62
63
64
65
66
67
68
69
70
71
72
73