Académique Documents
Professionnel Documents
Culture Documents
Mai 2023
Nous déclarons que ce rapport est le fruit de notre seul travail, à part lorsque cela
est indiqué explicitement.
Nous acceptons que la personne évaluant ce rapport puisse, pour les besoins de
cette évaluation:
Signature: Date:
Signature: Date:
Signature: Date:
Signature: Date:
i
Remerciements
Nos plus sincères remerciements vont à notre encadrant pédagogique pour les con-
seils avisés sur notre travail.
07/05/2023.
ii
Résumé
iii
Table des matières
Chapitre 1 Introduction 1
Bibliographie 12
Codes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
iv
Chapitre 1
Introduction
Investir dans le secteur des entreprises a toujours été un sujet d'intérêt pour les
investisseurs. Les opportunités d'investissement dans l'industrie vont de l'achat de
participations dans de grandes chaînes à l'investissement direct dans des startups.
Cependant, avec la récente perturbation économique causée par la pandémie de
COVID-19, beaucoup se demandent si investir dans le secteur des entreprises sera
toujours rentable en 2023. Alors que certains secteurs d'activité ont été durement
touchés par la pandémie, d'autres ont connu une croissance importante en raison de
l'augmentation des achats en ligne et de la demande accrue pour certains produits.
Dans ce projet , nous examinons les tendances actuelles du marché, les oppor-
tunités d'investissement dans le secteur des entreprises, ainsi que les risques et les
dés qui y sont associés.
Nous évaluerons également si investir dans le secteur commercial peut être con-
sidéré comme rentable en 2023 et s'il s'agit d'un bon choix pour les investisseurs à
la recherche de rendements attractifs.
1
Chapitre 2
Base de donnée
Les diérentes informations sur les entreprises permettront de prendre des déci-
sions d'investissement au sein de ce secteur.
2
Table 2.4: REGIONS (1725L × 2C)
Le prétraitement des données est une étape importante dans l'obtention de données
de qualité dans un but analytique.
Tout d'abord plusieurs colonnes inutiles ont été retiré des données concernant
l'ensemble des entreprises françaises car elles n'étaient pas assez pertinentes dans
notre analyse. Il y a les données suivante:
- NIC,Forme juridique, Adresse, Numéro de département, Numéro de région, Code
gree, Appelation du code gree ,Date de radiation,Statut,Géolocalisation,3 durées
d'activité des 3 dernières années , 3 eectifs des 3 dernières années, Fiche identité
Ensuite, nous avons ltré les données de la colonne libellé pour prendre unique-
ment les entreprises du secteur commercial. Cela nous a permis de nous concentrer
sur le domaine de notre étude
Nous avons également ltré les données des colonnes des chires d'aaire 1,
chire d'aaire 2 et chire d'aaire 3 an de retirer toutes les données qui ne
contenaient pas ces informations. Ainsi, nous avons pu nous assurer que les données
sur les chires d'aaires étaient complètes.
Nous avons par la suite extrait les colonnes code postal et ville pour les mettre
dans un autre chier CSV car ces informations concernaient une autre table de
données
Enn, nous avons extrait tous les codes APE et les avons reliés à un chier CSV
externe contenant l'ensemble des codes APE relié à leurs dénominations propre.
Cette étape nous a permis d'avoir une meilleure compréhension des activités des
entreprises analysées.
3
En somme, le prétraitement des données est une étape cruciale pour obtenir des
données de qualité avant de les analyser. Les modications apportées au chier
CSV Chire clés ont permis de s'assurer que les données étaient pertinentes et
complètes, et ont ainsi facilité l'importation des données.
SELECT*
FROM entreprise, INDICATEUR
WHERE
ENTREPRISE.Numero_Siren=INDICATEUR.ID_Indicateur
AND ( resultat_1+resultat_2+resultat_3)/3 >0;
4
Chapitre 3
Analyse statistique des Données
## [1] 705557.6
Moyenne 2
## [1] 385546.7
Moyenne3
## [1] 1070420
5
On observe que la moyenne de l'année 2020 étant égale à 1069857 est largement
surperieur à celle de 2022 et 2020.
Le diagramme cirulaire ci-dessous reprensente en pourcentage les dierents moyennes
32.6 %
17.8 %
2022
2021
49.5 % 2020
## [1] 1.232102e+14
## [1] "ecart type de resultat1"
## [1] 11100007
Au vu des résultats, l' ecart type est tres grande dons on a une grande dispersion
autour de moyenne
Année 2021
## [1] 4.048048e+13
## [1] "ecart type de resultat2"
6
## [1] 6362428
Certes la dispersion est grande en 2020 mais elle ne l'es pas autant qu'en 2021
cela est causé par la covid qui a mis tout le monde à terre
Année 2022
## [1] 4.074842e+15
## [1] "ecart type de resultat2"
## [1] 63834493
Là aussi la dispersion est grande est lègerement plus élévé qu'en 2021 cela
s'explique par la relance économique après covid
Ci contre, se présente les distributions pour chacunes des années
Distribution 1
2500
Frequency
1500
500
0
Valeurs
A travers ces trois graphes on a donc une conclusion 2020 qui est supérieur en
terme de résultat et malgré la crise de 2021 on a une croissance en 2022
Nous allons dorénavant étudier la relation entre les résultats et l'activité princi-
pale sur les trois dernières années. On obtient les graphiques suivant:
| | |
Ces graphiques nous permette de conclure que l'activité des commerces surgelés
prédomine le marché en therme de résultats. Nous allons donc proceder à un test
de l'anova sur les trois années an de déterminer si l'activité principale inue sur
le résultat.
7
Figure 3.1: anova_2020.
Les résultats de l'analyse ANOVA ont montré que la valeur p associée au facteur
code_ape était supérieure à la valeur seuil de 0,05 (p>0,05), montrant qu'il n'y
avait pas de diérence signicative entre la moyenne des groupes déterminée par
ce facteur. La somme des carrés de la variation résiduelle est élevée,ce qui peut
suggérer la présence d'autres facteurs inuençant les variables analysées mais qui
n'ont pas été pris en compte dans cette analyse
Nous allons donc procédé à l'analyse de la liaisons entre les résultats observé
par entreprise selon la localité. Pour chaque année on obtient le même graphique
ci contre (à quelques variance près)
8
Nous observons que les hubs obtiennent les résultats les plus importants. Cela
s'explique par la relance économique ainsi que la concentration d'entreprise proche
entre elle ce qui réduit le prix d'importation.
On peut remarquer une certaine évolution des recettes des entreprises de manière
importante, il est donc important de déterminer si l'activité principal est un facteur
de cette expension.
Nous allons donc étudier graphiquement la moyenne du chire d'aaire selon
l'activité principal
On obtient alors de manière uniforme le même graphique pour chaque année. En
eet, tout comme l'analyse des résultats des entreprises, l'activité des commerces
surgelés prédomine le marché.
Il est donc trivial de proceder à un test de l'anova sur les trois années an de
déterminer si l'activité principale inue sur le résultat.
Notons que l'année 2021 montre que la F-value est de 2,385 et la p-value associée
est de 9.18e-11, ce qui est inférieur au seuil de signication de 0,05. Cela suggère
9
que les moyennes des groupes comparés sont signicativement diérentes, et donc
que l'hypothèse nulle d'égalité des moyennes peut être rejetée.
Etudions dorénavant, le liens entre le chire d'aaire et la localité. Pour se faire,
nous avons mis en place une heatmap à l'aide de RStudio. Certaines valeurs sont
manquante et apparaisse en gris car ces informations sont manquantes dans la base
de données initial
Remarquons que la moyenne du chire d'aaire selon la localité reste tout à fait
homogène. Cependant, nous ne pouvons négliger que certaines zones comme Paris
les Yvelines et Saine-Saints-Denis, possèdent une certaines densité de population
qui pousse à la consommation ce qui explique cette écart de chire d'aaires avec
les autres départements qui sont homogènes
10
Chapitre 4
Conclusion et perspectives
11
Bibliographie
CHIFFRE CLES
CODE AFE
CODE POSTAUX
-Le logiciel R: Maîtriser le langage, eectuer des analyses (bio)statistiques Broché
9 octobre 2014 - Comprendre et réaliser les tests statistiques à l'aide de R: Manuel
de biostatistique Broché Livre grand format, 30 janvier 2018 - SQL 2015
Codes
Ajouter vos codes informatique ici. Les codes doivent être correctement indentés et
commentés.
12