Application de Web Scraping en Python

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats TXT, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

80 vues2 pages

Application de Web Scraping en Python

Transféré par

benhettalmaryem

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats TXT, PDF, TXT ou lisez en ligne sur Scribd

\documentclass[a4paper,12pt]{report}

\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{geometry}
\geometry{top=2.5cm, bottom=2.5cm, left=2.5cm, right=2.5cm}
\usepackage{xcolor}
\usepackage{graphicx}
\usepackage{titlesec}
\usepackage{hyperref}
\usepackage{fancyhdr}

% Couleurs personnalisées pour un thème noir

\definecolor{myblack}{rgb}{0.1, 0.1, 0.1}
\definecolor{mywhite}{rgb}{1, 1, 1}
\definecolor{mygray}{rgb}{0.7, 0.7, 0.7}

% Configuration du thème noir

\pagecolor{myblack}
\color{mywhite}
\hypersetup{
colorlinks=true,
linkcolor=mygray,
filecolor=mygray,
urlcolor=mygray,
citecolor=mygray,
}

% Style des titres

\titleformat{\chapter}[hang]{\normalfont\LARGE\bfseries\color{mywhite}}{\
thechapter.}{20pt}{\LARGE}
\titleformat{\section}{\large\bfseries\color{mywhite}}{\thesection.}{10pt}{\large}

% En-tête et pied de page

\pagestyle{fancy}
\fancyhf{}
\fancyhead[L]{\textcolor{mygray}{Mini-projet Web Scraping}}
\fancyhead[R]{\textcolor{mygray}{\thepage}}
\fancyfoot[C]{\textcolor{mygray}{Meryem Benhettal - Université Abdelmalek Essaâdi}}

% Page de garde
\begin{document}
\thispagestyle{empty}
\begin{center}
\vspace*{4cm}
{\Huge \bfseries \textcolor{mywhite}{Développement d'une Application de Web
Scraping}}\\
\vspace{1.5cm}
{\LARGE \textcolor{mygray}{Compte Rendu N°1}}\\
\vspace{3cm}

\textbf{\Large \textcolor{mygray}{Préparé par : Meryem Benhettal}}\\

\vspace{0.5cm}
\textbf{\Large \textcolor{mygray}{Encadré par : Pr. ZANNOU Abderrahim}}\\
\vfill
\textbf{\Large \textcolor{mywhite}{Année Universitaire : 2024/2025}}\\
\vspace{2cm}
\end{center}
\newpage
% Introduction et Données à Scraper (page 2)
\chapter*{Introduction et Données à Scraper}
\addcontentsline{toc}{chapter}{Introduction et Données à Scraper}
Ce projet a pour but de développer une application de web scraping utilisant
Python. Les données sont extraites de plusieurs dépôts GitHub.

Les dépôts GitHub sélectionnés pour l'extraction sont :

\begin{itemize}
\item \href{https://github.com/python/cpython}{python/cpython}
\item \href{https://github.com/django/django}{django/django}
\item \href{https://github.com/pallets/flask}{pallets/flask}
\item \href{https://github.com/tensorflow/tensorflow}{tensorflow/tensorflow}
\end{itemize}
Les informations extraites sont : le nom du dépôt, la description, le nombre
d'étoiles et de contributeurs. Ces données sont sauvegardées dans un fichier CSV.

\newpage

% Étapes Clés et Conclusion (page 3)

\chapter*{Étapes Clés et Conclusion}
\addcontentsline{toc}{chapter}{Étapes Clés et Conclusion}
\section*{1. Choix du site}
GitHub a été choisi pour la richesse des informations à scraper, notamment la
popularité des projets et les contributions.

\section*{2. Scraping des données}

Le scraping a été réalisé en Python en utilisant \textit{requests} et \
textit{BeautifulSoup}. Les informations ont été organisées et sauvegardées dans un
fichier CSV intitulé \textit{github\_multiple\_data.csv}.

\section*{3. Enregistrement des données}

Les informations extraites (description du projet, nombre d'étoiles et
contributeurs) sont enregistrées dans le fichier CSV. Chaque dépôt contient des
données pertinentes pour l'analyse.

\section*{Conclusion}
Ce projet m'a permis de comprendre le processus de scraping et d'apprendre à
manipuler les données extraites dans un format structuré. Le code peut être
réutilisé pour d'autres projets similaires.
\end{document}

Vous aimerez peut-être aussi

Documentclass (1 WPS Office
Pas encore d'évaluation
Documentclass (1 WPS Office
1 page
HHH
Pas encore d'évaluation
HHH
3 pages
Compte Rendu 1 Énoncé
Pas encore d'évaluation
Compte Rendu 1 Énoncé
1 page
Guide Complet sur LaTeX et Beamer
Pas encore d'évaluation
Guide Complet sur LaTeX et Beamer
189 pages
Code Source Latex Rapport
Pas encore d'évaluation
Code Source Latex Rapport
15 pages
Rapport Technique en Génie Mécanique
Pas encore d'évaluation
Rapport Technique en Génie Mécanique
6 pages
Guide Complet sur LaTeX
Pas encore d'évaluation
Guide Complet sur LaTeX
9 pages
Formation Latex
Pas encore d'évaluation
Formation Latex
18 pages
Formation Rédaction LATEX Professionnelle
Pas encore d'évaluation
Formation Rédaction LATEX Professionnelle
24 pages
Init La Te X
Pas encore d'évaluation
Init La Te X
136 pages
LaTeX Commande
Pas encore d'évaluation
LaTeX Commande
5 pages
Débuter avec LATEX pour Mathématiciens
Pas encore d'évaluation
Débuter avec LATEX pour Mathématiciens
114 pages
Introduction à LaTeX pour mathématiciens
Pas encore d'évaluation
Introduction à LaTeX pour mathématiciens
114 pages
Correction
Pas encore d'évaluation
Correction
3 pages
TP HTML CSS N2
Pas encore d'évaluation
TP HTML CSS N2
4 pages
Guide de web scraping avec Python
Pas encore d'évaluation
Guide de web scraping avec Python
5 pages
A. Introduction: Objectif Du TP
Pas encore d'évaluation
A. Introduction: Objectif Du TP
4 pages
Deep Learning pour l'Extraction Web
Pas encore d'évaluation
Deep Learning pour l'Extraction Web
84 pages
Cours Latex P
Pas encore d'évaluation
Cours Latex P
61 pages
Memoire Fin D Etude These Memoire
Pas encore d'évaluation
Memoire Fin D Etude These Memoire
21 pages
Manuel LATEX : Commandes et Styles
Pas encore d'évaluation
Manuel LATEX : Commandes et Styles
43 pages
Exercices pratiques sur LATEX
Pas encore d'évaluation
Exercices pratiques sur LATEX
55 pages
Commandes essentielles en LaTeX
Pas encore d'évaluation
Commandes essentielles en LaTeX
18 pages
Introduction à LATEX et ses fonctionnalités
Pas encore d'évaluation
Introduction à LATEX et ses fonctionnalités
45 pages
These - SAOUT - Introduction À La GED
Pas encore d'évaluation
These - SAOUT - Introduction À La GED
171 pages
Guide LaTeX pour littéraires et designers
Pas encore d'évaluation
Guide LaTeX pour littéraires et designers
123 pages
Session LaTeX Brut
Pas encore d'évaluation
Session LaTeX Brut
36 pages
Rapport de projet en Informatique
Pas encore d'évaluation
Rapport de projet en Informatique
21 pages
Webscraping Avec Python
Pas encore d'évaluation
Webscraping Avec Python
21 pages
Compte Rendu de Project
Pas encore d'évaluation
Compte Rendu de Project
13 pages
Ses A Manuel
Pas encore d'évaluation
Ses A Manuel
194 pages
Ebook Web Scraping
Pas encore d'évaluation
Ebook Web Scraping
35 pages
Rédaction de rapports avec LaTeX
Pas encore d'évaluation
Rédaction de rapports avec LaTeX
11 pages
En-têtes et pieds de page en LaTeX
Pas encore d'évaluation
En-têtes et pieds de page en LaTeX
4 pages
Guide Latex
Pas encore d'évaluation
Guide Latex
8 pages
Guide Complet pour Débuter avec LaTeX
Pas encore d'évaluation
Guide Complet pour Débuter avec LaTeX
42 pages
Tpe Inf224p W
Pas encore d'évaluation
Tpe Inf224p W
5 pages
Automatisation des Rapports Académiques Te-sea
Pas encore d'évaluation
Automatisation des Rapports Académiques Te-sea
6 pages
Introduction à LaTeX pour débutants
Pas encore d'évaluation
Introduction à LaTeX pour débutants
7 pages
Guide complet sur LaTeX et ses commandes
Pas encore d'évaluation
Guide complet sur LaTeX et ses commandes
4 pages
Controle
Pas encore d'évaluation
Controle
2 pages
Initiation à LATEX pour étudiants
Pas encore d'évaluation
Initiation à LATEX pour étudiants
46 pages
Romari
Pas encore d'évaluation
Romari
6 pages
TP La 014740
Pas encore d'évaluation
TP La 014740
9 pages
Application de Recherche d'Emploi Big Data
Pas encore d'évaluation
Application de Recherche d'Emploi Big Data
5 pages
Guide Latex FR
100% (1)
Guide Latex FR
281 pages
Liste Projets m1s8 Mti+Ishm-24-25
Pas encore d'évaluation
Liste Projets m1s8 Mti+Ishm-24-25
42 pages
TP Langages Web : HTML et CSS
Pas encore d'évaluation
TP Langages Web : HTML et CSS
2 pages
Initiation à LATEX pour étudiants
Pas encore d'évaluation
Initiation à LATEX pour étudiants
46 pages
Navigation Universitaire avec Python et Graphes
Pas encore d'évaluation
Navigation Universitaire avec Python et Graphes
13 pages
Cours Latex
Pas encore d'évaluation
Cours Latex
136 pages
Scraper Airbnb avec Python et Scrapy
Pas encore d'évaluation
Scraper Airbnb avec Python et Scrapy
8 pages
Web Scraping
Pas encore d'évaluation
Web Scraping
15 pages
Rédiger un rapport avec LaTeX
Pas encore d'évaluation
Rédiger un rapport avec LaTeX
9 pages
TP Initlatex
Pas encore d'évaluation
TP Initlatex
46 pages
Guide Pratique pour Débuter avec LaTeX
Pas encore d'évaluation
Guide Pratique pour Débuter avec LaTeX
36 pages
Guide Simplifié de Beamer en Français
Pas encore d'évaluation
Guide Simplifié de Beamer en Français
26 pages
Guide de configuration LaTeX et marges
Pas encore d'évaluation
Guide de configuration LaTeX et marges
2 pages
TP - 4 - Énoncé - Version 1
Pas encore d'évaluation
TP - 4 - Énoncé - Version 1
3 pages
Bioénergétique et Réactions Métaboliques
Pas encore d'évaluation
Bioénergétique et Réactions Métaboliques
3 pages
Exporter une feuille Excel en PDF
Pas encore d'évaluation
Exporter une feuille Excel en PDF
1 page
Projet Afaire Java
Pas encore d'évaluation
Projet Afaire Java
2 pages
Rapport de Stage de Fin de Formation M
Pas encore d'évaluation
Rapport de Stage de Fin de Formation M
15 pages
Exporter une feuille Excel en PDF
Pas encore d'évaluation
Exporter une feuille Excel en PDF
1 page
Formation Complete Excel VBA
Pas encore d'évaluation
Formation Complete Excel VBA
8 pages
Correction SN Inf 111 - 2 2025 Auteur Disclaimer: EC 2: Programmation en Langage C
Pas encore d'évaluation
Correction SN Inf 111 - 2 2025 Auteur Disclaimer: EC 2: Programmation en Langage C
4 pages
Plan de Cours AEC Big Data
Pas encore d'évaluation
Plan de Cours AEC Big Data
18 pages
Cours de programmation en Delphi
Pas encore d'évaluation
Cours de programmation en Delphi
20 pages
Exercices-Ordonnancement (Partie 1)
Pas encore d'évaluation
Exercices-Ordonnancement (Partie 1)
2 pages
Programmation en Python
Pas encore d'évaluation
Programmation en Python
2 pages
Variables et Constantes en Algorithme
Pas encore d'évaluation
Variables et Constantes en Algorithme
5 pages
Test d'Algorithmique Avancée 2015-2016
Pas encore d'évaluation
Test d'Algorithmique Avancée 2015-2016
2 pages
TP4: Gestion des Interruptions GPIO
Pas encore d'évaluation
TP4: Gestion des Interruptions GPIO
17 pages
Didactique de L'informatique-Concepts Generaux
Pas encore d'évaluation
Didactique de L'informatique-Concepts Generaux
13 pages
Mapping or 6
Pas encore d'évaluation
Mapping or 6
16 pages
Serie TD1
Pas encore d'évaluation
Serie TD1
2 pages
CV Brahim Azougagh
Pas encore d'évaluation
CV Brahim Azougagh
2 pages
Quiz 092818
Pas encore d'évaluation
Quiz 092818
8 pages
Méthodes itératives pour systèmes linéaires
Pas encore d'évaluation
Méthodes itératives pour systèmes linéaires
4 pages
Structures de données en programmation
Pas encore d'évaluation
Structures de données en programmation
24 pages
Devenir Un (E) Bon Développeur Node - Js ??
100% (1)
Devenir Un (E) Bon Développeur Node - Js ??
103 pages
Correction (1) Converti
50% (2)
Correction (1) Converti
41 pages
Persistance des données sur Android
Pas encore d'évaluation
Persistance des données sur Android
39 pages
Programmation Assembleur PIC16F87x
Pas encore d'évaluation
Programmation Assembleur PIC16F87x
2 pages
Introduction au langage SQL et SGBDR
Pas encore d'évaluation
Introduction au langage SQL et SGBDR
147 pages
TP1 : Algorithmiques et Conventions INF1005D
Pas encore d'évaluation
TP1 : Algorithmiques et Conventions INF1005D
7 pages
Structures conditionnelles en algorithmique
Pas encore d'évaluation
Structures conditionnelles en algorithmique
3 pages
RX Logic
Pas encore d'évaluation
RX Logic
13 pages
Fonctions du Moteur d'Expression
Pas encore d'évaluation
Fonctions du Moteur d'Expression
15 pages
FSEG LMD1-Intervention 1, 2 Cours D'initiation
Pas encore d'évaluation
FSEG LMD1-Intervention 1, 2 Cours D'initiation
211 pages
Guide des Commandes Shell
Pas encore d'évaluation
Guide des Commandes Shell
1 page
Introduction à TypeScript et Angular
Pas encore d'évaluation
Introduction à TypeScript et Angular
68 pages
Chapitre05 POO Java
Pas encore d'évaluation
Chapitre05 POO Java
67 pages
Cours Microprocesseur 8086 - ++++
Pas encore d'évaluation
Cours Microprocesseur 8086 - ++++
95 pages