Académique Documents
Professionnel Documents
Culture Documents
20 janvier 2024
ii
Table des matières
4 XPath 7
4.1 Qu’est-ce que XPath ? . . . . . . . . . . . . . . . . . . . . . . 7
4.2 Utilisation de XPath pour naviguer dans le DOM . . . . . . . 7
4.3 Extraire des données en utilisant XPath . . . . . . . . . . . . 7
5 Introduction à Selenium 9
5.1 Présentation de Selenium . . . . . . . . . . . . . . . . . . . . . 9
5.2 Installation et configuration de Selenium . . . . . . . . . . . . 9
5.3 Utilisation de Selenium pour l’automatisation du navigateur . 9
iii
iv TABLE DES MATIÈRES
7 Introduction à Scrapy 13
7.1 Présentation de Scrapy . . . . . . . . . . . . . . . . . . . . . . 13
7.2 Installation et configuration de Scrapy . . . . . . . . . . . . . 13
7.3 Structure de base d’un projet Scrapy . . . . . . . . . . . . . . 13
12 Fondamentaux de Splash 23
12.1 Qu’est-ce que Splash ? . . . . . . . . . . . . . . . . . . . . . . 23
12.2 Installation et configuration de Splash . . . . . . . . . . . . . 23
12.3 Utilisation de Splash pour le scraping de sites web basés sur
JavaScript . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Bibliographie 27
vi TABLE DES MATIÈRES
Chapitre 1
1
2 CHAPITRE 1. INTRODUCTION AU WEB SCRAPING
Chapitre 2
3
4 CHAPITRE 2. INTRODUCTION À BEAUTIFUL SOUP
Chapitre 3
5
6CHAPITRE 3. SCRAPING DE PLUSIEURS PAGES AVEC BEAUTIFUL SOUP
Chapitre 4
XPath
7
8 CHAPITRE 4. XPATH
Chapitre 5
Introduction à Selenium
9
10 CHAPITRE 5. INTRODUCTION À SELENIUM
Chapitre 6
11
12CHAPITRE 6. PROJET 2 : INFINITE SCROLLING & LOGIN (TWITTER BOT)
Chapitre 7
Introduction à Scrapy
13
14 CHAPITRE 7. INTRODUCTION À SCRAPY
Chapitre 8
15
16 CHAPITRE 8. GÉRER PLUSIEURS PAGES AVEC SCRAPY
Chapitre 9
Projet 3 : Construction de
Crawlers avec Scrapy
17
18CHAPITRE 9. PROJET 3 : CONSTRUCTION DE CRAWLERS AVEC SCRAPY
Chapitre 10
19
20CHAPITRE 10. EXPORTATION DE DONNÉES VERS UNE BASE DE DONNÉES : MON
Chapitre 11
21
22CHAPITRE 11. SCRAPING D’APIS & CONNEXION À UN SITE WEB AVEC SCRAPY
Chapitre 12
Fondamentaux de Splash
23
24 CHAPITRE 12. FONDAMENTAUX DE SPLASH
Chapitre 13
25
26CHAPITRE 13. PROJET 4 : SCRAPING DE SITES WEB JAVASCRIPT AVEC SPLASH
Bibliographie
27
28CHAPITRE 13. PROJET 4 : SCRAPING DE SITES WEB JAVASCRIPT AVEC SPLASH
Bibliographie
Lawson, Richard (2015). Web scraping with Python. Packt Publishing Ltd.
29