TD Pyspark

Transféré par

Ahmed Yassine

0% ont trouvé ce document utile (0 vote)

37 vues2 pages

exercice pyspark

Titre original

TD pyspark

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

exercice pyspark

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

37 vues2 pages

TD Pyspark

Transféré par

Ahmed Yassine

exercice pyspark

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 2

Rechercher à l'intérieur du document

TD 1 : Traitement des données avec Spark

Exercice 1 :
Ecrire un programme python qui permet de :
❑ Créer une session Spark nommée « Magasin »
❑ Créer un RDD nommé « commande » partir d’un fichier « datasets/commandes.csv »
❑ Afficher les 10 premières commandes.
❑ Arrêter de la session Spark

Exercice 2 :
Soit le schéma de données suivant :
date,produit,montant,quantité
2024-01-01,Ordinateur portable,1200,2
2024-01-02,Smartphone,800,3
2024-01-03,Tablette,500,1
2024-01-04,Ordinateur portable,1500,2
2024-01-05,Smartphone,900,2

Ecrire un programme python qui permet de :

❑ Créer une session Spark nommée « Entreprise »
❑ Créer un DataFrame nommée « ventes » à partir d'un fichier CSV contenant des
données de ventes « /datasets/ventes.csv ».
❑ Affichez le schéma du DataFrame avec la méthode « printSchema() »
❑ Affichez les 5 premières ventes du DataFrame.
❑ Filtrer les ventes où le montant est supérieur à 1000.
❑ Calculez le montant total des ventes par produit.
❑ Trouvez le produit le plus vendu.
Exercice 3 :
Ecrire un programme python qui permet de :

❑ Créer une vue temporaire à partir du DataFrame nommée « ventes » chargé dans
l'exercice précédent.

Écrivez une requête SQL pour :

❑ Lister les produits et le montant de chaque produit.

❑ Afficher les produits dont le montant est supérieur à 3000.
❑ Calculer le montant total des ventes par produit.
❑ Calculer le montant total des ventes.
❑ Filtrer les ventes où le montant est supérieur à 1000 et trier par date.

Vous aimerez peut-être aussi

Exos Recap
Document7 pages
Exos Recap
Wilfreed Minfoundi Manguele
Pas encore d'évaluation
Atelier Access #2 PDF
Document6 pages
Atelier Access #2 PDF
Ayoub Mahi
Pas encore d'évaluation
Devoir
Document2 pages
Devoir
Idriss Longo
Pas encore d'évaluation
TP3: Base de Données Relationnelles Sous Oracle: Déclencheurs)
Document2 pages
TP3: Base de Données Relationnelles Sous Oracle: Déclencheurs)
abc 123
Pas encore d'évaluation
Exemple BD Stock
Document7 pages
Exemple BD Stock
Khalid Seddik
Pas encore d'évaluation
TP 2 Bda
Document2 pages
TP 2 Bda
ahmed00400
Pas encore d'évaluation
TP Vues
Document1 page
TP Vues
Roseline Luong
Pas encore d'évaluation
Mini Projet
Document3 pages
Mini Projet
Fatima Asebbane
Pas encore d'évaluation
TP #2: Modélisation Power BI Et Langage DAX
Document1 page
TP #2: Modélisation Power BI Et Langage DAX
hafida ait abed
Pas encore d'évaluation
TP4: Base de Données Relationnelles Sous Oracle: Déclencheurs)
Document3 pages
TP4: Base de Données Relationnelles Sous Oracle: Déclencheurs)
FAMFA ILYASSE
Pas encore d'évaluation
tp2 transactSQL
Document1 page
tp2 transactSQL
Hamza Yamid
Pas encore d'évaluation
TP3 Les Procédures Stockées
Document2 pages
TP3 Les Procédures Stockées
Jacqueline GBEDEVI
Pas encore d'évaluation
TP N°2: PHP: Prérequis
Document4 pages
TP N°2: PHP: Prérequis
alphonsojados
Pas encore d'évaluation
Informatique
Document4 pages
Informatique
Kawtar Jbari
Pas encore d'évaluation
TD ASDLesEnregistrements2014
Document2 pages
TD ASDLesEnregistrements2014
Nour Allah tabib
Pas encore d'évaluation
PowerBI BOUFARES TP6
Document2 pages
PowerBI BOUFARES TP6
yosri grira
Pas encore d'évaluation
TP4 Correction
Document6 pages
TP4 Correction
Hind Mezouari
Pas encore d'évaluation
TP 15 Microsoft Access
Document1 page
TP 15 Microsoft Access
Nabila Touisi
Pas encore d'évaluation
TP1 Correction
Document7 pages
TP1 Correction
abc 123
Pas encore d'évaluation
TP2 - DW
Document10 pages
TP2 - DW
Dou Nia
Pas encore d'évaluation
Sgbd1 Td5 Cor
Document4 pages
Sgbd1 Td5 Cor
haggarfils
Pas encore d'évaluation
Guide Des TPs M09 - DVPT Client - Serveur - Linq, Connecté Et Deconnecté - CSharp
Document66 pages
Guide Des TPs M09 - DVPT Client - Serveur - Linq, Connecté Et Deconnecté - CSharp
Radouane El Asri
100% (1)
TP1 Correction
Document7 pages
TP1 Correction
Zakaria Touyeb
Pas encore d'évaluation
Base Données Partie 2
Document77 pages
Base Données Partie 2
Manelle Bouyahyi
Pas encore d'évaluation
tp3 transactSQL Correction
Document7 pages
tp3 transactSQL Correction
zakariae harime
Pas encore d'évaluation
Corrigée Série N°5
Document9 pages
Corrigée Série N°5
EL AYACHI zakariae
Pas encore d'évaluation
Devoir Surveillé Algorithmique Et Structures de Données
Document3 pages
Devoir Surveillé Algorithmique Et Structures de Données
createursite
Pas encore d'évaluation
Serie1 GD
Document1 page
Serie1 GD
Oumaima Al
Pas encore d'évaluation
Examen Sid Ricm3 0102
Document4 pages
Examen Sid Ricm3 0102
gridech
Pas encore d'évaluation
Examen15 16
Document2 pages
Examen15 16
zayd
Pas encore d'évaluation
Facturation
Document8 pages
Facturation
FadhilaCeline
Pas encore d'évaluation
TP1: Oracle: Base de Données Relationnelles Et Langage SQL
Document5 pages
TP1: Oracle: Base de Données Relationnelles Et Langage SQL
Zakaria Touyeb
Pas encore d'évaluation
Bac Blanc TTI Prog
Document3 pages
Bac Blanc TTI Prog
nana charles cédrick
Pas encore d'évaluation
Ex2 02
Document7 pages
Ex2 02
FSE TICE
Pas encore d'évaluation
TD4 SQL
Document3 pages
TD4 SQL
abdel america
Pas encore d'évaluation
Concept DW
Document58 pages
Concept DW
Aboulfadl Mustapha
Pas encore d'évaluation
TD 2 - Structures
Document3 pages
TD 2 - Structures
Warda Flora
Pas encore d'évaluation
Big Data
Document34 pages
Big Data
Asma Tekitek
Pas encore d'évaluation
Série Synthese
Document2 pages
Série Synthese
ziko ch
Pas encore d'évaluation
TP3
Document3 pages
TP3
FAMFA ILYASSE
Pas encore d'évaluation
TP XML Facturation V1
Document7 pages
TP XML Facturation V1
Anouar Attn
Pas encore d'évaluation
TP2 Est
Document1 page
TP2 Est
salmasaffir1
Pas encore d'évaluation
Travaux Pratique 2
Document3 pages
Travaux Pratique 2
Thierry Bamba
Pas encore d'évaluation
Etude de Cas Examen Informatique
Document6 pages
Etude de Cas Examen Informatique
EL KTIRI LAHOUSSINE
Pas encore d'évaluation
CBD Examen
Document3 pages
CBD Examen
Paul Essong
Pas encore d'évaluation
TP3: Manipulation Des Vues Et Interaction Entre Les Couches Contrôleur-Vue
Document6 pages
TP3: Manipulation Des Vues Et Interaction Entre Les Couches Contrôleur-Vue
BOUZAZI
Pas encore d'évaluation
Bilal Mohamed Ismail
Document33 pages
Bilal Mohamed Ismail
Houssein Amin
Pas encore d'évaluation
React Js Online Shopping
Document18 pages
React Js Online Shopping
mohamedezzaraoui1
Pas encore d'évaluation
PL TP1
Document4 pages
PL TP1
Mohamed Maddouri
50% (2)
DW TP2
Document1 page
DW TP2
traore faly
Pas encore d'évaluation
TP SQL 2023
Document2 pages
TP SQL 2023
Aymane Berka
Pas encore d'évaluation
Access - Requete
Document29 pages
Access - Requete
Brahim Tebbaâ
Pas encore d'évaluation
tp1 Premiereutilisationdeopenerp
Document8 pages
tp1 Premiereutilisationdeopenerp
Bader El kefi
Pas encore d'évaluation
Bac Pratique 25052022 Eco Corrige1
Document4 pages
Bac Pratique 25052022 Eco Corrige1
Kaydo amv
Pas encore d'évaluation
TP 2
Document7 pages
TP 2
Olivia Adouko
Pas encore d'évaluation
tp1 Hadoop Mapreduce 2023
Document5 pages
tp1 Hadoop Mapreduce 2023
mohamedfarouk.hamadi
100% (1)
Serie 2
Document2 pages
Serie 2
yassineGR
Pas encore d'évaluation
Examen Sid Ricm3 0102 PDF
Document4 pages
Examen Sid Ricm3 0102 PDF
Fadi
Pas encore d'évaluation
TD PLSQL
Document2 pages
TD PLSQL
Imane Rachid
Pas encore d'évaluation
introduction a la cryptomonnaie
D'Everand
introduction a la cryptomonnaie
fraidji ahcene
Pas encore d'évaluation