Vous êtes sur la page 1sur 2

# Liste de mots vides à supprimer

mots_vides = ["le", "la", "de", "du", "un", "une", "des", "et", "ou", "mais",
"donc", "car", "si", "que"]

1)# Ouverture du fichier en mode lecture


fichier = open("chemin/vers/votre/fichier", "r")

2)# Lecture de toutes les lignes et suppression des mots vides


contenu = fichier.readlines()
contenu_sans_mots_vides = []

for ligne in contenu:


mots = ligne.split()
nouveaux_mots = []
for mot in mots:
if mot.lower() not in mots_vides:
nouveaux_mots.append(mot)
contenu_sans_mots_vides.append(nouveaux_mots)

# Fermeture du fichier d'entrée


fichier.close()

3)# Comptage du nombre d'occurrences de chaque mot


compteur_mots = Counter()

for ligne in contenu_sans_mots_vides:


for mot in ligne:
compteur_mots[mot] += 1

4)# Sélection des 5 mots les plus fréquents


top_5_mots = compteur_mots.most_common(5)

# Ouverture d'un nouveau fichier en mode écriture


fichier_top_5_mots = open("chemin/vers/votre/fichier_top_5_mots", "w")

# Écriture des 5 mots les plus fréquents dans le nouveau fichier


for mot, nombre in top_5_mots:
fichier_top_5_mots.write("{} : {}\n".format(mot, nombre))

# Fermeture du fichier de sortie


fichier_top_5_mots.close()
program python pour SRI

import re
import collections

1)Ouvrir le fichier
with open('mon_fichier.txt', 'r') as f:
// Lire le contenu du fichier
contenu = f.read()

2) Segmenter le contenu en sous-chaînes de mots


mots = re.findall(r'\b\w+\b', contenu)

3)Trier les mots par ordre alphabétique


mots_tries = sorted(mots)

4)Supprimer les mots vides


mots_non_vides = [mot for mot in mots_tries if mot]

// Utiliser la bibliothèque collections pour compter les occurrences de chaque mot


comptes = collections.Counter(mots_non_vides)

5) Trouver les 5 mots les plus fréquents


top_cinq_mots = comptes.most_common(5)

6) Afficher les 5 mots les plus fréquents


print("Les 5 mots les plus fréquents sont :")
for mot, occurences in top_cinq_mots:
print(f"{mot} : {occurences}")

Vous aimerez peut-être aussi