Académique Documents
Professionnel Documents
Culture Documents
Introduction
qu'il y a différents programmes qui utilisent les expression régulières ; grep, expr, awk, sed,
Perl, Tcl, Python, PHP, Java… Il s'agira ici de ceux utilisables en ligne de commandes GNU/Linux.
que certains des métacaractères reconnus par les shells UNIX (bash, ksh, csh, sh, etc.), sont
homonymes avec certains caractères des ER, et qui plus est, ils servent le même objectif de
fournir des motifs de recherche. Mais ils ne font pas partie de ce qu'on appelle les expressions
rationnelles et ne doivent pas être confondus avec elles.
que la syntaxe introduisant une ER n'est pas la même d'un programme de ligne de commandes
GNU/Linux à l'autre.
Enfin, les différents programmes susceptibles d'utiliser toutes les ER de la bibliothèque REGEX,
vi, expr, grep, egrep, find, locate, sed, awk, transforment le contexte d'utilisation de l'ER et par
conséquent, l'utilisation d'une même ER n'a plus le même effet d'un programme à l'autre.
Ces deux derniers points sont rarement mis en avant, il est pourtant crucial de les soulever, pour des
raisons autant pédagogiques, que philosophiques.
Le fondement en est simplement la certitude que le dédain envers la diversité, tandis que
l'entendement est la puissance d'éprouver l'unité cachée sous tout genre de multiple, est une
tentative qui s'ignore d'instrumentaliser la raison.
En bref, il s'agira de donner accès à l'utilisation des expressions rationnelles POSIX par la
ligne de commandes GNU/linux.
Il y en a trois :
expression rationnelle basique (ERb); appelées aussi “Basic Regular Expression” (BRE)
expression rationnelle étendue (ERe); appelées aussi “Extended Regular Expression” (ERE)
les classes POSIX (considérer soit comme ERb, soit comme ERe selon les programmes
Les raccourcis (par exemples, retour à la ligne \n, tabulation \t) étant particuliers aux programmes,
seront listés en complément.
expr : ERb
pour la correspondance de chaîne de caractères avec une expression régulière.
grep : ERb
sélectionne par la ER, la ou les lignes d'un ou plusieurs fichiers comportant le motif. grep peut
aussi rechercher les fichiers contenant le motif.
grep -E ou egrep : ERe
Même usage que grep
find : ERb en le précisant avec l'option -regextype “posix-basic” ou ERe en précisant
avec l'option -regextype “posix-extended”
rechercher de fichier en fonction du motif spécifié par la ER.
locate : ERb avec l'option - -regexp ou ERe avec l'option - -regex
recherche de fichiers selon un motif dans la base de données.
vi : ERb
recherche et substitution de chaîne de caractères.
sed : ERb
par exemple, sélectionne, modifie les chaînes d'un fichier ou de l'affichage en se basant sur les
colonnes. La ER permet de sélectionner quelle(s) colonne(s) est (sont) concernée(s).
sed -r : ERe
même usage que sed.
awk1) : ERe
sélectionne les colonnes, lignes, mots d'un fichier, et modifie l'affichage, le fichier, etc. en
utilisant la ER comme condition de l'action qu'on choisit.
Concernant chacun de ces programmes, je me limiterai strictement à leur utilisation des ER.
Pour plus de détail sur chacun d'entre eux, consulter la documentation à leur sujet.
Préparation
Il est nécessaire d'avoir dossier, sous-dossier, et des fichiers ayant ou non du contenu pour s'exercer.
Mais pas d'inquiétude, tout ce qui a été créé ou qui le sera, peut être supprimer en une ligne:
Le dossier et fichiers créés dans le dossier “ERetCMD” au cours de cette partie serviront aux
exemples d'utilisation des expressions rationnelles avec chacun des programmes GNU/Linux. Mieux
vaut ne pas les supprimer dès la fin de cette partie.
grep
Synopsis :
Les guillemets sont obligatoires lorsque MOTIF est une chaîne de caractères espacés d'un ou
plusieurs espaces.
grep -r -w Toto ~/
L'étoile :
Imaginons qu'on cherche tous les fichiers commençant par “t” contenant le caractère “e”.
tintin
titi1
titi2
tito
toto
Le motif entre guillemets (“e”) concerne la recherche dans le contenu du fichier. C'est là qu'il faut
placer l'expression rationnelle. Le motif “e” en est d'ailleurs une.
Le caractère “*” est le métacaractère qui signifie “nom de fichier commençant par “Toto” avec
n'importe quel autre caractère après ou rien après.
Le caractère ?
titi1:documentation
titi2:dent
On recherche dans les fichiers commençant par titi et suivi d'un seul caractère exactement (?),
les mots comportant “an” ou “en”.3)
L'expression rationnelle décrit : une chaîne composée de “a” ou “e”, suivi de “n”, suivi d'un seul
caractère ou non.
Les crochets ont la même signification en tant que métacaractère et en tant que ER
Pour trouver dans les fichiers commençant par “T” ou “t” suivi de “i” ou “o” suivi d'un “t” suivi de
“i” ou “o” suivi d'un caractère quelconque et un seul ;
Une chaîne comportant “T” ou “t” suivi de “i” ou “o” suivi d'un “t” suivi de “i” ou “o” :
titi1.txt:.
Toto1.txt:il a tout mangé.
find
Sans critère de recherche find affiche les fichiers du ou des répertoire(s) de recherche qu'on lui a
donné en argument :
Les critères de recherche : Utiliser les guillemets dans le critère de recherche est une bonne
habitude à prendre car cela permet d’éviter les problèmes avec les caractères génériques du Shell :
find ~ -name “*.mp3”
Voir : http://qanuq.com/exploitez-la-puissance-de-la-commande-find/
Étoile :
/home/hypathie/ERetCMD/Dossier/toto
Le point d'interrogation :
/home/hypathie/ERetCMD/Dossier/titi1
/home/hypathie/ERetCMD/Dossier/titi2
Crochets :
/home/hypathie/ERetCMD/Dossier/titi1
/home/hypathie/ERetCMD/Dossier/titi2
locate
Options:
Préparation :
Pour utiliser locate, qui fonctionne à partir de la base de donnée, faire un petit :
updatedb
Rechercher les fichiers dont le nom est “un ou plusieurs caractères suivi de ”.txt“ :
locate ~/ERetCMD/*.txt
/home/hypathie/ERetCMD/smolski-exo-sed.txt
/home/hypathie/ERetCMD/sort1.txt
/home/hypathie/ERetCMD/sort2.txt
/home/hypathie/ERetCMD/sort3.txt
sed
Adressages
cd ~/ERetCMD/Dossier/
L'expression rationnelle est constituée de l'alternative (a|e) (la sous-chaîne “a” ou “e”), suivi d'un
caractère quelconque zéro ou plusieurs fois.
Cela sera approfondit dans la partie Caractères spécifiques aux ERb ou caractères spécifiques aux
ERe
un copAin malin
modifiAnt cette page
Toto Titi toto titi tito
dAns
documentAtion
.
Toto Titi
dent
Il mAnque une option a tito
awk
Affiche les lignes dont la troisième colonne comporte un “e” ou un “E” de TOUS les fichiers du
répertoire ”~/ERetCMD/Dossier“ commençant par “smolski-”.
Le caractère ~ (tilde) est un opérateur de correspondance relevant de la commande awk.
Il permet de tester la correspondance entre la variable $3 et l'expression rationnelle encadrée de /
(/(e|E)/). Voir awk et les expressions rationnelles
3 3 CAMILLE M 7
4 3 CHLOE F 12
6 3 CLEMENT M 7
7 3 EMMA F 6
8 3 THEO M 8
toto préfère les Fraises.
titi les cerises.
Pour vi (vim), il faut avoir édité le ou les fichiers pour utiliser les expressions rationnelles, mais on
peut utiliser les métacaractères pour ouvrir plusieurs fichiers en même temps.
vim smolski-*
D'autres exemples d'utilisation des expressions rationnelles avec vim seront donnés.
Puisque tout est bien clair, nous pouvons aller plus loin, et présenter le détail des
expressions rationnelles ainsi que leur utilisation avec les programmes GNU/Linux. Cela
permettra, non seulement de distinguer ERb, ERe et classes, mais encore d'en apprécier
les différences.
Certaines commandes les utilisent soit en tant que ERb, soit en tant que ERe :
il s'agit de grep ; sed ; locate ; et find.
Sans option ou avec l'option -G, grep utilise les expressions rationnelles basiques.
grep
-G, --basic-regexp
Interpréter le MOTIF comme une expression rationnelle simple
C'est le comportement par défaut.
Pour l'utilisation de grep (grep -G ou grep -E) avec soit les caractères spécifiques aux ERb, soit les
caractères spécifiques aux ERe, voir "grep -E (egrep) et les caractères spécifiques aux ERe".
Préparation
EOF
4 5 Béatrice
Le caractère fin de ligne $
1 2 Francine
3 4 Géraldine
tout le monde
4 5 Béatrice
5 6 Christelle
5 7 Dorothée
Le point
2 3 Édith
L'étoile
1 2 Francine
2 3 Édith
3 4 Géraldine
123 AAAAAA
tout le monde
partout
toutefois
4 5 Béatrice
5 6 Christelle
5 7 Dorothée
6 8 Amanda
Autre exemple :
123 AAAAAA
Les crochets
2 3 Édith
3 4 Géraldine
123 AAAAAA
4 5 Béatrice
Chaîne qui commence ni par 1, ni par 2, ni par aucun des caractères entre crochets.
tout le monde
partout
toutefois
123 AAAAAA
tout le monde
toutefois
toutefois
tout le monde
find
-regextype type
Définir la syntaxe des expressions rationnelles des tests -
regex
et -iregex qui seront indiqués plus loin sur la ligne de
com‐
mande. Les types actuellement implémentés sont emacs (type par
défaut), posix-awk, posix-basic, posix-egrep et posix-extended.
Avec find, il faut toujours une option pour utiliser une ER.
Je ne donnerai ici quelques exemples d'utilisation des caractères communs aux ERb et ERe, en tant
que caractères ERb, afin d'illustrer l'utilisation de find avec l'option -regextype “posix-basic.
Pour l'utilisation des caractères spécifiques aux ERb ou des caractères spécifiques aux ERe avec find,
voir : "find et les caractères spécifiques aux ERe".
ls
./liste2-nom
./liste1-nom
./liste4-vim
Le premier groupe de .* décrit le chemin du ou des fichiers dont le nom correspond à une chaîne
commençant par “li”, suivi de plusieurs caractères (deuxième groupe .*), puis d'un “m”.
La même commande lancée depuis un répertoire plus en amont dans la hiérarchie, par exemple,
depuis le répertoire personnel de l'utilisateur,et non depuis le répertoire parent des fichiers :
./liste2-nom
./liste1-nom
./liste4-vim
./.config/libreoffice/3/user/gallery/sg100.thm
./.config/libreoffice/3/user/gallery/sg30.thm
Dans le répertoire “~/ERetCMD/”, les fichiers comportant un “e” ou un “s”, plusieurs caractères, un
point littéral (\.), plusieurs caractères :
./Dossier/smolski-sed.txt
./Dossier/smolski-awk.txt
./smolski-exo-sed.txt
./server-0.xkb
./sort3.txt
./sort1.txt
./sort2.txt
Pour utiliser les ER avec locate, il faut dans tous les cas une option.
Les caractères communs aux ERb et ERe, peuvent être utilisés avec l'une ou l'autre de ces options :
locate
--regexp REGEXP
Search for a basic regexp REGEXP. No PATTERNs are allowed if
this option is used, but this option can be specified multiple
times.
Pour utiliser ces mêmes caractères en tant que ERe il faut utiliser l'option :
locate
--regex
Interpret all PATTERNs as extended regexps
Sans l'une ou l'autre de ces options, locate reconnaît le caractère * comme un métacaractère du
shell.
⇒ Encore une fois, si on choisit d'utiliser les ERb, il faudra un antislash pour utiliser les caractères
spécifiques aux ERb et ce sera inutile si on choisit les ERe.
Contrairement à find, il n'est pas nécessaire que la ER corresponde au chemin absolu d'un
fichier.
Mais la quantité de réponses peut être très élevée, et si l'on a une idée du répertoire dans lequel se
trouve le fichier recherché, il peut plus confortable de le préciser.
On peut aussi filtrer le retour avec grep.
En effet, avec une commande qui recherche des noms de fichier, la seule possibilité serait ^/. Or
locate permet justement de ne pas avoir à donner le chemin absolu du fichier recherché. L'utiliser ne
ferait qu'allonger inutilement l'expression régulière !
updatedb
Étoile et point :
/home/hypathie/ERetCMD/Dossier/Toto.txt
/home/hypathie/ERetCMD/Dossier/Toto1.txt
/home/hypathie/ERetCMD/Dossier/tito
/home/hypathie/ERetCMD/Dossier/toto
Caractère fin de ligne $ :
/home/hypathie/ERetCMD/Dossier/Toto.txt
/home/hypathie/ERetCMD/Dossier/Toto1.txt
/home/hypathie/ERetCMD/smolski-exo-sed.txt
/home/hypathie/ERetCMD/Dossier/smolski-awk.txt
/home/hypathie/ERetCMD/Dossier/smolski-sed.txt
Le caractère étoile :
1 2 Francine
2 3 Édith
3 4 Géraldine
123 COUCOU
tout le monde
partout
toutefois
4 5 Béatrice
5 6 Christelle
5 7 Dorothée
6 8 Amanda
Le caractère fin de mot :
Par exemple, tout supprimer sauf (!)9) la ligne correspondant à un mot finissant par “fois” :
toutefois
Si la signification des caractère est la même, l'action de la commande modifie “la phrase”, ou le sens
global de la ER.
Comparer l'usage des [^ ] de grep avec ce qui suit :
12 f 6 7
Il ne se passe rien car avec sed la signification de la ER est : “substitue le caractère de début de la
ligne qui ne commence pas par l'un des caractères '1234567'”.
sed ne cherche pas comme grep une chaîne ou un cataère qui “ne commence pas par l'un des
caractères '1234567'”, et ne substituerait pas “f” de cette manière.
Ainsi :
X12XXX6X7
Il ne faut donc pas s'imaginer que sed utilise une version non posix des ER, telle que la littérature à
son sujet l'alimente parfois.
Ce n'est que pour ce qui concerne les implantations GNU qui ne sont pas posix, que sed présente
quelques bizarreries.
Rien d'obscure et pas d'obscurantisme, tout reste logique, à condition de savoir en changer… C'est
là ce qui rend passionnant l'utilisation d'un méta-langage, la possibilité de la différence par delà
l'identité des éléments, au moyen du contexte !
La commande awk travail sur les colonnes, les lignes, les mots, et constitue un langage de
programmation. Je ne rappellerai pas toutes les fonctions de awk mais présenterai seulement
comment utiliser les ER pour une utilisation basique de cette commande.
L'usage le plus simple d'awk consiste à utiliser une ER pour sélectionner une chaîne.
Le contenu des champs sont enregistrés dans les variables $1, $2, $3, …, correspondant aux colonnes
1, 2, 3, …
L'étoile :
AAAAAA
Notez qu'il s'agit bien du caractère * qui signifie “une ou plusieurs fois 'A', et non du métacaratère
*.
Notez encore que cet exemple est un peu surfait. Il ne sert qu'à vérifier si la ER est juste, et à
rappeler la syntaxe d'utilisation d'une ER avec awk. C'est que awk ne sert pas à vérifier l'exactitude
d'une ER. Au contraire la ER sert de condition (correspondance de la chaîne AAAAAA avec A* ) pour
effectuer une action (ici imprimer, c'est-à-dire afficher la colonne n°2).
Néanmoins, cet exemple permet d'insister encore une fois : il est important de bien comprendre
que la signification globale d'une ER dépend du contexte créé par les commandes.
Modifions l'exemple ci-dessus, afin de comparer l'utilisation d'une ER dans le contexte de awk avec
celui de sed.
Rappel :
X12XXX6X7
Afficher le champ n°2 ($2) si la ER ( “tout ce qui n'est pas 1, 2, 3, 4, 5, 6, 7”) est vraie.
Ce qui rend difficile l'utilisation des ER n'est peut-être pas de savoir “traduire” une expression littérale
par l'association de plusieurs caractères symboliques. C'est bien plutôt la “mouvance” de l'effet de
cette “traduction”, effet qui n'est pas le même selon telle ou telle commande utilisée.
Chaque commande crée un contexte différents qui détermine l'usage des ER.
Si l'utilisation des ER est souvent déprécié, c'est pour une bonne part parce que leurs différents
contextes ne sont jamais mis en confrontation.
Mais une fois ces contextes précisés, et une fois s'être exercé à passer de l'un à l'autre, l'utilisation
des ER devient bien plus facile.
cat liste1-nom
1 2 Francine
2 3 Édith
3 4 Géraldine
123 AAAAAA
tout le monde
partout
toutefois
4 5 Béatrice
5 6 Christelle
5 7 Dorothée
6 8 Amanda
Affiche la ligne ou les lignes dont la colonne n°1 correspond à la ER (“qui commence par 4”).
4 5 Béatrice
L'action par défaut est print, s'il aucune action n'est mentionnée et que la condition est vraie.
Le caractère tilde ~ est un opérateur de correspondance entre une ER et une variable.
Il ne s'agit pas du tilde qui symbolise le répertoire personnel de l'utilisateur.
Et ce n'est pas un caractère qui fait partie des caractères des expressions rationnelles.
L'opérateur de correspondance appartient à awk, et fait partie des opérateurs de tests < ; > ; == …
4 5 Béatrice
Affiche la ou les lignes dont le troisième champ (colonne) comporte une chaîne correspondant à
“un caractère (.), suivi d'un d, suivi d'un ou plusieurs caractères (.*).
2 3 Édith
3 4 Géraldine
tout le monde
6 8 Amanda
Les crochets :
2 3 Édith
5 7 Dorothée
Exclusion [^ ] :
tout le monde
partout
toutefois
tout le monde
partout
toutefois
Début et fin de mot :
toutefois
Syntaxe
Exemples
var=123
“3” ne doit pas être confondu avec un code de retour, c'est le nombre de caractères de la variable
qui correspondent à ER.
echo $?
echo $?
Le chiffre “1” est le code de retour : pas de correspondance, donc code d'erreur.
les bonbons
Demander le code de retour est inutile, la ER est forcément juste, s'il y a affichage de la sous-
chaîne correspondante. À moins d'en avoir besoin lors d'une utilisation de expr dans un script shell
s'en servant pour un test.
Le mode normal: celui dans lequel vous êtes à l'ouverture du fichier. Il permet de taper des
commandes.
Par exemple, la commande :q! pour sortir sans enregistrer ;
la commande :wq pour enregistrer et sortir
Le mode insertion: Ce mode permet d'insérer les caractères que vous saisissez à l'intérieur
du document. Pour passer en mode insertion, il suffit d'appuyer sur la touche “i” ; touche
“Échap” pour en sortir.
vimtutor
vi liste4-spec
ou
vim liste4-spec
/expression-rationnelle-basique
substitution d'une occurrence (depuis le mode interactif passer en mode commande (:) :
:[adresse[,adresse]]s/expression-rationnelle-basique/remplacement/[drapeau]
:adresse%s/chaine_a_remplacer/chaine_de_remplacement/
g - drapeau - remplacer toutes les occurrences de le ER (si cette option n'est pas utilisée, vi
substituera que la prochaine occurrence du motif)
Exemples de recherches
/^chose
On appuie sur la touche shift+: pour inscrire /, on inscrit sa ER, on valide avec la touche “entrée”. vi
ou vim surligne toutes les occurrences de “chose” qui sont en début de ligne.
:nohlsearch
Le caractère fin de ligne $
/chose$
Exemples de substitution
Crochets :
:s/[Ss]/XXX/g
Substitue les caractères “S” ou “s” à la ligne du curseur et surligne toutes les occurrences
potentiellement substituables.
:nohlsearch pour retirer la surbrillance.
puis pour annuler la substitution “Échap” (pour être sûr de ne pas être en mode insertion), puis
appuyer sur la lettre “u” (“u” pour annuler un seul changement, (“U” pour annuler plusieurs
changements).
:1,$s/[Ss]/XXX/g
/\([0-9]\{3\}.\)\{2\}\.
Je présenterai ensuite les commandes “à option” qui utilisent tous les caractères spécifiques aux ERb,
mais qui peuvent aussi utiliser ces mêmes caractères10) sans antislash avec les ERe.
Ainsi tous les caractères des expressions rationnelles auront été abordés ainsi que leurs divers
contextes d'utilisation. Il ne restera plus qu'à présenter les classes.
Toutes les commandes utilisant les expressions rationnelles basiques utilisent les caractères
énumérés ci-dessous.
Les commandes grep (ou grep -G) ; find -regextype “posix-basic” ; locate –regexp ;
sed; vi utilisent en plus ces caractères ci-dessous :
→ Le caractère \ donne une signification spéciale aux parenthèses et accolades, ?, +, | au lieu de les
rendre littérales.
Mais il permet de rendre littéraux les autres caractères des ERb, par exemple \. permet de
sélectionner un point.
Les caractères spécifiques aux ERe sont utilisables avec les commandes :
Bien évidemment tous les caractères communs aux ERb et ERe sont utilisables avec ces commandes
et ces options.
Rappel :
cat liste4-spec
gdd:a:aa:aaa:aaaa:aaaaaa:aaaaaaaa
T5c Kc5 T5 c E2* abcd 7 9Abcd
7 1AAA.AAA.bcdef aBcd6a 123*
abc2356.99
73000|Savoie
123456
1234567
index-tel|04|Rhône-Alpe
-15 +36 5687 {15} exemple{36}
il y a un truc et un truc et encore un truc et une chose
choses et trucs ne font pas bon ménage
123.3456.abc
trucschosetruc
tructructrucs
chosechosechose
Syntaxe :
Exemple
var=123.456.
456.
vi (vim) utilise tous les caractères communs aux ERb et ERe, tous les caractères spécifiques aux ERb,
y compris ceux ci-dessous (comme “les commandes à option” permettant de choisir le type ER):
\? zéro ou une fois l'élément précédent
\+ une ou plusieurs fois l'élément précédent
Documentation - Wiki - http://debian-facile.org/
Last
update:
utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes http://debian-facile.org/utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes
13/11/2014
14:05
\| alternative
vi liste4-vim
ou
vim liste4-vim
utilisation de \|
/c\|t
Utilisation de \?
/\.[0-9]\?
→ Là aussi :
Utilisation de \+
/[A-Z]\+
→ Là aussi :
La substitution sous vi et vim est très proche de sed. Je ne développerai pas d'avantage.
En plus des ERb, vi et vim utilisent quelques raccourcis.
\d - chiffres de 0 à 9
\n - nouvelle ligne
http://www.olivierpons.fr/2010/08/05/vim-expressions-regulieres-rechercher-remplacer-memo/
http://switzernet.com/3/public/110324-training-vi-regex/
awk (gawk) utilise seulement les expressions rationnelles étendues; voir awk, les ERe et les classes
Préparation
gdd:a:aa:aaa:aaaa:aaaaaa:aaaaaaaa
T5c Kc5 T5 c E2* abcd 7 9Abcd
7 1AAA.AAA.bcdef aBcd6a 123*
abc2356.99
73000|Savoie
123456
1234567
index-tel|04|Rhône-Alpe
-15 +36 5687 {15} exemple{36}
il y a un truc et un truc et encore un truc et une chose
choses et trucs ne font pas bon ménage
123.3456.abc
trucschosetruc
tructructrucs
chosechosechose
il possible avec grep d'utiliser aussi les caractères spécifiques aux ERb.
Par exemple :
ou
Parenthèses
abc2356.99
73000|Savoie
-15 +36 5687 {15} exemple{36}
123.3456.abc
Le caractère + et parenthèses
Le caractère ?
Le caractère d'alternative |
Rappel
Sans option et avec l'antislash le signification de ces caractères sont les mêmes que lors de leur
utilisation avec l'option -r.
Exemples
coucou OK Yep
echo "a aa aaa aaaa aaaaaa aaaaaaaa" | sed -re 's/(a{1} )/OK/'\
-e 's/(a{2} )/OK/'
Rappel
Pour les caractères [ ] { } ? + , on peut là aussi choisir les ERb en mettant un antislash devant.
Pour ce faire, il faut alors utiliser l'option -regextype “posix-basic” .
Préparation
Exemples
./img-perso-2.jpg
./img-perso-1.jpg
ou
./img-perso-2.jpg
./img-perso-1.jpg
Le caractère ? :
./ERetCMD/liste1
./ERetCMD/liste
./ERetCMD/liste2
./liste2-nom
./liste1-nom
./liste3-erb-ere
./liste4-vim
./liste1
./liste4-spec
./liste2
./liste-class
Rappel
updatedb
Exemples
D'autres fichiers que ceux du répertoire “~/ERetCMD/” et créés pour les exemples peuvent
apparaître.
ou
Caractère ? :
/home/hypathie/Documents/PYTHON/python2/chap06/liste_et_branch.py
/home/hypathie/Documents/PYTHON/python3/chap06/liste_et_branch.py
/home/hypathie/ERetCMD/liste
/home/hypathie/ERetCMD/liste-class
/home/hypathie/ERetCMD/liste1
/home/hypathie/ERetCMD/liste1-nom
/home/hypathie/ERetCMD/liste2
/home/hypathie/ERetCMD/liste2-nom
/home/hypathie/ERetCMD/liste3-erb-ere
/home/hypathie/ERetCMD/liste4-spec
/home/hypathie/ERetCMD/liste4-vim
/usr/share/man/man2/listen.2.gz
Caractère + :
/home/hypathie/Documents/PYTHON/python2/chap06/liste_et_branch.py
/home/hypathie/Documents/PYTHON/python3/chap06/liste_et_branch.py
/home/hypathie/ERetCMD/liste-class
/home/hypathie/ERetCMD/liste1
/home/hypathie/ERetCMD/liste1-nom
/home/hypathie/ERetCMD/liste2
/home/hypathie/ERetCMD/liste2-nom
/home/hypathie/ERetCMD/liste3-erb-ere
/home/hypathie/ERetCMD/liste4-spec
/home/hypathie/ERetCMD/liste4-vim
/usr/share/man/man2/listen.2.gz
Les classes
symboles et significations
La commande grep utilise les classes soit comme ERb et soit comme ERe, c'est-à-dire sans l'option -E
ou avec l'option -E
Préparation
soit le fichier “
[[:class:]] + quantificateur { }
abc2356.99
73000|Savoie
123456
1234567
-15 +36 5687 {15} exemple{36}
123.3456.abc
Sélection de “3456” ; “5687” ; de “2356” ; et des lignes avec plus de 4 chiffres consécutif.
123456
1234567
grep sélectionne les lignes lorsqu'il trouve exactement 4 chiffres sans se préoccuper de ce qu'il y a
après, même s'il y a d'autres chiffres. En réalité, c'est à nous de préciser avec la ER qu'il faut tenir
compte de ce qu'il y a après cet “exactement 6 chiffres”.
Les classes servent à décrire des sous-chaînes ou des lignes entières plus facilement et ne relèvent
pas des expressions rationnelles dites “atomiques”.
123456
1234567
classes et sous-chaîne
abc2356.99
-15 +36 5687 {15} exemple{36}
123.3456.abc
abc2356.99
-15 +36 5687 {15} exemple{36}
123.3456.abc
Dans l'exemple ci-dessus, avec les ERe, on pourrait remplacer [\. ] par (\.| )
ls
Idem mais avec option –regex et on enlève les \ inutiles avec les ERe
./img-perso-2.jpg
./img-perso-1.jpg
./img-perso-2.jpg
./img-perso-1.jpg
Rappel :
sed utilise les ERb sans option et les ERe avec l'option -r, mais pour utiliser les classes, il faut utiliser
l'option -r.
Exemple 1 :
123OK123
Exemple 2 :
1 11 111
Il ne s'agit que de donner le détail des commandes quant à l'utilisation des ER.
Remarquons au passage la différence avec et sans le flags g qui applique “partout”.
Et encore une fois l'effet d'une ER dépend de ce que fait la commande
Exemple 3 :
a 2 2a
123 abc
x x 123
Exemple 1 :
var=123
00
Préparation
vim liste4-spec
Exemples
Recherche :
/[[:alnum:]]\{7\}{[[:digit:]]\{2\}}
Substitution [[:graph:]]:
:6,10s/[[:graph:]]/x/g
Les caractères accentués ne sont pas concernés car ils comportent un caractère de contrôle pour
l'accentuation avec la touche morte.
Substitution [[:print:]] :
:6,10s/[[:print:]]/x/g
Cette fois les caractères accentués sont concernés s'ils font partie de l'adressage.
Faire :q! pour quitter sans enregistrer.
Samuel 27-08-2008
Hélène-Fleur 06-03-2005
À ne pas confondre avec les classes abrégées supportées uniquement par les regex PCRE
voir : http://en.wikipedia.org/wiki/Regular_expression#Examples
sed
Séquences Séquences
\f Produit ou correspond à un saut
\n Produit ou correspond à un retour à la ligne
\t Produit ou correspond à un onglet horizontal
\v Produit ou correspond à une tabulation verticale
\w Synonyme de [[:alnum:]] → correspond à un mot.
\W Synonyme de [^[:alnum]] → ce qui autre qu'un mot.
\b Correspond à une chaîne vide (blanc) à l'extrémité d'un mot
awk
Séquences Séquences
\b backspace (supprime le dernier caractère d'une chaîne)
\f formfeed (nouvelle page)
\r carriage return (retour à la ligne)
\t tabulation (crée une tabulation de dix espaces)
tout caractère pris sous sa forme littérale
\c
excepté \
1)
c'est-à-dire gawk
whereis awk
awk: /usr/bin/awk
ls -l /usr/bin/awk
lrwxrwxrwx 1 root root 21 juin 8 18:43 /usr/bin/awk → /etc/alternatives/awk
ls -l /etc/alternatives/awk
lrwxrwxrwx 1 root root 13 juil. 13 18:41 /etc/alternatives/awk → /usr/bin/gawk
2)
le point étant un caractère des ER, il faut l'antislash pour qu'il soit lu comme un point littéral
5)
-perm u=rwx (0700) ; -perm -u=r (-0400) ⇒ u=r ou u=rw ou u=rx ou u=rwx ou u=r,g=x… ; -
perm /u=w,g=w,o=w ⇒ u=w ou g=w ou o=w ou u=w,g=w,o=w ou u=rw,g=rwx…
6)
lorsque l’on ne précise pas le -type à rechercher, la commande find recherchera des fichiers, des
dossiers, des sockets, etc
7)
de même qu'on prévient qu'on cherche un motif en respectant la casse avec -name
9)
parenthèses, accolades, +, ? et |
11)
alias gawk
From:
http://debian-facile.org/ - Documentation - Wiki
Permanent link:
http://debian-facile.org/utilisateurs:hypathie:tutos:erb-et-ere-par-le-contexte-des-commandes