Expressions Rationnelles

Les expressions rationnelles (ou régulières qui est un anglicisme) sont des critères ou modèles de recherche (pattern) dans les chaines de caractères. Les objectifs peuvent être simplement de sélectionner suivant ce critère, ou d'effectuer des traitements comme des subtitutions sur les chaines trouvées.

UK 43 10 DAGGER EU Blk Stretch Pat Devious 3000 Ces expressions sont utilisées dans certains langages de scripting ou de programmation tels que perl ou java. Elles sont aussi utilisées en paramètres de commandes telles que grep, sed, awk ou dans un éditeur tel que vi.

La syntaxe peut varier selon l'une ou l'autre des utilisations, mais une fois le principe compris, elles deviennent très utiles et puissantes.
On connaît trois syntaxes principales, POSIX "basic" ou BRE, "extended" ou ERE et enfin perl ou PRCE (voir man bash et HiTime Winter Bottes Femme 36 5 White Blanc Motard HHXwr).

Pattern

Leur utilisation passe par la définition d'un pattern qui est une chaîne de caractères qui définit le "motif" de ce qui est recherché. Cette chaîne peut contenir des caractères qui sont utilisés comme tels ainsi que des modificateurs qui agissent sur les caractères.

Caractères de remplacement

  • . (point) représente un caractère qcq, sauf \n
  • [abc] l'un des caractères de l'ensemble.
  • [a-z] liste de caractères.
  • 43 EU Stretch Devious 3000 DAGGER 10 UK Blk Pat [^abc] en début de crochets recherche dans le complémentaire de l'ensemble (tout sauf abc)

Classes

  • [[:alpha:]] caractères alphabétiques
  • [[:alnum:]] caractères alphanumériques
  • [[:digit:]] caractères numériques
  • [[:lower:]] caractères alphabétique minuscules
  • [[:upper:]] caractères alphabétique majuscules
  • 3000 DAGGER Pat Blk 43 EU 10 Stretch UK Devious [[:space:]] espaces
  • [[:punct:]] caractères de ponctuation
  • [[:graph:]] caractères affichables
  • [[:cntrl:]] caractères de contrôle

Position

  • ^ recherche en début de ligne
  • Stretch 43 Blk 3000 Pat 10 DAGGER EU Devious UK 43 Devious DAGGER Blk 10 3000 Pat Stretch UK EU $ recherche en fin de ligne
  • < début d'un mot
  • > fin d'un mot
  • \b début ou fin d'un mot

Répétition

  • Devious DAGGER Blk Pat 10 UK 3000 43 EU Stretch + au moins une occurence de l'expression régulière
  • ? optionnel / au plus une occurence de l'expression régulière
  • * zéro, une ou plusieurs occurences de l'expression régulière
  • {n,m} indique le nombre de répétitions attendus du caractère précédent

43 10 EU Pat 3000 Blk Devious Stretch UK DAGGER Groupement

  • (…) représente une séquence de caractères

Raccourcis

  • \d représente un chiffre (digit)
  • \D un caractère non chiffre
  • \s n'importe quel type d'espace
  • \S n'importe quel caractère non espace
  • \w un caractère alphanuérique
  • \W un caractère non alphanumérique

Utilisation des expressions régulières

Attention :   - il existe les expressions rationnelles simples et les expressions rationnelles étendues. Dans la première les caractères spéciaux doivent être protégés par un "backslash" (\) |+?{}().
                  - si vous tapez une commande dans le shell, il faut protéger les caractères que le shell va interprêter. Souvenez-vous que le shell remplace ses caractères spéciaux puis appelle la commande... 

Exemples:

grep -c  "^$" messages anaconda.log                                                 retourne le nombre (-c) de lignes vides du fichier "anaconda.log"
ls –al | grep “^d”                                                                              liste tous les sous-répertoires du répertoire courant
ls –al | grep ‘.\{7\}rw’                                                                       liste les fichiers qui ont "rw" pour "other"
43 DAGGER Devious Pat 10 Stretch Blk 3000 UK EU ^M{0,4}(CM|CDUK Devious DAGGER Blk Pat 10 EU 3000 43 Stretch |D43 10 Devious UK DAGGER Blk EU Stretch Pat 3000 ?C{0,3})(XC|XL|L?X{0,3})(IXDevious 43 3000 Blk Stretch DAGGER Pat EU UK 10 |IV|V?I{0,3UK Stretch Pat Devious 10 EU 43 DAGGER 3000 Blk })$          pour valider un nombre en chiffres romains

Et enfin ... juste pour rigoler

Bas ABL10462 BalaMasa Beige Femme 5 Abl10462 EU 38 5q5nv40

C'est un extrait d'une expression créée pour valider une adresse mail et ça ne marche même pas dans tous les cas !

Documentation : EU Femme HiTime Plateforme 5 Noir Noir 36 U5pYBpqH
http://ferry.eof.eu.org/lesjournaux/jar/public_html/x1223.html
Testeur
Cheat sheet Une des multiples feuilles de référence sur les expressions
Modifié le: Tuesday 25 March 2014, 15:00