Les expressions régulières peuvent être composées d'un ou plusieurs caractères. Ces caractères peuvent provenir des jeux de caractères US-ASCII ou/et Unicode.
//Recherche du caractère a Expression régulière : a Cible : Grâce au clonage, les femmes pourraient procréer seules et ainsi se passer des hommes. //Recherche des caractères accentués â ou é Expression régulière : â|é Cible : Grâce au clonage, les femmes pourraient procréer seules et ainsi se passer des hommes.
Les caractères d'une séquence d'entrée, peuvent avoir une forme canonique (ex.: X) ou une forme numérique (ex.: \u005D) ou bien les deux combinées.
//Recherche des caractères â, é ou m Expression régulière : \u00E2|\u00E9|\u006D Cible : Grâce au clonage, les femmes pourraient procréer seules et ainsi se passer des hommes.
Il est également possible d'utiliser des caractères spéciaux afin d'exprimer notamment les espaces blancs tels qu'un espace, une tabulation ou encore une fin de ligne.
//Recherche du caractère s avant une fin de ligne Expression régulière : s\n Cible : Grâce au clonage, les femmes pourraient procréer seules et ainsi se passer des hommes.
Certains caractères spécifiques aux expressions régulières, appelés méta-caractères, ne peuvent être utilisés tels quels dans les expressions régulières. Il est nécessaire, dans ce cas, d'échapper les caractères. C'est le cas des caractères suivants : ( [ { \ ^ $ | ) ? * + ..
Les caractères//Recherche d'une sous-chaîne entre des parenthèses Expression régulière : \(.*\) Cible : Le premier animal cloné (la brebis dolly) a ouvert la porte au clonage humain. //Recherche d'une sous-chaîne entre des accolades Expression régulière : \{.*} Cible : Le premier animal cloné {la brebis dolly} a ouvert la porte au clonage humain.
Symboles | Description |
---|---|
x | Un caractère quelconque. |
\\ | Le caractère anti-slash. |
\0n | Un caractère exprimé en valeur octale, ou n est compris entre 0 et 7. |
\0nn | Un caractère exprimé en valeur octale, ou n est compris entre 0 et 7. |
\0mnn | Un caractère exprimé en valeur octale, ou n est compris entre 0 et 7 et m entre 0 et 3. |
\xhh | Un caractère exprimé en valeur hexadécimale, ou h est compris entre 0 et F. |
\uhhhh | Un caractère exprimé en valeur Unicode, ou h est compris entre 0 et F. |
\b | Le caractère de retour arrière ('\u0008'). |
\t | Le caractère de tabulation ('\u0009'). |
\n | Le caractère de fin de ligne (LF : Line Feed :'\u000A') |
\r | Le caractère de retour charriot (CR : Carriage Return : '\u000D'). |
\f | Le caractère de fin de formulaire (FF : Form Feed : '\u000C'). |
\a | Le caractère d'alerte (bell : '\u0007'). |
\e | Le caractère échappe (escape : '\u001B'). |
\cx | Le caractère de contrôle avec un caractère quelconque (CTRL + x). |
\u0085 | Le caractère de prochaîne ligne. |
\u2028 | Le caractère de séparateur de lignes. |
\u2029 | Le caractère de séparateur de paragraphes. |