Les classes pour le jeux de caractères Unicode prennent en compte l'ensemble des caractères US-ASCII, mais aussi les caractères grecques, arabes, chinois, les caractères accentués majuscules et minuscules, les symboles monétaires, etc..
//Recherche de mots grecs Expression régulière : \b\p{InGreek}+\b Cible : καλωσορίζω (bienvenue) τους (les) επισκέπτες (visiteurs) //Recherche d'une majuscule Expression régulière : \p{Lu} Cible : Être ou ne pas être, telle est la question ! William Shakespeare. //Recherche d'un symbole monétaire Expression régulière : \p{Sc} Cible : Les deniers cours monétaires : 1 € = 1.31 $ = 137.87 ¥
Symboles | Description |
---|---|
\p{propriété} | Un caractère correspondant à une propriété. |
\p{IsCatégorie} ou \p{Catégorie} | Un caractère d'une catégorie Java définie dans la classe java.lang.Character. |
\p{L} | Une lettre Unicode. |
\P{L} | Tout sauf une lettre Unicode. |
\p{Lu} | Une lettre majuscule. |
\P{Sc} | Tout sauf une lettre majuscule. |
\p{Ll} | Une lettre minuscule. |
\P{Sc} | Tout sauf ue lettre minuscule. |
\p{Sc} | Un symbole monétaire. |
\P{Sc} | Tout sauf un symbole monétaire. |
\p{InLangue} | Un caractère d'une langue indiquée définie dans la classe java.lang.Character.UnicodeBlock. |
\P{InLangue} | Tout sauf un caractère d'une langue indiquée. |
\p{InGreek} | Un caractère grecque. |
\P{InGreek} | Tout sauf un caractère grecque. |
\p{InCyrillic} | Un caractère cyrillique. |
\P{InCyrillic} | Tout sauf un caractère cyrillique. |
\p{InArabic} | Un caractère arabe. |
\P{InArabic} | Tout sauf un caractère arabe. |
[\p{L}&&[^\p{Lu}]] | Toute lettre sauf une lettre majuscule. |