Les classes pour le jeux de caractères Unicode prennent en compte l'ensemble des caractères US-ASCII, mais aussi les caractères grecques, arabes, chinois, les caractères accentués majuscules et minuscules, les symboles monétaires, etc..
//Recherche de mots grecs
Expression régulière : \b\p{InGreek}+\b
Cible :
καλωσορίζω (bienvenue) τους (les) επισκέπτες (visiteurs)
//Recherche d'une majuscule
Expression régulière : \p{Lu}
Cible :
Être ou ne pas être, telle est la question !
William Shakespeare.
//Recherche d'un symbole monétaire
Expression régulière : \p{Sc}
Cible :
Les deniers cours monétaires :
1 € = 1.31 $ = 137.87 ¥
| Symboles | Description |
|---|---|
| \p{propriété} | Un caractère correspondant à une propriété. |
| \p{IsCatégorie} ou \p{Catégorie} | Un caractère d'une catégorie Java définie dans la classe java.lang.Character. |
| \p{L} | Une lettre Unicode. |
| \P{L} | Tout sauf une lettre Unicode. |
| \p{Lu} | Une lettre majuscule. |
| \P{Sc} | Tout sauf une lettre majuscule. |
| \p{Ll} | Une lettre minuscule. |
| \P{Sc} | Tout sauf ue lettre minuscule. |
| \p{Sc} | Un symbole monétaire. |
| \P{Sc} | Tout sauf un symbole monétaire. |
| \p{InLangue} | Un caractère d'une langue indiquée définie dans la classe java.lang.Character.UnicodeBlock. |
| \P{InLangue} | Tout sauf un caractère d'une langue indiquée. |
| \p{InGreek} | Un caractère grecque. |
| \P{InGreek} | Tout sauf un caractère grecque. |
| \p{InCyrillic} | Un caractère cyrillique. |
| \P{InCyrillic} | Tout sauf un caractère cyrillique. |
| \p{InArabic} | Un caractère arabe. |
| \P{InArabic} | Tout sauf un caractère arabe. |
| [\p{L}&&[^\p{Lu}]] | Toute lettre sauf une lettre majuscule. |