Aquí un listado de patrones los cuales sin duda nos serán de mucha utilidad.
Metacaracteres
- \w: Secuencia de caracteres [a-zA-Z0-9_] (Sin espacio).
- \d: Cualquier carácter numérico[0-9].
- \s: Espacio en blanco, así como salto de línea (\n) y tab (\t).
- \D: Caracteres que no sean numéricos.
- \W caracteres que no sean letras, números o guiones bajo (_).
- \S: Caracteres que no sean espacios en blanco, saltos de línea o tab.
Grupos
- + : 1 o más.
- * : 0 o más.
- ? : 0 o 1.
- {k}: Exactamente el entero (K).
- {m, n}: m a n ocurrencias.
- . : Match con cualquier carácter exceptuando una nueva línea (\n).
- ^ : Comienzo de un string.
- $: Final de un string.
- | : Permite indicar una de varias opciones.
- [] : Agrupamiento de caracteres.
Ejemplos
# La cadena debe comenzar con PyWombat.
r'^PyWombat'
# La cadena debe finalizar con fin.
r'fin.$'
# La cadena debe comenzar con 3 caracteres números.
r'^\d{3}'
# La cadena debe poseer por lo menos un carácter numérico.
r'\d+
# La cadena debe ser un número telefónico.
r'\d\d\d-\d\d\d-\d\d\d\d'
r'\d{3}-\d{3}-\d{4}'
# La cadena debe ser una dirección IP valida.
r'\d{1,3}.\d{1,3}.\d{1,3}.\d{1,3}'
# Cat debe existir como palabra dentro de la cadena.
r'\bcat\b'
# python', ruby o java deben existir dentro de la cadena.
'python|ruby|java