Expresión regular en Ruby
Una expresión regular, a menudo llamada también patrón, es una expresión que describe un conjunto de cadenas sin enumerar sus elementos. Por ejemplo, el grupo formado por las cadenas Handel, Händel y Haendel se describe mediante el patrón "H(a|ä|ae)ndel".
La mayoría de las formalizaciones proporcionan los siguientes constructores: una expresión regular es una forma de representar a los lenguajes regularescaracteres del alfabeto sobre el cual se define el lenguaje. (finitos o infinitos) y se construye utilizando.
Un ejemplo:
regex = Regexp.new(/"video_id": "(.*?)"/)
regex.match(page)
var_id = $1
En este ejemplo lo que estariamos buscando seria todo lo de rojo :
"video_id":"Un nombre de una pelicula"
La expresion regular devuelve el valor encontrado e $1 y esto lo pasamos a una variables para ser usado.
Para construir una expresion regular debe estar entre "/ /"
/a/ buscariamos la a
Hay comando que podemos usar como :
\t — Representa un tabulador.
\r — Representa el "regreso al inicio" o sea el lugar en que la línea vuelve a iniciar.
\n — Representa la "nueva línea" el carácter por medio del cual una línea da inicio.
\a — Representa una "campana" o "beep" que se produce al imprimir este carácter.
\e — Representa la tecla "Esc" o "Escape"
\f — Representa un salto de página
\v — Representa un tabulador vertical
\x — Se utiliza para representar caracteres ASCII o ANSI si conoce su código.
\u — Se utiliza para representar caracteres Unicode si se conoce su código.
\d — Representa un dígito del 0 al 9.
\w — Representa cualquier carácter alfanumérico.
\s — Representa un espacio en blanco.
\D — Representa cualquier carácter que no sea un dígito del 0 al 9.
\W — Representa cualquier carácter no alfanumérico.
\S — Representa cualquier carácter que no sea un espacio en blanco.
\A — Representa el inicio de la cadena. No un carácter sino una posición.
\Z — Representa el final de la cadena. No un carácter sino una posición.
\b — Marca el inicio y el final de una palabra.
\B — Marca la posición entre dos caracteres alfanuméricos o dos no-alfanuméricos.
Y para podemos escapar estos comando :
/\?/
[]
La función de los corchetes en el lenguaje de las expresiones regulares es representar "clases de caracteres", o sea, agrupar caracteres en grupos o clases. Son útiles cuando es necesario buscar uno de un grupo de caracteres. Dentro de los corchetes es posible utilizar el guión "-" para especificar rangos de caracteres.
Ssi queremos buscar numero seria de esta forma :
/[0-9]/
|
Sirve para indicar una de varias opciones. Por ejemplo, la expresión regular "a|e" encontrará cualquier "a" o "e" dentro del texto. La expresión regular "este|oeste|norte|sur" permitirá encontrar cualquiera de los nombres de los puntos cardinales.
$
Representa el final de la cadena de caracteres o el final de la línea, si se utiliza el modo multi-línea.
Si te gusto este artículo puedes dejar un comentario, también puedes suscribirte al canal RSS de la página o compartir este articulo por facebook