Ubuntu Manpage: regex - expresiones regulares

Provided by: manpages-es-extra_0.8a-17_all

NOMBRE

       regex - expresiones regulares

DESCRIPCIÓN

Una expresión regular es un patrón que describe un conjunto de cadenas de caracteres. Las expresiones
regulares se construyen de forma análoga a las aritméticas, empleándose varios operadores para combinar
expresiones más pequeñas.

Hay dos versiones diferentes de la sintaxis de las expresiones regulares: la ``básica'' y la
``extendida''. En algunas implementaciones (como en la del grep de GNU), no hay ninguna diferencia entre
las dos en cuanto a la funcionalidad disponible con cada una. En otras implementaciones, las expresiones
regulares básicas son menos potentes. La descripción siguiente se aplica a las expresiones regulares
extendidas; las diferencias con las básicas se resumen después.

Los bloques de construcción fundamentales son las expresiones regulares que concuerdan con un solo
carácter. La mayoría de los caracteres, incluyendo todas las letras y los dígitos, son expresiones
regulares que concuerdan consigo mismos. Cualquier meta-carácter con un significado especial puede ser
protegido precediéndolo con una barra inclinada inversa.

Una lista de caracteres rodeados por [ y ] concuerda con cualquier carácter solo de los de la lista; pero
si el primer carácter de ella es el acento circunflejo ^ entonces concuerda con cualquier carácter que no
esté en la lista. Por ejemplo, la expresión regular [0123456789] concuerda con cualquier dígito. Se
puede especificar un rango de caracteres ASCII dando el primero y el último, separados por un guión.
Finalmente, ciertas clases de caracteres tienen nombres predefinidos, y uno puede referirse a ellas por
éstos. Los nombres son auto-explicativos, y son los siguientes: [:alnum:], [:alpha:], [:cntrl:],
[:digit:], [:graph:], [:lower:], [:print:], [:punct:], [:space:], [:upper:], y [:xdigit:]. Por ejemplo,
[[:alnum:]] significa [0-9A-Za-z], excepto en que la última forma depende de que se use la codificación
de caracteres ASCII, mientras que la primera es transportable. (Note que en estos nombres de clases los
corchetes son parte de los nombres simbólicos, y deben incluirse aparte de los que delimiten la lista
entre corchetes.) La mayoría de los meta-caracteres pierden su significado especial cuando están dentro
de listas. Para incluir un ] literal, póngase el primero de la lista. De forma similar, para incluir un ^
literal, póngase en cualquier posición menos en la primera. Finalmente, para incluir un - literal,
póngase el último.

El punto . concuerda con cualquier carácter. El símbolo \w es un sinónimo de [[:alnum:]] y \W lo es de
[^[:alnum]].

El acento circunflejo ^ y el signo del dólar (o del escudo portugués) $ son meta-caracteres que
concuerdan respectivamente con la cadena vacía al principio y al final de una línea. Los símbolos \< y
\> concuerdan respectivamente con la cadena vacía al principio y al final de una palabra. El símbolo \b
concuerda con la cadena vacía al borde de una palabra, y \B concuerda con la cadena vacía si no está en
el extremo de una palabra.

A una expresión regular que concuerde con un solo carácter puede seguir uno de los varios operadores de
repetición:
? El elemento precedente es opcional y concordaba como mucho una vez.
* El elemento precedente concordará cero o más veces.
+ El elemento precedente concordará una o más veces.
{n} El elemento precedente va a concordar exactamente n veces.
{n,} El elemento precedente ha concordado n o más veces.
{,m} El elemento precedente es opcional y ha concordado como mucho m veces.
{n,m} El elemento precedente ha concordado como poco n veces, pero no más de m veces.

Dos expresiones regulares pueden concatenarse; la expresión regular resultante concuerda con cualquier
cadena de caracteres formada por la concatenación de dos subcadenas que concuerden respectivamente con
las subexpresiones concatenadas.

Dos expresiones regulares pueden juntarse por medio del operador infijo |; la expresión regular
resultante concuerda con cualquier cadena que lo haga con cualquiera de las subexpresiones.

La repetición tiene precedencia sobre la concatenación, la cual a su vez la tiene sobre la alternancia.
Una subexpresión entera puede encerrarse entre paréntesis para modificar estas reglas de precedencia.

La retrorreferencia \n, donde n es un solo dígito, concuerda con la subcadena que previamente concordaba
con la n-sima subexpresión entre paréntesis de la expresión regular.

En las expresiones regulares básicas, los meta-caracteres ?, +, {, |, (, y ) pierden su significado
especial; en su lugar emplee las versiones protegidas por la barra inclinada inversa \?, \+, \{, \|, $,
y $.

OBSERVACIÓN

       Esta página del Manual de Debian/GNU Linux se ha extraído de la de grep(1).

VÉASE TAMBIÉN

       regcomp(3), grep(1)

Debian GNU/Linux                               10 Septiembre 1992                                       REGEX(7)