Una guía de expresiones regulares (con casos de uso)

Una guía de expresiones regulares (con casos de uso)

enero 19, 2022 0 Por admin


Es posible que haya oído hablar de expresiones regulares, pero no está seguro de cómo se pueden usar en SEO o si encaja en su propia estrategia.

Las expresiones regulares, o ‘regex’, son como un lenguaje de programación en línea para búsquedas de texto que le permiten incluir cadenas de búsqueda complejas, coincidencias parciales y comodines, búsquedas que no distinguen entre mayúsculas y minúsculas y otras instrucciones avanzadas.

Puede pensar en ellos como si buscaran un patrón en lugar de una cadena de texto específica.

Por lo tanto, pueden ayudarlo a encontrar conjuntos completos de resultados de búsqueda que, a primera vista, pueden parecer que tienen poco en común entre sí.

Las expresiones Regex son un lenguaje por derecho propio y la primera vez que ves una puede parecer bastante extraña.

Pero son bastante fáciles de aprender y se pueden usar con JavaScript, Python y otros lenguajes de programación, lo que los convierte en una herramienta de SEO versátil y poderosa.

En esta guía, aprenderá operadores comunes de expresiones regulares, cómo usar filtros de expresiones regulares más avanzados para SEO, cómo usar expresiones regulares en Google Analytics y Google Search Console, y más.

También encontrará ejemplos de expresiones regulares en el trabajo de diferentes maneras en SEO.

¿Cómo se ve la expresión regular?

Una expresión regular generalmente incluye una combinación de texto que coincidirá exactamente con los resultados de búsqueda, además de varios operadores que actúan más como comodines para lograr una coincidencia de patrón en lugar de una coincidencia de texto exacta.

Esto puede incluir un comodín de un solo carácter, una coincidencia para uno o más caracteres o una coincidencia para cero o más caracteres, así como caracteres opcionales, subexpresiones anidadas entre paréntesis y funciones «o».

Al combinar estas diferentes operaciones, puede construir una expresión compleja que puede lograr resultados muy amplios pero muy específicos.

Operadores Regex comunes

Estos son algunos ejemplos de operadores de expresiones regulares comunes:

. Una coincidencia de comodín para cualquier carácter único.

.* Una coincidencia para cero o más caracteres.

.+ Una coincidencia para uno o más caracteres.

d Una coincidencia para cualquier dígito numérico único entre 0 y 9.

? Insertado después de un carácter para convertirlo en una parte opcional de la expresión.

| Una línea vertical o un carácter de «tubo» indica una función «o».

^ Se usa para indicar el comienzo de una cadena.

$ Usado para indicar el final de una cadena.

( ) Se utiliza para anidar una subexpresión.

Insertado antes de un operador o carácter especial para «escaparlo».

Algunos lenguajes de programación, como JavaScript, permiten la inclusión de «banderas» después del patrón de expresión regular en sí, y aún pueden afectar el resultado:

g Devuelve todas las coincidencias en lugar de solo la primera.

i Devuelve resultados que no distinguen entre mayúsculas y minúsculas.

m Habilite el modo multilínea.

s Habilite el modo ‘dotall’.

u Habilite la compatibilidad completa con Unicode.

y Encuentra la posición de texto específica (modo ‘sticky’).

Como puede ver, estos operadores e indicadores juntos comienzan a construir un lenguaje lógico complejo, lo que le brinda la capacidad de obtener resultados muy específicos en grandes conjuntos de datos desordenados.

¿Cómo se usa Regex para SEO?

Regex se puede usar para explorar qué consultas utilizan diferentes segmentos de usuarios, qué consultas son comunes a áreas de contenido específicas, qué consultas dirigen el tráfico a partes específicas de su sitio y más.

En este artículo, Hamlet Batista mostró cómo usar expresiones regulares en Python para analizar archivos de registro del servidor, por ejemplo.

Y en este, Chris Long le mostró cómo usar expresiones regulares para extraer la posición, el elemento y el nombre de las migas de pan asociadas con cada URL en su sitio como parte de un proceso escalable de búsqueda y segmentación de palabras clave.

Google alienta a los profesionales de SEO a compartir ejemplos de cómo usan expresiones regulares en Twitter usando el hashtag #rendimientoregex.

Aquí hay algunos consejos de SEO de Twitter (notarás que es un hashtag bastante silencioso; ¡agrega tus propios ejemplos si tienes alguno!):

Usar Regex en Google Analytics

Uno de los usos más comunes de expresiones regulares para SEO es en Google Analytics, donde las expresiones regulares se pueden usar para configurar filtros para que solo vea los datos que desea ver.

En este sentido, la frase se usa para excluir resultados, en lugar de generar un conjunto de resultados de búsqueda inclusivo.

Por ejemplo, si desea excluir datos de direcciones IP en su red local, puede filtrar 192.168.*.* para eliminar todo el rango de 192.168.0.0 a 192.168.255.255.

Filtros SEO Regex más avanzados

Como ejemplo más complejo, supongamos que tiene dos marcas: regex247 y regex365.

Puede filtrar los resultados que coincidan con cualquier combinación de URL que contengan estos nombres de marca, como regex247.biz o www.regex365.org.

Una forma de hacer esto es usar una expresión «o» bastante simple:

.*regex247.*|.*regex365.*

Esto eliminaría todas las URL coincidentes de sus datos de Analytics, incluidas las rutas de las subcarpetas y las URL de páginas específicas que aparecen en esos nombres de dominio.

Una palabra de advertencia

Vale la pena señalar que, al igual que su archivo robots.txt, una expresión regular mal escrita puede filtrar fácilmente la mayoría o la totalidad de sus datos al incluir coincidencias ilimitadas de comodines.

La buena noticia es que, en muchos casos de SEO, el filtro solo se aplica a sus datos en la etapa del informe y, al editar o eliminar su expresión regular, puede restaurar la visibilidad total de sus datos.

También puede probar expresiones regulares en varias herramientas de prueba en línea, para ver si logran el resultado deseado, lo que le permite «aislar» sus expresiones regulares antes de liberarlas en todo su conjunto de datos.

Para crear filtros de expresiones regulares en Google Analytics, primero navegue hasta el tipo de informe que desea crear (p. Conducta > contenido del sitio > Todas las páginas Donde Adquisición > Todo el tráfico > La fuente/Promedio).

Debajo del gráfico, en la parte superior de la tabla de datos, busque el campo de búsqueda y haga clic en Avanzado para mostrar las opciones de filtrado avanzadas.

Aquí puede incluir o excluir datos en función de una dimensión o métrica en particular. En la lista desplegable después de seleccionar su dimensión, elija Coincidencia de expresiones regulares luego ingrese su expresión en el cuadro de texto.

‘O’ y ‘Y’ en Google Analytics Regex

Para crear una expresión «o» en Google Analytics, simplemente incluya el carácter de barra vertical (el | símbolo de trazo vertical) entre los segmentos apropiados de su expresión.

Las expresiones regulares de Google Analytics no admiten declaraciones «y» dentro de la misma expresión regular; sin embargo, simplemente puede agregar otro filtro para lograr esto.

Debajo de su primera expresión regular, simplemente haga clic en Agregar una dimensión o métrica e ingrese su próxima expresión regular. De esta manera, puede apilar tantas expresiones como desee y se tratarán como una sola declaración lógica «y» al filtrar sus datos.

Uso de expresiones regulares en la consola de búsqueda de Google

En 2021, Google Search Console comenzó a admitir la sintaxis Re2 de expresiones regulares, lo que permite a los webmasters incluir y excluir datos en la interfaz de usuario.

Puede encontrar todos los metacaracteres compatibles con Google Search Console en esta referencia de sintaxis de expresiones regulares RE2 en GitHub.

Al momento de escribir, hay un límite de caracteres de 4096 caracteres (que suele ser suficiente…).

Los ejemplos que puede usar en Search Console pueden ser consultas de filtrado que contienen una marca específica y variaciones que los usuarios pueden ingresar, como Facebook:

.*facebook.*|face*book.*|fb.*|fbook.*|f*book.*

Filtre a los usuarios que encuentran su sitio web utilizando términos de intención «comercial»:

.*(mejor|principal|alternativa|alternativa|vs|contra|reseña*).*

Relacionado: Google Search Console agrega nuevas opciones de filtro Regex

¿Por qué Regex es importante para el SEO?

Finalmente, ¿por qué es todo esto importante?

Bueno, se trata de tomar el control de sus datos y filtrar las partes que no lo ayudan a mejorar su SEO, ya sean páginas particulares o partes de su sitio web, tráfico de una fuente o medio específico, o su propio sitio local. datos de red

Puede crear expresiones regulares que sean lo suficientemente simples para lograr un filtro básico de «inclusión» o «exclusión», o escribir expresiones más largas que funcionen de manera similar al código de programación para lograr resultados complejos y muy específicos.

Y con la expresión regular correcta para cada campaña, puede verificar que sus esfuerzos de SEO están cumpliendo sus objetivos, ambiciones y resultados, una forma poderosa de demostrar un ROI positivo en sus futuras inversiones en SEO.

Más recursos:


Imagen destacada: Optura Design/Shutterstock