Google PageRank explicado para principiantes de SEO

Google PageRank explicado para principiantes de SEO

mayo 16, 2023 0 Por admin


PageRank estuvo una vez en el corazón de la búsqueda, y es lo que convirtió a Google en el imperio que es hoy.

Incluso si cree que la búsqueda evolucionó a partir de PageRank, no se puede negar que durante mucho tiempo ha sido un concepto omnipresente en la industria.

Cada profesional de SEO debe tener una buena comprensión de lo que solía ser PageRank y lo que sigue siendo hoy.

En este artículo, cubriremos:

  • ¿Qué es PageRank?
  • La historia de la evolución de PageRank.
  • Cómo PageRank revolucionó la búsqueda.
  • Barra de herramientas de PageRank frente a PageRank.
  • Cómo funciona PageRank.
  • Cómo fluye PageRank entre las páginas.
  • ¿Se sigue utilizando PageRank?

Sumerjámonos en ello.

¿Qué es PageRank?

Creado por los fundadores de Google, Larry Page y Sergey Brin, PageRank es un algoritmo basado en las fortalezas relativas combinadas de todos los hipervínculos en Internet.

La mayoría de la gente argumenta que el nombre se basó en el apellido de Larry Page, mientras que otros sugieren que «Page» se refiere a una página web. Ambas posiciones son probablemente verdaderas y la superposición probablemente fue intencional.

Cuando Page y Brin estaban en la Universidad de Stanford, escribieron un artículo titulado: Ranking de citas de PageRank: poner orden en la Web.

Publicado en enero de 1999, el documento presenta un algoritmo relativamente simple para evaluar la solidez de las páginas web.

patente de pagerank: páginas de inicioImagen de patents.google.com, abril de 2023

Posteriormente, el documento se convirtió en patente en los Estados Unidos (pero no en Europa, donde las fórmulas matemáticas no son patentables).

de principio a fin del proceso de pagerankImagen de patents.google.com, abril de 2023

La Universidad de Stanford posee la patente y se la asignó a Google. Actualmente, la patente expirará en 2027.

proceso de jadeo de pagerankImagen de patents.google.com, abril de 2023

La historia de la evolución del PageRank

Mientras estaba en Stanford a fines de la década de 1990, Brin y Page estaban estudiando métodos de recuperación de información.

En aquel entonces, usar enlaces para determinar qué tan «importante» era cada página para otra era una forma revolucionaria de clasificar las páginas. Fue computacionalmente difícil, pero de ninguna manera imposible.

La idea se transformó rápidamente en Google, que en ese momento era un pez pequeño en el mundo de las búsquedas.

Hubo tanta confianza institucional en el enfoque de Google por parte de algunas partes que la empresa lanzó inicialmente su motor de búsqueda sin poder generar ingresos.

Y mientras que Google (conocido en ese momento como «BackRub») era el motor de búsqueda, PageRank era el algoritmo que usaba para clasificar las páginas en las páginas de resultados del motor de búsqueda (SERP).

El baile de Google

Uno de los desafíos con PageRank era que los cálculos, aunque simples, tenían que hacerse iterativamente. El cálculo se ejecuta varias veces, en cada página y en cada enlace de Internet. En el cambio de milenio, este cálculo tardó varios días en procesarse.

Los SERP de Google subieron y bajaron durante este tiempo. Estos cambios a menudo eran erráticos, ya que se calculaban nuevos PageRanks para cada página.

Era conocido como el «Google Dance» y notoriamente detenía a los profesionales de SEO del momento cada vez que Google comenzaba su actualización mensual.

(Más tarde, Google Dance se convirtió en el nombre de una fiesta anual que Google organizaba para expertos en SEO en su sede en Mountain View).

Semillas de confianza

Una iteración posterior de PageRank introdujo la idea de un conjunto de «semillas de confianza» para iniciar el algoritmo en lugar de dar a cada página en Internet el mismo valor inicial.

surfista razonable

Otra iteración del modelo introdujo la idea de un «surfista razonable».

Este modelo sugiere que el PageRank de una página podría no compartirse por igual con las páginas a las que enlaza, pero podría ponderar el valor relativo de cada enlace en función de la probabilidad de que un usuario haga clic en él.

La caída del PageRank

El algoritmo de Google inicialmente se consideró «no spam» internamente, ya que la importancia de una página no solo estaba dictada por su contenido, sino también por una especie de «sistema de votación» generado por los enlaces a la página.

Sin embargo, la confianza de Google no duró.

PageRank comenzó a volverse problemático a medida que crecía la industria de backlinks. Por lo tanto, Google lo eliminó de la vista del público, pero siguió confiando en él para sus algoritmos de clasificación.

La barra de herramientas de PageRank se retiró en 2016 y, finalmente, se restringió todo el acceso público a PageRank. Pero en ese momento, Majestic (una herramienta de SEO), en particular, había podido correlacionar bastante bien sus propios cálculos con PageRank.

Google pasó muchos años alentando a los profesionales de SEO a no manipular los enlaces a través de su documentación de «Directrices de Google» y los consejos de su equipo antispam, dirigido por Matt Cutts, hasta enero de 2017.

Los algoritmos de Google también cambiaron durante este tiempo.

La empresa dependía menos de PageRank y, tras la compra de MetaWeb y su Knowledge Graph patentado (denominado «Freebase» en 2014), Google comenzó a indexar la información global de diferentes maneras.

PageRank frente a la barra de herramientas de clasificación

Inicialmente, Google estaba tan orgulloso de su algoritmo que estaba feliz de compartir públicamente el resultado de su cálculo con cualquiera que quisiera verlo.

La representación más notable fue una extensión de la barra de herramientas para navegadores como Firefox, que mostraba una puntuación entre 0 y 10 para cada página de Internet.

En verdad, PageRank tiene una gama mucho más amplia de puntajes, pero 0-10 les ha brindado a los profesionales y consumidores de SEO una forma instantánea de medir la importancia de cualquier página en Internet.

La barra de herramientas de PageRank hizo que el algoritmo fuera extremadamente visible, lo que también generó complicaciones. En particular, esto significaba que estaba claro que los enlaces eran la forma más fácil de «jugar» con Google.

Cuantos más enlaces (o, más exactamente, cuanto mejor sea el enlace), mejor se clasificará una página en los SERP de Google para cualquier palabra clave específica.

Esto significa que se ha formado un mercado secundario, comprando y vendiendo enlaces calificados en el PageRank de la URL donde se vendió el enlace.

Este problema se agravó cuando Yahoo lanzó una herramienta gratuita llamada Yahoo Search Explorer, que permitía a cualquiera comenzar a encontrar enlaces a cualquier página.

Más tarde, dos herramientas, Moz y Majestic, se basaron en la opción gratuita creando sus propios índices en Internet y evaluando los enlaces por separado.

Cómo PageRank revolucionó la búsqueda

Otros motores de búsqueda se han basado en gran medida en el análisis del contenido de cada página de forma individual. Estos métodos hicieron poco para identificar la diferencia entre una página influyente y una página simplemente escrita con texto aleatorio (o manipulado).

Esto significaba que otros métodos de búsqueda de motores de búsqueda eran extremadamente fáciles de manejar para los profesionales de SEO.

El algoritmo PageRank de Google fue entonces revolucionario.

Combinado con un concepto relativamente simple de «nGrams» para ayudar a establecer la relevancia, Google ha encontrado una fórmula ganadora.

Rápidamente superó a los principales titulares de la época, como AltaVista e Inktomi (que impulsaron a MSN, entre otros).

Al operar a nivel de página, Google también encontró una solución mucho más escalable que el enfoque basado en «directorios» adoptado por Yahoo y más tarde por DMOZ, aunque DMOZ (también conocido como Open Directory Project) fue capaz inicialmente de proporcionar a Google una solución abierta. directorio fuente propio.

Cómo funciona PageRank

La fórmula de PageRank viene en muchas formas, pero se puede explicar en unas pocas oraciones.

Inicialmente, a cada página de Internet se le asigna una puntuación de PageRank estimada. Podría ser cualquier número. Históricamente, el PageRank se presentaba al público como una puntuación entre 0 y 10, pero en la práctica, las estimaciones no deberían comenzar en este rango.

Luego, el PageRank de esa página se divide por la cantidad de enlaces fuera de la página, lo que da como resultado una fracción más pequeña.

Luego, el PageRank se distribuye a las páginas vinculadas, y lo mismo se hace para todas las demás páginas en Internet.

Luego, para la próxima iteración del algoritmo, la nueva estimación de PageRank para cada página es la suma de todas las páginas fraccionarias que apuntan a cada página dada.

La fórmula también contiene un «factor de amortiguamiento», que se ha descrito como la posibilidad de que una persona que navega por la web deje de navegar por completo.

Antes del inicio de cada iteración posterior del algoritmo, el nuevo PageRank propuesto se reduce por el factor de amortiguamiento.

Esta metodología se repite hasta que las puntuaciones de PageRank alcanzan un equilibrio establecido. Los números resultantes generalmente se transponían a un rango más reconocible de 0-10 por conveniencia.

Una forma de representar esto matemáticamente es:

Fórmula de PageRankImagen del autor, abril de 2023

O:

  • PR = PageRank en la siguiente iteración del algoritmo.
  • d = factor de amortiguamiento.
  • j = el número de página en Internet (si cada página tuviera un número único).
  • n = número total de páginas en Internet.
  • i = la iteración del algoritmo (inicialmente establecido en 0).

La fórmula también se puede expresar en forma matricial.

Problemas e iteraciones de la fórmula.

La fórmula tiene algunos desafíos.

Si una página no enlaza con ninguna otra página, la fórmula no logrará el equilibrio.

En este caso, el PageRank estaría por tanto repartido entre todas las páginas de Internet. De esta manera, incluso una página sin enlaces entrantes podría obtener algunas PageRank, pero no se acumularía lo suficiente como para ser significativo.

Otro desafío menos documentado es que las nuevas páginas, aunque potencialmente Más importante que las páginas más antiguas, tendrán un PageRank más bajo. Esto significa que, con el tiempo, el contenido antiguo puede tener un PageRank desproporcionadamente alto.

El tiempo de vida de una página no se tiene en cuenta en el algoritmo.

Cómo fluye PageRank entre las páginas

Si una página comienza con un valor de 5 y contiene 10 enlaces salientes, a cada página a la que enlaza se le asigna un PageRank de 0,5 (menos el factor de amortiguación).

De esta forma, el PageRank circula en Internet entre iteraciones.

A medida que las nuevas páginas llegan a Internet, comienzan con solo una pequeña cantidad de PageRank. Pero a medida que otras páginas comienzan a vincularse a estas páginas, su PageRank aumenta con el tiempo.

¿Se sigue utilizando PageRank?

Aunque el acceso público a PageRank se eliminó en 2016, se cree que el puntaje aún está disponible para los ingenieros de búsqueda dentro de Google.

Una filtración de los factores usados ​​por Yandex mostró que PageRank todavía era un factor que podía usar.

Los ingenieros de Google han sugerido que la forma original de PageRank se haya reemplazado con una nueva aproximación que requiere menos potencia de procesamiento para calcular. Aunque la fórmula es menos importante en la forma en que Google clasifica las páginas, sigue siendo una constante para cada página web.

Independientemente de los otros algoritmos que Google decida usar, es probable que PageRank permanezca integrado en muchos de los sistemas del gigante de las búsquedas hasta el día de hoy.

Dixon explica más sobre cómo funciona PageRank en este video:



Patentes y documentos originales para leer más:

Más recursos:


Imagen destacada: VectorMine/Shutterstock