Páginas suplementarias
¿Qué son las páginas suplementarias en google?
Como ya es conocido, Google mantiene una base de datos paralela a la principal, que según Google, contiene páginas que han sido eliminadas (404), o páginas muertas (ya no hay links a ella), duplicadas, etc...
Cuando google no encuentra resultados en la base de datos principal, lo que hace es mostrar resultados de este índice paralelo.
Cuando la mayoría de páginas de un dominio, pasan del índice principal, al suplementario, se puede decir que prácticamente desaparece de google. Y las visitas que se reciben desde el buscador descienden brúscamente.
¿Qué páginas entran en el índice secundario?
Google dice que el proceso es completamente automático, calculado mediante procesos matemáticos, y nunca de forma manual.
Dicho esto, decir que en el mundo SEO, hay muchas voces opinando cosas diferentes, pero por resumir, estas podrían ser las causas principales de que una página pase del índice principal, al secundario:
- Contenido duplicado
Si google ya tiene el contenido en una página, ¿pór qué debería incluir otra página con el mismo contenido en el índice principal?
Aunque tenga cierta lógica, se ha comprobado que muchas copias de la wikipedia no están en el índice suplementario, por lo que, o bien tiene que haber otros factores adicionales, o bien el algoritmo no es capaz de detectar el contenido duplicado en el 100% de las ocasiones. - Links insuficientes
Si una página dada, tiene pocos o ningún link, es más probable que pase al índice secundario ("probable"). - URLs diferentes / Misma página (Canonical URLs)
Si cada vez que linkas a tu página, lo haces de forma diferente...
http://www.sergioblanco.org
http://sergioblanco.org
http://www.sergioblanco.org/index.html
http://www.sergioblanco.org/
Para un buscador, todas estas páginas son diferentes, porque su URL es diferente, sin embargo, de hecho, es la misma página en los 4 ejemplos.
Pero en algunos casos, una misma página puede estar en el índice principal con 3 o 4 URLs diferentes, por lo que seguimos desconociendo algunos factores que influyen en las páginas suplementarias. - Profundidad
Cuanta mayor profundidad en los directorios de una página web, mayor es la probabilidad de aparecer en el índice secundario.
La idea es, que cuanto mayor número de clicks haga falta, desde la página principal, hasta llegar a una página profunda, mayor riesgo de que dicha página sea incluida en el índice secundario de google.
Sin embargo, el contenido profundo puede mostrarse perfectamente en el índice principal, si por ejemplo tienes links a dicha página de forma externa, o el contenido es exclusivo.
En boca de Matt Cutts:
"PageRank is the primary factor determining whether a url is in the main web index vs. the supplemental results, so I’d concentrate on good backlinks more than worrying about varying page layouts, etc."
Es decir, consigue links hacia tu contenido, y no solo a la página principal, sino a cualquier página interna que consideres importante (o no tan importante).
Nota: Cuando Matt Cutts habla de Pagerank, no se refiere al número que aparece en la barrita, sino al interno.
¿Cuántas páginas tengo en el índice suplementario?
Para averiguar cuántas páginas tienes en el índice suplementario, puedes realizar la siguiente búsqueda en google:
site:miweb.com -a ****
Ejemplos: Google, ya.com, Youtube, etc...
Actualizado: Telendro comenta un método mejor.
¿Cómo pasar páginas del índice suplementario al principal?
Consigue links desde páginas que estén en el índice principal, que no vendan links, que no tengan demasiados otros links, etc...
Si tu web tiene miles de páginas, lo que debes intentar es conseguir links a las principales secciones, y que desde ahí estén linkadas prácticamente el resto de páginas. Es decir, dividir tu página principal en varias diferentes.
No es recomendable linkar desde 1 página, a otras 1.000, eso podría ser incluso perjudicial. Lo ideal es crear una buena estructura interna de links. Sin hacer burradas.
Es muy imporante, que cada página tenga un título único y diferente al resto. Si tus páginas se parecen entre sí, y además les pones a todas el mismo título, mal vamos.
Aplicar esta misma idea al resto de meta-tags (Description).
Referencias:
+ ¿Cómo controlar el número de páginas suplementarias de un dominio?
+ Contenido duplicado y Google (El Telendro)
+ Cuídate del contenido duplicado (Blogdaddy)
Actualización:
Google ha borrado la pregunta 34473 de su centro de ayuda (ver aquí) relativa a las páginas suplementarias. Aquí una reproducción:
¿Qué es un "resultado complementario"?
Un resultado complementario es como un resultado web normal, excepto en que se obtiene de nuestro índice complementario. Los sitios que rastreamos para este índice complementario están sujetos a menos restricciones que los sitios destinados a nuestro índice principal. Por ejemplo, el número de parámetros de una URL puede excluir un sitio del rastreo para ser incluido en nuestro índice principal. No obstante, podrá rastrearse y añadirse a nuestro índice complementario.
Si usted es webmaster, tenga en cuenta que la decisión de en qué índice se va a incluir un sitio está totalmente automatizada: no hay modo alguno de poder seleccionarlo o cambiarlo. No le quepa la menor duda de que el índice en el que se incluye un sitio no afecta a su PageRank. Si desea obtener sugerencias acerca de cómo mantener un sitio apto para rastreos, por favor, visite nuestra Guía para webmasters.
Actualizado:
Leo en Max Glaser, que google ha desabilitado la opción que nos permitía ver páginas suplementarias en el buscador de google.
Actualizado #2:
El método de Telendro parece mejor para identificar páginas suplementarias, y por lo que acabo de comprobar, sigue funcionando.


Un artículo muy interesante. Me gustaría añadir que uno de los factores determinantes a la hora de calificar las páginas como suplementarias es el % de similitud. Con esta web podréis saber el % de similitud entre dos páginas:
http://www.webconfs.com/similar-page-checker.php
Intentad que estén entre por debajo de un 50 o 60%.
Publicado por: Fabio Núñez | 3 de julio de 2007 at 16:17
Muy buen artículo, Sergio.
Aporto mi granito de arena:
Los resultados suplementarios, cuando pasan a ser un caso excesivo, hay que estudiarlos muy bien. La idea no es conseguir únicamente enlaces a la página principal: también a esas páginas internas que consideramos, son relevantes respecto a nuestra temática.
Además, no es positivo hacer de la exploración del sitio (de cara a los robots y a los usuarios también) un proceso tedioso. Mientras más rápido se llegue a lo que se necesita, mejor será para ellos.
Saludos.
Publicado por: Kervin Vergara | 4 de julio de 2007 at 12:00
Aparte de lo que se dice, también cuenta la relevancia del contenido con respecto a una keyword o frase de búsqueda.
Es algo como la similitud, una desventaja, ya que si hay páginas con mejor calificación para responder a una búsqueda, no tiene sentido listar páginas que no aportan ni más ni igual, teniendo en cuenta que los usuarios exigen resultados entre las primeras URLs.
Cuando una página en RS se modifica, enriquece, linkea y agiorna con información de valor > sale de los RS.
Saludos
Publicado por: Héctor | 6 de julio de 2007 at 17:16
El método que utilizas funciona igual de bien que el de telendro, lo que pasa es que hay que entender que al colocar site:www.midominio.com -a **** lo que estás diciéndole es que te muestre los resultados suplementarios de los documentos indexados que no contengan la palabra "a".
Prueba con site:www.midominio.com -agsdfga **** y verás como te ofrece los mismos resultados que los de telendro.
Publicado por: cpons | 7 de julio de 2007 at 15:44
muchas gracias por tu articulo, me sirvio para un trabajo de la u, felicitaciones por tu blog y espero que en el futuro me puedas regalar mucha ayuda para posicionar miweb-site.
FELIPE ALFARO
Publicado por: felipe alfaro | 27 de agosto de 2008 at 6:00