Desindexar URL Google
Novedades
Cómo eliminar una URL en Google
4.3 (85%) 4 votos

¬ŅQu√© motivos pueden existir para querer eliminar una URL en Google? Aunque no es lo com√ļn, hay ocasiones en que, por la raz√≥n de que sea,¬†no nos interesa que una URL de nuestro sitio web¬†aparezca indexada en Google. Puede que esa p√°gina que queremos eliminar est√© atrayendo un tr√°fico no cualificado y empeorando nuestras m√©tricas UX (como un aumento de la tasa de rebote o, peor a√ļn, Pogo Sticking) , o puede, sencillamente, que ya no queramos que esa informaci√≥n sea p√ļblica.

No obstante, los casos más frecuentes que se suelen dar son cuando tenemos una URL a la que no queremos traspasar link juice desde la Home porque tiene thin content (contenido pobre o de escaso o nulo interés para el usuario que no atrae tráfico orgánico, ni leads ni conversiones, como esos post con menos de 300 palabras que Google considera spam) o cuando queremos evitar el contenido duplicado. Como vemos, las razones pueden ser muchas y variadas.

Los ejemplos m√°s comunes de URLs que no conviene indexar son el Aviso Legal y la Pol√≠tica de Privacidad y Pol√≠tica de Cookies; esto eso, los t√≠picos links que solemos tener en el footer y no aportan ning√ļn valor, pero que son de obligado cumplimiento. Otra p√°gina irrelevante que tienen la mayor√≠a de webs comerciales y har√≠amos bien en eliminar de los buscadores es la de Presupuestos.

Ante una tesitura como ésta, quizás el primer impulso sea cortar por lo sano; es decir, eliminar dicha página del servidor (y que devuelva un error 404). Sin embargo, como ahora veremos, hay mejores y más sutiles maneras de hacerlo.

ūüĒó¬†C√≥mo averiguar cu√°ntas URLs tiene Google indexadas

Pero antes de analizar y ver en detalle las diferentes maneras que existen de eliminar páginas internas, vamos a ver cómo saber cuántas URLs tiene Google indexadas de nuestro website.

La primera y m√°s sencilla consiste en teclear en el buscador site:www.tudominio.com. De esta manera Google te mostrar√° todas las URLs que tiene indexadas de tu web (ojo, que si no te aparece ninguna es porque probablemente hayas sufrido una penalizaci√≥n y tu dominio haya sido baneado). Esto es lo que se conoce como footprint, o comandos avanzados de b√ļsqueda. Lo malo de este m√©todo es que, cuando nuestro sitio web tiene muchas p√°ginas, no resulta f√°cil ni pr√°ctico hacer una recopilaci√≥n de todas ellas.

URLs indexadas Google Site

Si queremos ahorrarnos tiempo, una opci√≥n mejor y m√°s directa es usar alguna de las¬†herramientas que extraen todas URLs de una web con un solo clic, y luego s√≥lo tenemos que copiarlas y pegarlas en una hoja de Excel. Una de las m√°s profesionales es¬†Screaming Frog, la mejor aplicaci√≥n para realizar una¬†auditor√≠a SEO On-Page, pero en su versi√≥n gratuita s√≥lo nos muestra hasta un m√°ximo de 500 URLs, lo que, dependiendo del tama√Īo del site, puede quedarse corto (no obstante, con la genial rana aulladora podemos averiguar si tenemos etiquetas duplicadas, redirecciones, errores 404, etc., as√≠ que es de uso obligado).

En Search Console, antes conocida como Google Webmaster Tools, tambi√©n podemos saber cu√°ntas URLs tiene indexadas, mirando en √ćndice de Google>Estado de Indexaci√≥n, y, al mismo tiempo, en Tr√°fico de b√ļsqueda>Enlaces internos tambi√©n podemos extraer todas o casi todas las URLs (basta con que tengan, al menos, un enlace interno, lo cual no parece muy complicado), pero de eso os hablar√© m√°s adelante.

ūüĒó¬†C√≥mo indexar una URL en Google

Es el caso opuesto al que aquí nos planteamos, pero también es bueno saberlo.

Cómo indexar una URL en Google mediante Search Console

Una vez más, tenemos que ir a nuestro panel de Search Console. Allí, en Rastreo, seleccionar Explorar como Google. Introducimos el slug (la parte final que sigue al dominio raíz y la barra invertida o slash) de la URL que queremos indexar y le damos a Obtener y procesar. Entonces Google comenzará a procesar su estado, y cuando finalice (le suele llevar muy poco tiempo), podremos solicitar su indexación.

Desde que Search Console cambi√≥ su interfaz es a√ļn, si cabe, m√°s f√°cil. Basta con Inspeccionar la URL de marras y Google la pondr√° en su cola de tareas pendientes. Dependiendo de la autoridad del sitio web y de la frecuencia de rastreo de Googlebot, los cambios estar√°n visibles en la SERP en cuesti√≥n de horas o minutos.

Esto sería más o menos el equivalente de hacerle un ping a Google, pero de forma más sutil y profesional. Por supuesto, hay otras formas de solicitar la indexación de una página, como utilizar el panel submit URL (Google deshabilitó recientemente esta herramienta), o incluso difundirla en redes sociales, pero como digo, Search Console es lo más recomendable, siempre que la URL sea de tu propiedad, claro (distinto es si quieres que Google te indexe un backlink).

ūüĒ󬆬ŅEn qu√© casos querr√≠amos eliminar una URL?

Como he dicho al principio, pueden darse muchas casu√≠sticas, pero un caso que suele repetirse muy a menudo es cuando tenemos un ecommerce y un producto al que cambiamos de nombre y de caracter√≠sticas. En tal circunstancia, es probable que tengamos una p√°gina con su correspondiente ficha de producto, y que esta p√°gina est√© recibiendo tr√°fico. ¬ŅSer√≠a conveniente eliminar dicha URL y crear una nueva? Rotundamente no. Si lo hici√©ramos, perder√≠amos esas visitas y provocar√≠amos un error 404. En tal caso, lo suyo ser√≠a¬†redirigir la antigua URL (redirecci√≥n 301, permanente) hacia la nueva, y as√≠ conservar√≠amos el tr√°fico de visitas, y de paso tambi√©n transferir√≠amos su autoridad.

Así que no siempre que vayamos a deshacernos de una URL conviene desindexarla. Eso hay que tenerlo muy presente.

Un caso mucho peor (y no tan infrecuente como pudiera parecer) que exigir√≠a de nosotros una respuesta inmediata ser√≠a que nuestra web hubiera sido hackeada. En dicho supuesto es muy probable que se hubieran creado cientos o incluso miles de URLs basura que estar√≠an da√Īando cr√≠ticamente nuestro posicionamiento web. Esto nos obligar√≠a a una eliminaci√≥n masiva, que luego veremos c√≥mo se hace.

B√°sicamente, hay 4 formas para eliminar y desindexar una URL en Google:

1-Meta noindex

Es la opci√≥n m√°s f√°cil de implementar, aunque, probablemente, no la mejor. Lo √ļnico que tendr√≠amos que hacer es a√Īadir en el head de la p√°gina la etiqueta o metatag <meta name=‚ÄĚrobots‚ÄĚ content=‚ÄĚnoindex‚ÄĚ>. Con esto le estaremos dando la orden a los rastreadores de los motores de b√ļsqueda de que no indexen dicha p√°gina.

Llegados a este punto conviene aclarar que el meta noindex nada tiene que ver con el nofollow, el cual no sirve para desindexar URLs, sino para ordenar a los spiders que no sigan un enlace y, en consecuencia, corten el flujo de autoridad.

El principal inconveniente de este método es que los resultados pueden tardar un tiempo en verse, o no verse nunca, ya que tenemos que esperar a que los crawlers visiten nuestro sitio web, lleguen hasta la URL de marras y reciban la orden. Por lo tanto, esta opción es más recomendable utilizarla antes de que la URL haya sido ya indexada.

2-Robots.txt

Robots.txt Disallow

El archivo robots.txt est√° pensado espec√≠ficamente para orientar a las ara√Īas y darles indicaciones sobre qu√© URLs, carpetas o directorios queremos que indexen o no. A trav√©s del comando Disallow podemos ordenarles que no indexen una URL concreta o una carpeta. Bastar√≠a con escribir esta l√≠nea de c√≥digo:

Disallow: /politica-de-cookies/

(éste es un típico ejemplo de URL que no aporta nada a una web y que conviene no indexar)

Aunque pocos lo hacen, con robots.txt también se pueden bloquear imágenes.

La gran ventaja de utilizar el archivo robots.txt es que optimizamos el crawl budget; esto es, el presupuesto o tiempo que dedican los crawlers (como Googlebot) a rastrear nuestro sitio web. Es, por decirlo de alguna manera, la forma m√°s profesional y aconsejable de hacerlo.

El √ļnico inconveniente que plantea este m√©todo es que si esa p√°gina que queremos eliminar del √≠ndice de Google recibe alg√ļn link desde otra web, entonces podr√≠a no desaparecer.

Si tenéis dudas sobre cómo generar el archivo robots.txt o cómo utilizarlo, os recomiendo que leáis este estupendo artículo de Tomás de Teresa.

3-Search Console

Eliminar URL, Search Console

A veces la mejor opci√≥n es utilizar las herramientas que el propio Google pone a nuestra disposici√≥n, que para eso est√°n. Si vamos a Search Console>√ćndice de Google>Eliminaci√≥n de URL podemos eliminar temporalmente ‚Äďeste matiz es importante‚Äď cualquier p√°gina de nuestro sitio web de los resultados de b√ļsqueda. S√≥lo tenemos que pulsar en Ocultar temporalmente e introducir la URL en cuesti√≥n, y desaparecer√° durante 90 d√≠as de las SERPs. Tambi√©n se borrar√° la copia guardada en la cach√© de la p√°gina. Ahora bien, Google nos advierte de que si queremos eliminarla de forma permanente tendremos que recurrir a alguna de las otras t√©cnicas aqu√≠ mencionadas.

Así pues, para eliminar una URL en Google con Search Console tenemos que seguir los siguientes pasos:

  1. Ir a √ćndice de Google.
  2. Clic en Eliminar URLs.
  3. Clic en Ocultar temporalmente.
  4. Introducir la URL relativa.
  5. Elegir entre ocultar temporalmente la URL durante 90 días y/o eliminarla de la caché (pasado ese tiempo, Google seguirá rastreándola si no la bloqueamos por otros medios).
  6. Enviar solicitud.

Asimismo, dentro del mismo apartado de Search Console, pero en Estado de indexación, si hacemos clic en Avanzada nos mostrará un gráfico con el total de páginas indexadas, bloqueadas por robots y eliminadas, y además podemos actualizar el resultado en cualquier momento.

Estado de indexación

Personalmente, yo recomendaría combinar estas dos acciones: en primer lugar, eliminar la URL con Search Console; y en segundo lugar, bloquearla mediante robots.txt. Después de eso, también la borraría del servidor asegurándome de que devuelve un error 404 (not found).

4-Eliminar masivamente URLs en Search Console

¬ŅPero qu√© pasar√≠a si, como he dicho antes, nuestra web ha sido hackeada y de pronto nos vemos con un mont√≥n de URLs? Desindexarlas una por una, como en el ejemplo anterior, nos llevar√≠a much√≠simo tiempo.

Por suerte, en GitHub hay una extensión de Chrome llamada Google Wemaster Tools Bulk URL Removal creada para este propósito. Sólo tenemos que descargar el zip y descomprimirlo en nuestro disco duro.

Con la extension de GitHub Google Webmaster Tools Bulk URL Removal podemos eliminar masivamente URLs en Search Console.

Luego abriremos las Extensiones de Chrome y marcaremos el modo desarrollador, y allí cargaremos la extensión descomprimida. Por supuesto, una vez cargada no te olvides de habilitarla.

Una vez finalizado el proceso, ver√°s que en Search Console>√ćndice de Google>Eliminar URLs te aparece ahora la opci√≥n de seleccionar un archivo. Ah√≠ es donde deber√°s adjuntar un txt con todas las URLs que quieres desindexar separadas por un salto de l√≠nea. Hay un l√≠mite de 1000 URLs, por lo que si tienes m√°s, deber√°s repetir el proceso.

Eliminar masivamente URLs en Search Console es posible con esta extensión.

5-Directorio protegido con contrase√Īa

La he dejado en √ļltimo lugar por ser muy poco habitual, pero es bueno saber que existe. Otra forma de bloquear una URL es guardarla en un directorio protegido con contrase√Īa en el servidor. Si utilizas Apache, tendr√°s que editar el archivo .htaccess. √Čste ser√≠a el m√©todo m√°s seguro de todos, ya que, mientras que los anteriores son s√≥lo instrucciones que se dan a los rastreadores, √©ste los forzar√≠a definitivamente a no indexar la URL. Toda la informaci√≥n necesaria para utilizar este recurso la ten√©is aqu√≠.

Y t√ļ, ¬Ņconoces alguna otra manera de eliminar URLs en Google?

Dejar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*