lunes, 7 de enero de 2008

"Robot, no sigas a este link!"

Tanto Google como todos los otros Search Engines modernos, tienen programas que recorren la web de manera automática y programada. Esos programas (que se llaman bots, robots, crawlers o spiders) entran a cada página y la copian para que luego sea procesada por otro soft que la "indexa", o sea, analiza su estructura, sus links entrantes y sus links salientes.

Google tiene dos bots, uno que se llama deepbot que recorre toda la web, siguiendo cada link, tarea que le lleva aproximadamente un mes; y otro que se llama freshbot que sólo busca contenido nuevo.

Cuando el Googlebot entra a una página, existe el riesgo de que siguiendo a alguno de los links salientes que están en esa página, el bot se vaya antes de hacer una copia completa. Eso dejaría parte de la página sin indexar, que es lo mismo que decir que esa parte no existe para el buscador. Para evitar eso, lo que hay que hacer es incorporar en el código una indicación que le diga al bot que "no se vaya por ese link". Esa indicación se llama "no follow".

La optimización de hoy fue simplemente incorporar el tag rel='nofollow' en el código de los widgets con links externos que tengo en la barra de la derecha: el About Me y el de los feeds (al botón de Blogger no se lo pongo ya que me dan el servicio de Blogging gratis y funciona muy bien).

En este blog los Comments, Backlinks y links a otros blogs citados NO TIENEN NO FOLLOW. Ver la política acá.

En el siguiente post, una nota complementaria a lo que ya escribí de Trackbacks: el Backlist.