sábado, 19 de enero de 2008

Hay que entrar a las Webmaster tools más seguido.

Hoy aparecieron bastantes mensajes cuando entré a las webmaster tools de Google. La herramienta es buenísima porque te marca los problemas que tuvo el bot cuando pasó por tu página.

1) Me marca como error a 8 páginas restringidas por robots.txt. Cuando cargué el robots.txt me llamó la atención la instrucción "Disallow: /search" (mi archivo robots.txt está acá). No la entendí pero la dejé. Resulta que las 8 páginas restringidas son páginas de Labels, por ejemplo http://daniserra.blogspot.com/search/label/Dani%20Serra que te muestra todas las páginas que tienen "Dani Serra" como label. Investigando un poco descubrí que eso se hace para que Google no indexe páginas redundantes, o sea, información duplicada, ayudando al bot a focalizarse en las páginas importantes. Ahora que llené de labels los posts viejos, me van a aparecer muchas páginas restringidas por robots.txt, pero mientras sean páginas de labels search, no hay problema.

2) En el sitemap, dos mensajes en chino básico: "XML no válido: demasiados códigos" para la etiqueta principal channel (...) y "Espacio de nombre incorrecto en la línea 2" (será un bondi?). Después de 15' minutos de leer el help no entiendo nada, con lo cual espero que no sea grave.

3) Me dice que hay 26 urls en mi blog, y dado que tengo 36 posts, hay 10 que no los está indexando, y por lo tanto son invisibles para Google. Google me aclara que es normal que haya páginas no indexadas, yo prefiero corregir esa "normalidad".
Hago una búsqueda de "site:daniserra.blogspot.com" (un Operador Google de búsqueda, muy útil) para ver cuales están y cuales no. Muy interesante dado que:
- hay posts que todavía aparecen con el nombre viejo del blog (o sea, el bot no las volvió a visitar desde aquella vez).
- hay posts viejos que borré pero todavía quedaron en el caché de Google.
- hay posts que no están.
A los primeros y a los terceros les vuelvo a hacer ping (me hace acordar a Technorati...). La verdad, no se me ocurre otra manera de solucionarlo. Vamos a ver mañana si cambió algo.

4) Encuentro una sección para solicitar la eliminación de una página, con lo cual elimino esos posts que escribí al principio, luego borré, pero que todavía están en el caché de Google.

Como dice el título, hay que visitar las Webmaster tools más seguido, uno se lleva sorpresas.

Add to Technorati Favorites