ProgramacionWeb - Ayuda al webmaster
No has iniciado sesión
Conectar al sistema | Registrar usuario
¿Que es PWeBot y de porque visita mi web?
PWeBot es un software que visita un documento de internet y extrae una información concreta el documento o servidor.

¿Que informacion busca en mi web?
El número de versión de PWeBot indica la finalidad de la petición, de esta manera, podemos saber porque nos está accediendo según si es:

PWeBot/1.1
Recopila información sobre los archivos robots.txt de las páginas que serán visitadas por la version 1.0 o bajo una petición en esta página o esta página.

PWeBot/3.0
Esta versión, descarga un documento y lo analiza, parsea HTML, CSS, Javascript... puedes acceder a la información parseada desde esta herramienta.

Algunos de los documentos descargados pasarán a formar parte de la base de datos del buscador. Siempre y cuando lo permita el protocolo robots.txt PWeBot almacenará sus palabras claves y buscará otros documentos siguiendo sus enlaces.
¿Como puedo evitar que me visite?
Como la mayoría de robots, En sus peticiones automatizadas PWeBot 3.0 atiende al protocolo estándar de exclusión de robots, el archivo robots.txt, con este archivo puedes desactivar el acceso a un determinado directório a los robots, para desactivar PWeBot, el user-agent correcto es pwebot o *.

Cuando la visita realizada es debido a que un usuario introduce tu URL en esta herramienta para analizar páginas web, PWeBot no atenderá a robots.txt pero tampoco guardará ningún dato de la página visitada.

¿Como ha llegado PWeBot a mi web?
PWeBot 3.0 sigue los vínculos de las páginas web a las que accede, ya sean por href como por src, de esta manera, si ha llegado hasta aquí es que ha seguido un vínculo desde otra página.
Las otras versiones acceden a tu servidor porque alguien se lo indica directamente.

¿Porque esta intentando abrir robots.txt?
La forma que tiene PWeBot de saber si es bienvenido a un servidor es examinar su archivo robots.txt, el contenido de este archivo puede indicarle que no debe pedir ninguna página del servidor, que las puede pedir todas...


 
English version
To read this in english click the link below:

English version