Joueb.com
Envie de créer un weblog ?
ViaBloga
Le nec plus ultra pour créer un site web.
Débarrassez vous de cette publicité : participez ! :O)

L'En Dehors


Quotidien anarchiste individualiste





Crée le 18 mai 2002

Pour nous contacter : endehors(a)no-log.org



D'où venons-nous ?


Nos références
( archives par thèmes )


Vous pouvez nous soutenir en commandant nos brochures :

Les éditions de L'En Dehors



Index des rubriques

Les collaborateurs et collaboratrices de l'En Dehors

Liens

A noter

Recherche

Archive : tous les articles

Session
Nom d'utilisateur
Mot de passe

Mot de passe oublié ?

Comment interdire l'accès d'un robot ?
L'équipe de l'En Dehors recherche un moyen d'interdire l'accès du site au robot de Yahoo!, surnommé "Slurp". Ce robot passe un nombre impressionnant de fois chaque jour ( aux alentours de 800 ) et nous prend de la bande passante pour rien. Les solutions proposées comme mettre une fichier texte à la racine du site ne semblent pas possible avec le type de blog que nous utilisons et divers essais d'ajouts dans la mise en page ( skin ) n'ont rien donné de probant.
Si vous connaissez une solution à ce problème, vous pouvez nous laisser un comentaire ou nous envoyer un mail à l'adresse du site. Merci
Ecrit par libertad, à 14:53 dans la rubrique "Nouvelles du site".

Commentaires :

  floreal
24-12-06
à 16:50

Mal nommés les choses, là commence les ennuis du monde A. CAMUS

Salut,

tous ce passe dans l'élément <meta>
c'est un élément vide; l'information est contenue dans ses attributs.


maintenant venons en au problème actuel.
Je pense que le choix qui  est actuellement dans la valeur content est:
<meta name="robot" content="follow" />
 
en effet cette valeur autorise l'indexation simultanée de la page concernée et des pages qui sont les cibles des liens contenus dans cette page.
Le choix de cette valeur est riqué car il produit des indexations en chaîne si les pages cibles font de même.

pour empêcher cette indexation des pages liées.
<meta name="robot" content="nofollow" />,


<meta name="revisit-after" content="1 days" />
cette valeur précise aux robots des moteurs de recherche la périodicité des passages en nombre de jours sur le site.

A+
Floreal

Répondre à ce commentaire

  Anonyme
24-12-06
à 17:07

Un peu de technique...

salut,

au vu des données technique du site l'endehors que j'ai reperé tout à l'heure :

Domain Name:ENDEHORS.ORG
Server Type:       Apache/1.3.33 (Unix) mod_perl/1.29
IP Address:     213.186.57.165
IP Location:     France - Ovh Sas
Response Code:     200
Blacklist Status:     Clear
SSL Cert:     No valid SSL on this Host
Website Status:     Active

il est possible de placer un fichier .htaccess (le . devant htaccess est obligatoire) sous le dossier www de l'hébergement ovh (la racine du site en fait).
le contenu de ce fichier pour bloquer slurp sera

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ^.*Slurp.*$ [OR]
RewriteRule /* http://www.perdu.com [L,R]

en gros tout ce qui arrive et qui s'identifie comme étant Slurp est balancé vers http://www.perdu.com...
.htaccess permet d'effectuer du paramétrage d'Apache sans modifier le fichier httpd.conf qui ne peut être modifié que par l'hébergeur du site...(à moins de posséder un serveur dédié...)

Répondre à ce commentaire

  Anonyme
24-12-06
à 17:11

Re: Mal nommés les choses, là commence les ennuis du monde A. CAMUS

salut floreal,

yahoo ne respecte pas les rel="nofollow" comme la plupart des autres robots de recherche !

le nofollow permet d'indiquer au robot qu'il ne suive pas les liens présent sur la page, il n'évite pas la visite du robot sur la page en question

d'ailleurs si tu recherche "yahoo" +  "nofollow" sur le net tu verras la confirmation de ce que je dis sur pas mal de site technique...






Répondre à ce commentaire

  libertad
24-12-06
à 17:35

Re: Re: Mal nommés les choses, là commence les ennuis du monde A. CAMUS

Anonyme, on fait comme pour  placer un fichier .htaccess sous le dossier www de l'hébergement ovh ?
Répondre à ce commentaire

  Txo
24-12-06
à 18:05

Re: Re: Re: Mal nommés les choses, là commence les ennuis du monde A. CAMUS

Il faut avoir acccès à son espace par ftp ou sftp et transférer ce fichier à la racine. de cet espace. Ce qui n'est peut-être pas forcément possible sur des blogs.
Répondre à ce commentaire

  Anonyme
24-12-06
à 18:18

Re: Re: Mal nommés les choses, là commence les ennuis du monde A. CAMUS

Salut anonyme

Il ne me semblait pas que libertad soit pour la suppresion du passage des robots sur le site. Il avait l'air de trouver qu'il passait trop souvent (problème des multiples liens sur le site) à son c(g)oût en bande passante.
maintenant s'il veut supprimer les robots
content="none" ou "noindex"

D'après ce que tu dis de yahoo et consorts, j'en déduis qu' ils ne respectent pas les accords  du W3C, comme les états membres de l'ONU ne respectent pas les leurs.

En tout cas, sur la toile comme dans la vie, il faut tendre à être le plus autonome possible.
En l'occurence, les ossatures prémachées et les hébergements sur serveurs externes  montrent vite leurs limites.


Répondre à ce commentaire

  libertad
25-12-06
à 01:56

Re: Re: Re: Mal nommés les choses, là commence les ennuis du monde A. CAMUS

Effectivement on souhaite juste empêcher l'accès de Slurp et pas des autres robots, la méthode donnée par anonyme semble juste empêcher Slurp, comme on a pas d'accès ftp à la racine, on va demander au responsable du serveur de le faire.
Répondre à ce commentaire

  libertad
28-12-06
à 23:27

Re: Re: Re: Re: Mal nommés les choses, là commence les ennuis du monde A. CAMUS

Anonyme du 24-12-06
à 17:07, est-il possible de modifier un peu le texte pour que Slurp ne puisse plus passer qu'une fois par jour ?
Répondre à ce commentaire

  Anonyme
29-12-06
à 10:56

Re: Re: Re: Re: Re: Mal nommés les choses, là commence les ennuis du monde A. CAMUS

et bien non ce n'est pas possible de faire cela avec la solution évoquée le 24. <br />
Répondre à ce commentaire

  libertad
29-12-06
à 11:25

Re: Re: Re: Re: Re: Re: Mal nommés les choses, là commence les ennuis du monde A. CAMUS

Merci anonyme pour ton coup de main, on va voir avec l'animateur de joueb. Nous sommes en recherche de personnes qui puissent nous donner des conseils ponctuellement comme celui-ci, si tu voulais nous communiquer ton adresse mail en nous écrivant à l'adresse du site, cela nous aidrait bien. A bientôt
Répondre à ce commentaire

  opi
04-04-07
à 11:11

Re: Re: Re: Re: Re: Re: Re: Mal nommés les choses, là commence les ennuis du monde A. CAMUS

salut,<br /><br />je suis peut etre un peu en retard, mais je suis tombé chez vous, et en meme temps sur ca:<br /><br />http://www.webrankinfo.com/actualites/200611-fichier-robots-txt.htm<br /><br />donc y'a moyen de bloquer slurp...<br /><br /><br />Je suis aussi dispo pour des petits conseils techniques si besoin.<br /><br />Aplus !<br /><br />opi <br />
Répondre à ce commentaire



Modèle de mise en page par Milouse - Version  XML   atom