webleads-tracker

Comment faire pour que Google n'indexe pas des pages du type /xxx/yyy/viewcart.html

Thierry [1Dclic]
Avatar
Bonjour,

Pour un site ecommerce réalisé avec emajine, Google indexe autant de pages du style https://www.xxx.fr/categorie/ss-categorie/viewcart.html qu'il y a de catégorie.

Pourtant, aucun lien vers /categorie/ss-categorie/viewcart.html n'est visible dans le code source des pages.

Le lien "panier" est défini, par défaut et sur l'ensemble des pages, pour pointer vers l'url canonique : https://www.xxx.fr/mon-panier/viewcart.html

Ces pages accessibles via de nombreuses urls type https://www.xxx.fr/categorie/ss-categorie/viewcart.html ne présentant aucun contenu (uniquement l'information " Le panier est vide.... ", le résultat est plutôt néfaste côté SEO, d'autant que certains internautes entre sur le site par ces pages sans intérêt.

Ma question est donc : Comment faire pour qu'aucune page du type /xxx/yyy/viewcart.html ne soit accessible, ni par Google, ni par les internautes?

Merci d'avance.
Thierry
1Dclic | Thierry Leprince > Formateur, Créateur de sites web & Référenceur | www.1dclic.fr

Jérémie Glotin
Bonjour Thierry,

Cela peut être configuré depuis ton site e-majine. En effet, pour commencer, il convient de définir une rubrique dans laquelle seront gérées les actions du widget. Tu auras ainsi toujours la même URL pour l'accès à ton panier (ex : /panier/viewcart.html).
Une fois cette configuration effectuée, il devient possible de l'ajouter dans le robots.txt comme URL ne devant plus être indexée.

Bonne journée,
Directeur technique Medialibs

Thierry [1Dclic]
Avatar
Bonjour Jérémie,
Cette configuration est déjà en place pour ce site et, pourtant, des pages de type https://www.xxx.fr/categorie/ss-categorie/viewcart.html sont toujours indexées par Google, alors qu'aucun lien de ce type n'existe, à priori, dans les pages du site.


Thierry
1Dclic | Thierry Leprince > Formateur, Créateur de sites web & Référenceur | www.1dclic.fr

Vincent StartUp
Avatar
Salut Thierry,

En effet, depuis le début de l'année Google suit les liens d'ajout au panier. Médialibs a ajouté un header apache "X-Robots-Tag:noindex, nofollow, noarchive" sur les pages d'action du panier. De mon coté j'ai ajouté des nofollow sur le lien d'ajout au panier et également quelques lignes dans le robots.txt du genre :
Disallow: /*addtocart*
Disallow: /*update_box_cart*
Disallow: /*viewcart*
...
Google désindexe ces pages au fur et à mesure qu'il les recrawle. En fonction du nombre de pages indexées, je pense que ça peu prendre du temps.

Bonne journée
Vincent - StartUp Communication

Thierry [1Dclic]
Avatar
Salut Vincent,
Merci pour ta réponse.

Depuis mon message, posté début juillet, j'avais mis en place quelques éléments.
Après vérification hier, seul 3 urls avec viewcart.html étaient encore indexées par Google.
Ce que j'avais mis en place avait donc bien fait son effet.

J'ai fait une demande de suppression de ces 3 urls dans GWT hier, et aujourd'hui, plus aucune url n'est indexée. Cool.

Par précautions et suite à tes suggestions, j'ai tout de même ajouté aujourd'hui :
    - "nofollow, noarchive" à la balise META "Robots" que j'avais renseigné avec seulement "noindex".
    - rel="nofollow" sur le lien d'ajout au panier (bonne idée, je n'y avais pas encore pensé !!)
    - Disallow: /*addtocart* et Disallow: /*update_box_cart* dans robots.txt en complément des autres lignes déjà créées.

Merci, et bonne journée :)
Thierry
1Dclic | Thierry Leprince > Formateur, Créateur de sites web & Référenceur | www.1dclic.fr

Thierry [1Dclic]
Avatar
Bonjour,

Google Search Console (Exploration > Erreurs d'exploration > Smartphone) signale des erreurs au niveau des URL sur les Smartphones, en augmentation depuis l'ajout dans robots.txt de la ligne Disallow: /*addtocart*

Les urls bloquées sont du type :
https://www.ohdarling.fr/nouveautes/addtocartoverlib?rnd=94938&id_product=10287&quantity=1&var1=bleu&redirect=true

Une idée pour ne plus avoir ces retours d'erreur?

Thierry
1Dclic | Thierry Leprince > Formateur, Créateur de sites web & Référenceur | www.1dclic.fr

Ivann Zerovec
Avatar
Bonjour Thierry,

Pourrais-tu me confirmer que tu n'as plus de résidus "addtocart" dans ta Search Console ?

Bonne journée
Chef de projet SAV, Medialibs

Thierry [1Dclic]
Avatar
Bonjour Ivann,
J'ai supprimé la ligne
Disallow: /*addtocart*
du fichier robots.txt.
Depuis, je n'ai plus de résidus "addtocart" dans ta Search Console.
Thierry
1Dclic | Thierry Leprince > Formateur, Créateur de sites web & Référenceur | www.1dclic.fr