Categories
Blog SEO COOL

Que vous ayez quelque chose à cacher ou envie d’économiser du budget crawl, apprenez la désindexation facile dans cet article !

S’intéresser à l’indexation Google, ce n’est pas seulement savoir répondre à la question « comment indexer une page », mais aussi le contraire : comment ne pas l’indexer ?

Il existe de nombreuses raisons de vouloir désindexer une page des moteurs de recherche, et tout autant de façons pour le faire.

Regardons tout ça de plus près !

Qu’est-ce que l’indexation ?

L’indexation est le processus par lequel les moteurs de recherche, tels que Google, collectent, analysent et stockent les informations sur les pages web.

Lorsqu’une page est indexée, elle est ajoutée à la base de données du moteur de recherche et devient éligible à apparaître dans les résultats de recherche lorsqu’un utilisateur effectue une requête pertinente.

Pourquoi désindexer une page web ?

Si vous lisez ce texte, c’est que vous avez quelque chose à cacher

En tout cas, vous ne souhaitez pas qu’une ou des pages de votre site internet apparaissent dans les résultats des moteurs de recherche.

Et vous pouvez avoir plusieurs raisons (cumulables) de vouloir désindexer vos pages HTML :

Elles sont inutiles

Les pages qui ne présentent aucune valeur ajoutée pour les utilisateurs peuvent être exclues de l’indexation par les moteurs. Cela permet d’éviter de saturer les résultats de recherche avec un contenu non pertinent.

Elles créent un doublon (duplicate content)

Le contenu identique ou très similaire (contenu dupliqué) sur plusieurs pages peut entraîner une pénalité de Google

Désindexer certaines pages permet d’éviter cette duplication et ses conséquences négatives sur le référencement.

Elles sont confidentielles

Les pages contenant des informations confidentielles, destinées à un public restreint (intranet, extranet), peuvent être exclues de l’indexation pour garantir la confidentialité et éviter toute divulgation indésirable.

Pour récupérer du budget crawl

Le nombre de pages à indexer peut jouer si vous avez un site internet conséquent.

En désindexant des pages moins importantes, on permet aux moteurs de recherche de consacrer plus de ressources (budget crawl) aux pages cruciales, améliorant ainsi l’efficacité du processus d’exploration et d’indexation.

L’indexation sélective des pages web est une stratégie cruciale pour optimiser la visibilité dans les résultats de recherche tout en garantissant la pertinence du contenu affiché.

cacher page web

Contenus préjudiciables ou privés : mieux vaut les supprimer !

Si on pense moins indexation/référencement, je vous conseille, si vous avez des éléments à cacher, de plutôt les supprimer de votre site web.

La suppression permanente évite toute ré-apparition involontaire dans les résultats de recherche, garantit la pertinence des informations que vos utilisateurs consultent et protège plus efficacement la confidentialité de contenus sensibles. 

Assurez-vous simplement de sauvegarder les informations essentielles avant de procéder à la suppression, et entreprenez cette démarche avec précaution pour éviter tout impact négatif.

Si vous ne pouvez les supprimer, vous pouvez aussi plus simplement les protéger par un mot de passe.
Mais ça se trouve aussi. A vous de voir !

Comment ne pas indexer une page sur Google ? Les options possibles

ll existe plusieurs méthodes pour empêcher l’indexation d’une page sur Google.

Voici quelques-unes des approches les plus courantes que vous pouvez mettre en place :

1. Fichier robots.txt :

Le fichier robots.txt est un fichier texte situé à la racine de votre site web qui indique aux robots d’indexation quels sont les éléments qu’ils sont autorisés ou non à explorer. 

Voici un exemple de directive “Disallow” pour indiquer à Google de ne pas indexer une page spécifique :

Exemple : Disallow: /chemin-de-la-page/

2. Balise meta robots :

Ajoutez la balise <meta name=”robots” content=”noindex, nofollow”> dans la section <head> de la page.

 

3. En-tête HTTP X-Robots-Tag :

Configurez l’en-tête HTTP X-Robots-Tag pour spécifier les directives de non-indexation.

Exemple : X-Robots-Tag: noindex, nofollow

4. Dans la Google Search Console

Accédez à la Google Search Console, sélectionnez votre site, puis utilisez l’outil “Supression d’URL” pour demander la suppression temporaire ou permanente de la page.

Vérifiez régulièrement que les mises à jour ont été effectuées, la GSC joue parfois des tours !

5. Balises HTML avec l’attribut “noindex” :

Utilisez directement la balise noindex dans les balises HTML des liens pour empêcher l’indexation. 

Exemple : <a href=”url-de-la-page” rel=”noindex”>Lien vers la page non indexée</a>

6. Avec Yoast SEO

Yoast SEO est un plugin populaire pour les sites WordPress, qui offre des fonctionnalités avancées en matière d’optimisation SEO, notamment : ne pas indexer une page.

Pour ne pas laisser Google indexer une page spécifique à l’aide de Yoast SEO, suivez ces étapes :

  1. Accédez à l’éditeur de la page : allez dans la section “Pages” de votre tableau de bord WordPress et sélectionnez la page concernée.
  2. Ouvrez les paramètres Yoast SEO : dans l’éditeur de la page, recherchez la boîte “Yoast SEO” en bas de la page et cliquez sur l’onglet “Avancé”.
  3. Configurez la directive “noindex” : dans la section “Robots Meta”, choisissez l’option “noindex” dans le menu déroulant de l’option “Index”.
  4. Enregistrez les modifications.

Comment vérifier si une page est bien désindexée ?

Pour vérifier si une page est bien désindexée sur Google, en temps réel, c’est très simple !
 
Entrez la commande Google “site:” suivie de l’URL de votre page dans la barre de recherche Google.

Par exemple : “site:nepasindexerunepage.com/google”.
 
Si la page en question ne s’affiche pas, elle est désindexée.
 
Si vous avez vérifié votre site avec un compte Google Search Console, vous pouvez aussi y trouver des informations sur l’indexation de vos pages.

Quelles sont les pages à ne pas indexer sur Google ?

C’est à vous de choisir quelles pages vous souhaitez désindexer ! 
 
Mais voici des exemples de pages très souvent non indexées sur Google par les sites :
  • Pages de test ou de développement
  • Pages de confirmation de formulaire
  • Contenu dupliqué ou peu pertinent
  • Pages privées ou protégées par mot de passe
  • Répertoires sensibles
  • Mentions légales
  • Fichiers PDF, médias (files png, jpeg, gif..), et autres types de documents non pertinents

Tout savoir sur l’indexation Google

“Explorée actuellement non indexée” : résoudre le problème !

Identifiez et résolvez efficacement le statut “explorée actuellement non indexée” de vos pages. Suivez des étapes pratiques pour garantir que votre contenu soit correctement indexé et disponible aux utilisateurs.

  • Analyse des erreurs d’exploration
  • Modification des balises meta appropriées
  • Utilisation d’outils Google Search Console

Article à venir

Autres questions sur la désindexation Google

Quelles sont les conséquences de la désindexation d'une page sur Google ?

La désindexation d’une page peut avoir des implications importantes sur sa visibilité dans les résultats de recherche. Si une page est désindexée, elle ne sera plus visible aux utilisateurs qui effectuent des recherches sur Google.

Cela peut être souhaitable dans le cas de pages sensibles, mais il est important de noter que cela peut également affecter le référencement et la visibilité globale de votre site.

Avant de désindexer une page, assurez-vous de comprendre les conséquences sur votre présence en ligne.

Comment gérer les mises à jour de contenu sur une page désindexée ?

Si vous avez mis à jour le contenu d’une page désindexée et souhaitez qu’il soit à nouveau indexé, vous pouvez retirer la directive user agent “Disallow” du fichier robots.txt et supprimer la balise meta robots “noindex” de l’en-tête HTML de la page.

Ensuite, utilisez Google Search Console pour demander aux moteurs une nouvelle exploration et indexation de la page mise à jour.

Est-il possible de désindexer temporairement une page sur Google ?

Oui, il est possible de désindexer temporairement une page en utilisant la balise meta robots avec la directive “noindex” et en réintégrant la directive “index” lorsque vous souhaitez que la page soit à nouveau indexée.

Cela peut être utile pour gérer temporairement l’accès à une page sans compromettre son référencement à long terme.