Noindex nofollow : comprendre la différence et bien les utiliser en SEO

Temps de lecture : 12 minutes

🔑 L’essentiel à retenir

  • Noindex et nofollow sont deux directives distinctes : la première contrôle l’indexation d’une page, la seconde le suivi des liens. Les confondre est l’erreur la plus fréquente.
  • noindex dit à Google : « ne fais pas apparaître cette page dans les résultats de recherche ».
  • nofollow dit à Google : « ne transmets pas d’autorité (PageRank) via ce lien et ne le considère pas comme une recommandation ».
  • Une page en noindex doit rester en « follow » dans la majorité des cas, pour que Google continue de suivre ses liens internes.
  • Mal employées, ces balises peuvent désindexer des pages stratégiques ou bloquer la circulation du jus de lien dans votre maillage.
Noindex nofollow - décision d'indexation d'une page par le robot de Google
Le robot de Google traite séparément l’indexation (noindex) et le suivi des liens (nofollow).

🔍 noindex ou nofollow : quelle directive appliquer à votre page ?

Quel est votre objectif principal pour la page ou le lien concerné ?



Noindex et nofollow : deux directives à ne jamais confondre

Beaucoup de webmasters utilisent ces deux termes comme s’ils étaient interchangeables. C’est une erreur. Les balises noindex et nofollow répondent à deux questions totalement différentes que se pose le robot de Google quand il arrive sur une page.

La première question est : « dois-je faire apparaître cette page dans mes résultats de recherche ? ». C’est le rôle de noindex. La seconde est : « dois-je suivre ce lien et transmettre de l’autorité à la page de destination ? ». C’est le rôle de nofollow.

Autrement dit, noindex agit sur une page entière, tandis que nofollow agit sur un lien (ou, dans sa version meta, sur l’ensemble des liens d’une page). Comprendre cette distinction est la base d’une bonne gestion de l’indexation de votre site par Google.

Le noindex : contrôler ce qui entre dans l’index

L’index de Google est l’immense base de données qui contient toutes les pages susceptibles d’apparaître dans les résultats. Une directive noindex dit explicitement au moteur de ne pas y stocker la page concernée.

Concrètement, elle se place dans le code HTML de la page, dans la section <head> :

<meta name="robots" content="noindex, follow">

Elle peut aussi être envoyée via un en-tête HTTP X-Robots-Tag, particulièrement utile pour les fichiers non-HTML comme les PDF.

Le terme « follow » accolé au noindex est essentiel : il indique à Google de continuer à suivre les liens présents sur la page. On désindexe la page, mais on laisse le robot circuler vers le reste du site.

Le nofollow : maîtriser la transmission d’autorité

Le nofollow est un attribut que l’on ajoute à un lien hypertexte pour signaler à Google de ne pas le suivre et, surtout, de ne pas transmettre de « jus de lien » (PageRank) vers la page cible.

<a href="https://exemple.com" rel="nofollow">ancre du lien</a>

Depuis 2019, Google a introduit deux attributs complémentaires plus précis : rel="sponsored" pour les liens payants ou affiliés, et rel="ugc" (user-generated content) pour les liens issus de contenus créés par les utilisateurs, comme les commentaires. Ces signaux fonctionnent désormais comme des indices et non plus comme des ordres stricts.

Cette nuance compte dans toute stratégie de netlinking : un profil de liens 100 % dofollow paraît artificiel aux yeux de Google. Sur les profils qu’on analyse au quotidien, les sites les plus solides affichent une proportion naturelle de liens nofollow, souvent entre 20 % et 40 %, simplement parce qu’ils reçoivent des liens depuis des forums, des réseaux sociaux et des médias qui les posent automatiquement.

Noindex nofollow - circulation de l'autorité bloquée par les liens en nofollow
Un lien en nofollow interrompt la transmission d’autorité vers la page de destination.

En avez-vous vraiment besoin ? Évaluez votre cas avant d’agir

Avant de toucher au code, posez-vous la bonne question : la page doit-elle disparaître des résultats, ou bien est-ce un simple lien que vous voulez neutraliser ? La réponse détermine la directive à employer. Voici les cas les plus courants.

Cas 1 — Vous avez des pages utiles aux visiteurs mais sans valeur SEO

Pages de remerciement après un formulaire, panier, espace client, pages de résultats de recherche interne, versions imprimables : ces pages servent l’utilisateur mais n’ont aucune raison d’apparaître dans Google. Le noindex, follow est ici la bonne réponse. Vous les retirez de l’index tout en laissant le robot explorer leurs liens.

Un signe simple pour les repérer : si une page ne répond à aucune requête de recherche et ne génère aucune valeur en arrivant depuis Google, elle est candidate au noindex.

Cas 2 — Vous posez un lien dont vous ne voulez pas vous porter garant

Vous citez une source douteuse, vous insérez un lien affilié, ou vous laissez vos lecteurs publier des liens en commentaires. Dans ces situations, la page reste parfaitement indexable : c’est le lien qu’il faut qualifier en nofollow, sponsored ou ugc. Vous ne touchez surtout pas au noindex.

Dans les audits qu’on réalise, on rencontre souvent ce cas de figure mal géré : des sites mettent en noindex tout un article de blog simplement parce qu’il contient un lien affilié. Résultat : ils sacrifient une page entière, et le trafic qu’elle générait, pour neutraliser un seul lien.

Cas 3 — Vous voulez économiser du budget de crawl sur des milliers de pages inutiles

Sur un gros site (e-commerce avec navigation à facettes, par exemple), des milliers d’URL parasites peuvent gaspiller le budget de crawl de Google. Là, ni le noindex seul ni le nofollow ne suffisent : il faut raisonner en combinant directives meta, robots.txt et balises canoniques. Nous y revenons dans la section sur les alternatives.

Comment implémenter noindex et nofollow étape par étape

Passons à la pratique. La méthode diffère selon que vous travaillez sur un CMS comme WordPress ou directement dans le code.

Mettre une page en noindex

Sur WordPress, la méthode la plus fiable passe par une extension SEO. Avec Yoast SEO ou Rank Math, ouvrez l’éditeur de la page, allez dans les réglages avancés du module SEO, et choisissez « Non » à la question « Autoriser les moteurs de recherche à afficher cette page dans les résultats ? ». L’extension injecte alors automatiquement la balise meta robots correcte.

En code pur, ajoutez simplement la balise dans le <head> :

<meta name="robots" content="noindex, follow">

Pour un fichier PDF ou une image, utilisez l’en-tête HTTP côté serveur :

X-Robots-Tag: noindex

Point crucial : la page doit rester explorable. Si vous la bloquez dans le robots.txt, Google ne lira jamais votre noindex, et la page pourra rester indexée indéfiniment (souvent avec la mention « Aucune information disponible » dans les SERP).

Poser un lien en nofollow

Pour un lien isolé, ajoutez l’attribut rel directement dans la balise <a>. Sur WordPress, l’éditeur de blocs propose une case « marquer comme nofollow » et « lien sponsorisé » dans les options du lien, ce qui évite de toucher au HTML.

Choisissez la bonne valeur selon le contexte :

  • rel="nofollow" : lien dont vous ne voulez pas vous porter garant.
  • rel="sponsored" : lien payant, affilié ou publicitaire.
  • rel="ugc" : lien dans un commentaire ou un contenu d’utilisateur.

Pour appliquer un nofollow à tous les liens d’une page d’un coup, la balise meta <meta name="robots" content="nofollow"> existe, mais elle est rarement recommandée : elle coupe aussi le suivi de vos propres liens internes, ce qui nuit à votre maillage interne.

Tableau comparatif : noindex vs nofollow

Critère noindex nofollow
Agit sur Une page entière Un lien (ou tous les liens d’une page)
Effet Retire la page de l’index Ne transmet pas d’autorité
Où on le place Balise meta robots / X-Robots-Tag Attribut rel sur la balise <a>
La page reste visible ? Non, elle disparaît des SERP Oui, totalement indexable
Cas d’usage type Panier, page de remerciement, recherche interne Lien affilié, commentaire, source non vérifiée

Vérifier que vos directives fonctionnent vraiment

Poser une balise ne suffit pas : il faut confirmer que Google l’a bien prise en compte. Plusieurs outils permettent ce contrôle, en quelques minutes.

Le plus fiable reste l’outil d’inspection d’URL de la Google Search Console. Collez l’URL : il vous indique si la page est indexée, et si une balise noindex a été détectée. Pour un audit massif, un crawler comme Screaming Frog liste toutes les pages en noindex et tous les liens en nofollow de votre site en un seul passage.

La documentation officielle de Google sur la balise meta robots et la directive noindex détaille précisément les valeurs reconnues et leur comportement — une lecture utile avant toute mise en production.

Une erreur que l’on observe très souvent dans les audits : des pages désindexées par accident à cause d’un noindex laissé en place après une refonte. Le contrôle régulier via la Search Console évite ce genre de catastrophe silencieuse.

✅ À vérifier avant de déployer une directive noindex ou nofollow

  • La page que vous mettez en noindex n’est-elle pas bloquée dans le robots.txt ? (sinon la directive ne sera jamais lue)
  • Avez-vous bien gardé « follow » sur vos pages en noindex pour préserver le maillage interne ?
  • Pour un lien, avez-vous choisi la bonne valeur (nofollow, sponsored ou ugc) selon le contexte ?
  • Avez-vous vérifié l’URL dans la Search Console après la mise en ligne ?
  • Aucune page stratégique génératrice de trafic ne se retrouve-t-elle en noindex par erreur ?
Noindex nofollow - arbre de décision pour choisir la bonne directive
Arbre de décision : quelle directive appliquer selon le type de page ou de lien.

Les alternatives : canonical, robots.txt et Search Console

Le noindex et le nofollow ne sont pas toujours les bons outils. Selon votre objectif, d’autres mécanismes sont parfois plus adaptés.

La balise canonical est la solution face aux contenus dupliqués ou très proches. Plutôt que de désindexer une variante d’URL (page avec paramètres de tri, par exemple), vous indiquez à Google quelle version est la « référence ». Le moteur consolide alors les signaux sur l’URL canonique, sans perdre la page. À privilégier quand les deux pages ont une valeur, contrairement au noindex qui sacrifie l’une d’elles.

Le robots.txt bloque l’exploration en amont. Il est idéal pour préserver le budget de crawl sur des répertoires entiers sans intérêt (espace d’administration, scripts, fichiers techniques). Sa limite : il n’empêche pas l’indexation d’une URL déjà connue. Une page bloquée au crawl peut donc apparaître dans Google sans description. Pour réellement désindexer, le noindex reste indispensable.

L’outil de suppression d’URL de la Search Console permet de masquer temporairement une page en quelques heures. C’est une mesure d’urgence — par exemple une page confidentielle publiée par erreur — mais elle ne dure que six mois environ. Pour un retrait permanent, repassez ensuite par un noindex.

En pratique, quand on compare ces approches sur un même site, le bon réflexe est presque toujours le même : noindex pour retirer proprement une page de l’index, canonical pour gérer les doublons, robots.txt uniquement pour ce qui ne doit jamais être exploré.

🚨 Erreurs fréquentes et comment les éviter

Erreur 1 — Bloquer une page en robots.txt ET la mettre en noindex

C’est l’erreur la plus dommageable. Si vous interdisez le crawl d’une page dans le robots.txt, Google n’accède jamais à son code HTML… et ne voit donc jamais la balise noindex. Résultat : la page peut rester indexée. Pour désindexer une page, il faut au contraire laisser Google l’explorer, lui faire lire le noindex, et attendre la désindexation effective avant d’envisager un blocage.

Erreur 2 — Utiliser noindex à la place de nofollow (et inversement)

Mettre une page entière en noindex pour neutraliser un seul lien affilié revient à se couper un bras pour soigner une écharde. À l’inverse, poser des nofollow partout en espérant cacher une page de Google ne fonctionne pas : la page reste parfaitement indexable. Chaque directive a son périmètre : page pour noindex, lien pour nofollow.

Erreur 3 — Oublier de retirer un noindex après une mise en production

Lors d’un développement, on met souvent tout le site en noindex sur l’environnement de préproduction. C’est l’erreur qu’on retrouve dans la quasi-totalité des audits de sites fraîchement refondus : le noindex global a été oublié au moment de la mise en ligne. Le site entier disparaît alors de Google. Première vérification systématique après une refonte : inspecter la balise robots de la page d’accueil.

Erreur 4 — Croire que nofollow bloque totalement le passage du robot

Le nofollow est aujourd’hui un indice, pas une barrière absolue. Google peut malgré tout explorer un lien nofollow s’il le découvre par ailleurs. Ne comptez donc jamais sur le nofollow pour empêcher l’indexation d’une page sensible : c’est le rôle du noindex, voire d’une protection par mot de passe.

❓ Questions fréquentes sur noindex et nofollow

Conclusion

Maîtriser noindex et nofollow, c’est avant tout savoir distinguer deux questions : cette page doit-elle être indexée ? et ce lien doit-il transmettre de l’autorité ?. Le noindex pilote l’indexation d’une page, le nofollow gouverne le comportement d’un lien.

Retenez trois réflexes : utilisez noindex, follow pour retirer une page sans casser votre maillage, qualifiez vos liens avec nofollow, sponsored ou ugc selon le contexte, et ne bloquez jamais une page en robots.txt si vous voulez la désindexer.

Prochaine étape concrète : ouvrez la Search Console, lancez l’inspection de vos pages les plus importantes, et vérifiez qu’aucune d’elles ne porte un noindex involontaire. C’est l’audit de cinq minutes qui peut vous éviter de perdre du trafic sans même vous en apercevoir.