optimisation core web vitals 8 min

WordPress : le vrai ménage SEO n’est pas technique, c’est l’élagage d’URLs

Votre site WordPress génère des centaines d’URLs sans valeur qui diluent votre crawl budget. Voici comment les supprimer à la racine, sans plugin.

Par Julien Morel
Partager

On va démolir un mythe tout de suite. Le mythe, c’est que WordPress est « SEO-friendly out of the box ». Il ne l’est pas. Il est bavard. Il génère des URLs pour tout : chaque auteur, chaque date, chaque étiquette, chaque pièce jointe. Ces pages ne sont pas optimisées, rarement utiles, et Google les explore quand même.

Pire : ces URLs fantômes sont souvent liées depuis vos propres pages, via des widgets ou des métadonnées d’article. Résultat, votre maillage interne distribue du PageRank vers du vide. C’est le sujet que la partie 1 de cette série avait amorcé en nettoyant la sémantique des en-têtes. On va maintenant s’attaquer au vrai chantier : supprimer les URLs qui diluent votre crawl budget et affaiblissent l’architecture de votre site.

Ce que Googlebot voit quand il explore un WordPress non nettoyé

Imaginez un site de 200 articles bien rédigés. Chaque article appartient à une catégorie, a un auteur, une date de publication. WordPress crée automatiquement une page pour chaque mois de publication, une page pour chaque auteur, une page pour chaque catégorie. Ajoutez les pages de médias, les pages d’étiquettes si vous les utilisez, les paginations d’archives. Vous atteignez 800 à 1200 URLs.

Le robot de Google arrive avec un budget de crawl. Disons 500 URLs par jour. Il va en explorer 300 qui sont soit vides, soit dupliquées, soit des archives de date sans contenu éditorial. Les 200 articles utiles passent en second, ou ne passent pas ce jour-là. C’est un gaspillage documenté : John Mueller a répété en 2024 que les pages de faible valeur consomment du crawl budget qui n’est pas alloué ailleurs.

Ce n’est pas une question de « pénalité ». C’est une question d’efficacité de crawl. Un site propre est un site que Google explore entièrement, rapidement, sans gaspiller de requêtes sur des /2013/02/.

Le maillage interne commence par supprimer les liens parasites, pas par en créer

On lit souvent qu’il faut « renforcer le maillage interne ». Avant de créer des liens, il faut supprimer ceux qui nuisent. Un lien interne depuis chacune de vos pages vers une page d’auteur qui contient trois phrases et zéro backlink externe, c’est un vote perdu.

Un test simple. Ouvrez n’importe quel article sur un WordPress standard. Affichez le code source. Comptez les balises <a> avec un href vers votre propre domaine. Vous en trouverez entre 40 et 80, parfois 120. Sur ces 80 liens, combien mènent vers du contenu vraiment utile ? Le logo vers l’accueil, les entrées du menu principal, peut-être trois articles liés à la main. Le reste, c’est du bruit.

Les principaux générateurs de liens parasites sont :

  • Le widget « Articles récents » et « Commentaires récents », qui créent 10 à 20 liens par page sans pertinence contextuelle.
  • Les blocs de métadonnées sous le titre : lien vers l’auteur, lien vers la date, lien vers la catégorie. Trois liens qui n’apportent rien si l’auteur est unique et si la catégorie est déjà accessible depuis le menu.
  • Les étiquettes (tags), qui produisent des pages d’archives avec 2 articles dedans, dupliquant le contenu des catégories.

Coupez-les. Pas dans les widgets de l’admin. Dans le code du thème. Un unregister_widget() dans functions.php pour les widgets, un remove_action pour les blocs de métadonnées. Sinon l’URL reste accessible, et Google la trouvera via le sitemap ou un crawl précédent.

Pourquoi les pages d’auteur sont le cancer silencieux de votre crawl

Prenons le cas d’un blog mono-auteur. La page auteur /author/julien/ affiche une bio de deux lignes et la liste de tous les articles. Elle est liée depuis chaque article, sous le titre ou dans la signature. Google voit 200 liens pointant vers une page qui n’a aucune chance de ranker sur quoi que ce soit — elle n’apporte rien qu’une page catégorie ou la home n’apporte déjà.

Le signal que vous envoyez aux algorithmes de classement est confus : vous dites « cette page est importante » via le maillage interne, mais son contenu est squelettique.

Ce qu’on fait : on vire le lien auteur du template single.php et on redirige /author/* vers la page d’accueil ou vers une page « À propos » personnalisée. Une 301 suffit. On gagne deux choses : on ne gaspille plus le jus de liens internes, et on consolide le signal de pertinence vers une page qui a du contenu.

Sur un site multi-auteurs, la logique est différente. Une page auteur avec 100 articles, une bio étoffée, et des liens vers ses réseaux peut avoir une valeur EEAT. Le critère n’est pas « pages auteur = mauvais », mais « cette page mérite-t-elle d’être dans l’index et d’être crawlée tous les jours ? ». Si la réponse est non pour 80 % d’entre elles, coupez.

La même logique s’applique aux archives de dates. Une page /2023/06/ n’a aucune valeur pour un utilisateur. Aucun moteur de recherche ne va classer une page vide juste parce qu’elle contient trois titres d’articles de juin 2023. Bloquez-les dans le robots.txt ou mieux, supprimez-les du code du thème et redirigez. Le crawl budget dégagé sera réalloué à vos landing pages.

Supprimez la page, pas juste le lien

L’erreur qu’on voit partout : aller dans Réglages > Permaliens, désactiver l’affichage, ou cacher le widget via le customizer. L’URL existe toujours. Googlebot la connaît déjà si elle est dans le sitemap ou s’il l’a explorée une fois. La masquer en façade change zéro.

Ce qu’il faut :

  1. Supprimer physiquement le lien de vos templates (header, sidebar, footer, zone métadonnées sous le titre).
  2. Faire renvoyer à l’URL concernée un code 301 vers une page pertinente, ou un 410 si la page n’a pas d’équivalent logique.
  3. Retirer l’URL du sitemap XML si elle y figure encore.
  4. Vérifier dans la Search Console que l’URL passe en « Page redirigée » ou « Non trouvée (410) » et non en erreur 404 ignorée.

Un client nous a envoyé une capture fin 2025 : Search Console affichait 3400 URLs « Explorées - actuellement non indexées ». En creusant, 2800 étaient des pages d’attachement média /photo-nom-fichier/. WordPress crée une page pour chaque image uploadée, sans contenu textuel, avec uniquement l’image. Les liens vers ces pages étaient dans le sitemap et parfois dans le code via des galeries. On a mis en place un redirect 301 de chaque page d’attachement vers le post parent et nettoyé le sitemap. Le crawl des vrais articles a augmenté de 40 % en trois semaines.

Et le nofollow dans tout ça ?

On entend parfois : « Mets un nofollow sur les liens vers les pages sans valeur et le problème est réglé ». Faux sur deux points.

D’abord, le nofollow n’empêche pas Googlebot d’explorer l’URL. Il dit simplement « je ne cautionne pas ce lien ». L’URL est quand même découverte et crawlée si elle est accessible. Ensuite, utiliser un nofollow pour sculpter le PageRank interne est une technique qui ne fonctionne plus comme certains l’imaginent. Depuis les mises à jour de 2019-2020, Google traite le nofollow comme un indice, pas une directive stricte pour le crawling. Les systèmes de classement peuvent choisir de ne pas transmettre de signal via ce lien, mais le crawl, lui, a toujours lieu.

La solution propre, c’est la suppression physique ou la redirection. Le nofollow, c’est un pansement sur une jambe cassée.

Pourquoi un bon maillage commence par une architecture en silo, pas un nuage de tags

L’ancien WordPress adorait les « nuages de tags ». On en voit encore. Un bloc avec 30 étiquettes, chaque étiquette menant à une page qui liste 2 articles en doublon avec la catégorie principale. Chaque page d’étiquette crée une nouvelle page d’archive, ajoute des liens transversaux, et dilue la structure du site.

Supprimez les étiquettes. Pas juste le widget. La fonction register_taxonomy dans votre thème ou votre plugin, et redirigez toutes les URLs /tag/ vers la catégorie la plus proche ou la home.

Le modèle à adopter : une architecture en silo. Une catégorie pilier. Des articles enfants. Des liens entre eux. Zéro lien vers une classification transversale floue. Cela n’a rien à voir avec un choix esthétique, c’est un signal de structure documentaire clair pour un moteur de recherche. Quand Google voit une page catégorie forte, liée depuis le menu principal, qui agrège 30 articles liés entre eux, il comprend le périmètre thématique.

Pour les sites e-commerce sous WooCommerce, cette logique s’applique de la même manière aux attributs produits. Chaque taille, chaque couleur crée une page d’archive avec une URL, souvent indexée, souvent sans contenu unique. Là-dessus, on a vu des boutiques avec 15 000 URLs d’attributs pour 300 produits. Le ratio parle de lui-même.

À l’inverse, un maillage bien construit implique des choix éditoriaux : quelle page pilier vous voulez pousser, quels articles satellites la soutiennent, et quels liens transversaux ont un vrai sens de lecture pour l’utilisateur. Rien à voir avec les liens générés automatiquement par un widget « Articles similaires » qui se base sur un mot-clé commun.

Si vous passez d’une logique de liens automatiques à une logique éditoriale de maillage, le temps de chargement des pages baisse aussi mécaniquement : moins de widgets PHP à exécuter, moins de requêtes SQL pour aller chercher les 10 derniers articles. Le lien entre core web vitals et SEO est direct : une page qui charge vite est explorée plus profondément.

Questions fréquentes

Faut-il supprimer complètement les pages de catégories vides ou les laisser avec un noindex ?

Une page de catégorie vide avec un noindex, c’est une URL que Google continue d’explorer périodiquement. Si elle n’a pas vocation à recevoir du contenu, il vaut mieux la supprimer et renvoyer un 410. Si vous comptez la remplir plus tard, gardez-la en noindex avec un Disallow dans le robots.txt pour épargner le crawl. Mais ne laissez pas un lien interne pointer dessus.

Cette approche d’élagage est-elle compatible avec les thèmes FSE (Full Site Editing) de WordPress récents ?

Oui, mais les leviers changent. Sur un thème classique, vous modifiez functions.php et les templates PHP. Sur un thème FSE, vous intervenez dans l’éditeur de site pour supprimer les blocs de métadonnées (auteur, date, catégorie) au niveau du template article unique. Pour les redirections, le même principe s’applique : un fichier de redirections côté serveur, pas un plugin.

Sur un site avec beaucoup de contributeurs, vaut-il mieux garder les pages auteur pour l’EEAT ?

Si l’auteur a une bio complète, des publications régulières sur le site, et idéalement une présence externe vérifiable (réseaux, publications, interventions), alors oui, la page auteur a une valeur EEAT. À ce moment-là, étoffez-la avec un vrai contenu, un lien vers un portfolio ou une page professionnelle, et un schema Person. Ce n’est plus une page parasite, c’est un signal d’autorité.

Articles similaires

Julien Morel

Julien Morel

Ancien dev front React passé SEO technique après une migration e-commerce qui a fait perdre 60% du trafic organique à son employeur en une nuit (fichier robots.txt oublié en staging). Depuis, il écrit pour que ça n'arrive à personne d'autre et teste sur ses propres side-projects avant de publier quoi que ce soit.

Cet article est publie a titre informatif. Faites vos propres recherches avant toute decision.