Derniers événements

Plus de vidéos
Fil d'actualités / Comment augmenter le nombre de pages indexées de votre site ?

Publié le 04/09/2024 à 11:40:32 par Neper

Comment augmenter le nombre de pages indexées de votre site ?

Pour avoir un site bien référencé dans les moteurs de recherche, outre les actions de SEO, cela commence par la découvrabilité, la crawlabilité et l’indexabilité de votre site. Si votre site n’est pas optimisé pour ces trois points, inutile de vous fatiguer à faire d’autres actions SEO, vous n’obtiendrez pas le ROI attendu !

Pour commencer, il s’agit de déterminer quelles parties de votre site ne sont pas indexées par Google et pourquoi. Ensuite, il faudra déterminer ce qu’il faut modifier sur ces pages pour que Google les indexe, mettre en œuvre les changements nécessaires et enfin suivre les résultats dans la Google Search Console.

Les problèmes les plus courants qui empêchent l’indexabilité de vos pages sont généralement de deux types : les problèmes techniques, les problèmes de contenu. Je vous propose une checklist à vérifier si des parties de votre site ne sont pas indexées par Google. Bien entendu, cette checklist n’est pas exhaustive. Je ne vois pas comment tous les cas particuliers pourraient être listés. Voici les plus courants, que nous rencontrons fréquemment chez nos clients.

Les problèmes techniques courants

Voici une liste des problèmes techniques les plus courants qui peuvent empêcher la bonne indexation de certaines pages par Googlebot :

Blocage par le fichier robots.txt
Le fichier robots.txt peut contenir des directives qui empêchent Googlebot d’explorer certaines pages ou sections du site. Par exemple, une directive Disallow mal configurée peut bloquer l’accès à des pages importantes.

Balises Meta Noindex
L’utilisation de la balise <meta name="robots" content="noindex"> sur certaines pages peut indiquer à Googlebot de ne pas indexer ces pages. Cela est parfois utilisé intentionnellement, mais peut aussi être appliqué par erreur.

Contenu en JavaScript mal pris en charge
Si une grande partie du contenu d’une page est générée dynamiquement via JavaScript, il se peut que Googlebot ne parvienne pas à indexer correctement ce contenu, surtout si le script n’est pas compatible avec l’exploration par Googlebot.

Mauvaise structure des URL
Les URL non accessibles ou mal configurées, telles que celles comportant des paramètres dynamiques complexes, peuvent être difficiles à explorer et à indexer par Googlebot. Cela inclut aussi les URL cassées ou redirigées de manière incorrecte.

Temps de chargement de la page trop long
Les pages qui mettent trop de temps à se charger peuvent ne pas être explorées complètement par Googlebot, ce qui peut entraîner une indexation partielle ou nulle de ces pages.

Problèmes de redirection
Les redirections mal configurées (par exemple, des boucles de redirection ou des redirections multiples) peuvent empêcher Googlebot d’accéder au contenu souhaité.

Liens internes cassés ou absents
Les pages qui ne sont pas bien intégrées dans la structure de liens internes du site peuvent être difficiles à trouver et à indexer pour Googlebot. Des liens internes cassés ou une navigation complexe peuvent rendre certaines pages quasiment invisibles pour le robot.

Erreurs serveur (HTTP 5xx)
Les erreurs serveur, comme les erreurs 500 (erreur interne du serveur) ou les erreurs 503 (service temporairement indisponible), peuvent empêcher Googlebot d’explorer et d’indexer les pages concernées.

Pages protégées par un mot de passe
Les pages qui nécessitent une authentification pour être accessibles ne peuvent pas être indexées par Googlebot.

Problèmes de balises canoniques
Une mauvaise implémentation des balises rel=“canonical” peut indiquer à Googlebot de privilégier d’autres pages, ce qui peut entraîner la non-indexation des pages concernées.

Sitemaps mal configurés
Un sitemap XML mal configuré, contenant des URL incorrectes, non mises à jour, ou excluant des pages importantes, peut limiter l’exploration et l’indexation de ces pages.

Ces problèmes techniques peuvent être identifiés à l’aide d’outils comme Google Search Console, des crawlers SEO (comme Screaming Frog), ou en examinant manuellement le code source et les fichiers de configuration du site.

Les problèmes courants liés au contenu

Les problèmes de qualité de contenu qui peuvent empêcher...