Tout comme Google qui cherche en permanence à améliorer ses algos (la plupart du temps sans le dire), chez My Ranking Metrics nous avons récemment amélioré un de nos algorithmes « maison » afin d’affiner nos analyses SEO. Il s’agit de l’identification des pages au contenu trop faible (qui augmentent le risque de pénalité Panda).

Meilleure détection des pages au contenu trop faible

Comme vous le savez sans doute, l’objectif de l’algorithme Panda de Google est d’identifier les pages à faible valeur ajoutée. Panda est intégré au coeur de l’algorithme principal : même si Google n’indique plus de dates de mises à jour, il fonctionne chaque jour, ne l’oubliez pas !

Nous y revenons plus loin, mais un élément essentiel de la qualité est le contenu texte. Même si on trouve des contre-exemples, une page avec un contenu texte court est rarement de haute qualité (de nature à satisfaire tous les internautes). C’est ce qu’on appelle « thin content » dans le jargon SEO en anglais.

Une approche simpliste consiste à compter le nombre de mots dans l’ensemble de la page HTML (incluant l’entête, les menus, les barres latérales et le pied de page). Comme vous vous en doutez, cela ne fonctionne pas car ce qui compte, c’est la taille du contenu dans la zone principale de la page.

C’est pourquoi nous avons développé un algorithme spécifique dans RM Tech, afin de vous aider à identifier les pages sans doute trop courtes.

Si vous lancez un audit de votre site, RM Tech devrait identifier vos pages trop courtes, donc des améliorations possibles en termes de référencement 🙂

Vous avez accès à la liste des pages dont le contenu texte est estimé trop court. Pour vous aider à les trier, nous fournissons un indice de gravité du problème, de 0 (aucun problème) à 100 (gros problème).

Des précisions sur QualityRisk

Si une page est estimée trop courte avec cet algorithme alors son QualityRisk va augmenter.

En effet, la taille du texte dans le contenu principal d’une page est un élément important de notre évaluation de la qualité d’une page.

Vous ne connaissez pas QualityRisk ? Consultez ce dossier détaillé

Vous devriez aussi visionner notre webinar QualityRisk, son replay est accessible gratuitement. Nous proposons aussi un guide pour bien utiliser QualityRisk et Zombies ainsi que des explications sur la matrice QR/Z.

A propos : vous trouverez dans le rapport la moyenne du QualityRisk de l’ensemble des pages indexables. Elle est fournie avec l’histogramme de répartition du QualityRisk :

Histogramme QualityRisk
Nombre de pages ayant un QualityRisk supérieur ou égal à 5