Créer une alerte sur les pages 404 dans Google Analytics

Quoi qu’on en dise, les erreurs 404 (pages non trouvées) font partie de la vie normale d’un site et rares sont ceux qui peuvent se vanter de ne pas (jamais) en avoir.
Ceux-ci sont soit :
  • des menteurs,
  • des médium maîtrisant l’avenir et anticipant chaque problème afin qu’il ne se produise pas,
  • des gourous qui ont trouvé la solution imparable de rediriger leurs erreurs 404 automatiquement vers la home (pas forcément une bonne solution pour diagnostiquer les problèmes éventuels),
  • des petits malins qui ne renvoient pas l’entête HTTP 404 pour les pages non trouvées mais 200 (ok) (on parle alors de «soft 404», ce n’est pas une 404 mais c’est tout comme),
  • des sites qui ne font pas suffisamment de trafic pour être dignes de recevoir des visiteurs échoués sur leur page d’erreur 404,

Si tu ne fais pas partie de l’élite du NO 404’s Land, alors la suite peut t’intéresser…

Voici  au moins 3 raisons qui justifient de garder un œil sur le volume de consultation de la page 404 de ton site :
  • Surveiller les liens morts qui génèrent du trafic (et sont donc théoriquement intéressant pour ton SEO, une petite redirection et le tour est joué).
  • Veiller à ce que les liens des campagnes marketing ne renvoient pas vers des pages vides donc des erreurs 404 (malheureusement ça arrive trop souvent).
  • Vérifier que l’ensemble de ton site web fonctionne bien et permette de réaliser tes objectifs de conversion. Et oui, un visiteur qui tombe sur une 404, c’est 90 % de taux de rebond/sortie au meilleur des cas si tu as une belle page 404 personnalisée et chartée à tes couleurs avec de beaux liens de navigation vers la home, le moteur de recherche interne ou un plan de site.

Je te propose donc, aujourd’hui, une méthode simple permettant d’être prévenu rapidement et de diagnostiquer les problèmes d’erreur 404 à l’aide de Google Analytics.

 

Pourquoi customiser le marqueur Analytics et où faut-il le mettre ?

Le premier problème des erreurs 404 est qu’elles sont souvent difficilement repérables dans Analytics. À la différence des solutions d’analyse de logs, Google Analytics n’enregistre pas l’activité du serveur. Il faudra donc customiser le marqueur Analytics spécifique afin de tracker différemment la consultation des pages 404, et encore mieux, effectuer un paramétrage permettant de savoir d’où viennent les internautes  qui échouent sur la page 404.
Le pré-requis est d’avoir une page 404 personnalisée (ex : que tu pourra facilement créer et diriger l’internaute via la commande ErrorDocument 404 /mapageerreur404.html dans un .htaccess dans Apache (ou sans le ‘/’ selon les configurations)).

Le marqueur Google Analytics pour la page d’erreur 404

Voici donc le code permettant de nommer la page 404.html  et de repérer la provenance de l’internaute « échoué ».

À noter que le code ci-dessous utilise le format de marquage du GA.js en mode asynchrone.

1
2
3
4
5
6
7
8
9
10
<script type=“text/javascript”>// <![CDATA[
var _gaq = _gaq || []; _gaq.push([‘_setAccount’, ‘UA-XXXXX-X’]);
_gaq.push([‘_trackPageview’, ‘/404.html?page=’ + document.location.pathname + document.location.search + ‘&amp;from=’ + document.referrer]);
(function() {
var ga = document.createElement(‘script’);
ga.type = ‘text/javascript’; ga.async = true;
ga.src = (‘https:’ == document.location.protocol ? ‘https://ssl’ : ‘http://www’) + ‘.google-analytics.com/ga.js’;
var s = document.getElementsByTagName(‘script’)[0]; s.parentNode.insertBefore(ga, s);
})();
// ]]></script>

Consulter les visites sur la page 404 dans Analytics

Pour consulter les visites sur la page 404 dans Analytics, il te suffit ensuite de te rendre sur le rapport des pages vues et de filtrer sur l’url type créée par le marqueur soit ‘404.html’ comme ci dessous.

À noter que le paramètre « page= » de ce rapport permet de remonter la provenance interne ou externe de l’internaute « échoué » et donc de diagnostiquer le problème plus facilement.

Connaitre ses pages 404 sur Analytics - 1ère position

Créer l’alerte dans Google  Analytics

Créer maintenant l’alerte sur le volume de visites de la page 404 sur Google Analytics. Rien de plus simple :

En bon webanalyste que tu es sûrement, la 1ère étape est déjà de définir un «seuil de tolérance» c’est-à-dire une valeur quotidienne limite que tu ne dois pas dépasser.  Imagine que tu es un danseur de Limbo : ton seuil de tolérance est la hauteur de la barre que tu dois franchir à l’aise, quel que soit ta forme (ndla aux non initiés : par le dessous). Par contre, si la hauteur de ta barre est fixée pour un trapéziste ou pire un sauteur à la perche plutôt qu’un danseur de limbo, c’est sans doute que le seuil de tolérance est trop… euh …. tolérant. Il est relativement facile de fixer une valeur maximum cible normale une fois le volume moyen de naufrages sur la 404 connu grâce à ton nouveau marqueur. 😉

La seconde et dernière étape est de paramétrer ton alerte dans Google Analytics  par rapport au  seuil de tolérance que je fixerai à 10 pour l’exemple (c’est-à-dire qu’au dessus de 10 visites par jour sur la page 404, tu considères qu’il y a un incident qui mérite ton attention et tes compétences d’analyste).

Tu sélectionnes donc période > «jour» pour définir une alerte quotidienne et être prévenu rapidement en cas de problème ;
ensuite page >  contient > 404.html pour définir le segment sur lequel va s’appliquer l’alerte ; et enfin ; tu appliques le seuil de tolérance sur la métrique «visite» qui doit déclencher l’alerte lorsque le volume de visites est supérieur à 10 (le seuil de tolérance).
Le détail de la manipulation est plus clair sur la copie d’écran ci-dessous.
creer une alerte Analytics pour vos 404 - 1ère Position
Si tu t’intéresses à Google Analytics, je te conseille également la lecture du dernière article sur l’analyse du trafic issus de Google Image et de me suivre sur Twitter pour d’autres news. 😉
Ces articles peuvent aussi vous intéresser

Commentaires

  1. Très bonne astuce, mais il serait peut-être également utile d’expliquer comment mettre en place une 404 personnalisée.
    Sinon, je trouve que la plus grosse erreur d’une 404 personnalisée est justement d’afficher que c’est une erreur. Ça a tendance a faire fuir l’internaute lambda plutôt qu’a l’inciter à se balader dans la pages valides du site.

  2. Aurélien Guiton

    Tu n’aurais pas des ressources sur la creation de 404 personnalisées 🙂 ? c’était pas l’objet initial de l’article donc je n’ai pas détaillé. Pour l’affichage de l’erreur c’est un point de vue, ça se défend… si tu le envoie l’internaute sur une page qui n’affiche pas que c’est une erreur, tu aura probablement de toute façon un contenu peu qualitatif qui va donner au visiteur une mauvaise perception de ton site: » je cherche un contenu précis » on m’envoie sur une page de résultats de recherche qui correspond pas vraiment à ma demande sans vraiment m’informer de ce qui se passe. Après je te rejoins dans le sens ou c’est parfois un peu brut si c’est signalé comme « 404 PAGE NON TROUVEE !!!! » . Il y a pleins d’exemple de 404 personnalisées originales qui font passer le message plus doucement

  3. Simplement
    ErrorDocument 404 /mapageerreur404.html
    dans un .htaccess dans Apache, avec ou sans le / suivant les config.
    Tu as raison pour le contenu de la 404, mais j’ai presque envie de dire que ça dépend du niveau de l’internaute, et par conséquent de la cible globale du site. Pour un néophyte, le terme erreur est rébarbatif, alors que pour des gens plus aguerris, ça ne pose aucun problème.
    L’important, c’est de faire passer au mieux la pilule 😉 et de limiter autant que faire se peut les pages manquantes grâce à ton astuce.

  4. Etienne Gousseau

    Merci Aurélien pour l’info. Après, il peut être intéressant quand le site brasse beaucoup de monde, de créer un profil Analytics spécifique pour isoler l’audience sur la 404. Dans XiTi, on isolerait ce trafic dans un site de niveau 1.
    Et celle de 1ère Position, elle est pas belle ?

  5. Sinon t’a aussi les webmaster tools de Google qui te permettent de lister simplement les 404 et autres codes d’erreurs détectés lors du crawl de Google. Mais pas de stats.

  6. Aurélien Guiton

    Tu as raison ça ne mange pas de pain de rappeler la commande permettant de rediriger vers une 404 personnalisée, c’est ajouté, merci a toi 🙂

  7. Aurélien Guiton

    @apo oui mais le webmaster tools a pas mal d’inconvirents
    – liens non crawalble non pris en compte par le webmaster tools (cas des campagnes marketing envoyant vers la 404 que cet outil ne te donnera jamais)
    – Problème de réactivité de l’outil (le temps que tes liens soit crawlés) par rapport a des alertes donn