Créer une alerte sur les pages 404 dans Google Analytics

Rédigé manuellement le 14 septembre 2011 par
Quoi qu’on en dise, les erreurs 404 (pages non trouvées)  font partie de la vie normale d’un site et rares sont ceux qui peuvent se vanter de ne pas  (jamais)  en avoir. Ceux ci sont soit:
  • des menteurs
  • des médium  maîtrisant l’avenir et anticipant chaque problème afin qu’il ne se produise pas.
  • des gourous qui ont trouvé la solution imparable de rediriger leurs  erreur 404 automatiquement vers la home (pas forcément une bonne solution pour diagnostiquer les problèmes éventuels)
  • des petits malins qui ne renvoient pas l’entête HTTP 404 pour les pages non trouvées mais 200 (ok): on parle alors de « soft 404″, c’est pas une 404 mais c’est tout comme.
  • des sites qui ne font pas suffisamment de trafic pour être digne de recevoir des visiteurs échoués sur leur page d’erreur 404
Si tu  ne fais pas partie de l’élite du NO 404’s Land, alors la suite  peut t’intéresser….
Voici  au moins 3 raisons qui justifient de garder un oeil sur le volume de consultation de la page 404 de ton site:
  •  Surveiller les liens morts qui génèrent du trafic (et sont donc théoriquement intéressant pour ton SEO, une petite redirection et le tour est joué)
  • Veiller à ce que les liens des campagnes marketing ne renvoient pas vers des pages vides donc des erreurs 404 (malheureusement ça arrive trop souvent)
  • Vérifier que l’ensemble de ton site web fonctionne bien et permette de réaliser tes objectifs de conversion. Et oui un visiteur qui tombe sur une 404  c’est 90% de taux de rebond / sortie au meilleur des cas si tu as une belle page 404 personnalisée et chartée à tes couleurs avec de beaux liens de navigation vers la home, le moteur de recherche interne ou un plan de site.

Je te propose donc aujourd’hui  un méthode simple permettant d’être prévenu rapidement et de diagnostiquer les problèmes d’erreur 404 à l’aide de Google Analytics:

Pourquoi customiser le marqueur Analytics et où faut il le mettre ?

Le premier problème des erreurs 404 est qu’elles sont souvent difficilement repérables dans Analytics.   A la différence des solutions d’analyse de logs Google Analytics  n’enregistre pas l’activité du serveur. Il faudra donc customiser le marqueur Analytics spécifique afin de tracker différemment la consultation des  pages 404,  et encore mieux, effectuer un paramétrage permettant de savoir d’où viennent les internautes  qui échouent sur la page 404.  Le pré requis est d’avoir une page 404 personnalisée  (ex: http://www.1ere-position.fr/404-personnalisee-waaaaaaaaahhhhhhhhhhhoooooooooouuuuuuuu que tu pourra facilement créer et diriger l’internaute via la commande ErrorDocument 404 /mapageerreur404.html dans un .htaccess dans Apache (ou sans le ‘/’ selon les configurations)
Voici donc le code permettant de nommer la page 404.html  et de repérer la provenance de l’internaute « échoué »:

Le marqueur Google Analytics pour la page d’erreur 404

A noter que le code ci dessous utilise le format de marquage du GA.js en mode asynchrone

1
2
3
4
5
6
7
8
9
10
<script type="text/javascript">// <![CDATA[
var _gaq = _gaq || []; _gaq.push(['_setAccount', 'UA-XXXXX-X']);
_gaq.push(['_trackPageview', '/404.html?page=' + document.location.pathname + document.location.search + '&amp;from=' + document.referrer]);
(function() {
var ga = document.createElement('script');
ga.type = 'text/javascript'; ga.async = true;
ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
})();
// ]]></script>

Consulter les visites sur la page 404 dans analytics

Pour consulter les visites sur la page 404 dans Analytics, il te suffit ensuite de te rendre sur le rapport des pages vues et de filtrer sur l’url type créee par le marqueur soit ‘404.html’ comme ci dessous.

A noter que le paramètre « page= » de ce rapport permet de remonter la provenance interne ou externe de l’internaute « échoué » et donc de diagnostiquer le problème plus facilement.

404 analytics

 

 Créer l’alerte dans Google  Analytics

Crée  maintenant l’alerte sur le volume de visites de la page 404 sur Google Analytics.  Rien de plus simple:

  • En bon webanalyste que tu es surement, la 1ere étape est déjà de définir un « seuil de tolérance » c’est à dire une valeur quotidienne limite que tu ne dois pas dépasser.  Imagine que tu es un danseur de Limbo: ton seuil de tolérance est la hauteur de la barre que  tu dois  franchir à l’aise,  quel que soit ta forme (ndla aux non initiés : par le dessous). Par contre si la hauteur de ta barre et fixé pour un trapéziste ou pire un sauteur à la perche plutôt qu’un danseur de limbo, c’est sans doute que le seuil de tolérance  est trop… euh …. tolérant. Il est relativement facile de fixer une valeur maximum cible  normale une fois le volume moyen de naufrages sur la 404 connu grâce à ton nouveau marqueur ;-)
  • La seconde et dernière étape est de paramétrer ton alerte dans Google Analytics  par rapport au  seuil de tolérance que je fixerai à 10 pour l’exemple (c’est à dire qu’au dessus de 10 visites par jour sur la page 404, tu considères qu’il y a un incident qui mérite ton attention et tes compétences d’analyste).
Tu sélectionnes donc période > « jour » pour définir une alerte quotidienne et être prévenu rapidement en cas de problème;
ensuite page >  contient > 404.html pour définir le segment sur lequel va s’appliquer l’alerte et enfin, applique le seuil de tolérance sur la métrique « visite »  qui doit déclencher l’alerte lorsque le volume de visites est supérieur à 10 (le seuil de tolérance).
Le détail de la manipulation est plus clair sur la copie d’écran ci dessous:
Si tu t’intéresses à Google Analytics , je te conseille également la lecture du dernière article sur l’analyse du trafic issus de Google Image
et de me suivre sur Twitter pour d’autres news ;-)
Aurélien Guiton

Par Aurélien Guiton

Consultant Search Marketing

Partager et noter cet article !







15 commentaires pour “Créer une alerte sur les pages 404 dans Google Analytics”

  • Par Apo apocalx.com, le 14 septembre 2011 à 12:23

    Très bonne astuce, mais il serait peut-être également utile d’expliquer comment mettre en place une 404 personnalisée.
    Sinon, je trouve que la plus grosse erreur d’une 404 personnalisée est justement d’afficher que c’est une erreur. Ça a tendance a faire fuir l’internaute lambda plutôt qu’a l’inciter à se balader dans la pages valides du site.

  • Aurélien Guiton

    Par Aurélien Guiton twitter.com/aurelien_guiton, le 14 septembre 2011 à 12:49

    Tu n’aurais pas des ressources sur la creation de 404 personnalisées :-) ? c’était pas l’objet initial de l’article donc je n’ai pas détaillé. Pour l’affichage de l’erreur c’est un point de vue, ça se défend… si tu le envoie l’internaute sur une page qui n’affiche pas que c’est une erreur, tu aura probablement de toute façon un contenu peu qualitatif qui va donner au visiteur une mauvaise perception de ton site:  » je cherche un contenu précis » on m’envoie sur une page de résultats de recherche qui correspond pas vraiment à ma demande sans vraiment m’informer de ce qui se passe. Après je te rejoins dans le sens ou c’est parfois un peu brut si c’est signalé comme « 404 PAGE NON TROUVEE !!!! » . Il y a pleins d’exemple de 404 personnalisées originales qui font passer le message plus doucement

  • Par Apo apocalx.com, le 14 septembre 2011 à 14:20

    Simplement
    ErrorDocument 404 /mapageerreur404.html
    dans un .htaccess dans Apache, avec ou sans le / suivant les config.

    Tu as raison pour le contenu de la 404, mais j’ai presque envie de dire que ça dépend du niveau de l’internaute, et par conséquent de la cible globale du site. Pour un néophyte, le terme erreur est rébarbatif, alors que pour des gens plus aguerris, ça ne pose aucun problème.
    L’important, c’est de faire passer au mieux la pilule ;-) et de limiter autant que faire se peut les pages manquantes grâce à ton astuce.

  • Par Etienne Gousseau , le 14 septembre 2011 à 14:27

    Merci Aurélien pour l’info. Après, il peut être intéressant quand le site brasse beaucoup de monde, de créer un profil Analytics spécifique pour isoler l’audience sur la 404. Dans XiTi, on isolerait ce trafic dans un site de niveau 1.

    Et celle de 1ère Position, elle est pas belle ? http://www.1ere-position.fr/blog/elle-est-pas-belle-la-404

  • Par Apo apocalx.com, le 14 septembre 2011 à 14:31

    Sinon t’a aussi les webmaster tools de Google qui te permettent de lister simplement les 404 et autres codes d’erreurs détectés lors du crawl de Google. Mais pas de stats.

  • Aurélien Guiton

    Par Aurélien Guiton twitter.com/aurelien_guiton, le 14 septembre 2011 à 14:32

    Tu as raison ça ne mange pas de pain de rappeler la commande permettant de rediriger vers une 404 personnalisée, c’est ajouté, merci a toi :-)

  • Aurélien Guiton

    Par Aurélien Guiton twitter.com/aurelien_guiton, le 14 septembre 2011 à 14:51

    @apo oui mais le webmaster tools a pas mal d’inconvirents

    – liens non crawalble non pris en compte par le webmaster tools (cas des campagnes marketing envoyant vers la 404 que cet outil ne te donnera jamais)

    – Problème de réactivité de l’outil (le temps que tes liens soit crawlés) par rapport a des alertes données par des stats de consultation qui sont significatives d’un vrai problème puisqu’elles affectent directement tes visiteurs.

    Par contre le webmaster tools te donne une vue purement technique de ce que va crawler le moteur de recherche qui est parfois très surprenant !

    En regardant, je vien de me rendre compte que Google crawle des urls virtuelles utilisées pour le tracking analytics sur des liens interne via le onclick, exemple:

    onclick= »_gaq.push([‘_trackPageview’,’/monurldetracking.html’));

    crawle vraiment n’importe quoi ce Google !!!

  • Par Jean-Christophe breizh-seo.com, le 15 septembre 2011 à 10:13

    Astuce très pratique. Il est en effet intéressant de pouvoir détecter ce genre d’erreur par soi-même. Pas que je ne fasse pas confiance aux Webmaster Tools mais je trouve que certaines des données sont erronées.

    Par contre, je plusoie la création d’un profil personnalisé qui à mon sens permet une visibilité plus rapide de l’information :)

    En tout cas, merci pour l’info.

  • Par Antoine Leroux antoineleroux.fr, le 15 septembre 2011 à 10:33

    Salut la sponzy team!
    2 questions Aurélien:

    il n’y a aucun changement?

    Enfin, dans le code que tu indiques, pourquoi il y a une balise ?

  • Aurélien Guiton

    Par Aurélien Guiton twitter.com/aurelien_guiton, le 15 septembre 2011 à 16:19

    Salut Antoine,
    Pas de changement sur le marqueur par rapport a ce que tu peux trouver ailleurs ;-), mai petite précision le code d’exemple est à utiliser lorsque que le marqueur est chargé en mode asynchrone (la syntaxe change donc un peu par rapport à l’ancienne version du GA.js que tu utilise peut être sur la plupart de tes sites ).

    Pour ta 2e remarque, je pense que le code HTML est nettoyé et ton code remplacé par « ? » de quelle balise parles tu dans le code d’exemple ?

  • Par Montreal SEO uniseo.com, le 15 septembre 2011 à 18:27

    Très utile comme article. C’est peu probable que les développeurs ou que ceux dans le référencement pensent à surveiller l’activité des pages 404. Ce n’est pas évident, mais ça s’avère très pratique. Aussi, saurais-tu par hasard comment créer plusieurs pages 404 pour un serveur qui héberge plusieurs sites ? Faut-il simplement créer un .htaccess pour chaque dossier ?

  • Par Daniel , le 15 septembre 2011 à 20:24

    Merci pour l’astuce dans Google analytics ….
    J’utilisais l’outil LinkExaminer pour localiser rapidement les pages 404 ….

  • Par Julien R , le 21 septembre 2011 à 16:47

    On peut utiliser tout simplement le filtre par titre pour trouver la 404 personnalisée.
    Mais bon rien ne vaut un rapport automatisé des logs apache pour suivre ce statut.

  • Aurélien Guiton

    Par Aurélien Guiton twitter.com/aurelien_guiton, le 21 septembre 2011 à 17:10

    @Julien R : oui le filtre par titre est une bonne alternative, cependant il te permet moins facilement de remonter l’origine de l’erreur (dans le paramètre « page= » du rapport par url)

    Au niveau des 404, le rapport automatisé des logs apache offre une vue technique a la différence de Analytics qui va te remonter lorsque les utilisateurs ont des problèmes de consultation sur ton site (ce qui me parait plus grave que les crawlers qui peuvent aussi provoquer des erreurs 404). L’avantage d’analytics est aussi la possibilité de définir une alerte donc n’être prévenu qu’en cas de problème. Ça surcharge un peu moins la messagerie ;-)

  • Par achat or cvadirect.com/achat-or, le 27 septembre 2011 à 10:41

    @Apo: je suis d’accord avec « je trouve que la plus grosse erreur d’une 404 personnalisée est justement d’afficher que c’est une erreur.  » Simplement préciser que en tout cas, il faut indiquer clairement aux visiteurs que la page qu’ils recherchent est introuvable.