- des menteurs,
- des médium maîtrisant l’avenir et anticipant chaque problème afin qu’il ne se produise pas,
- des gourous qui ont trouvé la solution imparable de rediriger leurs erreurs 404 automatiquement vers la home (pas forcément une bonne solution pour diagnostiquer les problèmes éventuels),
- des petits malins qui ne renvoient pas l’entête HTTP 404 pour les pages non trouvées mais 200 (ok) (on parle alors de «soft 404», ce n’est pas une 404 mais c’est tout comme),
- des sites qui ne font pas suffisamment de trafic pour être dignes de recevoir des visiteurs échoués sur leur page d’erreur 404,
Si tu ne fais pas partie de l’élite du NO 404’s Land, alors la suite peut t’intéresser…
- Surveiller les liens morts qui génèrent du trafic (et sont donc théoriquement intéressant pour ton SEO, une petite redirection et le tour est joué).
- Veiller à ce que les liens des campagnes marketing ne renvoient pas vers des pages vides donc des erreurs 404 (malheureusement ça arrive trop souvent).
- Vérifier que l’ensemble de ton site web fonctionne bien et permette de réaliser tes objectifs de conversion. Et oui, un visiteur qui tombe sur une 404, c’est 90 % de taux de rebond/sortie au meilleur des cas si tu as une belle page 404 personnalisée et chartée à tes couleurs avec de beaux liens de navigation vers la home, le moteur de recherche interne ou un plan de site.
Je te propose donc, aujourd’hui, une méthode simple permettant d’être prévenu rapidement et de diagnostiquer les problèmes d’erreur 404 à l’aide de Google Analytics.
Pourquoi customiser le marqueur Analytics et où faut-il le mettre ?
Le marqueur Google Analytics pour la page d’erreur 404
À noter que le code ci-dessous utilise le format de marquage du GA.js en mode asynchrone.
1
2 3 4 5 6 7 8 9 10 |
<script type=“text/javascript”>// <![CDATA[
var _gaq = _gaq || []; _gaq.push([‘_setAccount’, ‘UA-XXXXX-X’]); _gaq.push([‘_trackPageview’, ‘/404.html?page=’ + document.location.pathname + document.location.search + ‘&from=’ + document.referrer]); (function() { var ga = document.createElement(‘script’); ga.type = ‘text/javascript’; ga.async = true; ga.src = (‘https:’ == document.location.protocol ? ‘https://ssl’ : ‘http://www’) + ‘.google-analytics.com/ga.js’; var s = document.getElementsByTagName(‘script’)[0]; s.parentNode.insertBefore(ga, s); })(); // ]]></script> |
Consulter les visites sur la page 404 dans Analytics
Pour consulter les visites sur la page 404 dans Analytics, il te suffit ensuite de te rendre sur le rapport des pages vues et de filtrer sur l’url type créée par le marqueur soit ‘404.html’ comme ci dessous.
À noter que le paramètre « page= » de ce rapport permet de remonter la provenance interne ou externe de l’internaute « échoué » et donc de diagnostiquer le problème plus facilement.
Créer l’alerte dans Google Analytics
Créer maintenant l’alerte sur le volume de visites de la page 404 sur Google Analytics. Rien de plus simple :
En bon webanalyste que tu es sûrement, la 1ère étape est déjà de définir un «seuil de tolérance» c’est-à-dire une valeur quotidienne limite que tu ne dois pas dépasser. Imagine que tu es un danseur de Limbo : ton seuil de tolérance est la hauteur de la barre que tu dois franchir à l’aise, quel que soit ta forme (ndla aux non initiés : par le dessous). Par contre, si la hauteur de ta barre est fixée pour un trapéziste ou pire un sauteur à la perche plutôt qu’un danseur de limbo, c’est sans doute que le seuil de tolérance est trop… euh …. tolérant. Il est relativement facile de fixer une valeur maximum cible normale une fois le volume moyen de naufrages sur la 404 connu grâce à ton nouveau marqueur. 😉
La seconde et dernière étape est de paramétrer ton alerte dans Google Analytics par rapport au seuil de tolérance que je fixerai à 10 pour l’exemple (c’est-à-dire qu’au dessus de 10 visites par jour sur la page 404, tu considères qu’il y a un incident qui mérite ton attention et tes compétences d’analyste).
Commentaires
Laisser un commentaire
Très bonne astuce, mais il serait peut-être également utile d’expliquer comment mettre en place une 404 personnalisée.
Sinon, je trouve que la plus grosse erreur d’une 404 personnalisée est justement d’afficher que c’est une erreur. Ça a tendance a faire fuir l’internaute lambda plutôt qu’a l’inciter à se balader dans la pages valides du site.
Tu n’aurais pas des ressources sur la creation de 404 personnalisées 🙂 ? c’était pas l’objet initial de l’article donc je n’ai pas détaillé. Pour l’affichage de l’erreur c’est un point de vue, ça se défend… si tu le envoie l’internaute sur une page qui n’affiche pas que c’est une erreur, tu aura probablement de toute façon un contenu peu qualitatif qui va donner au visiteur une mauvaise perception de ton site: » je cherche un contenu précis » on m’envoie sur une page de résultats de recherche qui correspond pas vraiment à ma demande sans vraiment m’informer de ce qui se passe. Après je te rejoins dans le sens ou c’est parfois un peu brut si c’est signalé comme « 404 PAGE NON TROUVEE !!!! » . Il y a pleins d’exemple de 404 personnalisées originales qui font passer le message plus doucement
Simplement
ErrorDocument 404 /mapageerreur404.html
dans un .htaccess dans Apache, avec ou sans le / suivant les config.
Tu as raison pour le contenu de la 404, mais j’ai presque envie de dire que ça dépend du niveau de l’internaute, et par conséquent de la cible globale du site. Pour un néophyte, le terme erreur est rébarbatif, alors que pour des gens plus aguerris, ça ne pose aucun problème.
L’important, c’est de faire passer au mieux la pilule 😉 et de limiter autant que faire se peut les pages manquantes grâce à ton astuce.
Merci Aurélien pour l’info. Après, il peut être intéressant quand le site brasse beaucoup de monde, de créer un profil Analytics spécifique pour isoler l’audience sur la 404. Dans XiTi, on isolerait ce trafic dans un site de niveau 1.
Et celle de 1ère Position, elle est pas belle ?
Sinon t’a aussi les webmaster tools de Google qui te permettent de lister simplement les 404 et autres codes d’erreurs détectés lors du crawl de Google. Mais pas de stats.
Tu as raison ça ne mange pas de pain de rappeler la commande permettant de rediriger vers une 404 personnalisée, c’est ajouté, merci a toi 🙂
@apo oui mais le webmaster tools a pas mal d’inconvirents
– liens non crawalble non pris en compte par le webmaster tools (cas des campagnes marketing envoyant vers la 404 que cet outil ne te donnera jamais)
– Problème de réactivité de l’outil (le temps que tes liens soit crawlés) par rapport a des alertes données par des stats de consultation qui sont significatives d’un vrai problème puisqu’elles affectent directement tes visiteurs.
Par contre le webmaster tools te donne une vue purement technique de ce que va crawler le moteur de recherche qui est parfois très surprenant !
En regardant, je vien de me rendre compte que Google crawle des url virtuelles utilisées pour le tracking analytics sur des liens interne via le onclick, exemple:
onclick= »_gaq.push([‘_trackPageview’,’/monurldetracking.html’));
crawle vraiment n’importe quoi ce Google !!!
Astuce très pratique. Il est en effet intéressant de pouvoir détecter ce genre d’erreur par soi-même. Pas que je ne fasse pas confiance aux Webmaster Tools mais je trouve que certaines des données sont erronées.
Par contre, je plusoie la création d’un profil personnalisé qui à mon sens permet une visibilité plus rapide de l’information 🙂
En tout cas, merci pour l’info.
Salut la sponzy team!
2 questions Aurélien:
il n’y a aucun changement?
Enfin, dans le code que tu indiques, pourquoi il y a une balise ?
Salut Antoine,
Pas de changement sur le marqueur par rapport a ce que tu peux trouver ailleurs ;-), mai petite précision le code d’exemple est à utiliser lorsque que le marqueur est chargé en mode asynchrone (la syntaxe change donc un peu par rapport à l’ancienne version du GA.js que tu utilise peut être sur la plupart de tes sites ).
Pour ta 2e remarque, je pense que le code HTML est nettoyé et ton code remplacé par « ? » de quelle balise parles tu dans le code d’exemple ?
Très utile comme article. C’est peu probable que les développeurs ou que ceux dans le référencement pensent à surveiller l’activité des pages 404. Ce n’est pas évident, mais ça s’avère très pratique. Aussi, saurais-tu par hasard comment créer plusieurs pages 404 pour un serveur qui héberge plusieurs sites ? Faut-il simplement créer un .htaccess pour chaque dossier ?
Merci pour l’astuce dans Google analytics ….
J’utilisais l’outil LinkExaminer pour localiser rapidement les pages 404 ….
On peut utiliser tout simplement le filtre par titre pour trouver la 404 personnalisée.
Mais bon rien ne vaut un rapport automatisé des logs apache pour suivre ce
@Julien R : oui le filtre par titre est une bonne alternative, cependant il te permet moins facilement de remonter l’origine de l’erreur (dans le paramètre « page= » du rapport par url)
Au niveau des 404, le rapport automatisé des logs apache offre une vue technique a la différence de Analytics qui va te remonter lorsque les utilisateurs ont des problèmes de consultation sur ton site (ce qui me parait plus grave que les crawlers qui peuvent aussi provoquer des erreurs 404). L’avantage d’analytics est aussi la possibilité de définir une alerte donc n’être prévenu qu’en cas de problème. Ça surcharge un peu moins la messagerie 😉
@Apo: je suis d’accord avec « je trouve que la plus grosse erreur d’une 404 personnalisée est justement d’afficher que c’est une erreur. » Simplement préciser que en tout cas, il faut indiquer clairement aux visiteurs que la page qu’ils recherchent est introuvable.
Astuce très pratique. Il est en effet intéressant de pouvoir détecter ce genre d’erreur par soi-même. Pas que je ne fasse pas confiance aux Webmaster Tools mais je trouve que certaines des données sont erronées.
Par contre, je plusoie la création d’un profil personnalisé qui à mon sens permet une visibilité plus rapide de l’information 🙂
En tout cas, merci pour l’info.