Formation Réalisation d’un audit algorithmique



Vous souhaitez tout savoir sur la réalisation d’un audit algorithmique pour le référencement web ?

Nous vous proposons, durant une journée et demie (9h30) d’approfondir vos connaissances et de vous former à la réalisation d’audits efficaces.

Voici le programme :

Les primitives du fonctionnement d’un moteur de recherche, la structure d’un audit algorithmique

Objectifs pédagogiques

Comprendre comment fonctionne un moteur de recherche comme Google afin de situer l’utilité de chacune des briques fonctionnelles d’un audit algorithmique.
Présenter chacune de ces briques fonctionnelles.

Contenu

Savoir identifier les pièces qui constituent un moteur de recherche.

Crawl par le bot

Analyse de la pertinence

Analyse de la popularité via le pagerank

Analyse des contenus pour estimer leur qualité

Connaître les piliers d’un bon audit :

Aspects techniques du site et du serveur

Audit sémantique

Linking interne et externe

Analyse du comportement des visiteurs

Analyse qualitative


Aspects techniques de l’audit

Objectifs pédagogiques

Comprendre et analyser les critères techniques de configuration du serveur qui entrave le positionnement.
Comprendre et analyser les barrières au positionnement dans le développement du code source d’un site web.

Contenu

Un site web est hébergé sur un serveur qui nécessite une configuration technique particulière. Certains aspects techniques sont importants pour le positionnement dans un moteur de recherche. Cette séquence présente les différents aspects techniques importants, comment mesurer leur mise en place et les interprétations associées.

Une fois le serveur configuré, il faut que le site web soit développé selon un certain nombres de bonnes pratiques. Cette séquence présente les différentes bonnes pratiques importantes, comment mesurer leur mise en place et les interprétations associées.


Analyse sémantique

Objectifs pédagogiques

Comprendre ce qu’est une analyse sémantique. Réaliser une telle analyse sur un ensemble de pages web.

Contenu

Savoir comment mettre en place des scripts permettant de quantifier la pertinence entre une requête et des pages. Se servir de ces mesures pour proposer un contenu adapté aux moteurs de recherche.


Linking interne et externe

Objectifs pédagogiques

Comprendre ce qu’est une analyse du linking interne et du linking externe. Réaliser une telle analyse pour déterminer les flux de pagerank à l’interne, la dilution implicite, la qualité des liens externes en terme de popularité, confiance et force induite.

Contenu

Déterminer si le maillage mis en place permet de maximiser le pagerank d’un site web. Visualiser les pages qui profitent le plus de la structure du site en terme de “ventilation” de pagerank.
Vérifier si la structure de liens entre les pages d’un site permet de minimiser la perte de pagerank. La notion de force induite : comment la calculer, comment l’utiliser.

Les critères d’un bon netlinking externe : notion de citation flow, trustflow. Vérifier que l’ancrage des liens est correct, les critères du filtre penguin.


Analyse de la qualité

Objectifs pédagogiques

Comprendre ce qu’est une page web de qualité. Comprendre les différents niveaux de qualité et les critères constitutifs de cette qualité. utiliser les 21 critères constitutifs pour classifier les contenus.

Contenu

Savoir déterminer les pages qui sembleraient être du spam pour Google. Savoir déterminer les pages de haute qualité dans un site web. Etre capable de créer et utiliser un filtre, en utilisant des datas et un outil de création d’arbre de classification (C5, adaboost, random forest, SVM).


Comportement des visiteurs

Objectifs pédagogiques

Analyser des logs apache ou nginx pour déterminer le comportement des visiteurs humains, des bots et les erreurs serveurs associées.
Analyser les stats issues de Google Analytics pour croiser l’information des logs avec des données d’utilisation.

Contenu

Qu’est ce qu’un log apache/nginx, comment les lire et les analyser pour comprendre le comportement “macro” au niveau d’un site web ?

Quelles sont les barrières de positionnement liées à tel ou tel schéma temporel d’apparition de codes HTTP spécifiques ?
Comment sont agréger les statistiques de Google Analytics ? Comment s’en servir pour déterminer les pages actives et les pages mortes ?